中国IDC圈12月29日报道:在实践中,网页降噪就是要突出一个页面的实质内容的过程。我们先说说什么是网页噪音。

在对WEB上得到的一组页面集进行挖掘或聚类时,若一个网页所存留的副本,如镜像网站,复制的页面,及旧版本的页面也在此页面集中,则这些副本成为噪音数据。也就是说页面完全相同。我们称之为全局噪音。从经验上看,网页噪音,会给页面在搜索引擎收录、排名带来不少麻烦,一些因为噪音突出的网面,被搜索引擎放弃索引,一些虽被收录,也没能得到较为理想的搜索排名结果。

再看局部噪音:在一个页面内与页面主题无关的区域及项。这些噪音包括广告栏,导航条,修饰作用的图片等。

我们把网页中常见噪音信息分为这样几类:

a.  导航类:为了维持网页间的链接关系,方便浏览者对网站进行浏览而设置的链接。

b.  修饰类:为了美化页面而采用的背景,修饰图片,动画等.如站点标志图片,广告条。

c.  交互类:为了收集用户提交信息或提供站内搜索服务的表单等.如在线的问卷调查表。

d.  其它类:网页中声明的版权信息,创建时间,作者等描述性信息。

虽然网页中的噪音很多,且网页设计没有统一规范,但设计者大部分都将噪音信息放在页面中的次要位置,以突出主题.如版权信息一般在页面底部,广告栏一般在顶部等.这种设计习惯也为我们利用布局信息去除噪音带来了便利。

如何精准定义、判断页面中的噪点?给大家一个最简单的判断方法,即同时满足两个条件:与页面主体内容“非相关”尤其是多页面同时展现(模板化的),却又能被搜索引擎抓取的内容(公共信息、语句、图片、符号、代码等)都可以看作是该页面中的网页噪音;当然,判断这些噪音的影响程度,还要看其在页面中的占比程度,越高,则其影响越大。

如何处理、解决这些网页中的噪点?网页上的噪音,如果你稍有些经验,一眼便能识出八九,处理起来也较为简单:要么删掉,要么不让搜索引擎抓取到,要么改变内容使其与页面中的主体内容关联(各页面要差异化的),总之一句话,把页面最主体的内容提供给搜索引擎抓取(也就是让用户一眼看到你页面中最重要的信息)!

关注中国IDC圈官方微信:idc-quan或微信号:821496803 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2016-09-18 18:39:03
互联网 SEO高手月入万元多吗
默默无闻的SEOER为啥工资那么高?对于这个问题暂时先卖个关子。在今天的头条问答里面看到类似的问题出现了:为什么互联网行业工资普遍比较高? <详情>
SEO
2013-08-27 09:11:44
互联网 18个网站SEO建议
搜索引擎优化(简称SEO)对于互联网新创企业来说很重要。下面是四位相关专家给出的建议。 <详情>
2013-08-17 09:12:12
互联网 为何网站SEO优化会越来越难?
seo网站优化为什么会越来越难做呢?seo网站优化技术为什么很难再有提升呢?我给你们讲个小故事就知道了。 <详情>
2013-08-07 11:54:10
互联网 SEO内容展现:面向用户与搜索引擎
在目前看来,大多数的中小型网站都呈现着倒逼式的SEO内容现状。面对越来越频繁的算法更新,从原来所谓的“伪原创”过渡到TF/IDF之流的网站内容创作思路,大体说来SEOER普遍 <详情>
2013-08-06 11:56:27
互联网 个人网站seo技巧
SEO是一套系统工程,是从网站建设之初就的开始的,贯穿从建站到运营的方方面面。不管是个人网站,还是门户,搜索引擎都是一个很重要的流量来源,SEO显得尤为重要。 <详情>