中国IDC圈12月8日报道:一般来说,尽量让搜索引擎抓取和索引更多内容是SEO们经常头疼的一个问题,没有收录、索引就无从谈排名。尤其对达到一定规模的网站来说,使网站充分收录是个颇令人费神的SEO技术,当页面达到比如说几十万,无论网站架构怎么设计、多么优化,100%收录都是不可能的,只能尽量提高收录率。

但有时候怎么阻止搜索引擎收录也可能成为一个问题,最近越来越成为问题。需要阻止收录的情况如保密信息、复制内容、广告链接等。过去常用的阻止收录方法包括密码保护、把内容放在表格后面、使用JS/Ajax、使用Flash等。

使用Flash

Google几年前就开始尝试抓取Flash内容了,简单文字性内容已经能抓取。Flash里面的链接也能被跟踪。

表格

Google蜘蛛也能填表,也能抓取POST请求页面。这个早就能从日志中看到。

JS/Ajax

使用JS链接一直以来被当作不搜索引擎友好的方法,因此可以阻止蜘蛛爬行,但两三年前我就看到JS链接不能阻止Google蜘蛛抓取,不仅JS中出现的URL会被爬,简单的JS还能被执行找到更多URL。

前几天有人发现很多网站使用的Facebook评论插件里的评论被爬、被收录,插件本身是个AJAX。这是个好消息。我的一个实验电子商务网站产品评论功能就因为这个费了不少心思,用Facebook comments插件好处大大的,具体什么好处以后有时间再说,唯一的问题就是评论是AJAX实现的,不能被抓取,而产品评论被收录是目的之一(产生原创内容)。我当时想了半天也没有解决方法,只好先傻傻地既放上Facebook comments插件又打开购物车本身的评论功能。现在好了,Facebook comments里的评论能被收录,就不用两套评论功能了。

Robots文件

目前唯一确保内容不被收录的方法是robots文件禁止。但也有个坏处,会流失权重,虽然内容是不能收录了,但页面成了只接受链接权重、不流出权重的无底洞。

Nofollow

Nofollow并不能保证不被收录。就算自己网站所有指向页面的链接都加了NF,也不能保证别人网站不给这个页面弄个链接,搜索引擎还是能发现这个页面。

Meta Noindex + Follow

(11月3日补充)读者no1se提醒,为防止收录又能传递权重,可以在页面上使用meta noindex和 meta follow,这样页面不收录,但能流出权重。确实如此,也是个比较好的方法。也有一个问题,还是会浪费蜘蛛爬行时间。哪位读者有能防止收录、又没有权重流失、又不浪费爬行时间的方法,请留言,对SEO界功德无量。

怎样使页面不被收录是个值得思考的问题,没意识到严重性的童鞋可以想想自己网站上有多少复制内容、低质量内容、各种无搜索价值(但用户觉得方便、有用所以又不能拿掉)的分类、过滤URL。

关注中国IDC圈官方微信:idc-quan或微信号:821496803 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2016-09-18 18:39:03
互联网 SEO高手月入万元多吗
默默无闻的SEOER为啥工资那么高?对于这个问题暂时先卖个关子。在今天的头条问答里面看到类似的问题出现了:为什么互联网行业工资普遍比较高? <详情>
SEO
2013-08-27 09:11:44
互联网 18个网站SEO建议
搜索引擎优化(简称SEO)对于互联网新创企业来说很重要。下面是四位相关专家给出的建议。 <详情>
2013-08-17 09:12:12
互联网 为何网站SEO优化会越来越难?
seo网站优化为什么会越来越难做呢?seo网站优化技术为什么很难再有提升呢?我给你们讲个小故事就知道了。 <详情>
2013-08-07 11:54:10
互联网 SEO内容展现:面向用户与搜索引擎
在目前看来,大多数的中小型网站都呈现着倒逼式的SEO内容现状。面对越来越频繁的算法更新,从原来所谓的“伪原创”过渡到TF/IDF之流的网站内容创作思路,大体说来SEOER普遍 <详情>
2013-08-06 11:56:27
互联网 个人网站seo技巧
SEO是一套系统工程,是从网站建设之初就的开始的,贯穿从建站到运营的方方面面。不管是个人网站,还是门户,搜索引擎都是一个很重要的流量来源,SEO显得尤为重要。 <详情>