中国IDC圈7月4日报道:6月22日和6月28日的百度反作弊大更新对于相当一部分站长来说是一个噩梦,许多网站都被K掉,从官方数据来看,说是5%的流量已经被调整,我想这个数字只多不少,我举我自身的一个例子。本人的友情链接有33个,当初挑选时都是一些排名很好,***为3或4的企业网站,经过28日之后,我再检查自己的友情链接,已经有7个网站被K掉了。所幸的我比较懒,每天只更新一篇文章,而且这篇文章完全由我自己原创,所以在这次百度地震中,我的排名没有太大影响。
昨天,百度站长平台针对22号28号大量网站惩罚做出了说明,其中有两句话特别引人注目,第一句是百度更新了部分反作弊策略和特征,这些策略在6月21日逐渐生效。第二句话是对低质量文章的定义:低质量站点是指无原创, 或者伪原创(很少原创内容, 大量采集的内容)。
从这两句话可以悲观的看出,这只是一个开始,而且被K的网站也很难会被恢复了,以后只靠转载文章也很难养活网站了。
那么百度是如何判断文章是不是伪原创呢?
百度蜘蛛在抓取文章之后,经过一定处理将一些多余没有多大意义的字去掉,例如“因为”“的”“了”等等,把整个文章变成众多关键字的集合。然后计算各个关键词的密度,再和他数据库里的其他文章进行对比,如果这些文章关键词数量一样,密度也一样的话。那么百度就为认为这是一篇伪原创。当这些关键词的数量和密度有百分之五十以上不一样时,百度才会认为这篇文章是原创文章。
这个原理也是从搜索原理书上看到的,我想这个规则同样适合百度作弊大更新之后的策略,不会发生太大变化。那么以后众多个人站长如何去进行高质量的原创和伪原创呢?
首先是用户体验,最基本的就是用户能读通顺这篇文章,有些工具伪原创的文章根本不能看,完全是为了百度制造。
其次文章尽量用手打上去,减少复制加黏贴,对于发帖时间百度也能统计到,那些一分钟发好几篇文章很定有问题,只是百度以前没有过多关注,这次百度更新之后还能不能允许站长这么疯狂就不得而知了,可以肯定的是采集软件群发这个做法已经过时了。
针对我以上的百度规则,我给大家介绍两种伪原创方法:
1 文章改写
将文章的首段和尾段删掉,然后自己撰写,搜索引擎是从上到下抓取的,第一段是百度蜘蛛最先看到的,而最后一段文字是带蜘蛛离开的。更重要的是改写的文字尽量多一些,如果原文字首段为20个字,那么你改写的文字至少为40个字,这样才会引起蜘蛛的兴趣。
2 翻译软件的巧妙使用
选择一篇文章,最好是比较老或者转载次数较少的文章,用翻译软件翻译成英文在翻译成中文,不断转换,转换几次,原来的文章就面目全非了,然后你自己在通读一遍,把语句不通顺的地方改掉,满足最基本的用户体验。
过多的方法我就不介绍了,这两种方法想必大家都知道,用的人想必就很少了,毕竟还要自己去改写,但经过这次百度反作弊大更新之后,那种一开软件就坐着数钱的日子已经不在了,站长们也要跟着不断的进化。