中国IDC圈7月4日报道:6月22日和6月28日的百度反作弊大更新对于相当一部分站长来说是一个噩梦,许多网站都被K掉,从官方数据来看,说是5%的流量已经被调整,我想这个数字只多不少,我举我自身的一个例子。本人的友情链接有33个,当初挑选时都是一些排名很好,***为3或4的企业网站,经过28日之后,我再检查自己的友情链接,已经有7个网站被K掉了。所幸的我比较懒,每天只更新一篇文章,而且这篇文章完全由我自己原创,所以在这次百度地震中,我的排名没有太大影响。

昨天,百度站长平台针对22号28号大量网站惩罚做出了说明,其中有两句话特别引人注目,第一句是百度更新了部分反作弊策略和特征,这些策略在6月21日逐渐生效。第二句话是对低质量文章的定义:低质量站点是指无原创, 或者伪原创(很少原创内容, 大量采集的内容)。

从这两句话可以悲观的看出,这只是一个开始,而且被K的网站也很难会被恢复了,以后只靠转载文章也很难养活网站了。

那么百度是如何判断文章是不是伪原创呢?

百度蜘蛛在抓取文章之后,经过一定处理将一些多余没有多大意义的字去掉,例如“因为”“的”“了”等等,把整个文章变成众多关键字的集合。然后计算各个关键词的密度,再和他数据库里的其他文章进行对比,如果这些文章关键词数量一样,密度也一样的话。那么百度就为认为这是一篇伪原创。当这些关键词的数量和密度有百分之五十以上不一样时,百度才会认为这篇文章是原创文章。

这个原理也是从搜索原理书上看到的,我想这个规则同样适合百度作弊大更新之后的策略,不会发生太大变化。那么以后众多个人站长如何去进行高质量的原创和伪原创呢?

首先是用户体验,最基本的就是用户能读通顺这篇文章,有些工具伪原创的文章根本不能看,完全是为了百度制造。

其次文章尽量用手打上去,减少复制加黏贴,对于发帖时间百度也能统计到,那些一分钟发好几篇文章很定有问题,只是百度以前没有过多关注,这次百度更新之后还能不能允许站长这么疯狂就不得而知了,可以肯定的是采集软件群发这个做法已经过时了。

针对我以上的百度规则,我给大家介绍两种伪原创方法:

1 文章改写

将文章的首段和尾段删掉,然后自己撰写,搜索引擎是从上到下抓取的,第一段是百度蜘蛛最先看到的,而最后一段文字是带蜘蛛离开的。更重要的是改写的文字尽量多一些,如果原文字首段为20个字,那么你改写的文字至少为40个字,这样才会引起蜘蛛的兴趣。

2 翻译软件的巧妙使用

选择一篇文章,最好是比较老或者转载次数较少的文章,用翻译软件翻译成英文在翻译成中文,不断转换,转换几次,原来的文章就面目全非了,然后你自己在通读一遍,把语句不通顺的地方改掉,满足最基本的用户体验。

过多的方法我就不介绍了,这两种方法想必大家都知道,用的人想必就很少了,毕竟还要自己去改写,但经过这次百度反作弊大更新之后,那种一开软件就坐着数钱的日子已经不在了,站长们也要跟着不断的进化。

关注中国IDC圈官方微信:idc-quan或微信号:821496803 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2017-07-19 11:46:21
云资讯 百度与微软携手推进智能云 为“阿波罗”计划保驾护航
日前,微软和百度联合宣布,双方将在智能云服务市场展开合作,以推动自动驾驶技术的发展和普及。作为百度“阿波罗”(Apollo)计划的合作伙伴,微软将通过其Azure云服务在中 <详情>
2017-07-19 09:16:00
云资讯 微软和百度就阿波罗计划达成合作,Azure将为中国以外的市场提供智能云服务
在7月5日召开的百度AI开发者大会上,百度集团总裁兼COO陆奇宣称“Apollo是最强的自动驾驶生态”,背后的PPT上共有50家Apollo合作伙伴初始合作伙伴在列,其中就包括微软。今 <详情>
2017-07-18 09:52:00
大数据资讯 AI全新布局下的百度投资策略Facebook化,是不谋而合?还是野心勃勃?
一个细节之外的东西——所展露出的百度的全盘布局及投资的新变化。 <详情>
2017-07-17 16:48:04
大数据资讯 《福布斯》:百度欲借AI增加收入来源
据美国《福布斯》杂志7月16日报道,百度由核心业务转向人工智能,不仅为前沿研究,更重要的是带来新收入增长点。 <详情>
2017-07-14 10:33:00
市场情报 陆奇内部讲话:All in AI的百度需要什么样的工程师
陆奇:如果把深度学习真的要想彻底,必须把物理重学一遍,把生物学看一遍,再把进化论再看一遍。因为深度学习跟这些东西完全相关,自己肯定想不清楚,要彻底想清楚,必须学 <详情>