站长们对robots文件肯定都不会陌生,它能够正确指引搜索引擎蜘蛛对网站的抓取动作,正确的书写网站的robots文件很重要。但是站长朋友们:你的robots争取吗?
Google网站管理员工具中的“网站配置”中有一项“抓取工具的权限”,作用是测试网站的robots文件,其解析结果中详细列出了文件中的哪一行命令存在错误,下面笔者就通过其负责的齐鲁人才网的robots文件的解析结果来和大家分享一下发现的一些细节错误:
从上面的解析结果中看,其robots文件命令中存在语法错误。
分析:
(1)2,3,4行的错误可以明确,这段命令是错误的,对搜索引擎是不起作用的,这段命令的作用是为了限制蜘蛛的抓取频率,当时是为了减轻网站服务器的压力,现在来看这一点已经不需要考虑了,另一点搜索引擎的蜘蛛程序可以根据网站服务器的承受能力进行抓取,一般不会因为蜘蛛的爬行给网站造成压力。
(2)第12,32,……,38行的语法错误,不是很明确。都是在disallow或者Allow的后面出现了两个?,经仔细分析后发现,出现这类错误的命令中使用的是中文的冒号,而不存在语法错误的命令使用的是英文的冒号。所以就是因为错用了中文标点才导致了robots文件命令中出现了多行语法错误。
总结,在robots文件中应该使用英文标点,中文标点的使用存在语法错误,站长们,你的robots文件中有中文标点吗?