中国IDC圈5月17日报道:首先来看看两端代码,<META name="revisit-after" content="15 days">和<META robots="follow,index">可以说这是很多seo优化工作者最喜欢放在源头文件中的两个Meta标签内容,一个错误的认识是这两端代码可以帮助站长屏蔽一些搜索引擎的检索。
<META name="revisit-after" content="15 days">
站长朋友认为这段代码可以对搜索引擎的访问做一个引导,需要搜索引擎每隔15天来网站检索一次。但实际上这段代码并不能起到这样的效果,要知道搜索引擎的检索算法远比你的标签要复杂的多,即使你更新你的网站完全每隔15天,但是如果您的网站在最近的记忆中没有什么新的内容,长期这样只会影响你最终的搜索引擎优化,搜索引擎蜘蛛会跳过你的网站,原因是,搜索引擎没有找到任何新的内容索引。最佳的解决方法是实现XML的Sitemaps。
由于XML是一个特定结构化XML文档,它需要有一个参数会被搜索引擎读取所需的一组:
1、首先,以结束以<urlset>开始标记和结束</ urlset>标记。
2、内<urlset>标签指定的命名空间(协议标准)。
3、包括每个URL的父标记<url>条目。
4、包括一个每个<URL>父标签<loc>子项。
<META robots="follow,index">
通过robots告诉搜索机器人哪些页面需要索引,哪些页面不需要索引。此代码是无用的。原因是默认情况下,一旦搜索引擎机器人到达一个页面,抓取网页,并确定是否需要进行索引,按照搜索引擎这样的检索规则,上面的“跟随指数”代码是无用的,所以不要认为这个代码片段可以代替robots.txt文件,如果想告诉搜索引擎哪些页面不要进行检索,还是需要编辑一个robots.txt文件,然后提交给搜索引擎。
注:robots.txt文件编辑对于特殊符号的使用规则,支持的字符*(星号)和$(美元符号)
/ * / * / 禁止:_***int * HTML
第二行允许开头的所有文件夹爬行市民无论如字符长度的public_html或public_image。
第三行指示搜索引擎忽略任何HTML文件名中包含_***int。
另一方面,美元的指令表示对URL的末尾发现的任何比赛。例如:
不允许:/ * GIF
允许:/ * $?
不允许声明只是告诉搜索引擎忽略任何一个以gif文件名??结束的内容。需要注意的一点是,如果我们删除$符号,指令告诉搜索引擎忽略任何文件,其中包含GIF表达的文件。