robots.txt和Robots META标签的使用-SEO综合-SEO优化-自学php网

robots.txt和Robots META标签的使用-SEO综合-SEO优化

来源：自学PHP网时间：2014-12-11 18:04 作者：阅读:次

[导读] ...

     我们知道，搜索引擎都有自己的“搜索机器人”（ROBOTS），并通过这些ROBOTS在网络上沿着网页上的链接（一般是http和src链接）不断抓取资料建立自己的数据库。
     对于网站管理者和内容提供者来说，有时候会有一些站点内容，不希望被ROBOTS抓取而公开。为了解决这个问题，ROBOTS开发界提供了两个办法：一个是robots.txt，另一个是The Robots META标签。

     一、 robots.txt
1、什么是robots.txt？
robots.txt是一个纯文本文件，通过在这个文件中声明该网站中不想被robots访问的部分，这样，该网站的部分或全部内容就可以不被搜索引擎收录了，或者指定搜索引擎只收录指定的内容。
当一个搜索机器人访问一个站点时，它会首先检查该站点根目录下是否存在robots.txt，如果找到，搜索机器人就会按照该文件中的内容来确定访问的范围，如果该文件不存在，那么搜索机器人就沿着链接抓取。
robots.txt必须放置在一个站点的根目录下，而且文件名必须全部小写。
w3.org
http://www.w3.org/robots.txt
w3.org:80
http://www.w3.org:80/robots.txt
w3.org:1234
http://www.w3.org:1234/robots.txt
w3.org/
http://w3.org/robots.txt
2、 robots.txt的语法

"robots.txt"文件包含一条或更多的记录，这些记录通过空行分开（以CR,CR/NL, or NL作为结束符），每一条记录的格式如下所示：
　　　　"<field>:<optionalspace><value><optionalspace>"。

在该文件中可以使用#进行注解，具体使用方法和UNIX中的惯例一样。该文件中的记录通常以一行或多行User-agent开始，后面加上若干Disallow行,详细情况如下：

搜索引擎优化最常犯的五个错误-SEO综合-SEO优化

把动态页面变成静态页面--ISAPI_Rewrite针对IIS的解

子栏目

robots.txt和Robots META标签的使用-SEO综合-SEO优化

最新评论

添加评论

更多文章推荐

添加评论