相关文章
北京网站建设有道岂能成为大盗
企通互联TOM,疯狂的黑帽SEO!
北京网站制作SWJ小谈:SEO新人切忌浮躁 做自己的站走自己的路!
北京网站设计从GOOGLE的炸弹中得到的启示
网站设计免费seo,再接八个
网站建设掌握六点,一个月进搜索引擎排名前十[转]
北京网站建设网络关键字“搜索引擎” 渐成互联网新看点
网站建设Google为什么能取得成功
北京网站建设禁止搜索引擎收录的方法
网页设计seo 基础知识
品牌理念
北京网站建设最佳合作伙伴
北京网站建设专家企通互联
竭诚为您提供网站建设服务!
友好连接
文章搜索
你的位置:首页 >> seo >> 北京网站制作北京网站建设禁止搜索引擎收录的方法
北京网站制作北京网站建设禁止搜索引擎收录的方法
作者: 北京网站建设 日期:2008-03-27 05:59:39 来源: http://www.qitongnet.com
搜索引擎通过一种程序robot(又称spider),自动访问互联网上的网页并获取网页信息。 网站制作
您可以在您的网站中创建一个纯文本文件robots.txt,在这个文件中声明该网站中不想被robot访问的部分,这样,该网站的部分或全部内容就可以不被搜索引擎收录了,或者指定搜索引擎只收录指定的内容。北京网站制作 www.qitongnet.com
网页设计
robots.txt 文件应该放在网站根目录下。举例来说,当robots访问一个网站(比如http://www.abc.com)时,首先会检查该网站中是否存在 http://www.abc.com/robots.txt这个文件,如果机器人找到这个文件,它就会根据这个文件的内容,来确定它访问权限的范围。北京网站建设
| 网站 URL | 相应的 robots.txt的 URL |
| http://www.w3.org/ | http://www.w3.org/robots.txt |
| http://www.w3.org:80/ | http://www.w3.org:80/robots.txt |
| http://www.w3.org:1234/ | http://www.w3.org:1234/robots.txt |
| http://w3.org/ | http://w3.org/robots.txt |
"robots.txt"文件包含一条或更多的记录,这些记录通过空行分开(以CR,CR/NL, or NL作为结束符),每一条记录的格式如下所示:网站建设
"
网站建设 企通互联
在该文件中可以使用#进行注解,具体使用方法和UNIX中的惯例一样。该文件中的记录通常以一行或多行User-agent开始,后面加上若干Disallow行,详细情况如下:网站制作
网页设计
User-agent:北京网站设计
该项的值用于描述搜索引擎robot的名字,在"robots.txt"文件中,如果有多条User-agent记录说明有多个robot会受到该协议的限制,对该文件来说,至少要有一条User-agent记录。如果该项的值设为*,则该协议对任何机器人均有效,在"robots.txt"文件中, "User-agent:*"这样的记录只能有一条。北京网页设计
企通互联
Disallow:网站制作
该项的值用于描述不希望被访问到的一个URL,这个 北京网站建设URL可以是一条完整的路径,也可以是部分的,任何以Disallow 北京网站设计开头的URL均不会被 robot访问到。例如"Disallow:/help"对/help.html 和/help/index.html都不允许搜索引擎访问,而"Disallow:/help/"则允许robot访问/help.html,而不能访问 /help/index.html。任何一条Disallow记录为空,说明该网站的所有部分都允许被访问,在"/robots.txt"文件中,至少要有一条Disallow记录。如果"/robots.txt"是一个空文件,则对于所有的搜索引擎robot,该网站都是开放的。北京网站建设
网站设计
| 例1. 禁止所有搜索引擎访问网站的任何部分 北京网站设计 下载该robots.txt文件 |
User-agent: * 北京网站制作 Disallow: / |
| 例2. 允许所有的robot访问 (或者也可以建一个空文件 "/robots.txt" file) | User-agent: *北京网页设计 Disallow: |
| 例3. 禁止某个搜索引擎的访问 | User-agent: BadBot北京网站建设 Disallow: / |
| 例4. 允许某个搜索引擎的访问 | User-agent: baiduspider北京网站建设 Disallow: 北京网站制作 北京网站设计 User-agent: * 北京网页设计网站建设 Disallow: / |
| 例5.一个简单例子网站建设 在这个例子中,该网站有三个目录对搜索引擎的访问做了限制,即搜索引擎不会访问这三个目录。北京网站设计 需要注意的是对每一个目录必须分开声明,而不要写成 "Disallow: /cgi-bin/ /tmp/"。网站建设 User-agent:后的*具有特殊的含义,代表"any robot",所以在该文件中不能有"Disallow: /tmp/*" or "Disallow:*.gif"这样的记录出现. |
User-agent: *企通互联 Disallow: /cgi-bin/北京网站设计 Disallow: /tmp/企通互联 Disallow: /~joe/ |
robots.txt文件的更具体设置, 网页设计请参看以下链接:北京网站建设
· Web Server Administrator's Guide to the Robots Exclusion Protocol 网站建设
· HTML Author's Guide to the Robots Exclusion Protocol 北京网页设计 网站建设
· The original 1994 protocol description, as currently deployed北京网站制作
· The revised Internet-Draft specification, which is not yet completed or implemented
责任编辑:admin 责编无QQ