相关文章
网站制作自然搜索结果和关键字广告的点击率
北京网站制作正视seo和搜索引擎的关系,seo发展还得慢慢来
企通互联如何提高网站转换率?
企通互联SEO:SEO理论之外部链接建设(一)
网站制作搜索引擎是怎么侦测站群的?
企通互联关于用Meta标签进行SEO的心得
网页设计快速的提升网站排名、流量的计划步骤
北京网站制作如何推广B2C类独立的网店
企通互联浅谈博客广告的现状及发展趋势
网站制作电子商务网站关键词选择详解
品牌理念
北京网站建设最佳合作伙伴
北京网站建设专家企通互联
竭诚为您提供网站建设服务!
友好连接
文章搜索
你的位置:首页 >> 网站优化 >> 北京网页设计企通互联robots.txt的解释
北京网页设计企通互联robots.txt的解释
怎么写robots.txt文件?企通互联
robots.txt是个很简单的文本文件,您只要标明“谁不能访问哪些链接”即可。北京网页设计 网页设计
在文件的第一行写:网页设计
User-Agent: YodaoBot网页设计
这就告诉了爬虫下面的描述是针对名叫YodaoBot的爬虫。您还可以写: 网站制作网站设计
User-Agent: *北京网站建设
这就意味着向所有的爬虫开放。需要注意的是一个robots.txt文件里只能有一个"User-Agent: *"。
接下来是不希望被访问的链接前缀。例如:北京网站建设
Disallow: /private网站建设
这就告诉爬虫不要抓取以"/private"开头的所有链接。包括/private.html,/private/some.html,/private/some/haha.html。如果您写成:网站制作
Disallow: / 北京网站建设网页设计
则表明整个站点都不希望被访问。您也可以分多行来指定不希望被抓取的链接前缀,例如:北京网页设计
Disallow: /tmp网站制作 网站建设
Disallow: /disallow网站设计
那么所有以"/tmp"和"/disallow"开头的链接都不会被访问了。
网站制作
最后形成的robots.txt文件如下:北京网站建设
User-Agent: YodaoBot网站设计 企通互联
Disallow: /tmp北京网页设计
Disallow: /private
请注意,如果您的robots.txt文件里有中文等非英语字符,请确定该文件是由UTF-8编码编写。
网站制作