详谈robots.txt写法规则

2024-01-24 分类：网站建设

搜索引擎robots.txt规则，是放置在网站根目录下robots.txt文本文件，在文件中可以设定搜索引擎蜘蛛爬行规则。设置搜索引擎蜘蛛Spider抓取内容规则。
首先要创建一个robots.txt文本文件，放置网站的根目录下，下面就开始编辑设置robots.txt协议文件：
①robots.txt允许所有搜索引擎蜘蛛抓取所以目录文件，如果文件无内容，也表示允许所有的蜘蛛访问，设置代码如下：
User-agent: *
Disallow:
或者
User-agent: *
Allow: /
②robots.txt禁止某个搜索引擎蜘蛛抓取目录文件，设置代码如下：
User-agent: Msnbot
Disallow: /
例如想禁止MSN的蜘蛛抓取就设为，Msnbot代表MSN的蜘蛛，如果想禁止其他搜索引擎就更换蜘蛛名字即可，其他蜘蛛名字如下：
百度的蜘蛛：baiduspider
Google的蜘蛛： Googlebot
腾讯Soso:Sosospider
Yahoo的蜘蛛：Yahoo Slurp
Msn的蜘蛛：Msnbot
Altavista的蜘蛛：Scooter
Lycos的蜘蛛： Lycos_Spider_(T-Rex)
③robots.txt禁止某个目录被搜索引擎蜘蛛抓取，设置代码如下：
User-agent: *
Disallow: /目录名字1/
Disallow: /目录名字2/
Disallow: /目录名字3/
把目录名字改为你想要禁止的目录即可禁止搜索引擎蜘蛛抓取，目录名字未写表示可以被搜索引擎抓取。
④robots.txt禁止某个目录被某个搜索引擎蜘蛛抓取，设置代码如下：
User-agent: 搜索引擎蜘蛛名字说明(上面有说明蜘蛛的名字)
Disallow: /目录名字/说明(这里设定禁止蜘蛛抓取的目录名称)
例如，想禁目Msn蜘蛛抓取admin文件夹，可以设代码如下：
User-agent: Msnbot
Disallow: /admin/
⑤robots.txt设定某种类型文件禁止被某个搜索引擎蜘蛛抓取，设置代码如下:
User-agent: *
Disallow: /*.htm说明(其中“.htm”，表示禁止搜索引擎蜘蛛抓取所有“htm”为后缀的文件)⑥robots.txt充许所有搜索引擎蜘蛛访问以某个扩展名为后缀的网页地址被抓取，设置代码如下:User-agent: *
Allow: .htm$说明(其中“.htm”，表示充许搜索引擎蜘蛛抓取所有“htm”为后缀的文件)
⑦robots.txt只充许某个搜索引擎蜘蛛抓取目录文件，设置代码如下：
User-agent: 搜索引擎蜘蛛名字说明(上面有说明蜘蛛的名字)
Disallow:

网页名称：详谈robots.txt写法规则
网页路径：/news10/315210.html

成都网站建设公司_创新互联，为您提供微信小程序、网站建设、网页设计公司、关键词优化、电子商务、网站内链

声明：本网站发布的内容（图片、视频和文字）以用户投稿、用户转载内容为主，如果涉及侵权请尽快告知，我们将会在第一时间删除。文章观点不代表本网站立场，如需处理请联系客服。电话：028-86922220；邮箱：631063699@qq.com。内容未经允许不得转载，或转载时需注明来源：创新互联

猜你还喜欢下面的内容

97韩剧网站制作教程app 2024-01-24
说说看怎样才能选对网站优化公司 2024-01-24
优化关键词应该怎么做？这些事项要知晓！ 2024-01-24
潮州市政府领导工作分工 2024-01-24
成都400电话申请，400业务现趋势--“无孔不入” 2024-01-24
成都微信小程序开发定制贵不贵？开发需要多少钱？ 2024-01-24
江苏南京：临时身份证明、无犯罪记录证明等户政高频业务网上申办指南！ 2024-01-24