2021-08-13 分类: 网站建设
很对站长朋友在对网站开始进行优化之前,会忽略非常重要的一点,就是网站上的robots文件,robots文件的作用是告诉搜索引擎蜘蛛,这个网站上什么内容是可以抓取的,哪些内容是禁止抓取的。当robots文件制作完成之后,放在网站ftp的跟目录之下,就搞定了。那么,robots文件里写的各种内容,都是代表了什么样的含义呢?下面我们就来了解一下吧!
User-agent禁止访问抓取系列:
User-agent:*
这里的*好是通配符,意指所有的搜索引擎都可以抓取,包括百度、搜狗、360等等
Disallow:/
意思是禁止蜘蛛抓取该网站的任何目录
Disallow:/123
意思是禁止蜘蛛抓取该网站的123以及123层级之下的所有内容
Disallow:/123/
意思是禁止蜘蛛抓取123层级之下的所有内容,但是可以抓取123页面的内容
Disallow:/*.png
意思是禁止蜘蛛抓取网站上所有png格式的图片,想要禁止抓取其它格式也是这样书写,比如想要禁止抓取网站jpg格式的图片,书写方式为Disallow:/*.jpg
Disallow:/123/*.png
禁止蜘蛛访问123层次下的png图片,其他格式也是同样的书写方式
Disallow:/*?*
禁止蜘蛛抓取网站上所有的动态url页面
Disallow:/123/*?*
禁止蜘蛛抓取网站上123目录下的所有动态页面,不影响抓取网站123目录中的其它内容
allow允许抓取访问系列:
allow的意思是允许蜘蛛访问抓取的意思,在写robots文件的时候一定要注意一件事,就是在书写的时候,一定要将allow放在disallow前面,才能不受disallow的影响,其它的写法参考disallow的书写方式,这里就不凑字数了。
有一点注意事项,大家在使用的时候一定要注意,robots.txt文件名称一定要小写的,不要大写。有了完整的robots文件,搜索引擎在抓取的时候才会更加的方便,利于对网站的提升。
名称栏目:robots文件代表了什么样的含义呢
文章URL:/news17/121967.html
成都网站建设公司_创新互联,为您提供网站内链、网站设计公司、关键词优化、外贸建站、搜索引擎优化、网站导航
声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 创新互联
猜你还喜欢下面的内容