常见的搜索引擎蜘蛛

2020-01-18    分类: 网站建设

SEO,一定要知道搜索引擎,搜索引擎用来爬行和访问页面的程序被称为蜘蛛(spider),也称为机器人(bot)。 搜索引擎蜘蛛访问网站页面时类似于普通用户使用的浏览器。蜘蛛程序发出页面访问 请求后,服务器返回HTML代码,蜘蛛程序把收到的代码存入原始页面数据库。搜索引擎 为了提高爬行和抓取速度,都使用多个蜘蛛并发分布爬行。

蝴蛛访问任何一个网站时,都会先访问网站根目录下的robots.txt文件。如果robots.txt 文件禁止搜索引擎抓取某些文件或目录,蜘蛛将遵守协议,不抓取被禁止的网址。

和浏览器一样,搜索引擎蜘蛛也有标明自己身份的代理名称,站长可以在日志文件中 看到搜索引擎的特定代理名称,从而辨识搜索引擎蜘蛛。下面列出常见的搜索引擎蜘蛛 名称:

• Baiduspider+(+http://www.baidu.com/search/spider.htm)百度蝴蛛

• Mozilla/5.0 (compatible; Yahoo! Slurp China; http://misc.yahoo.com.cn/help.html) 雅虎中国蜘蛛

• Mozilla/5.0 (compatible; Yahoo! Slurp/3.0; http://help.yahoo.com/help/us/ysearch/slurp) 英文雅虎蜘蛛

• Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html) Google 蝴蛛

• msnbot/1.1 (+http://search.msn.com/msnbot.htm)微软 Bing 蝴蛛

• Sogou+web+robot+(+http://www.sogou.com/docs/help/webmasters.htm#07)搜狗蝴蛛

• Sosospider+(+http://help.soso.com/webspider.htm)搜搜蝴蛛

• Mozilla/5.0 (compatible; YodaoBot/1.0; http://www.yodao.com/help/webmaster/spider/;) 有道蜘蛛

网站标题:常见的搜索引擎蜘蛛
分享URL:/news20/81220.html

成都网站建设公司_创新互联,为您提供定制网站ChatGPT网页设计公司网站维护关键词优化静态网站

广告

声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 创新互联

网站建设网站维护公司