搜索引擎的工作原理简介

2022-07-21    分类: 网站建设

搜索引擎工作过程非常复杂,接下来成都网站建设--创新互联小编要简单介绍搜索引擎是怎么样实现网页排名的。这里介绍的内容相对于真正的搜索引擎技术来说知识皮毛,不过对大部分seo工作人员来说已经够用了。

搜索引擎的工作过程大体上可以分成三个阶段。

1):爬行和抓取:搜索引擎蜘蛛通过跟踪链接发现和访问页面,读取页面HTML代码,存入数据库。

2):预处理:索引程序对抓取来的页面数据进行文字提取.中文分词.索引.倒排索引等处理,以备排名程序调用。

3):用户输入查询词后,排名程序调用索引库数库,计算相关性,然后按一定格式生成搜索结果页面。

              

爬行和抓取是搜索引擎的第一步,完成数据收集的任务。

下面成都网站设计--创新互联小编就来和大家说说“蜘蛛”:搜索引擎用来爬行和访问页面的程序被称为蜘蛛或机器人。搜索引擎蜘蛛访问网站页面时类似于普通用户使用的浏览器。蜘蛛程序发出页面访问请求后,服务器返回HTML代码,都使用多个蜘蛛并发布爬行。蜘蛛访问任何一个网站时,都会先访问网站跟目录下的robots.txt文件。如果robots.txt文件禁止搜索引擎抓取某些文件或目录,蜘蛛将遵守协议,不抓取被禁止的网址。

和浏览器一样,搜索引擎蜘蛛也有标明自己身份的用户代理名称,站长可以在日志文件中看到搜索引擎的特定用户代理,从而辨识搜索引擎蜘蛛。成都网站建设--创新互联小编下面列出常见的搜索引擎蜘蛛名称:

. Baiduspider+(+http://www.baidu.com/search/spider.htm)百度蜘蛛。

.Mozilla/5.0(Windows;U;Windows NT 5.1;zh-CN;)Firefox/1.5.0.11;360Spider(369蜘蛛)。

.Mozilla/5.0(compatible;Yahoo!Slurp/3.0;http://help.yahoo.com/help/us/ysearch/slurp)英文雅虎蜘蛛(雅虎已经放弃自己的搜索技术,列在这里权当历史纪念吧)。

.MOZILL/5.0(compatible;Googlebot/2.1;+http://www.google.com/bot.html)Goole蜘蛛。

.MOZILL/5.0(iphone;CPU iphone OS 6_0 like Mac OS X)AppleWebKit/536.26(KHTML,like Gecko)Version/6.0 Mobile/10A5376e Safari/8536.25(compatible;Googlebot/2.1;+http://www.google.com/bot.html)(GOOGLR移动蜘蛛)。

.MOZILLA/5.0(compatibe;bingbot/2.0;+http://www.bing.com/bingbot.htm)微软Bing蜘蛛。

.Sogou+web+robot+(+http://www.spgou.com/docs/help/webmasters.htm307)搜狗蜘蛛。

.Sosospider+(+http://help.soso.com/webspider.htm)搜搜蜘蛛。

.Mozilla/5.0(compatible;YodaBot/1.0;http://www.yodao.com/help/webmaster/spider/;)有道蜘蛛。

分享题目:搜索引擎的工作原理简介
分享地址:/news41/181341.html

成都网站建设公司_创新互联,为您提供品牌网站设计面包屑导航App开发网站建设品牌网站建设网站设计

广告

声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 创新互联

外贸网站建设