搜索引擎的工作原理简介

2022-07-21 分类：网站建设

搜索引擎工作过程非常复杂，接下来成都网站建设--创新互联小编要简单介绍搜索引擎是怎么样实现网页排名的。这里介绍的内容相对于真正的搜索引擎技术来说知识皮毛，不过对大部分seo工作人员来说已经够用了。

搜索引擎的工作过程大体上可以分成三个阶段。

1）：爬行和抓取：搜索引擎蜘蛛通过跟踪链接发现和访问页面，读取页面HTML代码，存入数据库。

2）：预处理：索引程序对抓取来的页面数据进行文字提取.中文分词.索引.倒排索引等处理，以备排名程序调用。

3）：用户输入查询词后，排名程序调用索引库数库，计算相关性，然后按一定格式生成搜索结果页面。

爬行和抓取是搜索引擎的第一步，完成数据收集的任务。

下面成都网站设计--创新互联小编就来和大家说说“蜘蛛”：搜索引擎用来爬行和访问页面的程序被称为蜘蛛或机器人。搜索引擎蜘蛛访问网站页面时类似于普通用户使用的浏览器。蜘蛛程序发出页面访问请求后，服务器返回HTML代码，都使用多个蜘蛛并发布爬行。蜘蛛访问任何一个网站时，都会先访问网站跟目录下的robots.txt文件。如果robots.txt文件禁止搜索引擎抓取某些文件或目录，蜘蛛将遵守协议，不抓取被禁止的网址。

和浏览器一样，搜索引擎蜘蛛也有标明自己身份的用户代理名称，站长可以在日志文件中看到搜索引擎的特定用户代理，从而辨识搜索引擎蜘蛛。成都网站建设--创新互联小编下面列出常见的搜索引擎蜘蛛名称：

. Baiduspider+(+http://www.baidu.com/search/spider.htm)百度蜘蛛。

.Mozilla/5.0(Windows;U;Windows NT 5.1;zh-CN;)Firefox/1.5.0.11;360Spider(369蜘蛛）。

.Mozilla/5.0(compatible;Yahoo!Slurp/3.0;http://help.yahoo.com/help/us/ysearch/slurp)英文雅虎蜘蛛（雅虎已经放弃自己的搜索技术，列在这里权当历史纪念吧）。

.MOZILL/5.0(compatible;Googlebot/2.1;+http://www.google.com/bot.html)Goole蜘蛛。

.MOZILL/5.0(iphone;CPU iphone OS 6_0 like Mac OS X)AppleWebKit/536.26(KHTML,like Gecko)Version/6.0 Mobile/10A5376e Safari/8536.25(compatible;Googlebot/2.1;+http://www.google.com/bot.html)(GOOGLR移动蜘蛛）。

.MOZILLA/5.0(compatibe;bingbot/2.0;+http://www.bing.com/bingbot.htm)微软Bing蜘蛛。

.Sogou+web+robot+(+http://www.spgou.com/docs/help/webmasters.htm307)搜狗蜘蛛。

.Sosospider+(+http://help.soso.com/webspider.htm)搜搜蜘蛛。

.Mozilla/5.0(compatible;YodaBot/1.0;http://www.yodao.com/help/webmaster/spider/;)有道蜘蛛。

分享题目：搜索引擎的工作原理简介
分享地址：/news41/181341.html

成都网站建设公司_创新互联，为您提供品牌网站设计、面包屑导航、App开发、网站建设、品牌网站建设、网站设计

声明：本网站发布的内容（图片、视频和文字）以用户投稿、用户转载内容为主，如果涉及侵权请尽快告知，我们将会在第一时间删除。文章观点不代表本网站立场，如需处理请联系客服。电话：028-86922220；邮箱：631063699@qq.com。内容未经允许不得转载，或转载时需注明来源：创新互联

猜你还喜欢下面的内容