搜索引擎的工作流程是什么?

2014-07-05    分类: 网站建设

正所谓磨刀不误砍柴工,做好工作之前的准备工作也是十分重要的,那么对于搜索排名工作来说,了解搜索引擎是如何工作是一件比较重要的事,所以今天创新互联就为大家分析一下这方面的内容。

搜索引擎的工作流程是什么?

一、搜索引擎工作流程

搜索引擎的工作流程大致上可以分为四个步骤。

二、爬行和抓取

搜索引擎派出一个能够在网上发现新网页并抓取文件的程序,这个程序通常被称为蜘蛛(Spider)。搜索引擎蜘蛛从数据库中已知的网页开始出发,就像正常用户的浏览器一样访问这些网页并抓取文件。并且搜索引擎蜘蛛会跟踪网页上的链接,访问更多网页,这个过程就叫爬行。

当通过链接发现有新的网址时,蜘蛛将把新网址记录入数据库等待抓取。跟踪网页链接是搜索引擎蜘蛛发现新网址的最基本方法。搜索引擎蜘蛛抓取的页面文件与用户浏览器得到的完全一样,抓取的文件存入数据库。

搜索引擎的工作流程是什么?

三、建立索引

搜索引擎索引程序把蜘蛛抓取的网页文件分解、分析,并以巨大表格的形式存入数据库,这个过程就是索引。在索引数据库中,网页文字内容,关键词出现的位置、字体、颜色、加粗、斜体等相关信息都有相应记录。

搜索引擎索引数据库存储巨量数据,主流搜索引擎通常都存有几十亿级别的网页。

四、搜索词处理

用户在搜索引擎界面输入关键词,单击“搜索”按钮后,搜索引擎程序即对输入的搜索词进行处理,如中文特有的分词处理、对关键词词序的分别、去除停止词、判断是否需要启动整合搜索、判断是否有拼写错误或错别字等情况。搜索词的处理必须十分快速。

搜索引擎的工作流程是什么?

五、排序

对搜索词进行处理后,搜索引擎排序程序开始工作,从索引数据库中找出所有包含搜索词的网页,并且根据排名计算法计算出哪些网页应该排在前面,然后按一定格式返回“搜索”页面。

排序过程虽然在一两秒之内就完成返回用户所要的搜索结果,实际上这是一个非常复杂的过程。排名算法需要实时从索引数据库中找出所有相关页面,实时计算相关性,加入过滤算法,其复杂程度是外人无法想象的。搜索引擎是当今规模大、最复杂的计算系统之一。

分享名称:搜索引擎的工作流程是什么?
网页地址:/news8/27558.html

成都网站建设公司_创新互联,为您提供外贸建站Google网站排名移动网站建设网站内链手机网站建设

广告

声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 创新互联

成都网站建设公司