2016-11-03 分类: 网站建设
索引是经过文字,分词,消噪,去重后,搜索引擎得到的就是独特的,能反映页面主体内容的,以词为单位的内容,接下来搜索引擎索引程序就可以提取关键词,按照分词程序划分好的词,把页面转换为一个关键词组成的集全,同时记录每一个关键词在页面上的出现频率,出现次数,格式,位置.这样,每个页面都可以记录为一串关键词集全,其中每个关键词的词频,格式,位置等权重信息也都记录在案.
正向索引不能直接用于排名,如果只存在正向索引,排名程序需要扫描所有索引库中的文件,找出包含关键词的2个文件,再进行相关性计算,这样的计算量无法满足实时返回排名结果的要求.
所以搜索引擎会将正向索引数据仓库重新构造为倒排索引,把文件对应到关键词的映射转换为关键词到文件的映射.在倒排索引中关键词是主键,每个关键词都对应着一系列文件,这些文件中都出现了,这个关键词,这样当用户搜索某个关键词时,排序程序在倒排索引中定位到这个关键词就可以马上找出所有包含这个关键词的文件.
当前名称:正向索引与倒排索引的关系与区别
网页网址:/news31/59081.html
成都网站建设公司_创新互联,为您提供静态网站、电子商务、外贸网站建设、微信小程序、App开发、网站维护
声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 创新互联
猜你还喜欢下面的内容