正排索引和倒排索引

18次阅读
2024年07月31日 10:01:42

共计 837 个字符,预计需要花费 3 分钟才能阅读完成。

互联网每天都会产生数以万计的文章,在我们搜索的时候,如何能快速的找到这些内容,只有了解了这些规则,我们才能更好的进行网站优化和推广,提高网站排名。本文介绍一下正排索引和倒排索引。

搜索引擎工作原理简单介绍:

第一步:搜集,爬取大量的网页,去搜集这些网页内容。

第二步:建立索引,在经历了第一步后,搜集了大批的网页,将这些网页抓取过来后,显然要进行下一步处理,处理过程必然很复杂,简单讲就是建立了正排索引和倒排索引。

第三步:就是根据用户搜索,依靠倒排索引技术,提取关键词,展示相关页面。

正排索引:

简单来说就是将文章按照一定规则,建立目录,类似书本的目录页,或者数据库的ID,

比如我们平常操作软件查询内容的时候,其实是在后台生成了一条SQL查询语句,比如从标题和内容中查询“上海SEO优化”,生成的语句如下

文章表) where title like “%网站SEO优化%”

SQL语句会按数据表逐行检索,并将查询的数据结果反馈给我们,这种查询效率比较低,显然对一款并发量和数据量不大的软件可以这样做,但并不适合海量数据的搜索引擎,这个时候就出现了倒排排索引技术。

倒排索引:

将抓取的文章进行分词,用户输入关键词后,将关键词和网页匹配,快速的提取相关网页,即:关键词=网页。

比如:

上海网站优化推广排名,可以提取关键词为上海+网站+优化+推广+排名。

上海seo培训,可以提取关键词为上海+seo+培训。

利用倒排索引技术,提取关键词后,并记录了关键词出现的位置,频次,将文章归集按照一定规则进行分类存储。

倒排索引的应用:

关键词权重由左到右依次递减

例如:

未优化的标题:上海可以做网站优化排名的公司有哪些?

优化过的标题:上海网站优化排名公司有哪些?

关键词匹配度越高排名越好

例如:

有人搜索上海网站优化,经过倒排索引分词后建立了词库,搜索后则进行匹配,关键词匹配度高,则更可能排在前边。

举个例子:

上海网站优化,A网页完全匹配:即上海网站优化,B网站只匹配了上海优化4个关键词,在同等条件下,A网页排名要更靠前。

正文完
 0
鹿泽
版权声明:本站原创文章,本文由 鹿泽 于 2024年7月31日 10:01:42 发表,共计 837 字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
本站所有文章,如无特殊说明或标注,均为本站原创发布。任何在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。
如若本站内容侵犯了原著者的合法权益,可联系我们邮箱:526009505@qq.com进行处理。
最新文章
网站优化seo推广服务如何做好内链?

网站优化seo推广服务如何做好内链?

在一个网站刚刚建设的初期,网站内链的建设工作尤为重要,可以说网站内链做得好SEO就成功了一半。今天就来讲讲网站...
WordPress博客主题二次元风-lolimeow主题更新10.1版,重构样式

WordPress博客主题二次元风-lolimeow主题更新10.1版,重构样式

一个WordPress博客主题二次元风主题,本站之前启用过,后面更换了,不过很好看,适合大家选择使用: 202...
专业优化公司seo是怎么做好404页面的?

专业优化公司seo是怎么做好404页面的?

404页面的目的是:告诉浏览者其所请求的页面不存在或链接错误,同时引导用户使用网站其它页面而不是关闭窗口离开。...
网站搜索优化seo如何做好内部链接优化?

网站搜索优化seo如何做好内部链接优化?

网站内部链接的布局很多做SEO的朋友都知道,非常重要。网站想做的越大,就要更加重视内部链接的布局。因为良好的内...
影响关键词优化根本的排序因素

影响关键词优化根本的排序因素

对于像百度搜索来说,并没有排序这一说法,搜索引擎认为排序是在特定的关键词下网站内容的位置,而关键词是由用户搜索...