美文网首页
什么是倒排牵引?正排索引和倒排索引的区别?

什么是倒排牵引?正排索引和倒排索引的区别?

作者: Baby_f146 | 来源:发表于2021-09-06 10:12 被阅读0次

什么是倒排牵引?

倒排索引也常被称为反向索引、置入档案或反向档案,被用来存储在全文搜索下某个单词在一个文档或者一组文档中的存储位置的映射。带有倒排索引的文件称为倒排索引文件,简称倒排文件。建立全文索引中有两项非常重要,一个是如何对文本进行分词,一是建立索引的数据结构。分词的方法基本上是二元分词法、最大匹配法和统计方法。索引的数据结构基本上采用倒排索引的结构。

image.png

正排索引和倒排索引的区别

正排索引

是经过文字,分词,消噪,去重后,索引程序就能够提取关键词,根据分词程序划分好的词,把页面转化为一个关键词组成的集群,同时记录每一个关键词在页面上的出现频率,出现次数,格式,位置,这样,每个页面都能够记录为一串关键词集全,其中每个关键词的词频,格式,位置等权重信息也都记录在案。

一个文件(网站/网页)对应许多关键词

倒排索引

一个关键词对应许多文件(网站/网页)

作者:hongxinruishang
链接:https://www.jianshu.com/p/e0e0231fc9ef
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

相关文章

  • elasticsearch中的倒排索引

    正排索引 在说倒排索引之前我们先说说什么是正排索引。正排索引也称为"前向索引",它是创建倒排索引的基础。这种组织方...

  • 什么是倒排牵引?正排索引和倒排索引的区别?

    什么是倒排牵引? 倒排索引也常被称为反向索引、置入档案或反向档案,被用来存储在全文搜索下某个单词在一个文档或者一组...

  • 【elasticsearch】6、倒排索引

    正排和倒排索引 目录 - 正排目录 快速查找“benchmarking”所在的页面(倒排)benchmarking...

  • 正排索引和倒排索引

    倒排索引(英语:Inverted index),也常被称为反向索引、置入档案或反向档案,被用来存储在全文搜索下某个...

  • 倒排索引和正排索引

  • 倒排索引和正排索引

    倒排索引和正排索引一 以有限对无限这个世界很多东西是无限的,比如可以创造无限的小说,可以创造无限个程序。但是小说虽...

  • 倒排索引

    什么是倒排索引 先来说说什么事正排索引,举个简单的例子,常规的数据库存储就是正排索引。以下面的作为例子: 构建索引...

  • Elasticsearch(四)——Analyzer

    正排索引 目录页对应的正排索引文档Id到文档内容、单词的关联关系。 Inverted Index倒排索引 索引页对...

  • ElasticSearch 倒排索引简析

    内容概要 倒排索引是什么?为什么需要倒排索引? 倒排索引是怎么工作的? 1. 倒排索引是什么? 假设有一个交友网站...

  • es概念

    文档地址:https://es.xiaoleilu.com/ 倒排索引 对比: 正排索引 文档id到文档内容和...

网友评论

      本文标题:什么是倒排牵引?正排索引和倒排索引的区别?

      本文链接:https://www.haomeiwen.com/subject/jhvziltx.html