美文网首页
Elasticsearch 篇之倒排索引与分词

Elasticsearch 篇之倒排索引与分词

作者: 青衣敖王侯 | 来源:发表于2019-06-25 23:04 被阅读0次

正排索引

  文档ID到文档内容、单词的关联关系。比如书的目录页对应正排索引(指明章节名称,指明页数)用于查看章节

倒排索引:

  单词到文档ID的关联关系。比如索引页对应倒排索引(指明关键词、指明页数)用于关键词查找
  倒排索引时搜索引擎的核心,主要包含两个部分:

  • 单词词典
    记录所有文档的单词,一般都比较大
    记录单词到倒排列表的关联信息
  • 倒排列表
    记录了单词对应的文档集合,由倒排索引项组成。倒排索引项包含如下信息:
    • 文档ID,用于获取原始信息
    • 单词频率,记录该单词在该文档中的出现次数,用于后续相关性算分
    • 位置,记录单词在文档中的粉刺位置,用于做词语搜索
    • 偏移,记录单词在文档的开始和结束位置,用于做高亮显示



分词

分词是指将文本转换成一系列单词的过程,也可以叫做文本分析,在es里面成为Analysis




Analyze_api




ES自带分词器

























image.png
image.png

相关文章

  • Elasticsearch(一):概念与基本API

    安装 Elasticsearch 常用 API index Document 倒排索引与分词 倒排索引 倒排索引与...

  • Elasticsearch中ik分词器的使用

    1.ES分词简介 Elasticsearch是基于倒排索引来实现搜索功能,而倒排索引的基础就是分词。因此分词对于学...

  • Elasticsearch 篇之倒排索引与分词

    正排索引   文档ID到文档内容、单词的关联关系。比如书的目录页对应正排索引(指明章节名称,指明页数)用于查看章节...

  • Elasticsearch——倒排索引与分词

    正排索引 文档ID到文档内容、单词的关联关系。比如书的目录页对应正排索引(指明章节名称,指明页数)用于查看章节。 ...

  • ElasticSearch知识库

    一、原理篇 Elasticsearch 的倒排索引是什么? 倒排索引=term字典+docId倒排表,term字典...

  • elasticsearch索引原理

    多渠道简单理解elasticsearch的索引原理: 正排索引: 倒排索引:将字段内容进行分词后以一下形式进行索引...

  • 搜索引擎之倒排索引浅析

    上一篇文章 ElasticSearch 术语中提到了倒排索引,那么这篇文章就来讲解下什么是倒排索引,倒排索引的数据...

  • ElasticSearch核心之——分词

    前言 我们知道ElasticSearch(简称ES)底层的搜索使用的是倒排索引依赖于分词器的实现,那么分词器的规则...

  • Elasticsearch-基础使用

    零、本文纲要 一、认识Elasticsearch二、倒排索引三、ES的部分概念四、安装ES、Kibana、分词器五...

  • 【ES】ElasticSearch analyzer 和 ana

    [TOC] 一、分词 搜索引擎的核心是倒排索引,而倒排索引的基础就是分词。所谓分词可以简单理解为将一个完整的句子切...

网友评论

      本文标题:Elasticsearch 篇之倒排索引与分词

      本文链接:https://www.haomeiwen.com/subject/mwlfcctx.html