ElasticSearch中的倒排索引到底是什么

您所在的位置:网站首页 什么是es倒排索引 ElasticSearch中的倒排索引到底是什么

ElasticSearch中的倒排索引到底是什么

2024-07-09 20:38| 来源: 网络整理| 查看: 265

倒排索引是 es 中非常重要的索引结构,是从文档词项到文档 ID 的一个映射过程。

“正排索引”

我们在关系型数据库中见到的索引,就是“正排索引”。关系型数据库中的索引如下,假设我有一个博客表:image我们可以针对这个表建立索引(正排索引):image

当我们通过 id 或者标题去搜索文章时,就可以快速搜到。

但是如果我们按照文章内容的关键字去搜索,就只能去内容中做字符匹配了。为了提高查询效率,就要考虑使用倒排索引。

倒排索引

倒排索引就是以内容的关键字建立索引,通过索引找到文档 id,再进而找到整个文档。image

一般来说,倒排索引分为两个部分:

单词词典(记录所有的文档词项,以及词项到倒排列表的关联关系) 倒排列表(记录单词与对应的关系,由一系列倒排索引项组成,倒排索引项指:文档 id、词频(TF)(词项在文档中出现的次数,评分时使用)、位置(Position,词项在文档中分词的位置)、偏移(记录词项开始和结束的位置))

当我们去索引一个文档时,就回建立倒排索引,搜索时,直接根据倒排索引搜索。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3