elasticsearch中的倒排索引

金歌  论坛元老 | 2024-12-30 14:46:30 | 显示全部楼层 | 阅读模式
打印 上一主题 下一主题

主题 1050|帖子 1050|积分 3150

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?立即注册

x
        倒排索引是搜刮引擎中常用的一种数据结构,适用于全文检索,可以或许通过文本内容高效检索到相应的文档。
一、倒排索引的根本概念

正排索引:传统的索引方式,按照文档id顺序存储文档,通过文档id找到文档对应的词。因此当需要找到包罗某个词的文档时,需要遍历所有文档,不适合全文检索。
doc_1cat dog
doc_2dog fish
doc_3cat fish
倒排索引:将文档中的每个词映射到包罗该词的文档id列表,这样就可以快速找到包罗某个词的所有文档。
cat[1, 3]
dog[1, 2]
fish[2, 3]
二、倒排索引优势

(1) 快速检索,避免全局扫描所有文档
(2)节省存储空间,倒排索引只存储词条与文档的关系,不会重复存储词条
(3)适合全文检索
三、elasticsearch中的倒排索引

        elasticsearch在实际应用中,还对倒排索引做了一系列优化,以提高性能和存储效率:
(1)压缩。倒排索引中的文档列表通常会进行压缩。
(2)分片与副本。通过分片(shard)和副本(replica)提高并发性和容错性。
(3)缓存机制。es会缓存热词。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

金歌

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表