IT评测·应用市场-qidao123.com

标题: 2023最新整理的 Elasticsearch 21道口试题 [打印本页]

作者: 慢吞云雾缓吐愁    时间: 2024-7-31 03:08
标题: 2023最新整理的 Elasticsearch 21道口试题
1、为什么要使用 Elasticsearch?

   系统中的数据, 随着业务的发展, 时间的推移, 将会非常多,而业务中每每采用模糊查询进行数据的 搜刮,而模糊查询会导致查询引擎放弃索引, 导致系统查询数据时都是全表扫描,在百万级别的数据库中, 查询服从黑白常低下的,而我们使用 ES 做一个全文索引, 将经常查询的系统功能的某些字段,比如说电 商系统的商品表中商品名,形貌、价格另有 id 这些字段我们放入 ES 索引库里,可以进步查询速度。
  2、Elasticsearch 的 master 推举流程?

   
  3、Elasticsearch 集群脑裂题目?

   所谓脑裂题目(类似于精神分裂),就是同一个集群中的不同节点,对于集群的状态有了不一样的明白。
  由于某些节点的失效,部门节点的网络连接会断开,并形成一个与原集群一样名字的集群,这种情况成为集群脑裂(split-brain)现象。这个题目非常伤害,因为两个新形成的集群会同时索引和修改集群的数据。
  “脑裂”题目大概的成因:

脑裂题目解决方案:

4、文档索引步调次序是什么?

   新建单个文档所必要的步调次序:
  

  客户端向 Node 1 发送新建、索引或者删除请求。
  节点使用文档的 _id 确定文档属于分片 0 。请求会被转发到 Node 3,因为分片 0 的主分片现在被分配在 Node 3 上。
  Node 3 在主分片上面实行请求。假如成功了,它将请求并行转发到 Node 1 和 Node 2 的副天职片上。一旦所有的副天职片都报告成功, Node 3 将向和谐节点报告成功,和谐节点向客户端报告成功。
  5、Elasticsearch 索引文档的流程?



  1. shard = hash(document_id) % (num_of_primary_shards)
复制代码

6、 Elasticsearch 更新和删除文档的流程?

   
  7、Elasticsearch 搜刮的流程?

   
  8、GC 方面,在使用 Elasticsearch 时要留意什么?

   
  9、Elasticsearch 在部署时,对 Linux 的设置有哪些优化方法?

   
  10、索引阶段性能提拔方法有哪些?

   
  11、elasticsearch 相识多少,说说你们公司 es 的集群架构,索引数据大小,分片有多少,以及一些调优手段 。

   口试官:想相识应聘者之前公司打仗的 ES 使用场景、规模,有没有做过比较大规模的索引设计、规划、调优。
  解答:如实联合自己的实践场景回答即可。
  比如:ES 集群架构 13 个节点,索引根据通道不同共 20+索引,根据日期,逐日递增 20+,索引:10分片,逐日递增 1 亿+数据,每个通道每天索引大小控制:150GB 之内。
  仅索引层面调优手段:
  设计阶段调优
写入调优
查询调优
12、Elasticsearch 对于大数据量(上亿量级) 的聚合怎样实现?

   Elasticsearch 提供的首个近似聚合是 cardinality 度量。它提供一个字段的基数,即该字段的 distinct 或者 unique 值的数目。它是基于 HLL 算法的。 HLL 会先对我们的输入作哈希运算,然后根据哈希运算的 效果中的 bits 做概率估算从而得到基数。其特点是: 可配置的精度, 用来控制内存的使用(更精确 = 更 多内存);小的数据集精度黑白常高的;我们可以通过配置参数,来设置去重必要的固定内存使用量。无 论数千还是数十亿的唯一值,内存使用量只与你配置的精确度相干
  13、在并发情况下,Elasticsearch 假如保证读写一致?

   
  14、怎样监控 Elasticsearch 集群状态?

   elasticsearch-head 插件
通过 Kibana 监控 Elasticsearch。你可以及时检察你的集群健康状态和性能, 也可以分析过去的集群、 索引和节点指标
  15、是否相识字典树?

常用字典数据布局如下所示:

   字典树又称单词查找树, Trie 树,是一种树形布局,是一种哈希树的变种。典范应用是用于统计, 排序和保存大量的字符串 (但不仅限于字符串) ,所以经常被搜刮引擎系统用于文本词频统计。
  它的优点是:利用字符串的公共前缀来减少查询时间,最大限度地减少无谓的字符串比较,查询服从比哈希树高。
  Trie 的核心头脑是空间换时间,利用字符串的公共前缀来低落查询时间的开销以达到进步服从的目的。
  它有 3 个基天性质:
  
  对于中文的字典树,每个节点的子节点用一个哈希表存储, 如许就不用浪费太大的空间, 而且查询速度上 可以保留哈希的复杂度 O(1)。
  16、 Elasticsearch 中的集群、节点、索引、文档、范例是什么?

   
  17、Elasticsearch 中的倒排索引是什么?

   倒排索引是搜刮引擎的核心。搜刮引擎的主要目标是在查找发生搜刮条件的文档时提供快速搜刮。 ES 中的倒排索引实在就是 lucene 的倒排索引,区别于传统的正向索引, 倒排索引会再存储数据时将关键词和数据进行关联,保存到倒排表中,然后查询时,将查询内容进行分词后在倒排表中进行查询,最后匹配数 据即可。
  18、Elasticsearch与数据库之间的对应关系是什么?

   Elasticsearch数据库索引index数据库文档表数据索引库(index)中的映射数据库(database)中的表布局(table)字段(Field)数据表的字段,对文档数据根据不同属性进行的分类标识反向索引索引查询DSLSQLget http://select * from tableput http://update table setdelete http://delete  19、数据库修改信息怎样同步ElasticSearch?

     20、如安在保留不变性的前提下实现倒排索引的更新?

   用更多的索引。通过增加新的补充索引来反映新近的修改, 而不是直接重写整 个倒排索引。每一个倒排索引都会被轮番查询到,从最早的开始查询完后再对效果进行归并。
  21、ElasticSearch的主要功能及应用场景?

   
  1)海量数据的分布式存储以及集群管理,达到了服务与数据的高可用以及水平扩展;
  2)近及时搜刮,性能杰出。对布局化、全文、地理位置等范例数据的处理;
  3)海量数据的近及时分析(聚合功能)
  
  1)网站搜刮、垂直搜刮、代码搜刮;
  2)日记管理与分析、安全指标监控、应用性能监控、Web抓取舆情分析
  好了,本文就到这里了!假如觉得内容不错的话,渴望各人可以帮助点赞转发一波,这是对我最大的鼓励,感谢




欢迎光临 IT评测·应用市场-qidao123.com (https://dis.qidao123.com/) Powered by Discuz! X3.4