ElasticSearch 可观测性最佳实践

打印 上一主题 下一主题

主题 1008|帖子 1008|积分 3024

ElasticSearch 概述

ElasticSearch 是一个开源的高扩展的分布式全文检索引擎,它可以近乎及时的存储、检索数据;本身扩展性很好,可以扩展到上百台服务器,处置处罚 PB 级别(大数据期间)的数据。ES 也使用 Java 开发并使用 Lucene 作为其核心来实现所有索引和搜索的功能,但是它的目的是通过简单的 RestFul API 来隐藏 Lucene 的复杂性,从而让全文检索变得简单。
所以,ElasticSearch 的监控显得尤为重要,可以资助我们举行性能优化、资源管理、容量规划、故障检测和防备,及时发现和办理问题,确保系统的高效和稳定运行。


  • 及时性:ElasticSearch 能够及时地存储、检索和分析数据,使得用户能够快速获得最新的搜索效果和分析数据;
  • 分布式:ElasticSearch 接纳分布式架构,能够程度扩展,处置处罚 PB 级布局化或非布局化数据,同时具有高可用性和容错性;
  • 多样化的搜索和分析功能:ElasticSearch 支持全文搜索、布局化查询、过滤、地理空间查询和复杂的分析功能。
观测云

观测云是一个统一及时监测平台,它提供全面的系统可观测性办理方案,资助用户快速实现对云平台、云原生、应用及业务的监控需求。观测云的核心功能包罗:根本设施监测,日志收罗和分析,用户访问监测(RUM),应用性能监测(APM),服务可用性监测(拨测),安全巡检,智能监控等等。
DataKit 提供 ElasticSearch 指标和日志的收罗,安装好 DataKit 之后,开通 ElasticSearch 收罗器,即可收罗 ElasticSearch 指标和日志到观测云。
部署 DataKit

登录观测云控制台,点击「集成」 -「DataKit」 - 「Linux」,拷贝第 2 步中的安装命令。


安装完成后,DataKit 会提示您使用 datakit monitor 来检查 DataKit 的运行状态,如下图所示:


收罗器配置

指标收罗配置

   Tips: ElasticSearch 版本 >= 6.0.0
  适用于虚拟机部署的 ElasticSearch 监控,使用主机安装方式安装 DataKit 后,在 /usr/local/datakit/conf.d/db 目录下,复制 elasticsearch.conf.sample 为 elasticsearch.conf。
  1. # 根据实际情况进行修改,如果有账号密码,可进行如下配置
  2. servers = ["http://user:pass@localhost:9200"]
  3. # 若账号密码有特殊字符,也可以在这里添加账号密码
  4.   # HTTP Basic Authentication
  5.    username = "xxx"
  6.    password = "yyy"
  7.    
  8. # 重启DK
  9. datakit service -R
复制代码
日志收罗配置

收罗 ElasticSearch 的日志,可在 elasticsearch.conf 中 将 files 打开,并写入 ElasticSearch 日志文件的绝对路径。
  1. [[inputs.elasticsearch]]
  2.   ...
  3. [inputs.elasticsearch.log]
  4. files = ["/path/to/your/file.log"]
复制代码
开启日志收罗以后,默认会产生日志来源(source)为 elasticsearch 的日志。
实行 datakit monitor 表现如下:

关键指标

指标描述单位status_code集群状态countos_cpu_percent集群CPU使用率countos_mem_used_percent集群内存使用率countjvm_mem_heap_used_percent集群堆内存使用率countnumber_of_data_nodes数据节点countnumber_of_pending_tasks待处置处罚任务数countactive_primary_shards活跃主分片countactive_shards活跃分片countinitializing_shards初始化中分片countrelocating_shards迁徙中的分片countindices_lifecycle_error_count错误状态索引countunassigned_shards未分配的分片countprimaries_docs_count主分片文档数量countprimaries_docs_deleted主分片已删除文档数量counttotal_docs_count文档数量counttotal_docs_deleted已删除文档数量counttotal_flush_total_time_in_millisflush总时间mstotal_refresh_totalflush总数counttotal_store_size_in_bytes存储巨细Btotal_merges_current_docs当前正在运行的文档合并数counttotal_merges_total_docs合并文档的总数counttotal_indexing_index_current当前正在运行的索引利用数counttotal_indexing_index_total索引利用的总数counttotal_search_query_current当前查询数counttotal_search_query_total总查询数counttotal_search_query_time_in_millis实行查询利用花费时间mstotal_search_fetch_time_in_millis实行获取利用花费时间ms 视图

登录观测云控制台,点击「场景」 -「新建仪表板」,模板库系统视图中,输入 “ElasticSearch ”, 选择“ElasticSearch 监控视图”,点击“确定”。




监控器



  • 查询耗时过长






  • 当前文档存储空间不足






  • 集群状态异常






  • 查询拒绝率过高




总结

通过观测云监控 ElasticSearch 关键指标,可以资助我们优化查询、提前容量规划及告警,及时相应和处置处罚出现的各种问题,同时对于系统优化和业务开展提供了数据支持。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

麻花痒

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表