愛在花開的季節 发表于 2024-10-27 01:03:35

【架构】prometheus+grafana体系监控

Prometheus+Grafana体系监控是一个强大的组合,用于及时监控和分析体系的性能与状态。以下是对这一组合在体系监控中的详细分析:
一、Prometheus简介

Prometheus(普罗米修斯)是一个开源的体系监控和警报工具包,由Go语言开辟,是云原生盘算基金会(CNCF)的项目之一。它紧张特点包括:


[*]时间序列数据库:Prometheus的焦点是一个时间序列数据库,可以或许高效存储来自各种应用程序和体系的指标数据,如CPU使用率、内存使用环境、HTTP请求响应时间等。
[*]灵活的查询语言:PromQL(Prometheus Query Language)允许用户对存储的指标数据举行复杂的查询和聚合操作。
[*]强大的警报体系:Prometheus可以根据界说的规则触发警报,并通过多种渠道(如邮件、Slack等)发送通知。
[*]不依赖分布式存储:单个节点即可实现自治,易于摆设和扩展。
Prometheus四种数据类型
Counter
Counter用于累计值,例如记录请求次数、任务完成数、错误发生次数。一直增加,不会淘汰。重启进程后,会被重置。
例如:http_response_total{method=“GET”,endpoint=“/api/tracks”} 100,10秒后抓取http_response_total{method=“GET”,endpoint=“/api/tracks”} 100。
Gauge
Gauge常规数值,例如 温度变化、内存使用变化。可变大,可变小。重启进程后,会被重置。
例如: memory_usage_bytes{host=“master-01”} 100 < 抓取值、memory_usage_bytes{host=“master-01”} 30、memory_usage_bytes{host=“master-01”} 50、memory_usage_bytes{host=“master-01”} 80 < 抓取值。
Histogram
Histogram(直方图)可以理解为柱状图的意思,常用于跟踪事件发生的规模,例如:请求耗时、响应大小。它特别之处是可以对记录的内容举行分组,提供count和sum全部值的功能。
例如:{小于10=5次,小于20=1次,小于30=2次},count=7次,sum=7次的求和值。
Summary
Summary和Histogram十分相似,常用于跟踪事件发生的规模,例如:请求耗时、响应大小。同样提供 count 和 sum 全部值的功能。
例如:count=7次,sum=7次的值求值。
它提供一个quantiles的功能,可以按%比分别跟踪的效果。例如:quantile取值0.95,表示取采样值内里的95%数据。
二、Grafana简介

Grafana是一个开源的数据可视化和监控平台,由Torkel Ödegaard于2014年创建。其紧张特点包括:


[*]多数据源支持:Grafana可以或许连接多种数据源,包括Prometheus、Graphite、Elasticsearch、InfluxDB等,并在同一仪表板中统一展示数据。
[*]丰富的可视化选项:提供多种图表类型和设置选项,如折线图、柱状图、仪表板、热图等,用户可以根据需求自由组合和定制。
[*]告警功能:支持设置警报规则,并在达到特定条件时发送通知。
[*]插件生态体系:拥有丰富的插件生态体系,用户可以根据必要扩展和定制功能。
https://i-blog.csdnimg.cn/direct/93e4301832284ff1b9f323ebc1e00b9f.png
三、Prometheus+Grafana体系监控的实现


[*] 环境准备

[*]选择合适的操作体系(如Ubuntu、CentOS等)。
[*]安装Prometheus和Grafana,以及须要的Exporter(如Node Exporter用于收集Linux体系指标)。

[*] Prometheus设置

[*]下载并解压Prometheus安装包。
[*]设置prometheus.yml文件,界说监控目标和抓取间隔。
[*]启动Prometheus服务,并验证其正常运行。

[*] Grafana设置

[*]下载并解压Grafana安装包。
[*]启动Grafana服务,并使用默认用户名和暗码登录。
[*]在Grafana中添加Prometheus数据源,并设置数据源URL。

[*] 创建仪表板

[*]在Grafana中创建新的仪表板。
[*]添加图表组件,并设置查询以展示所需的指标数据(如CPU使用率、内存占用等)。
[*]自界说图表样式和布局,以满足监控需求。

[*] 设置告警

[*]在Prometheus中界说告警规则文件(如alerts.yml)。
[*]在Grafana中添加告警规则,并设置通知渠道(如邮件、Slack等)。
[*]测试告警功能,确保在指标异常时可以或许及时收到通知。

四、优势与应用场景

Prometheus+Grafana组合在体系监控中具有以下优势:


[*]及时监控:可以或许及时监控体系的各项性能指标,确保体系稳定运行。
[*]可视化展示:通过Grafana提供的丰富图表和仪表板,用户可以直观地了解体系状态。
[*]灵活扩展:支持多种数据源和插件,可以根据需求灵活扩展监控范围和功能。
[*]告警通知:强大的告警体系可以或许在指标异常时及时通知干系人员,便于快速响应和处理题目。
该组合广泛应用于云盘算、微服务架构、容器化摆设等场景,为体系稳定性和性能提供了有力的保障。
参考

【Prometheus】Prometheus 监控 + Grafana 可视化平台摆设
Prometheus+grafana监控体系-学习笔记
大数据监控系列(一)——Prometheus+Grafana监控概述

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页: [1]
查看完整版本: 【架构】prometheus+grafana体系监控