Linux摆设Prometheus+Grafana

打印 上一主题 下一主题

主题 837|帖子 837|积分 2511

一、Prometheus(普罗米修斯)

1、Prometheus简述

Prometheus是由SoundCloud开发的开源监控报警系统和时序列数据库(TSDB),基于Go语言开发,是Google BorgMon监控系统的开源版本。Prometheus在2016年加入了云原生存算基金会,成为Kubernetes之后的第二个项目。
Prometheus是一个开源的监控系统,它可以帮助用户监控各种不同类型的系统和应用步伐。Prometheus采用的是pull模子,它定期从目标系统中拉取指标数据在当地数据库中。这些指标数据可以用于天生图表、警报和报告,以帮助用户相识他们系统的运作状态和性能表现。Prometheus通过多种数学算法能实现强大的监控需求,原生支持k8s服务发现,能监控容器的动态变化,并且结合Grafana能绘出美丽图形,然后使用Altermanager或Grafana实现报警。
2、Prometheus特点



  • 多维数据模子:由度量名称和键值对标识的时间序列数据
  • 时间序列数据:按照时间序次记录系统、装备状态变化的数据,每个数据称为一个样本;服务器指标数据、应用步伐性能监控数据、网络数据等都是时序数据
  • 内置时间序列(Time Series)数据库:Prometheus ;外置的远端存储通常会用:InfluxDB、OpenTSDB 等
  • promQL 一种机动的查询语言,可以利用多维数据完成复杂查询
  • 基于 HTTP 的 pull(拉取)方式采集时间序列数据
  • 同时支持 PushGateway 组件网络数据
  • 通过静态配置或服务发现发现目标
  • 支持作为数据源接入 Grafana
3、Prometheus生态组件

Prometheus Server:用于网络、存储和查询监控数据的核心组件。它定期从配置的目标中拉取指标数据,并将其存储在当地的时间序列数据库中。
Alertmanager:用于处理和发送警报通知的组件。Alertmanager可以根据配置的规则对监控数据举行分析,并在触发警报条件时发送通知。
Exporters:用于将各种服务和应用步伐的指标数据转换成Prometheus可读取的格式。
Client Libraries:用于将应用步伐的指标数据暴露给Prometheus Server的库。Prometheus提供了多种语言的客户端库,方便开发人员集成监控功能到他们的应用步伐中。
Service Discovery:服务发现,用于动态发现待监控的 Target,Prometheus 支持多种服务发现机制:文件、DNS、Consul、Kubernetes 等等。 服务发现可通过第三方提供的接口,Prometheus 查询到需要监控的 Target 列表,然后轮询这些 Target 获取监控数据。该组件目前由 Prometheus Server 内建支持
Grafana:一个开源的数据可视化工具,可以与Prometheus集成,用于创建仪表板和图表展示监控数据。
4、Prometheus工作原理

●Prometheus Server 基于服务发现(Service Discovery)机制或静态配置获取要监视的目标(Target),并通过每个目标上的指标 exporter 来采集(Scrape)指标数据;
●Prometheus Server 内置了一个基于文件的时间序列存储来持久存储指标数据,用户可使用 PromQL 接口来检索数据,也能够按需将告警需求发往 Alertmanager 完成告警内容发送;
●一些短期运行的作业的生命周期过短,难以有效地将必要的指标数据供给到 Server 端,它们一般会采用推送(Push)方式输出指标数据, Prometheus 借助于 Pushgateway 吸收这些推送的数据,进而由 Server 端举行抓取
二、摆设Prometheus

1、系统架构


2、摆设Prometheus

直接访问官网
①地址:https://prometheus.io/download/

在服务器上直接下载
②地址:https://prometheus.io/download/

  1. wget https://github.com/prometheus/prometheus/releases/download/v2.44.0/prometheus-2.44.0.linux-amd64.tar.gz
复制代码

  1. [root@Prometheus prometheus]# setenforce 0
  2. [root@Prometheus prometheus]# systemctl disable  --now firewalld.service
  3. [root@Prometheus ~]# tar -xvf prometheus-2.53.0.linux-amd64.tar.gz
  4. [root@Prometheus ~]#mv prometheus-2.53.0.linux-amd64 /usr/local/prometheus
复制代码
3、修改配置文件

  1. [root@Prometheus prometheus]# cp prometheus.yml prometheus.yml.bak
  2. ## 第六行添加
  3. scrape_timeout: 10s        ##采集超时时间
  4. ## 最后一行localhost改为本机的ip(其实不改也可以,为了分辨,建议修改)
  5. - targets: ["172.16.11.209:9090"]  
复制代码

4、配置系统启动文件

配置系统启动文件,并且设置开机自启动
  1. #进入这个文件,默认是没有的,直接进入就行
  2. vim /usr/lib/systemd/system/prometheus.service
  3. [Unit]   #服务单元
  4. Description=Prometheus Server
  5. Documentation=https://prometheus.io
  6. After=network.target   #依赖关系
  7. [Service]
  8. Type=simple
  9. ExecStart=/usr/local/prometheus/prometheus \   
  10. --config.file=/usr/local/prometheus/prometheus.yml \     #配置文件
  11. --storage.tsdb.path=/usr/local/prometheus/data/ \        #数据目录
  12. --storage.tsdb.retention=15d \         #保存时间
  13. --web.enable-lifecycle      #开启热加载
  14.   
  15. ExecReload=/bin/kill -HUP $MAINPID    #重载
  16. Restart=on-failure
  17. [Install]
  18. WantedBy=multi-user.target
复制代码

  1. [root@Prometheus prometheus]# systemctl restart prometheus
  2. [root@Prometheus prometheus]# systemctl enable prometheus
  3. [root@Prometheus prometheus]# ss -antp|grep 9090
复制代码

通过浏览器访问http:// 服务器 IP:9090 就可以访问到 Prometheus 的主界面:

默认只监控了本机一台,点 Status→点 Targets→可以看到只监控了本机:

通过 http:// 服务器 IP:9090/metrics 可以查看到监控的数据:

三、摆设 Node Exporter 监控系统级指标

1、下载安装包

地址:https://prometheus.io/download/
监控长途主机(被监控端上安装node_Export192.168.10.131)组件

(1)上传所需要软件包到 /opt目次,并解压
  1. [root@node opt]# tar xf node_exporter-1.8.1.linux-amd64.tar.gz
  2. [root@node opt]# ls
  3. node_exporter-1.8.1.linux-amd64  node_exporter-1.8.1.linux-amd64.tar.gz  rh
  4. [root@node opt]# cd node_exporter-1.8.1.linux-amd64/
  5. [root@node node_exporter-1.8.1.linux-amd64]# ls
  6. LICENSE  node_exporter  NOTICE
  7. [root@node node_exporter-1.8.1.linux-amd64]# mv node_exporter /usr/local/bin/
  8. [root@node node_exporter-1.8.1.linux-amd64]#
复制代码

2、配置启动文件

  1. [root@node ~]# vim /usr/lib/systemd/system/node_exporter.service
  2. [Unit]
  3. Description=mysqld_exporter
  4. Documentation=https://prometheus.io/
  5. After=network.target
  6. [Service]
  7. Type=simple
  8. ExecStart=/usr/local/bin/node_exporter \
  9. --collector.ntp \
  10. --collector.mountstats \
  11. --collector.systemd \
  12. --collector.tcpstat
  13. ExecReload=/bin/kill -HUP $MAINPID
  14. Restart=on-failure
  15. [Install]
  16. WantedBy=multi-user.target
复制代码

3、启动

  1. [root@node ~]# systemctl start node_exporter.service
  2. [root@node ~]# systemctl enable node_exporter.service
  3. Created symlink from /etc/systemd/system/multi-user.target.wants/node_exporter.service to /usr/lib/systemd/system/node_exporter.service.
  4. [root@node ~]# ss -natp|grep 9100
  5. 浏览器访问:http://192.168.109.20:9100/metrics ,可以看到 Node Exporter 采集到的指标数据
复制代码

通过浏览器访问 http:// 被监控端 IP:9100/metrics 就可以查看到 node_exporter 在被监控端网络的监控信息:

点击Metrics可以查看node_exporter 在被监控端网络的监控信息

(1)修改Prometheus配置文件
  1. vim /usr/local/prometheus/prometheus.yml
  2.   - job_name: 'agent'
  3.     static_configs:
  4.     - targets: ['192.168.10.131:9100']
  5. [root@Prometheus prometheus]# systemctl restart prometheus.service    #修改完后重启服务
  6. [root@Prometheus prometheus]# systemctl status prometheus
复制代码

监测prometheus配置文件是否正确
  1. [root@Prometheus prometheus]#cd /usr/local/prometheus
  2. [root@Prometheus prometheus]# ./promtool check config prometheus.yml
复制代码
成功状态
  1. Checking prometheus.yml
  2. SUCCESS: prometheus.yml is valid prometheus config file syntax
复制代码
失败状态
  1. Checking prometheus.yml
  2.   FAILED: parsing YAML file prometheus.yml: "172.16.11.209:9999/cs" is not a valid hostname
复制代码
(2)访问Prometheus服务器,刷新
回到 web 管理界面→点 Status→点 Targets→可以看到多了一台监控目标

注:也可以在本机安装 node_exporter,使用上面的方式监控本机。
四、监控长途MySQL

在被管理机 agent上安装 mysqld_exporter 组件
1、下载安装包

地址:https://prometheus.io/download/

也可在服务器上直接下载
  1. wget https://github.com/prometheus/mysqld_exporter/releases/download/v0.15.1/mysqld_exporter-0.15.1.linux-amd64.tar.gz
复制代码
2、安装mysqld_exporter组件

  1. [root@agent opt]# tar xf mysqld_exporter-0.14.0.linux-amd64.tar.gz -C /usr/local
  2. [root@agent opt]# mv /usr/local/mysqld_exporter-0.14.0.linux-amd64/ /usr/local/mysqld_exporter
  3. [root@agent opt]# ls /usr/local/mysqld_exporter/
  4. LICENSE  mysqld_exporter  NOTICE
复制代码

(1) 安装mariadb数据库,并授权
  1. [root@node opt]# yum install mariadb\* -y
  2. [root@node opt]# systemctl start  mariadb
  3. [root@node opt]# systemctl enable mariadb
  4. Created symlink from /etc/systemd/system/multi-user.target.wants/mariadb.service to /usr/lib/systemd/system/mariadb.service.
  5. [root@node opt]# mysql
  6. Welcome to the MariaDB monitor.  Commands end with ; or \g.
  7. Your MariaDB connection id is 2
  8. Server version: 5.5.68-MariaDB MariaDB Server
  9. Copyright (c) 2000, 2018, Oracle, MariaDB Corporation Ab and others.
  10. Type 'help;' or '\h' for help. Type '\c' to clear the current input statement.
  11. MariaDB [(none)]> grant select,replication client,process ON *.* to 'mysql_monitor'@'192.168.10.131' identified by '123456';
  12. Query OK, 0 rows affected (0.00 sec)
  13. MariaDB [(none)]> flush privileges;
  14. Query OK, 0 rows affected (0.00 sec)
  15. MariaDB [(none)]>
复制代码

(2)创建一个mariadb配置文件
创建一个mariadb配置文件,写上毗连的用户名和密码(和上面的授权的用户名和密码要对应)

(3)配置启动文件
  1. [root@node opt]# vim /usr/lib/systemd/system/mysqld_exporter.service
  2. [Unit]
  3. Description=node_exporter
  4. Documentation=https://prometheus.io/
  5. After=network.target
  6. [Service]
  7. Type=simple
  8. ExecStart=/usr/local/bin/mysqld_exporter \
  9. --collector.ntp \
  10. --collector.mountstats \
  11. --collector.systemd \
  12. --collector.tcpstat
  13. ExecReload=/bin/kill -HUP $MAINPID
  14. Restart=on-failure
  15. [Install]
  16. WantedBy=multi-user.target
复制代码

  1. #启动
  2. systemctl restart mysqld_exporter
  3. #设置开机自启
  4. systemctl enable mysqld_exporter
  5. #查看端口是否启动9104
  6. netstat -anput | grep 9104
复制代码

第二种启动方式
  1. #进入解压目录
  2. cd /usr/local/mysqld_exporter
  3. #挂后台执行 mysqld_exporter
  4. nohup /usr/local/mysqld_exporter/mysqld_exporter --config.my-cnf=/usr/local/mysqld_exporter/.my.cnf &
  5. #查看端口是否启动
  6. netstat -anput | grep 9104
复制代码

页面访问:IP:9104

客户端配置完成
3、配置服务端

  1. [root@Prometheus ~]# vim /usr/local/prometheus/prometheus.yml
  2. - job_name: "agetn-mysql"
  3.     static_configs:   
  4.       - targets: ["192.168.10.131:9104"]
  5. [root@Prometheus ~]# systemctl restart prometheus.service
复制代码

添加完后,重启服务
  1. [root@Prometheus ~]# systemctl restart prometheus.service
复制代码
等候重启完成,刷新一下页面,假如还是没有可以扫除一下缓存,试试。

添加成功
五、Grafana平台摆设

1、Grafana简介

Grafana是一种开源的数据可视化和监控平台,它允许用户通过创建动态仪表板来监视和分析数据。Grafana最初由Torkel Ödegaard于2014年创建,旨在为不同数据源提供统一的可视化界面。它支持多种数据源,包括但不限于Graphite、Prometheus、Elasticsearch、InfluxDB等。通过Grafana,用户可以轻松创建图标、图形和面板,以直观和动态的方式展示数据趋势、指标和报警。
随着公司业务的不停发展,业务种类的增长、服务器数目的增长和网络情况的复杂以及版本发布频繁,从而不可制止带来了线上事故的增多,因此需要对服务器举行全方位的监控,提前预警,急需一个工具来实现办理这个题目,而Grafana的出现完美办理了这个题目。

Grafana特点:
多数据源支持:可以从多种数据源中网络数据,并在同一仪表板中举行统一展示。
可视化选项丰富:提供了各种图表类型、样式和配置选项,用户可以根据需求定制图表。
告警功能:支持设置警报规则,并在到达特定条件时发送通知。
插件生态系统:拥有丰富的插件生态系统,用户可以根据需要扩展和定制功能。
社区支持:拥有活泼的开发社区,提供了丰富的文档、教程和支持资源。

2、Grafana起源与初衷

Grafana的起源可以追溯到2014年,由瑞典工程师Torkel Ödegaard创建。其时,Torkel是一位开发者,他感受到了在处理和展示不同数据源时的困难和不便。他意识到,很多组织和开发者都面对着雷同的挑战,需要从多个数据源中网络数据,并以可视化的方式将其出现出来。
因此,Torkel决定创建一个开源的数据可视化平台,旨在为用户提供统一的界面和工具,帮助他们轻松地监控和分析数据。他的初衷是构建一个机动、易于使用且功能强大的平台,能够满意各种不同场景下的需求。在初始阶段,Grafana重要是为了满意Graphite这样的数据存储和可视化工具的需求而创建的。但随着时间的推移,Grafana的功能渐渐扩展,开始支持更多的数据源,如InfluxDB、Prometheus、Elasticsearch等,使其成为一个更加通用的数据可视化和监控平台。由于其开放源代码的特性,Grafana迅速得到了开发者和用户的欢迎,形成了一个活泼的社区。这个社区不停贡献新的功能、插件和改进,推动了Grafana的不停发展和壮大。

3、Grafana摆设

下载地址:https://grafana.com/grafana/download

下载保举rpm包,点击一下,就会自动下载;大概复制一下,粘贴到服务器上也会下载。

假如是直接在服务器实行下载的,直接等候下载完成启动即可,假如是下载的rpm包,就需要上传到服务器上,然后使用rpm -ivh grafana-enterprise-9.5.2-1.x86_64.rpm 举行安装;
假如是使用的二进制离线包安装的,默认是没有系统启动配置文件的,以是我们需要加一个:
  1. #进入这个文件,默认是没有的,直接进入就行
  2. vim /usr/lib/systemd/system/grafana.service
  3. #将下面的全部写进去
  4. [Unit]
  5. Description=Grafana instance
  6. After=network.target
  7. [Service]
  8. Type=simple
  9. WorkingDirectory=/data/monitor/grafana/
  10. ExecStart=/data/monitor/grafana/bin/grafana-server
  11. Restart=always
  12. [Install]
  13. WantedBy=multi-user.target
  14. [root@Prometheus opt]# systemctl start grafana-server.service    #启动
  15. [root@Prometheus opt]# systemctl enable grafana-server.service   #设置开机自启
  16. [root@Prometheus opt]#ss -anput | grep 3000               #查看端口是否启动3000
复制代码

页面访问 IP:port(3000)
  1. 注意:默认账号密码为:
  2. 账号:admin
  3. 密码:admin
  4. grafana默认配置文件目录 /etc/grafana/grafana.ini
复制代码

进去需要设置一个新的密码

4、配置数据源




点击保存测试

可以看到刚创建的模板

5、导入模板

点进去,选择:Dashboards–>从中选择恣意一个模板,这里我选择第二个,点击import。


点击名称,进入可以查看模板

这里所展示的只是个模板
6、数据源做数据展示

点击右上角加号,再点击创建新的仪表板


选择刚刚添加的监控项



在这写了三个条件



再次点击dashboard可以查看到

自界说的监控模块(监控的服务端的1、5、15分钟的平均负载),一个一个添加比较麻烦,我们可以去找一些模板
7、导入监控模板

  1. 这里我们使用现成的模板导入即可,GitHub上面很多人开发了dashboards模板,官方社区上也有很多开源的dashboards模板,我们只需要把模板的Copy ID 或者 Download JSON文件导入到grafana即可,参考官网免费的dashboards模板。
  2. 官方模板地址:https://grafana.com/grafana/dashboards/
复制代码
进入官网,往下拉,可以看到选择这几个,Data Source 选择Prometheus,然后搜刮主机监控,大概本身界说,linux什么的都可以,根据本身的需求选择

可以看到右边有Copy ID 和 Download JSON,自行选择就行;这里我选择复制id,json需要下载

复制好id之后,打开在 grafana 页面中,+ Create -> Import ,输入面板 ID 号大概上传 JSON 文件,点击 Load,即可导入监控面板


添加完成后页面视图如下



免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

自由的羽毛

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表