简单prometheus+grafana+pushgateway收罗GPU使用率和交换机流量 ...

打印 上一主题 下一主题

主题 1031|帖子 1031|积分 3093

1、prometheus+pushgateway

从https://prometheus.io/download/下载prometheus和pushgateway
下载后修改prometheus.yaml
pushgateway必要设置honor_labels: true才气保留原来的job、instance等

然后启动:./prometheus --config.file=“./prometheus.yml”
./pushgateway
访问pushgateway:http://x.x.x.x:9091
查看pushgateway数据:http://x.x.x.x:9091/metrics
留意:pushgateway只保留最后一次推送的值,prometheus拉取的时候也是拉取pushgateway当前存储的值
查看prometheus:http://x.x.x.x:9090

Status->Targets内里可以检查目标状态、前次拉取时间等
留意:http://x.x.x.x:9090/metrics并不能查看到全部表项
2、grafana

grafana安装:
apt-get install -y software-properties-common
wget -q -O - https://packages.grafana.com/gpg.key | sudo apt-key add -
add-apt-repository “deb https://packages.grafana.com/oss/deb stable main”
apt install grafana
systemctl start grafana-server
systemctl enable grafana-server
登录:http://x.x.x.x:3000
用户名暗码admin admin
有的exporter源码会提供grafana设置文件,比如dcgm-exporter中:
dcgm-exporter\grafana\dcgm-exporter-dashboard.json
在Home->Dashboards->New->Import中导入json就可以看到图形
修改Y轴的单元

对应panel右上角三个点中选择Edit,Standard options,Uint中选择(忘了。。待确认)
安装dcgm-exporter

https://github.com/NVIDIA/dcgm-exporter
下载源码,然后:
kubectl create namespace gpu-monitoring
kubectl apply dcgm-exporter/service-monitor.yaml
kubectl apply dcgm-exporter/dcgm-exporter.yaml -n gpu-monitoring
创建nodeport并提交
  1. apiVersion: v1
  2. kind: Service
  3. metadata:
  4.   name: dcgm-exporter
  5.   namespace: gpu-monitoring
  6. spec:
  7.   selector:
  8.     app.kubernetes.io/name: dcgm-exporter
  9.   ports:
  10.   - port: 9400
  11.     targetPort: 9400
  12.     nodePort: 30094
  13.   type: NodePort
复制代码
测试:curl http://localhost:30094/metrics
题目1:
  1. error: resource mapping not found for name: "dcgm-exporter" namespace: "" from "service-monitor.yaml": no matches for kind "ServiceMonitor" in version "monitoring.coreos.com/v1"
  2. ensure CRDs are installed first
复制代码
下载https://github.com/prometheus-operator/prometheus-operato,提交prometheus-operator\prometheus-operator\example\prometheus-operator-crd\monitoring.coreos.com_servicemonitors.yaml

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

用户云卷云舒

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表