在Ubuntu Server上安装Checkmk监控体系
一、安装前准备[*]更新体系并安装依赖:
sudo apt update && sudo apt upgrade -y
sudo apt install -y wget apt-transport-https
二、安装Checkmk(开源版)
[*]添加Checkmk仓库:
wget https://checkmk.com/support/1.6.0p30/check-mk-raw-2.1.0p30_0.jammy_amd64.deb
sudo dpkg -i check-mk-raw-2.1.0p30_0.jammy_amd64.deb
sudo apt install -f
[*]创建监控实例:
sudo omd create monitoring
sudo omd start monitoring
[*]开放防火墙端口(HTTP/HTTPS):
sudo ufw allow 80/tcp
sudo ufw allow 443/tcp
sudo ufw reload
三、访问Web界面
[*]访问 http://your-server-ip/monitoring,利用默认凭据登录:
[*]用户名: cmkadmin
[*]密码: 安装时天生的密码(检察 /omd/sites/monitoring/etc/htpasswd)。
配置被监控装备
一、监控Linux服务器
[*]在目的服务器上安装Checkmk Agent:
wget http://<checkmk-server-ip>/monitoring/check_mk/agents/check-mk-agent_2.1.0p30-1_all.deb
sudo dpkg -i check-mk-agent_*.deb
sudo systemctl restart xinetd# 确保xinetd服务运行
[*]在Checkmk Web界面添加主机:
[*]导航到 Setup > Hosts > Add host。
[*]输入主机名、IP地址,选择 Checkmk Agent 监控方式。
[*]点击 Save & Run Service Discovery,应用更改。
二、监控网络装备(交换机/路由器/防火墙)
[*]在装备上启用SNMP(以Cisco装备为例):
! 进入配置模式
configure terminal
snmp-server community YourCommunityString RO# 设置只读社区字符串
snmp-server host <checkmk-server-ip> version 2c YourCommunityString
exit
[*]在Checkmk中添加SNMP装备:
[*]导航到 Setup > Hosts > Add host。
[*]输入装备名称、IP地址,选择 SNMP 监控方式。
[*]配置SNMP版本(如v2c)及社区字符串。
[*]点击 Save & Run Service Discovery,勾选接口流量监控项(如 Interface statistics)。
三、监控堡垒机(以Linux堡垒机为例)
[*]通过SSH或Agent监控:
[*]若支持SNMP,按网络装备方式添加。
[*]若不支持SNMP,通过Checkmk Agent(同Linux服务器步调)。
配置接口流量监控
[*]在服务发现结果中启用接口监控:
[*]在主机页面点击 Service Discovery。
[*]勾选要监控的接口(如 Interface Ethernet0)。
[*]点击 Activate 应用更改。
[*]自界说流量阈值:
[*]导航到 Setup > Hosts > Services,选择接口服务。
[*]修改 Check parameters 设置告警阈值(如带宽利用率超80%告警)。
定时备份平台数据
一、手动备份
sudo omd backup monitoring# 备份文件默认存储在 `/var/lib/omd/backups/`二、主动备份(Cron任务)
[*]创建备份脚本:
sudo nano /usr/local/bin/checkmk_backup.sh#!/bin/bash
omd backup monitoring > /dev/null
find /var/lib/omd/backups/ -name "*.tar.gz" -mtime +30 -exec rm {} \;
[*]设置定时任务:
crontab -e0 2 * * * /usr/local/bin/checkmk_backup.sh# 每天凌晨2点备份
日常维护事项
[*]监控日志:
[*]Checkmk日志路径:/omd/sites/monitoring/var/log/.
[*]查抄 nagios.log 和 cmc.log 是否有错误。
[*]更新Checkmk:
sudo apt update
sudo apt install check-mk-raw-<新版本号>
sudo omd update monitoring
[*]整理旧数据:
[*]在Web界面调解数据保留策略:Setup > General > Global Settings > History。
注意事项
[*]SNMP安全:
[*]利用SNMPv3替代v2c(配置加密用户)。
[*]限定SNMP访问IP(通过装备ACL或防火墙)。
[*]权限管理:
[*]利用Checkmk的 Roles & Users 功能分配最小权限。
[*]制止利用默认密码,定期更换凭据。
[*]高可用性:
[*]若监控装备凌驾500台,考虑分布式部署(主从监控节点)。
[*]资源监控:
[*]监控Checkmk服务器资源(CPU/内存/磁盘),制止因负载过高丢数据。
[*]防火墙规则:
[*]答应Checkmk服务器访问装备的SNMP(UDP 161)和Agent(TCP 6556)端口。
故障排查示例
[*]SNMP监控失败:
snmpwalk -v2c -c YourCommunityString <设备IP> 1.3.6.1.2.1.1.1.0# 测试SNMP连通性
[*]Agent无数据:
telnet <目标服务器IP> 6556# 检查Agent端口是否开放
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页:
[1]