张国伟 发表于 2023-11-22 09:59:06

[运维笔记]内网服务器或设备宕机了怎么及时收到通知并处理

前言

此前公司内网的一台服务器运行着六七个各种各样的后台任务,还跑着几个客户端。之后有一天晚上,公司里断电了,服务器也就停了,因为不是关键业务,所以之后几天谁也没发现,直到一周后才发现服务器没在处理。
那怎么在服务器宕机时及时知道呢

目前的简单办法:
无非在服务器上跑个定时任务,发个请求到某些第三方服务上,请求到达,说明服务器正在运行;
如果很长一段时间,请求没有发送过来,说明服务器估计就宕机了,立刻发个通知到企业微信群或钉钉群里。
这样管理员就可以及时的去处理问题。怎么做,具体步骤:

注意:操作系统 Linux,这里我们以熊猫监控(xmtui.com)提供的服务为例子
创建 cron 任务:

[*]使用 SSH 连接到服务器/计算机
[*]输入 crontab -e
[*]选一个你常用的编辑器
[*]添加如下条目(每隔5分钟发送一次请求):
*/5 * * * * wget --spider "https://jiankong.xmtui.com/push/oooooooo-xxxxxxxxxxxxxxx" >/dev/null 2>&1
将这里的 URL 替换为你自己的 心跳包监控项的 URL,并将该/5部分替换为相应的间隔值。
你也可以curl的方式:
*/5 * * * * curl --insecure https://jiankong.xmtui.com/push/oooooooo-xxxxxxxxxxxxxxx >/dev/null 2>&1
[*]保存并关闭文件(无需重新启动)
这样熊猫监控(xmtui.com)在没有收到请求时,就可以及时的向我们管理员发送通知。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
页: [1]
查看完整版本: [运维笔记]内网服务器或设备宕机了怎么及时收到通知并处理