论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
只需一步,快速开始
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
ToB企服应用市场:ToB评测及商务社交产业平台
»
论坛
›
主机系统
›
linux
›
自从用了这些监控工具,我连续几天没睡好觉! ...
自从用了这些监控工具,我连续几天没睡好觉!
南七星之家
金牌会员
|
2024-8-17 20:49:11
|
显示全部楼层
|
阅读模式
楼主
主题
884
|
帖子
884
|
积分
2654
各人好,我是程序员鱼皮,本日分享一些很实用的系统监控诉警工具。
为什么要用监控诉警?
说到监控诉警,没有企业开辟经验的同学非常轻易忽视它,甚至会有同学以为没有必要,大不了出了 Bug 再修就是了。
这种想法大错特错!
我们把系统想象成人的身体。有的时候,一个人表面看起来可能很康健,但可能只是没有机会发现本身体内的异常,结果等到真的出事了,往往要承担的结果更严重。以是才需要定期体检,及时发现和处理标题。系统监控诉警的作用也是类似的,可以或许及时发现系统中潜伏的异常和标题、线上出了标题也能第一时间发现,尽早处理,从而预防或减轻故障。
别的,监控系统还有一些其他的好处,我们接着往下看。
怎么实现监控诉警呢?
最直接能想到的办法就是本身写代码实现,好比给要重点关注的功能加点儿逻辑,出现某个异常的时候发送一条短信 / 邮件 / 企微消息即可。我们最开始就是这么做的:
但其实业务告警只是监控诉警的其中一个层面,就像是人体的表面皮肤检查。如果我们想更全面地、更准确地监控系统的康健,还要里里外外做个全方位的体检,包罗服务器监控、网络监控、应用监控、数据库监控、API 接口监控等等。
是的,听上去就很复杂,以是监控在当代运维中有了一个更专业的别名,叫 “可观测性”。可观测性是指系统可以或许通过监控和分析其内部状态来了解和诊断其康健状况和性能的能力。这个概念不但包含了传统的监控,还扩展到了数据的收集、分析和响应。举个例子,我们通过监控发现系统的内存利用率不高,就可以得当降配节约成本;发现系统的内存利用率过高,就可以思量是否要升配扩容。
想要本身优化系统的可观测性照旧很复杂的,数据收集、数据存储、数据分析、告警机制、可用性保障、性能等等都要思量,大厂都是有规模的基础办法团队来做。
对于我们个人开辟者或者小公司来说,既然是全方位的 “体检”,我们一般不会本身来做,而是会选择更专业的工具或服务,直接利用和接入就好。下面就推荐几个我们团队在用的。
监控工具推荐
1、服务器监控
1)服务器自带的监控能力
只要你利用的是大厂的云服务器,根本都自带了服务器监控,还可以设置告警。好比下图腾讯云轻量应用服务器的监控,能看到 CPU、内存、网络带宽、硬盘等资源的利用情况:
2)容器平台的监控能力
如果你利用的是容器的方式来部署项目,根本上容器平台也自带了监控诉警能力。好比微信云托管的服务监控,除了看到系统资源的占用情况外,还能看到接口调用量、请求错误量、接口 QPS 和响应时间,相称于自带了一部分 API 接口监控能力。
而且云托管平台支持在微信群内接收告警信息,非常方便。一旦节点被攻击了,立刻就能通知到你。
2、数据库监控
以前,没有数据库监控,我们很难关注到数据库的运行状态,不知道它工作辛不辛劳、有没有摸鱼或者超负荷加班。但现在,如果你利用的是第三方云服务商的云数据库,可以直接在平台上查看数据库的资源利用情况。好比我们用的腾讯云数据库自带的监控:
以前只能通过用户反馈或者服务器的故障来发现危害系统的慢 SQL,现在利用云数据库自带的智能管家,就能第一时间帮你发现慢 SQL,防患于未然。
还能一键帮你的数据库做个体检,不是 100 分的话都要及时修改:
3、应用监控
应用监控的范围比力广,我们利用的是阿里云的应用实时监控服务 ARMS,重要的缘故原由是对比下来阿里在 Java 应用服务这一块的专业性确实更高。
包罗应用服务器(好比 Java 的 Tomcat)的状态、API 接口调用情况、系统内部依赖服务的调用情况、定时任务的调用情况、线程池的状态、假造机的内存、GC 的情况等等。
还能查看应用拓扑结构、分析调用链路等等:
除了监控能力外,它的告警能力是真的强!我们把服务接入到了企微,只要有个环节出了标题,立刻就会给我们发送告警。还可以快速查看告警详情、认领告警、屏蔽告警等等。
实不相瞒,我们刚接入这玩意的那几天,照旧挺痛苦的,由于暴露了很多之前没发现的系统标题,大半夜的企微也不停滴滴滴滴滴滴搁那响!我们团队的开辟同学苦不堪言。
不过现在已经风俗了。。。额,准确地说是系统颠末优化后,已经变得更康健了~
不管怎么样,接入监控诉警照旧很有必要的,感觉像是开了通透世界,对系统的状态了若指掌了!
但是监控服务的利用凌驾肯定次数,是需要费用的,大概每月几十 G 的免费额度吧,企业项目的话其实很快就用完了。用于学习或者个人网站可以试试。
4、前端监控
除了上面的监控外,有时我们还想了解用户的举动、用户属性和业务指标,好比天天有多少用户访问网站、是用的 PC 照旧手机、手机是什么牌子的、有多少新用户注册等等。那么可能还需要前端监控(当然也可以后端埋点统计),之前分享过的,用百度统计,一行代码就能接入到前端网站中,很方便~
OK,以上就是本期分享,恰饭去了~
更多
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
南七星之家
金牌会员
这个人很懒什么都没写!
楼主热帖
详讲Java开发中的六个常用API(Math,S ...
MySQL并行复制(MTS)原理(完整版) ...
【K8S】K8S入门基础知识
软件项目管理 3.5.敏捷生存期模型 ...
鸿蒙到底是不是安卓?
java中Collections.addAll方法具有什么 ...
云原生之 Docker篇 Docker Stack介绍及 ...
BOS EDI 项目 Excel 方案开源介绍 ...
postman结合newman生成测试报告 ...
ArrayList分析2 :Itr、ListIterator以 ...
标签云
挺好的
服务器
快速回复
返回顶部
返回列表