生产系统CPU飙高问题排查

打印 上一主题 下一主题

主题 737|帖子 737|积分 2211

现状

生产系统CPU占用过高,并且进行了报警

排查方法

执行top命令,查看是那个进程导致的,可以确定是pid为22168的java应用导致的

执行top -Hp命令,查看这个进程的那个线程导致cpu过高,如下图,可以看到是22749线程导致的
  1. top -Hp 22168
复制代码

由于jstack里面的线程号为16进制,需要转换线程号为16进制,如下图得到16进制值为58dd
  1. printf "%x\n" 22749
复制代码

执行jstack生成线程快照保存至1.txt文件中,22168为进程id
  1. jstack 22168>1.txt
复制代码
根据16进制线程号,查询线程信息
  1. grep 58dd 1.txt
复制代码

如上图,可以看到是调用DesenUtils.desen方法导致,此方法作用是数据脱敏,里面用了较为复杂的正则表达式,所以分析是由于特定字符正好遇到此正则表达式,进行大量计算导致,具体细节请访问(https://cloud.tencent.com/developer/article/1780881),为了快速解决此问题,先去除掉此代码的调用,重新发布即可。
总结

线上问题定位,相对比较简单,难点主要在于保留现场,有了现场就能快速定位问题,以下是二种常用排查方式

  • CPU飙高通过jstack命令,定位到线程信息。
  • 内存飙高通过jmap dump出堆栈信息,在通过mat这些工具定位那个类占用过多内存。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

惊落一身雪

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表