Linux 体系检测进程死锁的方法
Linux 体系检测进程死锁的方法在 Linux 体系中,可以利用多种方法来检测进程是否发存亡锁(Deadlock)。
1. 利用 ps + strace 观察进程状态
可以利用 ps 下令检察进程状态:
ps -eo pid,lwp,stat,wchan:30,cmd | grep <进程名或PID>
关键字段:
[*]STAT(状态):
[*]D:不可中断睡眠(通常是 I/O 问题)
[*]R:运行态
[*]S:可中断睡眠
[*]T:暂停(大概被 SIGSTOP 信号暂停)
[*]WCHAN(等候通道):假如多个线程在同一个 WCHAN 挂起,大概是死锁。
假如猜疑死锁,可以利用 strace 附加到进程,检察体系调用是否卡住:
strace -p <PID>
假如进程不绝停顿在 futex、sem_wait、pthread_mutex_lock,大概是线程死锁。
2. 利用 lsof 查抄资源锁定
lsof 可以查抄进程打开的文件或锁定的资源:
lsof -p <PID>
假如多个进程/线程对雷同资源(如文件或 socket)持有锁,而且都在等候,大概是死锁。
假如要查抄进程是否因文件锁(flock/fcntl)死锁:
lsof | grep -i "locked"
3. 利用 pstack 或 gdb 检察线程栈
假如是多线程程序,利用 pstack 或 gdb 检察线程堆栈:
pstack <PID>
或利用 gdb:
gdb -p <PID>
(gdb) thread apply all bt
假如多个线程都卡在 pthread_mutex_lock,大概是死锁。
4. 利用 proc 文件体系查抄 futex
假如猜疑进程死锁在 futex(用户态线程锁),可以查抄 /proc/<PID>/stack:
cat /proc/<PID>/stack
假如多个线程都在 futex_wait_queue_me,大概是死锁。
5. 利用 perf 观察锁争用
假如猜疑死锁涉及锁争用,可以利用 perf:
perf record -g -p <PID>
perf report
检察 pthread_mutex_lock 或 futex_wait 是否高频出现。
6. 利用 lockstat 监测锁争用
假如是内核级死锁,可以利用 lockstat(部门发行版需要开启 CONFIG_LOCK_STAT):
echo 1 > /proc/sys/kernel/lock_stat
cat /proc/lock_stat
7. 利用 dmesg 观察内核死锁
某些情况下,内核大概会检测到死锁并输出警告:
dmesg | grep -i deadlock
假如有干系信息,说明体系大概存在死锁。
总结
[*]ps, strace 用于分析进程状态和体系调用卡住的位置。
[*]lsof 用于查抄文件或资源锁。
[*]pstack, gdb 用于分析线程堆栈,判定是否多个线程卡在锁等候上。
[*]proc 文件体系(/proc/<PID>/stack)可用于查抄 futex 死锁。
[*]perf, lockstat 用于更深入分析锁争用情况。
[*]dmesg 可用于查抄内核是否检测到死锁。
你可以结合这些方法,具体看进程是否真的发生了死锁。
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页:
[1]