监控服务器GPU、CPU和内存使用情况的方法(Windows和Liunix环境) ...

打印 上一主题 下一主题

主题 653|帖子 653|积分 1961

一、Liunix环境下实时监控NVIDIA GPU资源动态

Watch命令

在服务器shell的命令行界面中键入以下代码,可以实时监控GPU显存和盘算单元占用情况(但请注意这会独占一个毗连窗口,关闭后重新打开毗连就会导致监控排除),通常要避免两项较大显存占用的任务被同时放在一张卡里举行盘算的情况。在这个监视窗口下可以看到服务器内全部显卡的工作状态,温度,功率,显存占用情况,算力单元占用情况等。同时也可以观测到驱动程序的版本,CUDA的版本等信息。
  1. watch -n 1 nvidia-smi
复制代码
其中,-n后面的1是革新速率,可以设置成任意数值,设置1,也就是1秒钟检察一次占用率(没须要太短,监视进程也会浪费服务器资源)。上述命令会得到如下图所示的监视窗口:

Liunix环境下实时监控服务器CPU资源动态

Top命令

同样的,不仅可以监视GPU,我们也可以在shell中键入以下两类命令来监控CPU的使用情况,起首第一种是:
  1. top
复制代码
在命令行输入top
就可以实现对服务器进程的监控,此时可以看到多个用户的进程,以及PID,假如碰到有进程卡在了内里可以采取kill + PID的方式竣事进程。如下图所示:

Htop
命令


同时也可以采取内置的更高级的视觉窗口来更直观的监视CPU和内存的使用情况:
  1. htop
复制代码
htop

能够更直观的体现活跃进程,单个进程或多个线程的具体内存1和CPU的占用情况,并且会报告当前全部服务器用户的内存使用状况,并且有更多的F-系列的直接命令可供使用。

Liunix环境下如何杀死无效进程

由于终端机死机,或因为一些其他的因素导致有进程被卡在服务器的GPU里大概CPU里,占着显存活着内存,但是无法在终端机用IDE举行竣事,或无法立刻竣事回收资源,这时间该怎么办?
起首,用上文的方法打开GPU或CPU监视窗口,根据你自身的UID大概准确的定位无效进程的PID,使用Kill命令来杀死进程,立刻开释相干的盘算资源,比方杀死进程PID=14320:
  1. kill 14320
复制代码
二、Windows环境下如何检察GPU状况

NVIDIA的命令在Windows中也同样实用
  1. nvidia-smi
复制代码

Windows环境下如何检察进程内存占用情况

  1. tasklist
复制代码

Windows环境下如何杀死无效进程

通过上述方法可以检察到占用端标语的进程的PID,这时间就可以直接杀掉进程相干。
 比方,杀死PID=4396的进程,并杀死其子进程。
  1. taskkill /PID 4396 -t -f
复制代码
其中,/PID processid 指定要停止的进程的 PID。/F 指定欺压停止进程。/T 停止指定的进程和由它启用的子进程
  1. [参考链接]
  2. https://blog.csdn.net/qq_39381654/article/details/115957538?spm=1001.2014.3001.5502
复制代码
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

南七星之家

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表