CUDA编程练习(八) Nsight System使用与服务器连接

打印 上一主题 下一主题

主题 943|帖子 943|积分 2829

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?立即注册

x
1 想法

不为别的,下次再有为什么优化不可,也能有理有据,生动直观。减轻对于sanity值的斲丧。
2 实践

Ubuntu的Nvidia官方镜像安装,可以自搜,本站有。nsys版本号如下:
  1. NVIDIA Nsight Systems version 2023.1.1.127-32365746v0
复制代码
2.1 CLI下令

这里只先容几个大概常用的,因为主要还是用GUI,以防个人电脑出现各种题目(主要是连接不了内网,然后SSH用不了,你知道的,这对一个颠沛流浪的人来说,是一件常有的事情)。
nsys profile:开始一个新的性能分析会话。这是最常用的下令,主要用于网络应用步伐的性能数据。


  • -o <output>:指定输出文件名。
  • -t <trace>:指定要跟踪的活动(比方,cuda,opengl,osrt 等)。
  • --duration <seconds>:设置采集数据的连续时间。
nsys launch:与 nsys profile 雷同,但可以直接指定应用步伐下令和参数


  • <application>:指定要启动的应用步伐。
  • <arguments>:为应用步伐提供的下令行参数。
nsys stop
nsys report


  • -i <input>:指定输入的性能数据文件。
  • -o <output>:指定输出陈诉文件名。
  • --format <format>:指定陈诉格式(比方,html,txt,csv)。
nsys extract


  • 从性能数据文件中提取特定的信息,用于进一步的分析和处理。
nsys stats,统计输出文件的内容


  • -i <input>:指定输入的性能数据文件
2.1.1 你看,这就是docker ((;>

那些没权限的docker是如许的
  1. WARNING: CPU IP/backtrace sampling not supported, disabling.
  2. Try the 'nsys status --environment' command to learn more.
  3. WARNING: CPU context switch tracing not supported, disabling.
  4. Try the 'nsys status --environment' command to learn more.
  5. // nsys status --environment查看情况
  6. Timestamp counter supported: Yes
  7. CPU Profiling Environment Check
  8. Root privilege: enabled
  9. Linux Kernel Paranoid Level = 2
  10. Linux Distribution = Ubuntu
  11. Linux Kernel Version = 3.10.0-1160.el7.x86_64: Fail
  12. Linux perf_event_open syscall available: Fail
  13. Sampling trigger event available: Fail
  14. Intel(c) Last Branch Record support: Not Available
  15. CPU Profiling Environment (process-tree): Fail
  16. CPU Profiling Environment (system-wide): Fail
复制代码
2.1.2 正常环境

正常环境必须使用root账号,uno?@服务器管理员
分析与输出
nsys profile -o analysis_test -t cuda,osrt ./convolution
html可视化
nsys report -i analysis_test .qdrep -o test_report --format html
提取信息
nsys extract -i analysis_test .qdrep -o cuda_api_calls --cuda-api-trace
统计信息
nsys stats -i analysis_test .qdrep
2.2 GUI

2.2.1 连接步骤


小插曲:服务器内存又爆了,这波,又得清理空间
2.2.2 使用方法

非常简单!

2.2.3 现在的可用信息


选择左边的CUDA Summary,直接就能看到各个部分用时,方便!
3 总结

非常简单!
现在的需求就到这,nsight compute的独特作用尚未显现,你看人家nsys可视化多好看
(bug还是有的,nsys解析文件卡住。。。话说我为什么要为人家测试新版软件?)

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

张国伟

金牌会员
这个人很懒什么都没写!
快速回复 返回顶部 返回列表