张国伟 发表于 2024-8-17 01:20:26

CUDA编程练习(八) Nsight System使用与服务器连接

1 想法

不为别的,下次再有为什么优化不可,也能有理有据,生动直观。减轻对于sanity值的斲丧。
2 实践

Ubuntu的Nvidia官方镜像安装,可以自搜,本站有。nsys版本号如下:
NVIDIA Nsight Systems version 2023.1.1.127-32365746v0 2.1 CLI下令

这里只先容几个大概常用的,因为主要还是用GUI,以防个人电脑出现各种题目(主要是连接不了内网,然后SSH用不了,你知道的,这对一个颠沛流浪的人来说,是一件常有的事情)。
nsys profile:开始一个新的性能分析会话。这是最常用的下令,主要用于网络应用步伐的性能数据。


[*]-o <output>:指定输出文件名。
[*]-t <trace>:指定要跟踪的活动(比方,cuda,opengl,osrt 等)。
[*]--duration <seconds>:设置采集数据的连续时间。
nsys launch:与 nsys profile 雷同,但可以直接指定应用步伐下令和参数


[*]<application>:指定要启动的应用步伐。
[*]<arguments>:为应用步伐提供的下令行参数。
nsys stop
nsys report


[*]-i <input>:指定输入的性能数据文件。
[*]-o <output>:指定输出陈诉文件名。
[*]--format <format>:指定陈诉格式(比方,html,txt,csv)。
nsys extract


[*]从性能数据文件中提取特定的信息,用于进一步的分析和处理。
nsys stats,统计输出文件的内容


[*]-i <input>:指定输入的性能数据文件
2.1.1 你看,这就是docker ((;>

那些没权限的docker是如许的
WARNING: CPU IP/backtrace sampling not supported, disabling.
Try the 'nsys status --environment' command to learn more.

WARNING: CPU context switch tracing not supported, disabling.
Try the 'nsys status --environment' command to learn more.


// nsys status --environment查看情况
Timestamp counter supported: Yes

CPU Profiling Environment Check
Root privilege: enabled
Linux Kernel Paranoid Level = 2
Linux Distribution = Ubuntu
Linux Kernel Version = 3.10.0-1160.el7.x86_64: Fail
Linux perf_event_open syscall available: Fail
Sampling trigger event available: Fail
Intel(c) Last Branch Record support: Not Available
CPU Profiling Environment (process-tree): Fail
CPU Profiling Environment (system-wide): Fail
2.1.2 正常环境

正常环境必须使用root账号,uno?@服务器管理员
分析与输出
nsys profile -o analysis_test -t cuda,osrt ./convolution
html可视化
nsys report -i analysis_test .qdrep -o test_report --format html
提取信息
nsys extract -i analysis_test .qdrep -o cuda_api_calls --cuda-api-trace
统计信息
nsys stats -i analysis_test .qdrep
2.2 GUI

2.2.1 连接步骤

https://img-blog.csdnimg.cn/direct/f386d87b21f348c087b8fd5353dd4869.png
小插曲:服务器内存又爆了,这波,又得清理空间
2.2.2 使用方法

非常简单!
https://img-blog.csdnimg.cn/direct/b93989e983e44a8b917517ee0361c7be.png
2.2.3 现在的可用信息

https://img-blog.csdnimg.cn/direct/999a1c49573e4e799e479248ade8a89f.png
选择左边的CUDA Summary,直接就能看到各个部分用时,方便!
3 总结

非常简单!
现在的需求就到这,nsight compute的独特作用尚未显现,你看人家nsys可视化多好看
(bug还是有的,nsys解析文件卡住。。。话说我为什么要为人家测试新版软件?)

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页: [1]
查看完整版本: CUDA编程练习(八) Nsight System使用与服务器连接