农民 发表于 2024-12-22 19:06:54

CPU性能优化-磁盘空间和分析时间

纵然考虑了跟踪文件的压缩格式,编码后的数据仍旧会占用很大的磁盘空间。通常,每条指令不凌驾1字节,但是考虑到CPU实行指令的速度,数据仍旧非常多。根据负载,CPU编码以100MB/s的速度处理PT跟踪文件的情况是很常见的,分析后的数据可能增长10倍多(约1GB/s)。这使得PT工具并不实用于长时间运行的负载,但是,纵然是大负载程序也可以用PT运行一小段时间。在这种情况下,用户可以只在题目发生时绑定一小会运行进程。别的,也可以使用环形缓冲区,在环形缓冲区中新的跟踪数据可以覆盖老的。例如,总是跟踪最后10s的数据。
   用户可以通过多种方式进一步限制收罗,可以限制只跟踪用户或内核空间的代码。别的,另有一个地址过滤的功能,这样就可以动态的控制跟踪的开启和关闭以限制内存带宽,这使得我们可以只跟踪一个函数,甚至一个循环。
   分析PT跟踪文件很耗时。在Intel Core i5-8259U机器上,对于跑7ms的负载程序, 编码的PT跟踪文件大概1MB. 使用perf script分析它大概须要20s。使用下令perf script-F time, ip, sym, symoff, insn 的分析效果大概悍勇1.3GB的磁盘空间。
   个人履历,Intel PT工具被认为是性能分析的终极本领,有着较低的运行开销,是非常强大的分析工具。然而,到2020年2月为止,用perf script-F带+srcline或者+srccode参数分析跟踪文件会变得相当慢,在一样平常使用中不太实用。linux perf 工具的实现有待进步,Intel VTune profile对PT技能的支持照旧处于实行阶段。
   6.5 本章总结
   1 只有当上层的性能题目解决了,才建议使用硬件特性进行底层的调优
   2 TMA方法是一种非常强大的技能,可以辨认程序CPU微架构低效利用,这是一个稳健而且正式的方法
   3 最后分支记录LBR 机制可以在运行程序的同时进行持续的记录最近跳转分支指令的输出,产生的性能损耗最小。
   4 基于处理器事件的采样PEBS 是另一个性能分析增强技能,它通过不使用停止的方式自动多次对特定的缓冲区采样来降低采样的开销,不过,PEBS更广为人知的名字是“”精准事件,可以精准定位导致某个性能事件的详细指令。Intel处理器支持该特性,AMD处理器也有类似的特性,基于指令的采样。
   5 Intel处理器追踪PT技能是一个可以记录程序实行过程并把报文编码到高压缩率二进制文件的技能,该压缩文件可以基于每条指令的时间戳重建程序的实行流。PT技能覆盖度大,开销小。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页: [1]
查看完整版本: CPU性能优化-磁盘空间和分析时间