ToB企服应用市场:ToB评测及商务社交产业平台

标题: ptx指令,抽象指令与架构 [打印本页]

作者: 万有斥力    时间: 2024-6-11 08:42
标题: ptx指令,抽象指令与架构
(没用的题目:ptx如何抽象sass,它创造ir的方式和结果与mlir 创造ir有什么区别吗?)
PTX操作数范例:
PTX中常见和基础的opcode的例子:

了解PTX指令集对学习编译器有多方面的帮助:
了解PTX指令集可以为你在编译器学习路程中提供一个更深层次的视角,让你可以或许更好地理解、优化和利用GPU计算的潜力。这对于高性能计算、图形渲染、深度学习等领域都黑白常有价值的。

sass:
  1. /*0100*/        FSETP.NEU.AND P0, PT, |R10|, +INF , PT ;  /* 0x7f8000000a00780b */
  2.                                                           /* 0x000fd80003f0d200 */
  3. /*0110*/   @!P0 BRA 0x4c0 ;                               /* 0x000003a000008947 */
  4.                                                           /* 0x000fea0003800000 */
  5. /*0120*/        IMAD.SHL.U32 R4, R10, 0x100, RZ ;         /* 0x000001000a047824 */
  6.                                                           /* 0x000fe200078e00ff */
复制代码
/*0100*/是该行指令的地址(零点是当前kernel的起始位置,单位是Byte)
/* 0x780000000a00780b..*/ 是机器指令
/* 0x000fd80003f0d2000..*/ control codes 说什么还有和线程相关的,不懂
https://docs.nvidia.com/cuda/pdf/ptx_isa_8.4.pdf

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。




欢迎光临 ToB企服应用市场:ToB评测及商务社交产业平台 (https://dis.qidao123.com/) Powered by Discuz! X3.4