ToB企服应用市场:ToB评测及商务社交产业平台

标题: GPU架构概述 [打印本页]

作者: 何小豆儿在此    时间: 2024-11-7 18:59
标题: GPU架构概述
                                   GPU                              \textbf{GPU}                  GPU架构与                                   CUDA                              \textbf{CUDA}                  CUDA编程模型

                                             1.                                                               GPU                              \textbf{1. }\textbf{GPU}                  1. GPU体系结构

   1️⃣计算单位组织架构
  
  结构功能                                                       CUDA                                              \text{CUDA}                              CUDA焦点雷同                                                       ALU                                              \text{ALU}                              ALU(但远没                                                       CPU                                              \text{CPU}                              CPU的灵活),可执行浮点运算/张量运算/光线追踪(高级焦点)                                                       Warp                                              \text{Warp}                              Warp多焦点共用一个取指/译码器,按                                                       SIMT                                              \text{SIMT}                              SIMT工作(全部线程指令雷同/数据可不同)                                                       SM                                              \text{SM}                              SM包含多组                                                       Warps                                              \text{Warps}                              Warps,全部                                                       CUDA                                              \text{CUDA}                              CUDA焦点共用一套执行上下文(缓存)                                                       &                                              \&                              &共享内存  2️⃣存储条理架构:

                                       2.                                                        \textbf{2. }                  2.                                    CUDA                              \textbf{CUDA}                  CUDA编程模型

   1️⃣                                        CUDA                                  \text{CUDA}                     CUDA步伐简述
    2️⃣线程并行执行架构
                                       3.                                                   CPU                              \textbf{3. CPU}                  3. CPU与                                   GPU                              \textbf{GPU}                  GPU

   
  1️⃣                                        CPU/GPU                                  \text{CPU/}\text{GPU}                     CPU/GPU结构对比
                                                         GPU                                              \text{GPU}                              GPU                                                       CPU                                              \text{CPU}                              CPU                                                       ALU                                              \text{ALU}                              ALU功能强但数量少(只占                                                       GPU                                              \text{GPU}                              GPU小部),时钟频率极高功能弱但数量大,时钟频率低                                                       Cache                                              \text{Cache}                              Cache容量大并分级,缓存后续访问数据容量很小,用于提高线程服务控制复杂串行逻辑,如流水/分支预测/乱序执行简单(但大规模)并行逻辑  3️⃣                                        CPU                                       ↔                                                        数据                                     /                                     指令传输                                                                  PCIe                                                 GPU                                  \text{CPU} \xleftrightarrow[数据/指令传输]{\text{PCIe}} \text{GPU}                     CPUPCIe                            数据/指令传输​GPU交互
  设备逻辑职位                                                       IO                                              \textbf{IO}                              IO模块任务分配                                                       GPU                                              \text{GPU}                              GPU外设                                                       IO Block                                              \text{IO Block}                              IO Block(南桥)控制逻辑和任务调度                                                       CPU                                              \text{CPU}                              CPU主机                                                       Copy Engine                                              \text{Copy Engine}                              Copy Engine执行大量并行计算任务
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。




欢迎光临 ToB企服应用市场:ToB评测及商务社交产业平台 (https://dis.qidao123.com/) Powered by Discuz! X3.4