ToB企服应用市场:ToB评测及商务社交产业平台

标题: GPU 架构概述 费米(Feimi)、开普勒(Kepler)、麦克斯韦(Maxwell)、帕 [打印本页]

作者: 西河刘卡车医    时间: 2024-7-25 22:18
标题: GPU 架构概述 费米(Feimi)、开普勒(Kepler)、麦克斯韦(Maxwell)、帕
GPU 架构概述

本文主要介绍 NVIDIA GPU 每一代架构的技术发展和架构之间的区别和联系,时间跨度从 2010 年至 2017 年,包罗费米(Feimi)、开普勒(Kepler)、麦克斯韦(Maxwell)、帕斯卡(Pashcal)和伏特(Volt)架构。
    架构名称   Fermi   Kepler   Maxwell   Pascal   Volta         中文名字   费米   开普勒   麦克斯韦   帕斯卡   伏特       发布时间   2010   2012   2014   2016   2017       核心参数   16 个 SM,每个 SM 包罗 32 个 CUDA Cores,一共 512 CUDA Cores   15 个 SMX,每个 SMX 包罗 192 个 FP32+64 个 FP64 CUDA Cores   16 个 SM,每个 SM 包罗 4 个处理块,每个处理块包罗 32 个 CUDA Cores+8 个 LD/ST Unit + 8 SFU   GP100 有 60 个 SM,每个 SM 包罗 64 个 CUDA Cores,32 个 DP Cores   80 个 SM,每个 SM 包罗 32 个 FP64+64 Int32+64 FP32+8 个 Tensor Cores       特点&上风   首个完备 GPU 盘算架构,支持与共享存储联合的 Cache 层次 GPU 架构,支持 ECC GPU 架构   游戏性能大幅提升,首次支持 GPU Direct 技术   每组 SM 单元从 192 个淘汰到每组 128 个,每个 SMM 单元拥有更多逻辑控制电路   NVLink 第一代,双向互联带宽 160GB/s,P100 拥有 56 个 SM HBM   NVLink2.0,Tensor Cores 第一代,支持 AI 运算,NVSwitch1.0       纳米制程   40/28nm 30 亿晶体管   28nm 71 亿晶体管   28nm 80 亿晶体管   16nm 153 亿晶体管   12nm 211 亿晶体管       代表型号   Quadro 7000   K80 K40M   M5000 M4000 GTX 9XX 系列   P100 P6000 TTX1080   V100 TiTan V   现代盘算机的内存结构主要如下:

Fermi 架构

2010 年 NVIDIA 提出 Feimi 架构,最大可支持 16 个 SMs,每个 SM 有 32 个 CUDA Cores,一共 512 个 CUDA Cores,架构设计主要是以

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。




欢迎光临 ToB企服应用市场:ToB评测及商务社交产业平台 (https://dis.qidao123.com/) Powered by Discuz! X3.4