ToB企服应用市场:ToB评测及商务社交产业平台

标题: 详解 Nvidia Ampere 架构 [打印本页]

作者: 东湖之滨    时间: 2024-8-3 19:57
标题: 详解 Nvidia Ampere 架构
NVIDIA Ampere架构是NVIDIA推出的高性能GPU微架构,它是继Volta和Turing架构之后的新一代技能。Ampere架构在2020年初次发布,并被用于构建多种范例的GPU产品,包括数据中心的A100以及面向消费者的GeForce RTX 30系列显卡。Ampere架构代表了在计算性能、能效和AI加速方面的重大进步。
主要特点和改进:

以 NVIDIA GA100 为 例子

NVIDIA GA100 GPU 由多个 GPU 处置惩罚集群 (GPC)、纹理处置惩罚集群 (TPC)、流式多处置惩罚器 (SM) 和 HBM2 内存控制器组成。
GA100 GPU 的完整实现包括以下单元:

GA100 GPU 的 A100 Tensor Core GPU 实现包括以下单元:

   GA100 全 GPU,具有 128 个 SM。A100 Tensor Core GPU 有 108 个 SM
  以下是图中一些关键组件的解释及其工作方式:
GPC(Graphics Processing Cluster,图形处置惩罚集群)


TPC(Texture Processing Cluster,纹理处置惩罚集群)


SM(Streaming Multiprocessor,流式处置惩罚器)


CUDA Core & Tensor Core


RT Core(Ray Tracing Core,光线追踪核心)


L2 Cache


Memory Controller


PCI Express 4.0 Host Interface & NVLink


工作流程

当运行图形或计算步伐时:

Cuda Core 和 Tensor Core 的区别

在进行深度学习训练,例如使用ResNet-18模子时,CUDA Core和Tensor Core在计算过程中饰演着各自的角色,并可以协同工作以提升整体的训练服从。以下是它们各自的工作方式以及如何联系起来:
CUDA Core 在深度学习训练中的作用:

Tensor Core 在深度学习训练中的作用:

在实际的训练过程中,CUDA Core和Tensor Core可以被同时使用。在使用深度学习框架(如TensorFlow或PyTorch)时,这些框架的底层实现通常会根据具体的操作和硬件能力自动选择使用CUDA Core照旧Tensor Core。
SM 架构


   GA100 的流式多处置惩罚器 (SM)
  Volta 和 Turing 每个 SM 有 8 个 Tensor Core,每个 Tensor Core 每个时钟实行 64 个 FP16/FP32 混合精度融合乘法加法 (FMA) 运算。A100 SM 使用新的第三代 Tensor Core,每个 Tensor Core 每个时钟实行 256 次 FP16/FP32 FMA 操作。A100 每个 SM 有四个张量核心,每个时钟总共提供 1024 个密集的 FP16/FP32 FMA 操作,与 Volta 和 Turing 相比,每个 SM 的计算马力增加了 2 倍。
此处简要先容了 SM 的主要功能,并在本文后面进行了详细描述:
第三代 Tensor Core:

   A100 Tensor Core 操作与 V100 Tensor Core 的比较以及不同数据范例的标准操作
  NVIDIA Ampere 架构引入了对 TF32 的新支持,使 AI 训练能够默认使用张量核心,而无需用户付出任何努力。非张量操作继续使用 FP32 数据路径,而 TF32 张量核心读取 FP32 数据并使用与 FP32 雷同的范围,但内部精度低落,然后再天生标准 IEEE FP32 输出。TF32 包括一个 8 位指数(与 FP32 雷同)、10 位尾数(与 FP16 雷同)和 1 个符号位。
与 Volta 一样,自动混合精度 (AMP) 使您能够将混合精度与 FP16 结合使用,只需更改几行代码即可进行 AI 训练。使用 AMP,A100 的 Tensor Core 性能比 TF32 快 2 倍。
总而言之,用于 DL 训练的 NVIDIA Ampere 架构的选择如下:

   参考资料:https://developer.nvidia.com/blog/nvidia-ampere-architecture-in-depth/

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。




欢迎光临 ToB企服应用市场:ToB评测及商务社交产业平台 (https://dis.qidao123.com/) Powered by Discuz! X3.4