特性
| 完整模子
| 量化模子
| 蒸馏技术
|
定义
| 原始的、未经优化的深度学习模子,通常具有高精度但计算和存储本钱高。
| 通过低落模子参数和激活值的数值精度(如从32位浮点数转换为8位整数)来减少模子大小和计算需求。
| 将大型西席模子的知识迁移到小型门生模子中,通过软标签引导门生模子的训练,使其在较小规模下接近西席模子的性能。
|
优化目的
| 无优化,追求最高精度。
| 减少模子存储空间和计算本钱,提高推理速度。
| 在保持较小模子规模的同时,尽可能保存西席模子的性能。
|
实现方法
| 直接训练得到的模子,不涉及优化。
| 训练后量化(PTQ)或量化感知训练(QAT)。
| 训练一个大型西席模子,然后用其输出引导小型门生模子的训练。
|
精度影响
| 通常具有最高的精度。
| 精度可能因量化而有所丧失,但可以通过优化方法只管减少这种丧失。
| 门生模子的精度通常接近西席模子,乃至在某些情况下可以高出西席模子。
|
适用场景
| 适用于计算资源富足且对精度要求极高的场景。
| 适用于边缘计算、实时应用和大规模部署等对存储和计算资源要求严格的场景。
| 适用于资源受限的装备,如移动装备和嵌入式系统,以及需要快速推理的场景。
|
5. DeepSeek 相较于其他大模子的优势和专长 Model
| Parameters (B)
| VRAM Requirement (GB)
| Recommended GPU
|
DeepSeek-R1-Zero
| 671B
| ~1,543 GB
| Multi-GPU setup (e.g., NVIDIA A100 80GB x16)
|
DeepSeek-R1
| 671B
| ~1,543 GB
| Multi-GPU setup (e.g., NVIDIA A100 80GB x16)
|
DeepSeek-R1-Distill-Qwen-1.5B
| 1.5B
| ~3.9 GB
| NVIDIA RTX 3060 12GB or higher
|
DeepSeek-R1-Distill-Qwen-7B
| 7B
| ~18 GB
| NVIDIA RTX 4090 24GB or higher
|
DeepSeek-R1-Distill-Llama-8B
| 8B
| ~21 GB
| NVIDIA RTX 4090 24GB or higher
|
DeepSeek-R1-Distill-Qwen-14B
| 14B
| ~36 GB
| Multi-GPU setup (e.g., NVIDIA RTX 4090 x2)
|
DeepSeek-R1-Distill-Qwen-32B
| 32B
| ~82 GB
| Multi-GPU setup (e.g., NVIDIA RTX 4090 x4)
|
DeepSeek-R1-Distill-Llama-70B
| 70B
| ~181 GB
| Multi-GPU setup (e.g., NVIDIA A100 80GB x3)
|
量化模子:(通过将模子中的参数和激活值从高精度数值(如32位浮点数)转换为低精度数值(如8位整数或更低)来优化模子,以减少存储需求和计算本钱) Model
| Parameters (B)
| VRAM Requirement (GB) (4-bit)
| Recommended GPU
|
DeepSeek-R1-Zero
| 671B
| ~436 GB
| Multi-GPU setup (e.g., NVIDIA A100 80GB x6)
|
DeepSeek-R1
| 671B
| ~436 GB
| Multi-GPU setup (e.g., NVIDIA A100 80GB x6)
|
DeepSeek-R1-Distill-Qwen-1.5B
| 1.5B
| ~1 GB
| NVIDIA RTX 3050 8GB or higher
|
DeepSeek-R1-Distill-Qwen-7B
| 7B
| ~4.5 GB
| NVIDIA RTX 3060 12GB or higher
|
|
|
|
|
DeepSeek-R1-Distill-Llama-8B
| 8B
| ~5 GB
| NVIDIA RTX 3060 12GB or higher
|
DeepSeek-R1-Distill-Qwen-14B
| 14B
| ~9 GB
| NVIDIA RTX 4080 16GB or higher
|
DeepSeek-R1-Distill-Qwen-32B
| 32B
| ~21GB
| NVIDIA RTX 4090 24GB or higher
|
DeepSeek-R1-Distill-Llama-70B
| 70B
| ~46 GB
| Multi-GPU setup (e.g. NVIDIA RTX 4090 24GB x2)
|