IT评测·应用市场-qidao123.com
标题:
DeepSeek 8B,14B,32B,70B在ubuntu,mac上的性能测试结果
[打印本页]
作者:
九天猎人
时间:
2025-2-23 14:30
标题:
DeepSeek 8B,14B,32B,70B在ubuntu,mac上的性能测试结果
分别基于Ubuntu22.04, Macbook Pro M芯片模型测试:
ubuntu设置:Macbook Pro
CPU
: 13th Gen Intel(R) Core(TM) i7-13700KF
显卡
: NVIDIA GeForce RTX 4070 Ti 12GB
内存
:80G
系统版本
:Window11 WSL Ubuntu 22.04.5 LTS
CPU
: Apple M1 Max
显卡
:Apple M1 Max Metal 3
内存
:32G
系统版本
:14.6.1
Macbook Pro M芯片性能测试:
DeepSeek-R1-Distill-Qwen-8B-GGUF 测试结果:
modelsizeparamsbackendthreadstestt/sllama 8B Q2_K - Medium3.07 GiB8.03 BMetal,BLAS8pp512487.43 ± 0.24llama 8B Q2_K - Medium3.07 GiB8.03 BMetal,BLAS8tg128
49.33 ± 0.09
DeepSeek-R1-Distill-Qwen-14B-GGUF 测试结果:
modelsizeparamsbackendthreadstestt/sqwen2 14B Q2_K - Medium5.37 GiB14.77 BMetal,BLAS8pp512257.18 ± 0.12qwen2 14B Q2_K - Medium5.37 GiB14.77 BMetal,BLAS8tg128
27.45 ± 0.10
DeepSeek-R1-Distill-Qwen-32B-GGUF 测试结果:
modelsizeparamsbackendthreadstestt/sqwen2 32B IQ2_XXS - 2.0625 bpw8.40 GiB32.76 BMetal,BLAS8pp51299.51 ± 0.15qwen2 32B IQ2_XXS - 2.0625 bpw8.40 GiB32.76 BMetal,BLAS8tg128
13.58 ± 0.01
DeepSeek-R1-Distill-Qwen-70B-GGUF 测试结果:
ModelSizeParamsBackendThreadsTestt/sLLaMA 70B Q2_K - Medium24.79 GiB70.55 BMetal,BLAS8pp5126.3 ± 0.08LLaMA 70B Q2_K - Medium24.79 GiB70.55 BMetal,BLAS8tg128
00.00 ± 0.00
Ubuntu 22.04 性能测试:
DeepSeek-R1-Distill-Qwen-8B-GGUF 测试结果:
ModelSizeParamsBackendNGLTestT/sllama 8B Q2_K - Medium3.07 GiB8.03 BCUDA99pp5124371.47 ± 8.21llama 8B Q2_K - Medium3.07 GiB8.03 BCUDA99tg128
122.44 ± 0.09
DeepSeek-R1-Distill-Qwen-14B-GGUF 测试结果:
ModelSizeParamsBackendNGLTestT/sqwen2 14B Q2_K - Medium5.37 GiB14.77 BCUDA99pp5122411.33 ± 6.56qwen2 14B Q2_K - Medium5.37 GiB14.77 BCUDA99tg128
67.53 ± 0.15
DeepSeek-R1-Distill-Qwen-32B-GGUF 测试结果:
ModelSizeParamsBackendNGLTestT/sqwen2 32B IQ2_XXS - 2.0625 bpw8.40 GiB32.76 BCUDA99pp5121204.93 ± 83.32qwen2 32B IQ2_XXS - 2.0625 bpw8.40 GiB32.76 BCUDA99tg128
41.92 ± 0.17
DeepSeek-R1-Distill-Qwen-70B-GGUF 测试结果:
ModelSizeParamsBackendNGLTestT/sllama 70B Q2_K - Medium24.79 GiB70.55 BCUDA99pp51237.18 ± 0.16llama 70B Q2_K - Medium24.79 GiB70.55 BCUDA99tg128
1.31 ± 0.00
参数表明:
[/table] [table]标题表明模型 (Model)使用的模型名称和版本大小 (Size)模型的内存占用,单元是GiB (Gibibytes)参数 (Params)模型的参数数量,单元是B (Billion)后端 (Backend)模型运行所使用的盘算后端 (例如Metal, BLAS)线程 (Threads)使用的线程数量GPU数量(NGL)Number of GPU Layer,分给GPU的层数用来盘算测试 (Test) 运行测试的范例,例如pp512 (测试512 token)或tg128 (测试128 token)
pp512: Prompt Processing 处理512 token提示词
tg128: Text Generation 生成长度为128 token文本
每秒处理标志数 (t/s)每秒处理的token数量 (tokens per second)
测试结果:
在两台机器上,DeepSeek-R1-Distill-Qwen-8B,14B, 32B 都可以正常使用,通过 T/s 结果可以看出来,只有70B 在两台机器上固然可以运行,但根本无法使用。各人根据自己的机器设置,选择合适的模型。
模型资源下载地址:
DeepSeek-R1-Distill-Llama-8B
DeepSeek-R1-Distill-Qwen-14B
DeepSeek-R1-Distill-Qwen-32B
DeepSeek-R1-Distill-Llama-70B
测试项目llama.cpp
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
欢迎光临 IT评测·应用市场-qidao123.com (https://dis.qidao123.com/)
Powered by Discuz! X3.4