鲲鹏服务器+昇腾卡(Atlas 300I pro)搭建DeepSeek-R1-Distill-Qwen-7B(自 ...

种地  论坛元老 | 2025-2-22 01:07:59 | 显示全部楼层 | 阅读模式
打印 上一主题 下一主题

主题 1048|帖子 1048|积分 3144

参考文章:https://modelers.cn/models?name=deepseek&page=1&size=16
https://www.hiascend.com/software/modelzoo/models/detail/11aa2a48479d4d229a9830b8e41fc011
1.服务器硬件配置

当前服务器配置为:2 * 鲲鹏920 + 2 * Atlas 300I pro
系统:open Euler 22.03-LTS (AArch64)
驱动版本:Ascend-hdk-310p-npu-driver_24.1.rc3_linux-aarch64.run
固件版本:Ascend-hdk-310p-npu-firmware_7.5.0.1.129.run
注:记得先安装昇腾卡的驱动和固件
2.摆设

镜像准备:1.0.0-300I-Duo-py311-openeuler24.03-lts
完成加载镜像后,请使用docker images命令确认查找具体镜像名称与标签。
  1. docker load -i mindie:1.0.0-300I-Duo-py311-openeuler24.03-lts
复制代码
注:由于昇腾Atlas 300I PRO和Atlas 300 Duo都是310B芯片,我就直接用这个镜像了,现在昇腾官网已经下载不了该镜像了,需要可以找我
(1)新建容器

  1. docker run -it -d --net=host --shm-size=1g \
  2.     --name deepseek-7b \
  3.     --device=/dev/davinci_manager \
  4.     --device=/dev/hisi_hdc \
  5.     --device=/dev/devmm_svm \
  6.     --device=/dev/davinci0 \
  7.     --device=/dev/davinci1 \
  8.     --device=/dev/davinci2 \
  9.     --device=/dev/davinci3 \
  10.     --device=/dev/davinci4 \
  11.     --device=/dev/davinci5 \
  12.     --device=/dev/davinci6 \
  13.     --device=/dev/davinci7 \
  14.     -v /usr/local/Ascend/driver:/usr/local/Ascend/driver:ro \
  15.     -v /usr/local/sbin:/usr/local/sbin:ro \
  16.     -v /root/:/root/ \
  17.     mindie:1.0.0-800I-A2-py311-openeuler24.03-lts bash
复制代码
注:name 参数后是名称,device=/dev/davinci0,这是指你的第一张卡,剩下就是驱动和命令文件等等。
(2)进入容器

  1. docker exec -it deepseek-7b bash
复制代码
(3)下载模型DeepSeek-R1-Distill-Qwen-7B

请先通过如下命令安装ModelScope
  1. pip install modelscope
复制代码
下载完整模型repo
  1. modelscope download --model deepseek-ai/DeepSeek-R1-Distill-Qwen-7B
复制代码
或者你自己下载再放进系统里

魔塔社区下载蛮快的
(4)修改模型路径下的config.json文件


修改模型权重config.json中torch_dtype字段为float16

(5)服务化推理

打开配置文件
  1. vim /usr/local/Ascend/mindie/latest/mindie-service/conf/config.json
复制代码
修改配置文件

修改的参数为:
npuDeviceIds:我是两张卡所以[0,1]
truncation:false
modelName:你的模型名称,随便取
modelWeightPath:模型的路径
worldSize:2
启动服务
  1. cd /usr/local/Ascend/mindie/latest/mindie-service/bin
复制代码
  1. ./mindieservice_daemon
复制代码

(6)新建窗口测试

  1. curl 127.0.0.1:1040/generate -d '{
  2. "prompt": "What is deep learning?",
  3. "max_tokens": 32,
  4. "stream": false,
  5. "do_sample":true,
  6. "repetition_penalty": 1.00,
  7. "temperature": 0.01,
  8. "top_p": 0.001,
  9. "top_k": 1,
  10. "model": "qwen"
  11. }'
复制代码
注:默认是1025端口,可以在/usr/local/Ascend/mindie/latest/mindie-service/conf/config.json这个文件找到,IP配置也是。
答非所问,调解答复相关参数我不熟

DeepSeek-R1-Distill-Qwen-7B,QWen是比力善于中文,所以


  1. curl 127.0.0.1:1025/generate -d '{
  2.   "prompt": "深度学习是什么?",
  3.   "maxtokens": 150,
  4.   "stream": false,
  5.   "dosample": true,
  6.   "repetitionpenalty": 1.5,
  7.   "temperature": 0.7,
  8.   "topp": 0.95,
  9.   "topk": 100,
  10.   "model": "qwen"
  11. }'
复制代码
2025年2月13日11:18:48,现在我这个参数问就轻微正常点- -

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

种地

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表