【AIGC魔童】DeepSeek v3推理部署:DeepSeek-Infer/ModelScope/ollama ...

打印 上一主题 下一主题

主题 1110|帖子 1110|积分 3330

(1)快速使用

DeepSeek 官网访问:https://chat.deepseek.com
DeepSeek API访问:https://platform.deepseek.com
(2)推理部署

DeepSeek-V3 可以使用以下硬件和开源社区软件在本地部署:
2.1 使用DeepSeek-Infer部署DeepSeek

2.1.1 系统要求
留意:仅限 Python 3.10 的 Linux。不支持 Mac 和 Windows。
依赖包列表:
  1. torch==2.4.1
  2. triton==3.0.0
  3. transformers==4.46.3
  4. safetensors==0.4.5
复制代码
2.1.2 模子权重和演示代码准备
起首,克隆DeepSeek-V3 GitHub 仓库:
  1. git clone https://github.com/deepseek-ai/DeepSeek-V3.git
复制代码
切换到inference文件夹并安装requirements.txt中列出的依赖项。最简单的方法是使用雷同conda或uv的包管理器创建新的假造环境并安装依赖项。
  1. cd DeepSeek-V3/inference
  2. pip install -r requirements.txt
复制代码
从 Hugging Face 下载模子权重,并将其放入文件夹中。/path/to/DeepSeek-V3
2.1.3 模子权重转换
将 Hugging Face 模子权重转换为特定格式:
  1. python convert.py --hf-ckpt-path /path/to/DeepSeek-V3 --save-path /path/to/DeepSeek-V3-Demo --n-experts 256 --model-parallel 16
复制代码
2.1.4 运行 DeepSeek-V3 谈天
  1. torchrun --nnodes 2 --nproc-per-node 8 --node-rank $RANK --master-addr $ADDR generate.py --ckpt-path /path/to/DeepSeek-V3-Demo --config configs/config_671B.json --interactive --temperature 0.7 --max-new-tokens 200
复制代码
或对给定文件举行批量推理:
  1. torchrun --nnodes 2 --nproc-per-node 8 --node-rank $RANK --master-addr $ADDR generate.py --ckpt-path /path/to/DeepSeek-V3-Demo --config configs/config_671B.json --input-file $FILE
复制代码
2.2 使用ModelScope部署DeepSeek

2.2.1 安装ModelScope依赖包
  1. pip install modelscope
复制代码
2.2.2 下载模子
  1. mkdir ./deepseek
  2. modelscope download --model deepseek-ai/DeepSeek-R1 --local_dir ./deepseek
复制代码
2.2.3 模子权重转化
  1. cd DeepSeek-V3/inference
  2. python convert.py --hf-ckpt-path /path/to/DeepSeek-R1 --save-path /path/to/DeepSeek-R1-Demo --n-experts 256 --model-parallel 16
复制代码


  • python convert.py :运行 convert.py 脚本,这个脚本的作用是将Hugging Face格式的模子权重转换为另一个特定的格式。
  • --hf-ckpt-path /path/to/DeepSeek-R1 :指定Hugging Face格式的模子查抄点路径(即模子文件所在的位置)。在这个例子中是 /path/to/DeepSeek-R1 。
  • --save-path /path/to/DeepSeek-R1-Demo :指定转换后的模子权重保存的路径,即你想将模子保存到哪里。
  • --n-experts 256 :指定模子中的专家数量,这可能是与模子的分布式训练或者混合专家模子(Mixture of Experts, MoE)相干的参数,设置为256表示该模子将使用256个专家。
  • --model-parallel 16 :这个参数指定模子并行的程度,通常是指将模子分布在16个GPU上举行训练或推理。
2.2.4 模子推理
  1. torchrun --nnodes 2 --nproc-per-node 8 --node-rank $RANK --master-addr $ADDR generate.py --ckpt-path /path/to/DeepSeek-R1-Demo --config configs/config_671B.json --interactive --temperature 0.7 --max-new-tokens 200
复制代码
各个参数的寄义如下:
  1. torchrun :用于分布式训练或推理的命令。它会启动多个进程,支持跨多个节点(即多台机器)运行。
  2. --nnodes 2 :指定集群中的节点数目。在这个例子中,使用2个节点(即2台机器)。
  3. --nproc-per-node 8 :每个节点上运行的进程数。在每个节点上启动8个进程,通常是为了充分利用每个节点上的多个GPU。
  4. --node-rank $RANK :当前节点在集群中的排名,用于区分不同节点。 $RANK 是一个环境变量,代表当前节点的编号。
  5. --master-addr $ADDR :指定主节点的地址。主节点通常负责协调所有其他节点的工作。 $ADDR是一个环境变量,表示主节点的IP地址或主机名。
  6. generate.py :这是运行文本生成任务的脚本,它会使用模型进行推理生成文本。
  7. --ckpt-path /path/to/DeepSeek-R1-Demo :指定转换后的DeepSeek-R1模型检查点路径。这个路径是你之前在转换步骤中保存的模型文件。
  8. --config configs/config_671B.json :指定模型的配置文件。配置文件包含模型的架构、超参数等信息。在这个例子中,配置文件是 configs/config_671B.json 。
  9. --interactive :启用交互模式,通常表示用户可以在命令行中输入内容,并实时获得模型的响应。
  10. --temperature 0.7 :生成的温度值,影响模型的输出随机性。温度越高,生成的文本越随机;温度越低,生成的文本越确定。0.7通常意味着适度的随机性。
  11. --max-new-tokens 200 :限制生成的最大新token数量,表示每次生成时最多生成200个新的词元。
复制代码
2.3 使用ollama部署DeepSeek

目前DeepSeek R1已支持使用Ollama举行调用,并且非常便捷的是,Ollama中集成了DeepSeek
R1半精度版本,且集成了其他各蒸馏模子的Q4_K_M量化版本,支持ollama run命令一键下载与调用。
此中各模子在Q4_K_M量化环境下运行所需显存环境如下:

实际调用时,只需要在命令行输入ollama run + 模子版本即可,比方:
  1. ollama run deepseek-r1:1.5b
复制代码
即可运行1.5B蒸馏模子。而
  1. ollama run deepseek-r1:671b
复制代码
则可下载并运行半精度的DeepSeek R1模子。目前Ollama暂不支持全精度DeepSeek R1模子运行。
DeepSeek R1体验平台
字节火山引擎:
https://console.volcengine.com/ark/region:ark+cn-beijing/experience/chat
硅基流动:
https://cloud.siliconflow.cn/playground/chat/17885302724
百度智能云:
https://console.bce.baidu.com/qianfan/ais/console/onlineTest/LLM/DeepSeek-R1
秘塔AI搜索:
https://metaso.cn/
无问芯穹:
https://cloud.infini-ai.com/genstudio/experience
PPIO派欧云:
https://ppinfra.com/llm
纳米AI搜索:
https://bot.n.cn/chat?src=AIsearch
商汤大装置:
https://console.sensecore.cn/aistudio/experience/conversation
天工AI:
https://www.tiangong.cn/
POE:
https://poe.com/
腾讯云 TI 平台:
https://console.cloud.tencent.com/tione/v2/aimarket/detail/deepseek_series?regionId=1&detailTab=deep_seek_v1
讯飞开放平台:
https://training.xfyun.cn/experience/text2text?type=public&modelServiceId=2501631186799621

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

笑看天下无敌手

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表