IT评测·应用市场-qidao123.com

标题: 大模子条记之-Llama-3.1-405B-Instruct-FP8离线部署[8*A800] 基于vLLM 版本 [打印本页]

作者: 我可以不吃啊 时间: 2024-8-15 08:19
标题: 大模子条记之-Llama-3.1-405B-Instruct-FP8离线部署[8*A800] 基于vLLM 版本
提示：文章写完后，目次可以主动生成，怎样生成可参考右边的资助文档

前言

感谢：星鸾云提供8卡A800测试情况，本次部署教程均在星鸾云平台完成
邀请链接：https://xl.hzxingzai.cn/register?invitation_code=8707231444
Meta 的新一代开源大语言模子
vllm Blog：https://blog.vllm.ai/2024/07/23/llama31.html
一、硬件情况

GPU：A800 80GB PCIe * 8 卡
CPU：112 核
内存：880 G
二、软件情况

Python：Miniconda
CUDA Version:12.3
三 . 模子下载

利用魔搭下载脚本

#1.安装依赖
pip install modelscope
#2.新建download.py 填入下面文件
from modelscope import snapshot_download
model_dir = snapshot_download('LLM-Research/Meta-Llama-3.1-405B-Instruct-FP8',cache_dir='/user/data/model')
#3.开始下载
python download.py

复制代码

1.情况准备

新建 conda虚拟情况