LLaMA Factory多卡微调的实战教程

祗疼妳一个 · 2024-6-14 23:58:28

大家好，我是herosunly。985院校硕士结业，现担当算法研究员一职，热衷于呆板学习算法研究与应用。曾获得阿里云天池角逐第一名，CCF角逐第二名，科大讯飞角逐第三名。拥有多项发明专利。对呆板学习和深度学习拥有自己独到的见解。曾经辅导过若干个非盘算机专业的学生进入到算法行业就业。希望和大家一起发展进步。
本文重要先容了LLaMA Factory多卡微调的实战教程，希望对学习大语言模子的同砚们有所帮助。思量到部分同砚是按照旧版本来进行安装的，以是本篇博客内容不变。如果想要查看最新版本，则请点击链接LLaMA Factory多卡微调的实战教程（连续更新）进行学习。

1. 前言

在之前博客中先容了LLaMA Factory单机微调的实战教程，但模子参数量大了以后，必须就要使用多卡进行微调和训练了。尤其最近新出了几个效果很不错的开源大模子，好比Qwen1.5-72B-Chat、Command R+(104B)，以是即使是A100 80G，也须要多卡进行微调。
一般来说，是使用deepspeed进行多卡微调的。但是设置环境却并不是那么一帆风顺的。为了帮助同砚们加快多卡微调的进度，最终将逐步的操纵过程总结如下。希望能对遇到同样需求的同砚们有所帮助。

免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！更多信息从访问主页：qidao123.com:ToB企服之家，中国第一个企服评测及商务社交产业平台。

		自动登录	找回密码
密码			立即注册

LLaMA Factory多卡微调的实战教程

本帖子中包含更多资源

0 个回复

快速回复

楼主热帖

标签云