ToB企服应用市场:ToB评测及商务社交产业平台

标题: LLaMA Factory多卡微调的实战教程 [打印本页]

作者: 祗疼妳一个    时间: 2024-6-14 23:58
标题: LLaMA Factory多卡微调的实战教程
  大家好,我是herosunly。985院校硕士结业,现担当算法研究员一职,热衷于呆板学习算法研究与应用。曾获得阿里云天池角逐第一名,CCF角逐第二名,科大讯飞角逐第三名。拥有多项发明专利。对呆板学习和深度学习拥有自己独到的见解。曾经辅导过若干个非盘算机专业的学生进入到算法行业就业。希望和大家一起发展进步。
  本文重要先容了LLaMA Factory多卡微调的实战教程,希望对学习大语言模子的同砚们有所帮助。思量到部分同砚是按照旧版本来进行安装的,以是本篇博客内容不变。如果想要查看最新版本,则请点击链接LLaMA Factory多卡微调的实战教程(连续更新)进行学习。

  
1. 前言

  在之前博客中先容了LLaMA Factory单机微调的实战教程,但模子参数量大了以后,必须就要使用多卡进行微调和训练了。尤其最近新出了几个效果很不错的开源大模子,好比Qwen1.5-72B-Chat、Command R+(104B),以是即使是A100 80G,也须要多卡进行微调。
  一般来说,是使用deepspeed进行多卡微调的。但是设置环境却并不是那么一帆风顺的。为了帮助同砚们加快多卡微调的进度,最终将逐步的操纵过程总结如下。希望能对遇到同样需求的同砚们有所帮助。




免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。




欢迎光临 ToB企服应用市场:ToB评测及商务社交产业平台 (https://dis.qidao123.com/) Powered by Discuz! X3.4