LLaMA Factory多卡微调的实战教程

打印 上一主题 下一主题

主题 510|帖子 510|积分 1530

  大家好,我是herosunly。985院校硕士结业,现担当算法研究员一职,热衷于呆板学习算法研究与应用。曾获得阿里云天池角逐第一名,CCF角逐第二名,科大讯飞角逐第三名。拥有多项发明专利。对呆板学习和深度学习拥有自己独到的见解。曾经辅导过若干个非盘算机专业的学生进入到算法行业就业。希望和大家一起发展进步。
  本文重要先容了LLaMA Factory多卡微调的实战教程,希望对学习大语言模子的同砚们有所帮助。思量到部分同砚是按照旧版本来进行安装的,以是本篇博客内容不变。如果想要查看最新版本,则请点击链接LLaMA Factory多卡微调的实战教程(连续更新)进行学习。

  
1. 前言

  在之前博客中先容了LLaMA Factory单机微调的实战教程,但模子参数量大了以后,必须就要使用多卡进行微调和训练了。尤其最近新出了几个效果很不错的开源大模子,好比Qwen1.5-72B-Chat、Command R+(104B),以是即使是A100 80G,也须要多卡进行微调。
  一般来说,是使用deepspeed进行多卡微调的。但是设置环境却并不是那么一帆风顺的。为了帮助同砚们加快多卡微调的进度,最终将逐步的操纵过程总结如下。希望能对遇到同样需求的同砚们有所帮助。




免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

祗疼妳一个

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表