论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
只需一步,快速开始
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
ToB企服应用市场:ToB评测及商务社交产业平台
»
论坛
›
人工智能
›
人工智能
›
一文彻底搞懂大模子 - LLaMA-Factory
一文彻底搞懂大模子 - LLaMA-Factory
乌市泽哥
金牌会员
|
昨天 15:45
|
显示全部楼层
|
阅读模式
楼主
主题
897
|
帖子
897
|
积分
2691
LLaMA-Factory
怎样高效地微调和摆设大型语言模子(LLM)?
LLaMA-Factory作为一个开源的微调框架,应运而生,为开发者提供了一个简便、高效的工具,
以便在现有的预练习模子基础上,快速适应特定使命需求,提拔模子体现。
LLaMA-Factory作为一个功能
强大且高效的
大模子微调框架
,通过其用户友爱的界面和丰富的功能特性,为开发者提供了极大的便利。
LLaMA-Factory
一、
LLaMA-Factory
什么是LLaMA-Factory?LLaMA-Factory,全称Large Language Model Factory,即大型语言模子工厂。它支持多种预练习模子和微调算法,提供了一套完备的工具和接口,使得用户能够轻松地对
预练习的模子进行定制化的练习和调整
,以适应特定的应用场景,如
智能客服、语音辨认、呆板翻译
等。
LLaMA-Factory
支持的模子:LLaMA-Factory支持多种大型语言模子,包括但不限于LLaMA、BLOOM、Mistral、Baichuan、Qwen、ChatGLM等。
集成方法:包括(增量)预练习、指令监督微调、奖励模子练习、PPO练习、DPO练习和ORPO练习等多种方法。
运算精度与优化算法:提供32比特全参数微调、16比特冻结微调、16比特LoRA微调和基于AQLM/AWQ/GPTQ/LLM.int8的2/4/8比特QLoRA微调等多种精度选择,以及GaLore、DoRA、LongLoRA、LLaMA Pro、LoRA+、LoftQ和Agent微调等先辈算法。
LLaMA-Factory
LLaMA-Factory提供了简洁明了的操纵界面和丰富的文档支持,使得用户能够轻松上手并快速实现模子的微调与优化。
用户可以根据自己的需求选择差别的模子、算法和精度进行微调,以得到最佳的练习结果。
LLaMA-Factory
二、模子微调(Fine-Tuning)
怎样利用
LLaMA-Factory
进行模子微调?
利用LLaMA-Factory进行模子微调是一个涵盖从
选择模子、数据加载、参数设置到练习、评估优化直至摆设应用
的全面且高效的流程。
1. 选择模子:
根据应用场景和需求选择合适的预练习模子。
设置语言:进入WebUI后,可以切换到中文(zh)。
设置模子:选择LLaMA3-8B-Chat模子。
设置微调方法:微调方法则保持默认值
lora
,利用LoRA轻量化微调方法能极大程度地节省显存。
2. 加载数据:
将准备好的数据集加载到LLaMA-Factory中。
LLaMA-Factory项目内置了丰富的数据集,放在了data目次下。同时也可以自己准备自定义数据集,将数据处理惩罚为框架特定的格式,放到指定的data目次下。
3. 设置参数:
根据实际环境调整学习率、批次大小等练习参数。
学习率+梯度累积:设置学习率为1e-4,梯度累积为2,有利于模子拟合。
计算类型:如果是NVIDIA V100显卡,计算类型保持为fp16;如果利用了AMD A10系列显卡,可以更改计算类型为bf16。
LoRA参数设置:设置LoRA+学习率比例为16,LoRA+被证实是比LoRA学习结果更好的算法。在LoRA作用模块中填写all,即将LoRA层挂载到模子的所有线性层上,提高拟合结果。
4. 开始练习:
启动练习过程,并监控模子的练习进度和性能体现。
输出目次
:将输出目次修改为train_llama3,练习后的LoRA权重将会保存在此目次中。
预览命令:点击「预览命令」可展示所有已设置的参数,如果想通过代码运行微调,可以复制这段命令,在命令行运行。
开始:点击「开始」启动模子微调。
练习完毕:启动微调后需要等待一段时间,待模子下载完毕后可在界面观察到练习进度和损失曲线。模子微调约莫需要20分钟,显示“练习完毕”代表微调成功。
5. 评估与优化:
利用LLaMA-Factory提供的评估工具对模子性能进行评估,并根据评估结果进行针对性的优化。
革新适配器:微调完成后,点击页面顶部的「革新适配器」
适配器路径:点击适配器路径,即可弹出刚刚练习完成的LoRA权重,点击选择下拉列表中的train_llama3选项,在模子启动时即可加载微调结果。
评估模子:选择「Evaluate&
redict」栏,在数据集下拉列表中选择「eval」(验证集)评估模子。
输出目次:更改输出目次为eval_llama3,模子评估结果将会保存在该目次中。
开始评估:最后点击开始按钮启动模子评估。
评估分数:模子评估约莫需要5分钟左右,评估完成后会在界面上显示验证集的分数。
ROUGE分数:其中ROUGE分数衡量了模子输出答案(predict)和验证集中尺度答案(label)的相似度,ROUGE分数越高代表模子学习得更好。
6. 摆设应用:
将练习好的模子摆设到实际应用场景中,实现其功能和代价。
加载模子:选择「Chat」栏,确保适配器路径是train_llama3,点击「加载模子」即可在Web UI中和微调模子进行对话。
卸载模子:点击「卸载模子」,点击“×”号取消适配器路径,再次点击「加载模子」,即可与微调前的原始模子聊天。
零基础怎样学习AI大模子
领取方式在文末
为什么要学习大模子?
学习大模子课程的重要性在于它能够极大地促进个人在人工智能范畴的专业发展。大模子技术,如自然语言处理惩罚和图像辨认,正在推动着人工智能的新发展阶段。通过学习大模子课程,可以把握设计和实现基于大模子的应用系统所需的基本原理和技术,从而提拔自己在数据处理惩罚、分析和决策制定方面的能力。别的,大模子技术在多个行业中的应用日益增加,把握这一技术将有助于提高就业竞争力,并为将来的创新创业提供坚固的基础。
大模子典范应用场景
①
AI+教育
:智能讲授助手和主动评分系统使个性化教育成为大概。通过AI分析学生的学习数据,提供量身定制的学习方案,提高学习结果。
②
AI+医疗
:智能诊断系统和个性化医疗方案让医疗服务更加精准高效。AI可以分析医学影像,辅助医生进行早期诊断,同时根据患者数据制定个性化治疗方案。
③
AI+金融
:智能投顾和风险管理系统帮助投资者做出更明智的决策,并实时监控金融市场,辨认潜在风险。
④
AI+制造
:智能制造和主动化工厂提高了生产效率和质量。通过AI技术,工厂可以实现设备猜测性维护,减少停机时间。
…
这些案例表明,学习大模子课程不仅能够提拔个人技能,还能为企业带来实际效益,推动行业创新发展。
学习资料领取
如果你对大模子感兴趣,可以看看我整归并且整理成了一份AI大模子资料包,需要的小同伴文末免费领取哦,
无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给各人发
部门资料展示
一、 AI大模子学习路线图
整个学习分为7个阶段
二、AI大模子实战案例
涵盖AI大模子的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模子感兴趣的爱好者,皆可用。
三、视频和书籍PDF合集
从入门到进阶这里都有,跟着老师学习事半功倍。
四、LLM口试题
五、AI产物司理口试题
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
乌市泽哥
金牌会员
这个人很懒什么都没写!
楼主热帖
是什么让.NET7的Min和Max方法性能暴增 ...
@RequestParam,@PathVariable两个注解 ...
7 行代码搞崩溃 B 站,原因令人唏嘘! ...
SqlServer远程连接
2019 第十届蓝桥杯大赛软件赛决赛,国 ...
聚焦企业开放OpenAPI痛难点,华为云API ...
想入行SAP咨询,最具性价比的方式 ...
活动 | 塑造软件新生态 赋能发展新变革 ...
CentOS7 安装 Redis 7.0.2
[WPF] 使用 HandyControl 的 CirclePan ...
标签云
存储
挺好的
服务器
快速回复
返回顶部
返回列表