qidao123.com技术社区-IT企服评测·应用市场

标题: LLaMA-Factory使用指南：快速训练专属大模子，打造定制化AI办理方案！ [打印本页]

作者: 莫张周刘王 时间: 2024-9-18 01:45
标题: LLaMA-Factory使用指南：快速训练专属大模子，打造定制化AI办理方案！
本文聊聊 LLama-Factory，它是一个开源框架，这里头可以找到一系列预制的组件和模板，让你不消从零开始，就能训练出自己的语言模子（微调）。不管是谈天机器人，还是文章生成器，甚至是问答系统，都能搞定。而且，LLama-Factory 还支持多种框架和数据集，这意味着你可以根据项目需求灵活选择，把精力会合在真正重要的事变上——创造价值。
使用LLama-Factory，常见的就是训练LoRA模子，加强模子在某方面的生成本领。本教程将以加强 GLM-4-9B-Chat 模子的脑筋急转弯本领为例，演示LoRA模子的微调方法。
情况准备

本地使用

LLama-Factory 的安装比较简单，各人直接看官网页面就够了：
github.com/hiyouga/LLa…
云镜像

假如你本地没有一张好显卡，也不想费劲的安装，就想立刻开始训练。
可以试试我的云镜像，开箱即用：www.haoee.com/application…
平台注册就送肯定额度，可以完成本教程的的演示示例。
镜像已经内置了几个基础模子，大都在6B-9B，单卡24G显存即可完成LoRA微调。
  假如要微调更大的模子，则必要更多的显卡和显存，请在购买GPU时选择合适的显卡和数量。
  已经内置的模子：Yi-1.5-9B-Chat、Qwen2-7B、meta-llama-3.1-8b-instruct、glm-4-9b-chat、chatglm3-6b
  假如缺少你必要的模子，可以给我反馈。
  假设你已包办理了步伐运行情况问题，下边将开始讲解 LLama-Factory 的使用方法。
LLama-Factory 直接命令行和Web页面训练，为了方便入门，这篇文章以Web页面训练为例。
选择基础模子

语言：zh，因为我们要微调的是中文模子。
模子选择：GLM-4-9B-Chat
模子路径：/root/LLaMA-Factory/models/glm-4-9b-chat，默认会主动下载模子，不过速率可能比较慢，我们的镜像中已经下载好这个模子，所以直接填写路径更快。
微调方法：lora

准备训练数据集

LLaMA-Factory自带了一些常用的数据集，假如你使用的数据集不在里边，可以修改 data/dataset_info.json，在此中增加自己的数据集。
这里我使用的是一个弱智吧问答数据集，数据集的格式是 alpaca，来源：huggingface.co/datasets/Lo…

训练参数设置

训练参数必要根据现实训练结果进行调解，这里给出一个参考设置。

数据集：请根据你的必要选择，这里选择我上边定义的 ruozhiba_qa。
学习率：1e-4，设置的大点，有利于模子拟合。
计算类型：假如显卡较旧，建议计算类型选择fp16；假如显卡比较新，建议选择bf16。
梯度累计：2，有利于模子拟合。

LoRA+学习率比例：16，相比LoRA，LoRA+续写结果更好。
LoRA作用模块：all ，表现将LoRA层挂载到模子的全部线性层上，进步拟合结果。
开始训练

点击“开始”按钮，可以在页面上看到训练进度和训练结果。
根据训练方法和训练数据的大小，训练必要的时间不定。

推理测试

在“检查点路径”这里加载刚刚训练的LoRA模子，然后切换到“Chat”页签，点击“加载模子”。
测试完毕后，记得点击“卸载模子”，因为模子占用显存比较大，不释放的话，再进行别的任务可能会出错。

对比训练前后的变革：
训练前：

训练后：

这是一个比较感性的测试，假如必要更为正式的结果评估，请使用“Evaluate & Predict” 选择合适的评测数据集进行评估。

合并导出模子

有时候我们必要把模子导出来放在别的地方使用，输出一个完备的模子文件，而不是基础模子+LoRA模子。

检查点路径：训练出来的LoRA模子
导出目录：设置一个服务器上的路径，新的模子会存放到这里。
最后点击“开始导出”就行了。导出完毕后，请前往服务器相关的路径中下载模子。
LLaMA-Factory 架构

最后送各人一张 LLaMA-Factory 的架构图，方便理解其原理。

图片左侧：表现了 LLaMA-Factory 的架构，分为四个主要部分：LlamaBoard、Trainer、Model Loader 和 Data Worker。

LlamaBoard：用于参数配置和训练状态监视。
Trainer：负责优化和训练方法的选择，如 LoRA+、GaLoRe、Pre-train、SFT 等。
Model Loader：负责模子初始化、补丁、量化和适配器等功能。
Data Worker：负责加载、对齐、预处理和合并训练数据。

图片右侧：列出了支持的流行语言模子和大小，以及支持的训练方法。

支持的语言模子和大小：LLaMA、LLaMA-2、LLaMA-3、Command-R、Mistral/Mixtral、OLMo、Phi-1.5/2、Qwen、DeepSeek (MoE)、Falcon、Gemma/CodeGemma 和 StarCoder2。
支持的训练方法：全量调解、冻结调解、LoRA、QLoRA、嘉奖建模、PPO 训练、DPO 训练、ORPO 训练。

总体上来说，LLama-Factory 的使用还是挺顺利的，没有太多的坑。
听不如见，见不如做，自己动手，才气真正有所感悟！

零基础怎样学习大模子 AI

领取方式在文末
为什么要学习大模子？

学习大模子课程的重要性在于它可以大概极大地促进个人在人工智能范畴的专业发展。大模子技术，如自然语言处理和图像识别，正在推动着人工智能的新发展阶段。通过学习大模子课程，可以掌握设计和实现基于大模子的应用系统所需的基本原理和技术，从而提拔自己在数据处理、分析和决策订定方面的本领。别的，大模子技术在多个行业中的应用日益增加，掌握这一技术将有助于进步就业竞争力，并为未来的创新创业提供坚实的基础。
大模子典型应用场景

①AI+教诲：智能教学助手和主动评分系统使个性化教诲成为可能。通过AI分析弟子的学习数据，提供量身定制的学习方案，进步学习结果。
②AI+医疗：智能诊断系统和个性化医疗方案让医疗服务更加精准高效。AI可以分析医学影像，辅助医生进行早期诊断，同时根据患者数据订定个性化治疗方案。
③AI+金融：智能投顾和风险管理系统帮助投资者做出更明智的决策，并实时监控金融市场，识别潜在风险。
④AI+制造：智能制造和主动化工厂进步了生产效率和质量。通过AI技术，工厂可以实现设备预测性维护，减少停机时间。
⑤AI+零售：智能推荐系统和库存管理优化了用户体验和运营成本。AI可以分析用户行为，提供个性化商品推荐，同时优化库存，减少浪费。
⑥AI+交通：主动驾驶和智能交通管理提拔了交通安全和效率。AI技术可以实现车辆主动驾驶，并优化交通信号控制，减少拥堵。
…
这些案例表明，学习大模子课程不仅可以大概提拔个人技能，还能为企业带来现实效益，推动行业创新发展。
学习资料领取

假如你对大模子感爱好，可以看看我整合并且整理成了一份AI大模子资料包，必要的小伙伴文末免费领取哦，无偿分享！！！
vx扫描下方二维码即可
加上后会一个个给各人发

部分资料展示

一、 AI大模子学习路线图

整个学习分为7个阶段

二、AI大模子实战案例

涵盖AI大模子的理论研究、技术实现、行业应用等多个方面。无论您是科研职员、工程师，还是对AI大模子感爱好的爱好者，皆可用。

三、视频和册本PDF合集

从入门到进阶这里都有，跟着老师学习事半功倍。

四、LLM面试题

假如二维码失效，可以点击下方链接，一样的哦
【CSDN大礼包】最新AI大模子资源包，这里全都有！无偿分享！！！

欢迎光临 qidao123.com技术社区-IT企服评测·应用市场 (https://dis.qidao123.com/)