论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
应用中心
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
qidao123.com技术社区-IT企服评测·应用市场
»
论坛
›
人工智能
›
人工智能
›
LLaMA-Factory:大语言模子微调框架(大模子) ...
LLaMA-Factory:大语言模子微调框架(大模子)
尚未崩坏
论坛元老
|
2024-8-27 10:11:54
|
显示全部楼层
|
阅读模式
楼主
主题
2007
|
帖子
2007
|
积分
6021
简介:
LLaMA-Factory 是一个国内北航开源的低代码大模子训练框架,专为大型语言模子(LLMs)的微调而计划
LLaMA-Factory:大语言模子微调框架
一、功能特点
LLaMA-Factory 是一个国内北航开源的低代码大模子训练框架,专为大型语言模子(LLMs)的微调而计划。其主要功能特点包括:
高效且低本钱
:能够高效且低本钱地支持对100多个模子举行微调,简化了模子微调的过程。
易于访问和使用
:提供了友爱的用户界面,用户无需编写代码即可轻松定制和微调LLMs。
丰富的数据集选项
:支持多个数据集选项,用户可以选择自带的数据集或自己生成数据集举行微调。
多样化的算法支持
:集成了业界最广泛使用的微调方法和优化技能,如LoRA、GaLore、DoRA等。
实时监控和评估
:支持集成TensorBoard、VanDB和MLflow等监控工具,便于实时监控训练过程和评估模子性能。
极速推理
:提供了基于vLLM的OpenAI风格API、欣赏器界面和命令行接口,实现快速推理。
二、安装
LLaMA-Factory 的安装相对简单,以下是一般的安装步调(以conda环境为例):
创建Python环境
:
使用conda创建一个新的Python环境,并安装必要的依靠库,如PyTorch等。
克隆LLaMA-Factory项目
:
通过Git克隆LLaMA-Factory的源代码到本地。
git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
复制代码
安装依靠
:
进入项目目录,安装必要的Python依靠库。
cd LLaMA-Factory
pip install -e ".[torch,metrics]"
复制代码
启动服务
:
在项目目录中运行python src/train_web.py启动服务,然后在欣赏器中访问相应的端口(默认可能是7860)以访问训练界面。
三、支持的算法
LLaMA-Factory 支持多种先进的微调算法和模子,包括但不限于:
多种模子:LLaMA、LLaVA、Mistral、Mixtral-MoE、Qwen、Yi、Gemma、Baichuan、ChatGLM、Phi 等等。
集成方法:(增量)预训练、(多模态)指令监督微调、嘉奖模子训练、PPO 训练、DPO 训练、KTO 训练、ORPO 训练等等。
多种精度:16 比特全参数微调、冻结微调、LoRA 微调和基于 AQLM/AWQ/GPTQ/LLM.int8/HQQ/EETQ 的 2/3/4/5/6/8 比特 QLoRA 微调。
先进算法:GaLore、BAdam、DoRA、LongLoRA、LLaMA Pro、Mixture-of-Depths、LoRA+、LoftQ、PiSSA 和 Agent 微调。
实用本领:FlashAttention-2、Unsloth、RoPE scaling、NEFTune 和 rsLoRA。
实验监控:LlamaBoard、TensorBoard、Wandb、MLflow 等等。
极速推理:基于 vLLM 的 OpenAI 风格 API、欣赏器界面和命令行接口。
四、性能指标
与 ChatGLM 官方的 P-Tuning 微调相比,LLaMA Factory 的 LoRA 微调提供了 3.7 倍的加速比,同时在广告文案生成使命上取得了更高的 Rouge 分数。结合 4 比特量化技能,LLaMA Factory 的 QLoRA 微调进一步低沉了 GPU 显存消耗。
GPU现存消耗:
五、微调例子
以下是一个使用LLaMA-Factory对Yuan2.0模子举行LoRA微调的例子:
准备数据集
:
准备自定义的数据集,可以是JSON格式,包含指令、输入和输出等信息。
注册数据集
:
在LLaMA-Factory的数据集管理文件中注册自定义的数据集。
启动Web UI服务
:
运行python src/train_web.py启动Web UI服务,并在欣赏器中打开相应的地点。
配置微调参数
:
在Web界面上配置模子路径、微调方法(选择LoRA)、数据集等参数。
开始微调
:
点击“开始”按钮开始微调过程,可以在界面中检察训练进度和损失函数等信息。
评估模子
:
微调完成后,使用LLaMA-Factory提供的评估工具对模子举行评估,查抄模子性能是否有所提拔。
通过以上步调,用户可以使用LLaMA-Factory轻松实现LLMs的微调,提拔模子在特定使命上的性能。
如何体系的去学习大模子LLM ?
作为一名热心肠的互联网老兵,我意识到有许多经验和知识值得分享给各人,也可以通过我们的能力和经验解答各人在人工智能学习中的许多困惑,以是在工作繁忙的环境下照旧对峙各种整理和分享。
但苦于知识流传途径有限,许多互联网行业朋侪无法得到正确的资料得到学习提拔,故此将并将
重要的 AI大模子资料 包括AI大模子入门学习头脑导图、精品AI大模子学习册本手册、视频教程、实战学习等录播视频免费分享出来
。
所有资料 ⚡️ ,朋侪们如果有必要全套 《
LLM大模子入门+进阶学习资源包
》,
扫码获取~
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
尚未崩坏
论坛元老
这个人很懒什么都没写!
楼主热帖
读高性能MySQL(第4版)笔记01_MySQL架 ...
SQL Server向表中插入数据
鸿蒙DevEco Studio3.0——开发环境搭建 ...
容器开发运维人员的 Linux 操作机配置 ...
Redis命令手册
关于对四维空间一些理解
Webpack的使用
Triple 协议支持 Java 异常回传的设计 ...
0基础下载并安装SQLite并新建数据库 ...
2022-8-17 mysql 第三天
标签云
渠道
国产数据库
集成商
AI
运维
CIO
存储
服务器
浏览过的版块
区块链
快速回复
返回顶部
返回列表