论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
只需一步,快速开始
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
IT评测·应用市场-qidao123.com
»
论坛
›
人工智能
›
人工智能
›
大模子之路3:趟到了Llama-Factory,大神们请指点 ...
大模子之路3:趟到了Llama-Factory,大神们请指点
王柳
论坛元老
|
2024-8-12 16:43:56
|
显示全部楼层
|
阅读模式
楼主
主题
1018
|
帖子
1018
|
积分
3054
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
各种AI工具和框架层出不穷,为开辟者和研究者提供了亘古未有的便利。当然了,也有困扰。尤其是对于动手能力越来越弱的中年油腻老步伐员来说,更是难上加难。听说,嗯,据师弟说,说LlamaFactory依附其独特的功能和优势,在AI范畴(他所下载的代码和工具里),引起了广泛的关注(能够调试通过的)。当然,由于硬件环境的缘故,他的3个6000卡不好用,大概是有点老了吧,导致固然能调试通过,但是运行一个开始就完了。
今天,我在自己这边的环境上,也尝试了,感觉还可以。有坑是天然的。
1、优点
一、高效的模子训练与调优
LlamaFactory在模子训练方面表现出了极高的效率。的确是快,比我用代码行和bash、jupyter都快多了。通过其提供的丰富的预训练模子和调优工具,用户可以快速地搭建起实用于自己任务的AI模子。在实际应用中,我发现LlamaFactory的训练速度明显快于之前的手搓方式,这重要得益于其界面上的组织。当然,底层优化的算法和高效的并行盘算能力我还没完全体会到。(代码方式我是体会到了)。此外,按理说的,LlamaFactory还支持多种硬件平台,包括CPU、GPU和TPU等,进一步提拔了训练的机动性和效率。但是我没有运行成功。这个就比较扯。
语言栏里,有中英(俄?),中英文切换一下,对于去代码里手搓还是有帮助的,可以更好的理解。反正
我目前对于这所谓的适配器还没理解到位,盼望大神能指点一下,谢谢。
二、机动的模子定制与扩展
除了高效的训练性能,LlamaFactory还提供了机动的模子定制和扩展功能。用户可以根据自己的需求,轻松地调解模子的参数和结构,以适应不同的应用场景。听说,LlamaFactory能够成为了一个强大的“瑞士军刀”,无论是文本生成、图像辨认还是语音辨认等任务,都能通过简单的设置和调解实现精彩的性能。但是我这么一个新新手,还没相识那么深刻。
就这些设置,我都已经眼花缭乱了。
三、创新的Adapter技术
值得一提的是,LlamaFactory引入了创新的Adapter技术,这是一种轻量级的模子调解方法,可以在不改变原有模子结构的情况下,通过添加额外的网络层来适应新的任务。这种技术不仅生存了原有模子的泛化能力,还大大低沉了模子调优的复杂度和资本。听说,Adapter技术显著提拔了模子在新任务上的表现,能让人深刻体会到其实用性。但是我还是没搞明白。
好比共同着预览下令,我一下就明白了,之前的手搓bash就是如许的,但是问题在于,这个输出路径我大概看明白了,就是之前微调的时间输出的那个目录。那么,adapter的路径...又迷糊了,我也不会编辑Adapter啊。那,看来是要额外添加网络层的,这个其实更适合我来做后续的东西。加油吧。我的理解大概是如许,如果不对,大神请改正。至于
怎么用adapter,学习过程中盼望大神们指点。再谢谢。
四、友好的用户界面与社区支持
LlamaFactory在用户体验方面也做得非常精彩。其提供了直观易用的图形化界面,使得用户无需深入相识复杂的底层技术,就能轻松上手并享受AI带来的便利。我如今就只是看的官方介绍,是从gitee上看的 grang/LLaMA-Factory。
2、修改数据集
重要就是数据集的设置,按照readme的介绍,修改就好了,重要就是dataset的json文件
因为大模子的确不是很好去看效果,我才开始就弄错了,但是也没有发现。
有一个地方,就是数据集要写成下面如许
我开始的时间用python写这个数据集文件,把output也写成了json,然后就出错了(我用的是cmd conda 运行的方式,原因也正是下面求助所示)
3、求助
如上面所看到的,我进行设置后,按理说应该是可以了。那么点“start”以后就应该可以跑起来了。事实上,并没有。
很礼帽的给我干出来一个告诫。但是我并没有感觉哪个地方需要设置多GPU啊。
而且,我手搓Bash的时间,single和mul 是两个不一样的sh,我翻了翻反面的代码,也没看明白应该在那里去设置。
盼望路过的大神驻足,请指点迷津,谢三次
最后,我还是把那个预览代码拷贝到服务器上手动执行的,才成功。很奇怪,超出了我的学习范围。
祝大家天天都开心。。。。
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复
使用道具
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
王柳
论坛元老
这个人很懒什么都没写!
楼主热帖
Keytool配置 Tomcat的HTTPS双向认证 ...
【小程序】图解小程序平台架构及其特征 ...
NSIS官方认证插件集成安装包 ...
校园网组网方案的设计
[网鼎杯 2020 朱雀组]Think Java——wp ...
太方便了,钉钉上就可完成代码发布审批 ...
利用Python生成随机密码,灰常简单 ...
Google Earth Engine(GEE)——Kmeans ...
机加工行业MES系统模具行业MES系统CNCl ...
Ansible 学习笔记 - 批量巡检站点 URL ...
标签云
AI
运维
CIO
存储
服务器
浏览过的版块
数据仓库与分析
快速回复
返回顶部
返回列表