论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
应用中心
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
只需一步,快速开始
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
IT评测·应用市场-qidao123.com技术社区
»
论坛
›
物联网
›
物联网
›
【大模型技术】什么时候必要训练和微调属于本身的大模型 ...
【大模型技术】什么时候必要训练和微调属于本身的大模型——小微企业必须要 ...
反转基因福娃
论坛元老
|
2024-12-31 06:59:43
|
显示全部楼层
|
阅读模式
楼主
主题
1639
|
帖子
1639
|
积分
4917
“
从标题出发,先有需求再有办理方案
”
老板和员工在思维方式上有一个很大的差别就是,作为老板他们喜好寻找现有的办理方案,如果现有的办理方案无法满意的情况下,才会本身计划一个办理方案。
而作为员工来说特别是技术职员,多数有一种技术至上的心态,比如说很多技术职员找工作会特别在乎公司用的技术是否充足牛逼,充足高大上。
之所以产生这种征象的原因是由于,技术职员的心态是学会牛逼的技术,走到哪里都不怕。
而老板的心态是,能办理标题把业务跑起来最告急,现有的办理方案大概不是最好的,但它却是经过验证的,能够保证业务的稳定性;但如果提出新的办理方案,就要承担新方案潜在的各种风险。等以后业务稳定之后,可以慢慢的优化现有的方案。
什么时候必要训练和微调模型?
在上面的内容中,描述了一下员工与老板思维以及心态上的区别;这两种思维方式没有绝对的对错之分,区别只是两种完全差别的发展方向,一种是打工人的思维方式,一种是创业者的思维方式。
就拿大模型训练与微调来说,很多技术职员都想亲身参与或体验一下一个模型从无到有的诞生过程;但受限于各种原因,偶然机参与这样工程的人还是比力少的;因此很多人都退而求其次,想做一下模型的训练与微调。
举个例子,你是某个小公司的技术职员,老板想引入大模型技术来升级现有的业务系统,然后让你做一下前期调查和简单的办理方案。
不管使用的是大模型的什么技术,比如Agent,知识库,AIGC等;很多技术职员下意识的方式就是先搞一个本地模型,试试能不能训练和微调一下,然后就陷入各种技术细节中无法自拔。
但究竟上,市面上已经有很多大模型服务商,他们有专门训练和微调过的模型;根据现有的业务体系,大概随便找一个符合的模型就可以用了。
为什么不发起企业引入大模型技术时,就直接打造属于本身的大模型?
原因就是,你还不知道怎么把大模型技术与本身的业务场景相结合;虽然市面上可能有一些相似的案例,但每个企业都有其独特的运作方式,得当别人的不一定得当你。
简单来说就是,你都不知道现有业务引入大模型能办理哪些标题,以及潜藏着哪些标题;说白了就是,你都不知道要训练和微调出一个必要办理什么标题的模型,这样的模型怎么可能做的好呢?
就雷同于你需求都不清楚,就直接开始开辟产物了,这样的产物能有人用吗?
当然,如果说你觉得你是上帝之子,即使需求不明白也能做出符合业务场景的大模型;大概说你不差钱,训练一次不可就重新训练,那也可以。
因此,什么时候开始训练和微调模型?
最好的时机就是,在你的业务成型之后,有一些标题确实必要办理大概说必要节省本钱;这时,你再去考虑训练和微调一个模型,甚至是找模型服务商帮你重新计划一个模型都可以。
一句话就是,在你的需求明白之后,也就是你知道要训练出一个什么样的模型,并且你有充足的技术和资金支持,那么你就可以训练和微调本身的模型了。
说到底还是那句话,技术是为业务服务的,技术的发展是基于业务场景的落地,而不是从技术去推动业务场景的发展,虽然技术的发展也有可能颠覆现有的业务场景,但那是技术与业务场景的深度融合的效果。
总之,不要一开始就想着训练和微调属于本身的模型,要从标题出发,而不是从效果出发。
如何学习AI大模型?
作为一名热心肠的互联网老兵,我决定把名贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和本事了 。我已将告急的AI大模型资料包罗AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
这份完备版的大模型 AI 学习资料已经上传CSDN,朋侪们如果必要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】
一、全套AGI大模型学习路线
AI大模型期间的学习之旅:从底子到前沿,把握人工智能的核心技能!
二、640套AI大模型陈诉合集
这套包罗640份陈诉的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研职员、工程师,还是对AI大模型感兴趣的爱好者,这套陈诉合集都将为您提供名贵的信息和启示。
三、AI大模型经典PDF籍
随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强盛的语言理解和生本钱领,正在改变我们对人工智能的认识。 那以下这些PDF籍就黑白常不错的学习资源。
四、AI大模型商业化落地方案
作为普通人,入局大模型期间必要持续学习和实践,不断提高本身的技能和认知水平,同时也必要有责任感和伦理意识,为人工智能的健康发展贡献气力。
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
0 个回复
正序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
发新帖
回复
反转基因福娃
论坛元老
这个人很懒什么都没写!
楼主热帖
设计模式---组合模式
Spark快速上手(4)Spark核心编程-Spark ...
【Unity3D】Transform组件
拿到12家offer,想给大家分享一下面试 ...
【渗透攻击】PowerShell与Shell 有什么 ...
Linux的目录结构
使用 Kubeadm 部署 K8S安装
如何将鸿蒙(harmonyOS)系统退回安卓 ...
[工具使用]SqlMap
echarts使用及遇到的问题
标签云
集成商
AI
运维
CIO
存储
服务器
浏览过的版块
DevOps与敏捷开发
数据仓库与分析
Oracle
Mysql
登录参与点评抽奖加入IT实名职场社区
下次自动登录
忘记密码?点此找回!
登陆
新用户注册
用其它账号登录:
关闭
快速回复
返回顶部
返回列表