苹果公布”MUSCLE“,更好地与 ChatGPT 竞争

饭宝  论坛元老 | 2024-7-18 14:21:51 | 显示全部楼层 | 阅读模式
打印 上一主题 下一主题

主题 1002|帖子 1002|积分 3006

苹果公司最近在人工智能范畴取得了明显进展,特别是在提升其语言模型的用户体验方面。该公司的研究人员开发了一种新的方法,旨在改善用户在人工智能模型升级时的体验。这种方法被称为MUSCLE(兼容LLM进化的模型更新战略的缩写),它通过训练适配器来确保新模型与旧模型在相应上保持一致性。
在人工智能实验室中,当底层大语言模型更新时,经常会出现一些不测的举动,好比改变其相应查询的方式。这不仅会影响用户对体系的熟悉度,还可能迫使他们改变与模型交互的方式。苹果的研究人员意识到,这种变化可能会削弱主流iOS用户利用人工智能模型的体验。因此,他们动手研究如何通过创建指标来比力不同模型版本之间的回归和不一致,从而开发出一种培训战略,从一开始就最大限度地减少这些不一致的发生。
喜好儿网

研究人员在论文中指出,用户在与大型语言模型(LLM)交互时,会开发出自己的提示样式和技能。因此,模型的更新可能会迫利用户改变他们编写提示的方式。虽然一些早期采用者可能会担当这种变化,但对于大多数iOS用户来说,这可能是不可担当的。为相识决这个问题,苹果的团队研究了如何通过训练适配器来保持模型在更新过程中的一致性。
MUSCLE方法的核心在于不需要更改底子模型的训练,而是依赖于训练适配器,这些适配器根本上是LLMs。通过这种方式,研究人员成功地减少了负翻转(即旧模型给出正确答案而新模型给出错误答案)的环境,降低幅度高达40%。此外,他们还主张确保新模型所犯的错误与旧模型可能犯的错误一致,认为当两个模型都不正确时,保持一致是有代价的。如许做的目的是让用户在模型不正确时能够继续利用他们已经制定的应对战略,从而减少不一致带来的用户不满。
为了测试MUSCLE体系的有效性,研究团队对LLMs举行了更新,类似于Llama和Phi如许的模型,并在不同任务中发现了高达60%的负面翻转。他们通过询问更新后的模型数学问题,检查这些模型是否仍然能够给出特定问题的正确答案。结果表现,利用MUSCLE体系,研究人员成功地减轻了相当多的负面翻转,偶然高达40%。
这项研究的意义在于,它不仅进步了人工智能模型的可靠性,还确保了用户在模型更新时能够获得一致的体验。随着聊天机器人如ChatGPT和Google Gemini的更新速度不断加快,苹果的这项研究有可能使这些工具的新版本更加可靠,从而避免用户在切换到更新型号时遭受更差的用户体验。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

饭宝

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表