基础关卡-第1关:书生大模型全链路开源体系

打印 上一主题 下一主题

主题 906|帖子 906|积分 2718

基础关卡-第1关:书生大模型全链路开源体系

重要先容了大模型、书生·浦语大模型的发展,从基础模型到实际应用的重要步骤,以及书生·浦语全链条开源开放体系等。
任务链接:Tutorial/docs/L1/ToolChain at camp4 · InternLM/Tutorial (github.com)
视频链接:书生·浦语大模型开源开放体系_哔哩哔哩_bilibili
参考链接:书生·浦语大模型实战营(一):书生·浦语大模型全链路开源体系 (i-square.github.io)
1、发展进程

在过去,人工智能领域的发展不停遵循着一个基本原则:一个模型对应一个场景或者任务。然而,随着技能的进步和需求的增长,这一格局正在发生深刻的变化。现在,我们正迈向一个新的期间,一个模型不再局限于一个场景或任务,而是可以应用于多个场景、多模态的复杂环境中。
书生·浦语大模型的发展进程彰显了这一变革的重要性。它从轻量级的7B社区模型,渐渐升级到中量级的20B商业模型,再到重量级的123B全场景模型。这一演进不但仅是在模型规模上的提升,更是对多模态、多场景应用需求的积极响应。

2、从模型到应用

第一步:模型选型

在应用场景中,根据多个大模型的相干维度举行能力比较,并举行模型评测。初步选型后,可确定意向大模型。
第二步:评估业务场景复杂度

业务场景简单: 如果业务场景不太复杂,可以直接将选定的模型应用于场景中。
业务场景复杂: 对于复杂场景,通常直接使用开源模型难以满足需求,必要进一步微调、举行prompt工程等构建工作。
第三步:判定微调策略

全参数微调: 若算力富足,可以举行全参数微调,提高模型性能。
部门参数微调: 如果算力受限,只能举行部门参数微调,固定大部门参数,调解一小部门参数。
第四步:构建智能体

模型与环境交互: 考虑模型与环境的交互,特别是如果必要调用外部API或与已有业务数据库交互,则必要构建智能体。
无环境交互: 如果模型在业务场景中不必要与环境举行交互,可以直接将微调好的模型应用于场景。
第五步:模型评测与应用上线

模型评测: 举行模型评测,确保在实际场景中体现良好。
上线或迭代: 根据评测结果,决定是否上线应用或者继承迭代模型。
第六步:模型部署

考虑软件体系相干性能、安全、功能等方面内容:
资源优化: 考虑如何以更少的资源部署模型。
吞吐量提升: 提升整个应用的吞吐量,确保在生产环境中的性能体现。
这六个步骤构成了从选择模型到应用部署的全链条,确保在实际应用中大模型能够充分发挥作用。
3、书生·浦语大模型全链路开源体系

书生·浦语大模型打破了传统的人工智能应用模式,提出了全链条开源开放体系。这一体系涵盖了从数据到预训练、微调、部署、评测到应用的全过程,为通用人工智能的实现提供了完整的解决方案。数据(书生·万卷)作为起点,颠末IntermLM-Train的预训练,使用XTuner举行微调,通过LMDeploy实现部署,通过OpenCompass举行全面评测,最终应用在Lagent构建的多模态智能体中。
这一全链条开源开放体系,为大模型的发展提供了创新性的方法,促使人工智能更好地服务于多样化的实际需求。


数据:覆盖多模态和任务

全链条开源体系以书生-万卷为基础,涵盖了多模态和多任务的数据需求,为模型的学习提供了全面支持。

预训练:并行训练,极致优化

InterLM接纳并行训练的方式,通过极致优化实现了高效的预训练,为模型的通用性奠基基础。

微调:XTuner,支持全参数微调,支持Lora等低本钱微调

微调阶段使用XTuner工具,支持全参数微调,同时还支持诸如Lora等低本钱微调方法,使模型更好地适应各种特定任务。


  • 增量续训:让基座模型学习新知识,垂直领域
  • 有监督微调:让模型学会明白和遵循各种指令。一般接纳全量参数微调和部门参数微调等方法。
  • 多种微调算法:多种微调策略与算法,覆盖各类SFT场景。
  • 适配多种开源生态:支持加载HuggingFace、ModelScope模型或者数据级
  • 自动优化加速:开发者无需关注复杂的显存优化和计算加速细节

部署:LMDeploy,全链路部署,性能领先

LMDeploy提供了全链路部署的解决方案,包括模型轻量化、推理和服务,使得大模型在GPU上的部署更加高效,性能领先。

评测:OpenCompass,全方位评测,性能可以复现,全球领先的大模型开源评测体系

评测阶段使用OpenCompass工具,全方位评测模型性能,保证了评测结果的复现性,成为全球领先的大模型开源评测体系。


  • 丰富模型支持:开源模型、API模型一站式评测。
  • 分布式高效评测:支持千亿参数模型在海量数据集上分布式评测。
  • 便捷的数据集接口:支持社区用户根据自身需求快速添加自界说数据集。
  • 敏捷的能力迭代:每周更新大模型能力榜单。

应用:Legent、AgentLego 支持多种智能体,支持代码解释器和多种工具

最终,模型的应用在Legent和AgentLego等多种智能体中得以体现,支持代码解释器和多种工具,实现了多模态智能体的机动应用。


  • 丰富的工具集合,尤其是提供了大量视觉、多模态相干领域的工具。
  • 支持多个主流智能体体系,如LangChain、Transformers Agent、Lagent等。
  • 机动的多模态工具调用接口,可以轻松支持各类输入输特别式的工具函数
  • 一键式远程工具部署,轻松使用和调试大模型智能体


免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

正序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

郭卫东

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表