大模子开发的5种应用架构

打印 上一主题 下一主题

主题 704|帖子 704|积分 2112

​ 架构对一个项目来说至关重要,它们能帮助构建高效、可维护的系统。然而,当我们进入大模子应用范畴时,传统的设计模式好像不再完全适用。天生式 AI 等新兴技术的出现,使得我们在设计这些系统时面临前所未有的挑衅。
​ 在大模子应用实现过程中存在很多独特的问题,例如高昂的成本、较长的响应耽误以及天生内容的不确定性。这些问题要求我们在设计时采用新的方法和计谋,以确保系统的稳固性和效率。
​ 为了办理这些问题,总结了一些针对大模子应用的设计方法和架构模式。例如,通过调解模子规模和优化运行情况来降低成本;使用缓存和异步处理技术减少耽误;采用天生内容质量控制机制,降低不良天生内容的风险。这些方法不仅能有效应对当前的挑衅,还能为未来的系统设计提供参考。
1、路由分发
​ 当用户输入一个查询时,该查询首先会被发送到路由转发模块。这个模块的主要功能是对输入的查询进行分类和分发。如果查询是可识别的,路由转发模块会将其发送到小模子进行处理。小模子通常具有更高的响应速度、较低的成本,并且在处理可识别查询时体现得更为准确。
​ 然而,当遇到无法识别的查询时,路由转发模块会将其转交给大模子处理。固然大模子的运行成本较高,但它具备更强的处理本领,能够处理各种类型的查询并返回更全面的答案。
​ 通过这种分类处理机制,大模子应用产物能够在成本、性能和用户体验之间找到平衡。小模子负责处理常见的、易于识别的查询,以进步响应速度和降低成本。而大模子则负责处理复杂的、难以识别的查询,确保用户能够获得全面、准确的答案。这种设计既优化了系统性能,又提升了用户体验,终极实现了成本效益的最大化。

2、大模子署理
​ 在任何生态系统中,都会有多个针对特定任务范畴的专家并行工作,以处理特定类型的查询,并将这些响应整合在一起,形成一个全面的答案。这种架构模式非常适合复杂的问题办理场景,由于不同方面的问题必要不同的专业知识,就像一个由专家构成的小组,每个专家负责处理大问题的一个方面。
​ 在这个架构中,较大的模子(例如:GPT-4)负责理解上下文,并将其分解为特定的任务或信息请求。这些任务或信息请求被传递给更小的署理模子。这些署理模子可能是已经接受过特定任务训练的小模子,或者是具有特定功能的通用模子,例如BERT、Llama-2、上下文提示和函数调用。
​ 这种方法不仅优化了资源的使用,还进步了系统的响应速度和准确性。大模子善于处理复杂的上下文理解和任务分解,而小模子则专注于高效地执行特定任务。通过这种方式,系统能够以较低的成本和更高的性能,提供更加全面和精确的答案。
​ 总体而言,这种基于专家协作的架构模式为复杂问题的办理提供了一个有效的框架。在未来的发展中,这种模式有望进一步优化和扩展,为大模子应用带来更多的创新和改进。

3、基于缓存
​ 在大模子应用架构中引入缓存和微调,可以有效办理成本高、推理速度慢以及天生内容不准确等问题。通过缓存初始结果,可以在后续查询中迅速提供答案,从而显著进步效率。随着数据的累积,微调层将启动,使用早期交互的反馈,进一步优化和完善一个更为专业化的私有大模子。
​ 这种专有私有大模子不仅简化了操作流程,还使专业知识更好地顺应特定任务,使其在必要高度精确性和顺应性的情况中体现得更加精彩。例如,在客户服务或个性化内容创建等必要高度精确和顺应性的应用场景中,专有私有大模子能够提供更高效的服务。
​ 对于刚入门的用户,可以选择使用预先构建的服务,如GPTCache,或使用常见的缓存数据库,如Redis、Cassandra、Memcached,来运行自己的服务。这些工具可以帮助用户快速构建和部署高效的缓存系统,进步系统的响应速度和性能。
​ 总之,通过团结缓存和微调技术,大模子应用能够在成本、性能和用户体验之间找到更好的平衡,为各种复杂应用场景提供更加高效和专业的办理方案。

4、单 Agent 模式
​ 在用户输入提示词(Prompt)时,智能署理(Agent)首先会基于大模子进行全面的规划(Planning)。这个规划过程包罗将复杂的任务拆解成若干更小的子任务,从而使整个问题变得更易于管理和办理。每个子任务将被智能署理分别执行(Action),确保任务能够按步调推进。
​ 在执行每个子任务的过程中,智能署理会对每一步的执行结果进行观测(Observation)。这个观测步调至关重要,由于它确保了每个子任务的执行结果符合预期。如果观测结果合格,智能署理将把这些结果整合起来,直接返回给用户终极的答案,从而包管了高效和准确的响应。然而,如果在观测过程中发现结果不合格或者执行出现错误,智能署理会立即启动重新规划(Replanning)过程。重新规划的目的是调解任务的执行计谋,修正错误,从而确保终极结果的精确性和可靠性。
​ 这种面向目的的智能署理架构模式在当前的人工智能大模子期间非常广泛。它不仅能进步系统的机动性和顺应性,还能确保在处理复杂任务时提供准确和高效的办理方案。每个步伐员都必要掌握这种架构设计模式,以便在现实开发中应对各种复杂的应用场景。

5、Agent 智能体
​ 该架构设计模式强调了系统的机动性和模块化,通过自我重新配置来优化任务性能。它类似于一个多功能工具,可以根据不同的需求选择和激活恰当的功能模块。这种设计对于必要为各种客户需求或产物需求定制办理方案的企业来说,具有极高的实用性和效率。企业可以通过使用各种自主署理框架和体系结构来开发每个智能署理(Agent),例如CrewAI、Langchain、LLamaIndex、Microsoft Autogen 和 superAGI 等。
​ 这种模块化的架构允许一个智能署理专注于特定任务。例如,一个署理可以专门用于猜测,一个负责处理预约查询,另一个则专注于天生消息,还有一个专门用于更新数据库。通过这种方式,每个署理可以最大水平地发挥其专长,进步整个系统的效率和准确性。将不同的模块组合在一起,系统能够机动应对各种复杂的应用场景和任务需求。
​ 此外,随着专业 AI 公司提供的特定服务的增多,未来我们可以将现有模块替换为外部或第三方服务,以处理特定的任务或范畴的问题。这种机动的架构不仅能够顺应不停变革的技术情况,还能够快速响应市场需求和业务变革,提供更为精准和高效的办理方案。
​ 模块化的设计还促进了系统的可扩展性和维护性。通过引入新的功能模块或替换现有模块,系统可以不停更新和优化,以保持其领先的性能和功能。同时,这种设计使得系统的维护变得更加简便,由于每个模块都是独立的,修改或更新一个模块不会对整个系统产生重大影响。
​ 总之,这种机动和模块化的架构设计模式,为企业提供了一种高效、可扩展和易维护的办理方案。通过团结不同的自主署理框架和体系结构,企业能够构建出高度定制化的智能署理系统,满足各种复杂的业务需求。随着技术的发展和市场的变革,这种架构将继承展现其强大的顺应性和机动性,成为企业实现数字化转型和智能化运营的重要工具



如何学习大模子 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,以是现实上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的原理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和发展。
我意识到有很多履历和知识值得分享给大家,也可以通过我们的本领和履历解答大家在人工智能学习中的很多困惑,以是在工作繁忙的情况下还是对峙各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋侪无法获得精确的资料得到学习提升,故此将并将重要的AI大模子资料包罗AI大模子入门学习头脑导图、精品AI大模子学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

第一阶段(10天):初阶应用

该阶段让大家对大模子 AI有一个最前沿的熟悉,对大模子 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 谈天,而你能调教 AI,并能用代码将大模子和业务衔接。


  • 大模子 AI 能干什么?
  • 大模子是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模子应用业务架构
  • 大模子应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心头脑
  • Prompt 典范构成
  • 指令调优方法论
  • 头脑链和头脑树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模子 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的本领。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模子开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 步伐员。


  • 为什么要做 RAG
  • 搭建一个简朴的 ChatPDF
  • 检索的底子概念
  • 什么是向量表现(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模子本地部署

第三阶段(30天):模子训练

恭喜你,如果学到这里,你根本可以找到一份大模子 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模子,能独立训练开源多模态大模子,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?


  • 为什么要做 RAG
  • 什么是模子
  • 什么是模子训练
  • 求解器 & 损失函数简介
  • 小实行2:手写一个简朴的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实行数据集的构建

第四阶段(20天):商业闭环

对全球大模子从性能、吞吐量、成本等方面有肯定的认知,可以在云端和本地等多种情况下部署大模子,找到适合自己的项目/创业方向,做一名被 AI 武装的产物经理。


  • 硬件选型
  • 带你了解全球大模子
  • 使用国产大模子服务
  • 搭建 OpenAI 署理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模子
  • 大模子的私有化部署
  • 基于 vLLM 部署大模子
  • 案例:如何优雅地在阿里云私有部署开源大模子
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法存案

学习是一个过程,只要学习就会有挑衅。天道酬勤,你越努力,就会成为越良好的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模子 AI 的精确特征了。
这份完整版的大模子 AI 学习资料已经上传CSDN,朋侪们如果必要可以微信扫描下方CSDN官方认证二维码免费领取【包管100%免费】


免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

梦应逍遥

金牌会员
这个人很懒什么都没写!
快速回复 返回顶部 返回列表