大模子基本原理（四）——怎样武装ChatGPT

郭卫东 · 2025-2-13 19:22:19

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区。

您需要登录才可以下载或查看，没有账号？立即注册

x

传统的LLM存在几个短板：编造事实、计算不准确、数据过时等，为了应对这几个问题，可以借助一些外部工具或数据把AI武装起来。
实现这一思路的框架包罗RAG、PAL、ReAct。

1、RAG（检索增强生成）

LLM生成的内容会受到训练数据的影响，所以如果训练数据里对某个范畴的文本覆盖不多，就没有办法很好的答复我们提出的问题，这个时间RAG就可以很好的解决这个问题。
RAG：通过提供外部文档，让模子访问外部知识库，得到更可靠和准确的答复。
具体步调：
（1）外部知识文档要先被切分成一个个段落，因为LLM一次性能够担当的文本长度有限。每个段落会被转换成一系列向量，向量可以被看作是一串固定长度的数字，然后将一系列向量储存进向量数据库中。

（2）当我们提出问题时，这个提示也会被转换成向量，然后查找向量数据库中和用户的查询向量最为接近的段落向量，找到段落向量以后，段落信息会和原来的用户查询问题组合到一起，一块传给AI。这样AI就能把外部文档的段落作为上下文，基于里面的信息给出更严谨的答复。

RAG有利于搭建企业知识库或个人知识库。
2、PAL（步伐辅助语言模子）

AI的另一个缺陷是，我们没有办法把它用作计算器，因为AI只会预测下一个最大概率的token，并不会真正的进行计算。
PAL的焦点在于，我们不让AI直接生成计算效果，而是借助其他善于做计算的工具，如python解释器，那我们给AI的要求就酿成，在涉及计算步调时，生成得到计算效果所需的代码。
具体操作我们可以借助头脑链，在prompt中通过小样本提示，给模子示范怎样分步调思考，写出解决问题所需的变量赋值、数学运算等等代码。当用户提问后，将用户的问题和我们已有的提示模板进行拼接，将拼接后的内容一并给到AI，将AI生成的代码给到python解释器，并将代码实行的效果返回给AI，让AI带着计算得到的答案对用户的问题进行复兴。
相当于LLM得到了问题和答案，最终生成问题的答复。

3、ReAct（推理办法结合）

由于LLM自然受到训练数据日期的影响，没有办法得到最新的知识和内容。
ReAct焦点在于，让模子进办法态推理，并接纳办法与外界环境互动。
ReAct同样可以和头脑链结合，使用小样本提示，展示给模子一个推理与办法结合的框架，针对问题，把步调进行拆分，每个步调要进行推理、办法、观察。推理是针对问题或上一步观察的思考，办法是基于推理与外部环境的一些交互（比如用搜刮引擎对关键字进行搜刮），观察是对办法得到的效果进行查看。

如果问AI2022年欧冠的冠军是哪个球队，它得到答案的过程可能是这样。

通过分布推理的头脑链，模子不但可以得到更准确的答案，而且我们也可以通过这些轨迹进行验证。
ReAct框架的Action，不专指搜刮和欣赏网页，而是AI模子所支持的任何办法（实行代码，数据库查找，API调用等）

免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！更多信息从访问主页：qidao123.com:ToB企服之家，中国第一个企服评测及商务社交产业平台。

		自动登录	找回密码
密码			立即注册

大模子基本原理（四）——怎样武装ChatGPT

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区。

0 个回复

快速回复

楼主热帖

标签云

浏览过的版块