大模子基本原理(四)——怎样武装ChatGPT

打印 上一主题 下一主题

主题 1048|帖子 1048|积分 3144

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?立即注册

x
传统的LLM存在几个短板:编造事实、计算不准确、数据过时等,为了应对这几个问题,可以借助一些外部工具或数据把AI武装起来。
实现这一思路的框架包罗RAG、PAL、ReAct。

1、RAG(检索增强生成)

LLM生成的内容会受到训练数据的影响,所以如果训练数据里对某个范畴的文本覆盖不多,就没有办法很好的答复我们提出的问题,这个时间RAG就可以很好的解决这个问题。
RAG:通过提供外部文档,让模子访问外部知识库,得到更可靠和准确的答复。
具体步调:
(1)外部知识文档要先被切分成一个个段落,因为LLM一次性能够担当的文本长度有限。每个段落会被转换成一系列向量,向量可以被看作是一串固定长度的数字,然后将一系列向量储存进向量数据库中。

(2)当我们提出问题时,这个提示也会被转换成向量,然后查找向量数据库中和用户的查询向量最为接近的段落向量,找到段落向量以后,段落信息会和原来的用户查询问题组合到一起,一块传给AI。这样AI就能把外部文档的段落作为上下文,基于里面的信息给出更严谨的答复。


RAG有利于搭建企业知识库或个人知识库。
2、PAL(步伐辅助语言模子)

AI的另一个缺陷是,我们没有办法把它用作计算器,因为AI只会预测下一个最大概率的token,并不会真正的进行计算。
PAL的焦点在于,我们不让AI直接生成计算效果,而是借助其他善于做计算的工具,如python解释器,那我们给AI的要求就酿成,在涉及计算步调时,生成得到计算效果所需的代码。
具体操作我们可以借助头脑链,在prompt中通过小样本提示,给模子示范怎样分步调思考,写出解决问题所需的变量赋值、数学运算等等代码。当用户提问后,将用户的问题和我们已有的提示模板进行拼接,将拼接后的内容一并给到AI,将AI生成的代码给到python解释器,并将代码实行的效果返回给AI,让AI带着计算得到的答案对用户的问题进行复兴。
相当于LLM得到了问题和答案,最终生成问题的答复。

3、ReAct(推理办法结合)

由于LLM自然受到训练数据日期的影响,没有办法得到最新的知识和内容。
ReAct焦点在于,让模子进办法态推理,并接纳办法与外界环境互动。
ReAct同样可以和头脑链结合,使用小样本提示,展示给模子一个推理与办法结合的框架,针对问题,把步调进行拆分,每个步调要进行推理、办法、观察。推理是针对问题或上一步观察的思考,办法是基于推理与外部环境的一些交互(比如用搜刮引擎对关键字进行搜刮),观察是对办法得到的效果进行查看。

如果问AI2022年欧冠的冠军是哪个球队,它得到答案的过程可能是这样。

通过分布推理的头脑链,模子不但可以得到更准确的答案,而且我们也可以通过这些轨迹进行验证。
ReAct框架的Action,不专指搜刮和欣赏网页,而是AI模子所支持的任何办法(实行代码,数据库查找,API调用等)


免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

郭卫东

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表