论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
只需一步,快速开始
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
IT评测·应用市场-qidao123.com
»
论坛
›
数据库
›
Oracle
›
大模子基本原理(四)——怎样武装ChatGPT ...
大模子基本原理(四)——怎样武装ChatGPT
郭卫东
论坛元老
|
2025-2-13 19:22:19
|
显示全部楼层
|
阅读模式
楼主
主题
1048
|
帖子
1048
|
积分
3144
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
传统的LLM存在几个短板:编造事实、计算不准确、数据过时等,为了应对这几个问题,可以借助一些外部工具或数据把AI武装起来。
实现这一思路的框架包罗RAG、PAL、ReAct。
1、RAG(检索增强生成)
LLM生成的内容会受到训练数据的影响,所以如果训练数据里对某个范畴的文本覆盖不多,就没有办法很好的答复我们提出的问题,这个时间RAG就可以很好的解决这个问题。
RAG:
通过提供外部文档,让模子访问外部知识库,得到更可靠和准确的答复。
具体步调:
(1)外部知识文档要先被切分成一个个段落,因为LLM一次性能够担当的文本长度有限。每个段落会被转换成一系列向量,向量可以被看作是一串固定长度的数字,然后将一系列向量储存进向量数据库中。
(2)当我们提出问题时,这个提示也会被转换成向量,然后查找向量数据库中和用户的查询向量最为接近的段落向量,找到段落向量以后,段落信息会和原来的用户查询问题组合到一起,一块传给AI。这样AI就能把外部文档的段落作为上下文,基于里面的信息给出更严谨的答复。
RAG有利于搭建企业知识库或个人知识库。
2、PAL(步伐辅助语言模子)
AI的另一个缺陷是,我们没有办法把它用作计算器,因为AI只会预测下一个最大概率的token,并不会真正的进行计算。
PAL的焦点在于,我们不让AI直接生成计算效果,而是借助其他善于做计算的工具,如python解释器,那我们给AI的要求就酿成,在涉及计算步调时,生成得到计算效果所需的代码。
具体操作我们可以借助头脑链,在prompt中通过小样本提示,给模子示范怎样分步调思考,写出解决问题所需的变量赋值、数学运算等等代码。当用户提问后,将用户的问题和我们已有的提示模板进行拼接,将拼接后的内容一并给到AI,将AI生成的代码给到python解释器,并将代码实行的效果返回给AI,让AI带着计算得到的答案对用户的问题进行复兴。
相当于LLM得到了问题和答案,最终生成问题的答复。
3、ReAct(推理办法结合)
由于LLM自然受到训练数据日期的影响,没有办法得到最新的知识和内容。
ReAct焦点在于,让模子进办法态推理,并接纳办法与外界环境互动。
ReAct同样可以和头脑链结合,使用小样本提示,展示给模子一个推理与办法结合的框架,针对问题,把步调进行拆分,每个步调要进行推理、办法、观察。推理是针对问题或上一步观察的思考,办法是基于推理与外部环境的一些交互(比如用搜刮引擎对关键字进行搜刮),观察是对办法得到的效果进行查看。
如果问AI2022年欧冠的冠军是哪个球队,它得到答案的过程可能是这样。
通过分布推理的头脑链,模子不但可以得到更准确的答案,而且我们也可以通过这些轨迹进行验证。
ReAct框架的Action,不专指搜刮和欣赏网页,而是AI模子所支持的任何办法(实行代码,数据库查找,API调用等)
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复
使用道具
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
郭卫东
论坛元老
这个人很懒什么都没写!
楼主热帖
SQL的约束
界面组件DevExpress ASP.NET Core v21. ...
Cilium 系列-3-Cilium 的基本组件和重 ...
vue 详情页返回列表,过滤查询条件保留 ...
用python对美女内容采集,舞蹈区内容真 ...
2023团队天梯模拟赛 L2-3 智能护理中心 ...
mysql5.7.35安装配置教程【超级详细安 ...
ASP.NET Core MVC 从入门到精通之HttpC ...
在本地运行Kusto服务器
JS基础二--字面量和变量
标签云
AI
运维
CIO
存储
服务器
浏览过的版块
物联网
分布式数据库
DevOps与敏捷开发
Mysql
SQL-Server
数据仓库与分析
运维.售后
.Net
IOS
快速回复
返回顶部
返回列表