大模子实战:快速搭建基于RAG知识库的智能聊天助手,在当地部署的开源大模 ...

打印 上一主题 下一主题

主题 1013|帖子 1013|积分 3039

本篇文章内容共分为2个部分,你可根据必要选择性阅读:


  • RAG相关概念及检索方式简介;
  • 基于知识库的智能聊天助手搭建实验。
一、什么是RAG?

大语言模子的训练数据一样平常是基于公开数据,且每一次训练必要斲丧大量的算力,这意味着大模子的知识一样平常不会包含私有领域的知识,同时在公开知识领域存也会在肯定的滞后性。目前解决这一题目的通用方案是接纳 RAG(检索增强生成)技能,即首先使用用户题目来匹配最相关的外部数据,然后将检索到的相关内容召回后作为模子提示词的上下文和原题目一起提交给大模子来重新组织回复。
1.1 RAG 的概念表明
以向量检索为核心的 RAG 架构已成为解决大模子获取最新外部知识,同时解决其生成幻觉题目时的主流技能框架,并且已在相称多的应用场景中落地实践。开发者可以使用该技能低成当地构建一个 AI 智能客服、企业智能知识库、AI 搜索引擎等,通过自然语言输入与各类知识组织形式进行对话。以一个有代表性的 RAG 应用为例:
在下图中,当用户提问 “美国总统是谁?” 时,系统并不是将题目直接交给大模子来回答,而是先将用户题目在知识库中(如下图中的维基百科)进行向量搜索,通过语义相似度匹配的方式查询到相关的内容(拜登是美国现任第46届总统…),然后再将用户题目和搜索到的相关知识提供给大模子,使得大模子得到充足完备的知识来回答题目,以此得到更可靠的问答结果。

RAG 基本架构
基于上述架构,一个简化的流程实验逻辑图如下所示:

RAG流程实验逻辑图
1.2 为什么必要这样做?
我们可以把大模子比做是一个超级专家,他熟悉人类各个领域的知识,但他也有自己的局限性,比如他不知道你个人的一些状态,由于这些信息是你私家的,不会在互联网上公开,所以他没有提前学习的机遇。
当你想雇佣这个超级专家来充当你的家庭财务顾问时,必要答应他在接受你的提问时先翻看一下你的投资理财记录、家庭消费付出等数据。这样他才气根据你个人的现实情况提供专业的发起。
这就是 RAG 系统所做的事情:资助大模子临时性地得到他所不具备的外部知识,答应它在回答题目之前先找答案。
根据上面这个例子,我们很容易发现 RAG 系统中最核心的是外部知识的检索环节。专家能不能向你提供专业的家庭财务发起,取决于能不能精确找到他必要的信息,如果他找到的不是投资理财记录,而是家庭减肥计划,那再锋利的专家都会无能为力。

   

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

圆咕噜咕噜

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表