IT评测·应用市场-qidao123.com技术社区

标题: 【大模型基础_毛玉仁】6.2 检索加强生成(RAG)架构 [打印本页]

作者: 大号在练葵花宝典    时间: 5 天前
标题: 【大模型基础_毛玉仁】6.2 检索加强生成(RAG)架构


  

6.2 检索加强生成(RAG)架构

检索加强生成(RAG)系统是一个集成了外部知识库、检索器、生成器等多个功能模块的软件系统。针对差别的业务场景和需求,可以筹划差别的系统架构来 组合、和谐这些模块,以优化RAG的性能。
.
6.2.1 RAG 架构分类

思量到大语言模型的开源/闭源、微调成本等标题,RAG中的大语言模型可以是参数不可感知/调治的“黑盒”模型,也可以是参数可感知和微调的“白盒”模型。
从是否对大语言模型进行微调的角度出发,将RAG架构分类两大类:黑盒加强架构白盒加强架构
图6.9: 检索加强架构分类图。
此中含蓝色雪花的模块表示其参数被冻结、带红色 火焰的部分表示微调时其参数被更新。

黑盒加强架构, 根据是否对检索器进行微调分为两类:

白盒加强架构,根据是否对检索器进行微调分为两类:

在RAG系统中,除了调整检索器和大语言模型,我们也可对其他功能模块进行调整。调整其他功能模块与黑盒加强和白盒加强的分类是兼容的。
.
6.2.2 黑盒加强架构

某些情况下,无法获取大语言模型的结构和参数大概没有充足的算力对模型进行微调,此时,RAG 必要在黑盒加强架构的基础上构建。
在黑盒加强架构中,仅可对检索器进行策略调整与优化。其可以分为无微调架构和检索器微调两种架构。
.
1)无微调

无微调架构中,检索器和语言模型经太过别独立的预练习参数不再更新直接组合使用
In-Context RALM 是该框架下的代表性方法。其直接将检索器检索到的文档前置到输入标题前作为上下文。
检索操作时,几个关键参数:

.
2)检索器微调

在检索器微调架构中,大语言模型的参数保持不变,仅用其输出指导检索器的微调
REPLUG LSR 是检索器微调框架的代表性方法,它使用大语言模型的狐疑度分数作为监督信号来微调检索器,使其能更有用地检索出可以或许显著降低语言模型狐疑度的文档。
此过程涉及两个关键的概率分布:

REPLUG LSR 在微调过程中将语言模型视为黑盒,仅通过模型输出指导检索器练习,避免修改内部结构。同时采用异步索引更新策略,在肯定的练习步调之后才进行更新,降低索引更新频率以减少计算成本。
此外,检索器微调框架中还可以引入代理模型(如小型语言模型)来加强检索器的微调结果,从而在不微调目标语言模型的情况下提拔其在差别任务上的表现。
例如,AAR 方法通入引入额外小型语言模型,使用它的交叉注意力得分标注偏好文档,以此来微调检索器,使其可以或许在不微调目标语言模型的情况下加强其在差别任务上的表现。
.
6.2.3 白盒加强架构

通常,大语言模型和检索器是独立预练习的,二者可能存在匹配欠佳的情况。白盒加强架构通过微调大语言模型来共同检索器,以提拔 RAG 的结果。
白盒加强架构可根据是否对检索器进行微调分为两类:仅语言模型微调检索器和语言模型协同微调
.
1)仅微调语言模型

仅微调语言模型:

RETRO 是仅微调语言模型的代表性方法之:

SELF-RAG

图 6.12: RETRO 模型架构图

以 RETRO 为例,其结构如图:

.
2)检索器和语言模型协同微调

在检索器和语言模型协同微调的架构中,检索器和语言模型的参数更新同步进行
这种微调的方式使得检索器可以或许在检索的同时,学习如何更有用地支持语言模型的需求,而语言模型则可以更好地适应并使用检索到的信息,以进一步提拔 RAG 的性能。
图 6.13: Atlas 模型架构图

Atlas 是检索器和语言模型协同微调的架构的代表性工作,其架构如图所示。

为确保检索结果与模型最新状态保持同步,Atlas 同样必要定期更新语料库文档的向量编码,从而维持检索的准确性。
.
6.2.4 对比与分析

黑盒加强架构:闭源模型的背景下提出,限制了对模型内部参数的直接调整。两种策略如下:

白盒加强架构:使用开源模型优势,答应调整语言模型结构和参数,可更好和谐检索器和大语言模型。两种微调形式:

尽管白盒加强架构可以有用改善 RAG 的性能,但也存在明显缺点。这种架构通常必要大量计算资源和时间来练习,特别是协同微调策略,必要大量的运算资源来实现语言模型和检索器的同步更新。
.

其他参考:【大模型基础_毛玉仁】系列文章

   声明:资源可能存在第三方来源,若有侵权请接洽删除!

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。




欢迎光临 IT评测·应用市场-qidao123.com技术社区 (https://dis.qidao123.com/) Powered by Discuz! X3.4