用户名
Email
论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
帖子
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
只需一步,快速开始
账号登录
立即注册
找回密码
用户名
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
IT评测·应用市场-qidao123.com
»
论坛
›
软件与程序人生
›
云原生
›
一文讲透RAG,RAG的七种架构
一文讲透RAG,RAG的七种架构
玛卡巴卡的卡巴卡玛
金牌会员
|
2025-1-14 15:11:41
|
显示全部楼层
|
阅读模式
楼主
主题
993
|
帖子
993
|
积分
2979
Weaviate公司(向量服务厂商)近日梳理并发布了当下最流行的七种RAG架构,用图表的情势举行展示,清晰明了。下面,就这他们的分享,梳理一下每一种架构,资助查漏补缺。
Naive RAG | 朴素RAG
Naive RAG (Retrieval-Augmented Generation) 是一种最基础的 RAG 架构,紧张特点是将查询(query)与文档的检索联合起来,通过大语言模型 (LLM) 生成答案。
Naive RAG 的紧张组成部门
1.查询阶段 (Query Stage)
用户输入的查询被作为出发点,传递到检索模块。
2.检索模块 (Retrieval Module)
文档数据库 (Document Database)
:一个预先构建的数据库,存储了大量非结构化或结构化数据,如文本、图像或其他内容。
检索 (Search)
:基于用户查询,数据库会返回相干文档或文档片段(chunks),这些片段被认为与查询语义相干。
3.生成模块 (Generation Module)
将检索到的文档片段与查询联合,输入到生成模型(如 GPT-类 LLM)。
生成模型根据输入上下文,生成终极的相应。
Naive RAG 的优势
1.简单高效
:
架构设计简单,便于实现,特别适合初学者和小型应用场景。
2.模块化设计
:
将检索和生成分离,便于针对每一模块优化。
3.低延迟
:
因为无需复杂的后续排序或多级推理,相应速率快。
Naive RAG 的范围性
1.效果质量不稳定
:
检索的文档片段可能不完全相干,导致生成效果准确性受限。
2.缺乏上下文整合
:
无法有效地对不同文档片段之间的关系建模,例如相互矛盾或增补的信息。
3.易受查询噪声影响
:
用户查询假如不明确,可能导致检索到无关内容。
Retrieve-and-rerank RAG | 检索与重新排序 RAG
Retrieve-and-rerank RAG是一种改进版的检索加强生成架构。它在 Naive RAG 的基础上增加了一个重新排序(rerank)步骤,以提升检索内容的相干性和质量。
Retrieve-and-rerank RAG 的紧张组成部门
1.查询阶段 (Query Stage)
用户输入的查询被传递到检索模块。
2.检索模块 (Retrieval Module)
文档数据库 (Document Database)
:一个包含大量文档的知识库。文档可以是未分块的完备文档或分块的片段(chunks)。
检索阶段 (Search Stage)
:通过向量数据库或其他检索算法,从文档库中找到与查询相干的内容。这是初步检索效果。
3.重新排序模块 (Reranking Module)
对检索的初步效果举行重新排序,优化相干性。
工作原理
:
基于查询和检索效果的语义相似性,使用模型(如 Cross-Encoder 或专门的 reranker 模型)重新评分。
筛选出得分最高的文档片段,作为终极传递给生成模块的上下文。
优势
:
过滤掉噪声,提升检索质量。
确保生成模块能够获取最有价值的信息。
4.生成模块 (Generation Module)
将重新排序后的高质量文档片段与查询一起传递给生成模型(如 LLM)。
生成模型基于上下文,生成自然语言的回答。
Retrieve-and-rerank RAG 的优势
1.更高的效果相干性
:
通过重新排序模块,明显提升了传递给生成模块的文档上下文质量。
2.减少错误信息的传递
:
减少了无关或低相干性的文档对生成效果的干扰。
3.灵活性高
:
Reranking 模块可以根据具体使命更换模型(如特定领域的 fine-tuned reranker),以顺应多种应用场景。
Retrieve-and-rerank RAG 的范围性
1.盘算成本更高
:
Reranker 模块引入了额外的盘算步骤,增加了延迟和资源需求。
2.对 Reranker 依赖性强
:
假如重新排序模型表现欠佳,终极生成的质量可能仍然受到影响。
3.复杂度进步
:
架构比 Naive RAG 更复杂,增加了部署和调试的难度。
针对所有自学遇到困难的同学们,我帮大家体系梳理大模型学习脉络,将这份 LLM大模型资料 分享出来:包罗LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习门路、开源大模型学习教程等,
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
玛卡巴卡的卡巴卡玛
金牌会员
这个人很懒什么都没写!
楼主热帖
SQL SERVER事务提交回滚
Kubernetes(k8s)Deployment、Statefu ...
基于STM32的手势识别检测
【C++】ZZ1864- 解题精讲
ConcurrentHashMap源码,看我这篇就够 ...
一文读懂,硬核 Apache DolphinSchedul ...
实用五步法教会你指标体系的设计与加工 ...
数据类型的内置方法
如何用技术改变生活
同事写了一个责任链模式,bug 无数... ...
标签云
运维
CIO
存储
服务器
快速回复
返回顶部
返回列表