论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
只需一步,快速开始
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
ToB企服应用市场:ToB评测及商务社交产业平台
»
论坛
›
数据库
›
Nosql
›
大模型知识库——检索增强(RAG)技术与向量数据库的选择 ...
大模型知识库——检索增强(RAG)技术与向量数据库的选择 ...
民工心事
金牌会员
|
2025-1-25 02:44:34
|
显示全部楼层
|
阅读模式
楼主
主题
883
|
帖子
883
|
积分
2649
前言
“
RAG的核心在于准确与快速的检索
”
在之前关于RAG技术的文章中有介绍过知识库与检索增强的关系;也简单介绍了RAG的利用场景。
而RAG和向量数据库的实现原理,以及怎么选择向量数据库,是在智能客服,保举体系等领域必须要解决的一个问题。
RAG与向量数据库
先来回答第一个问题, 什么是检索增强——RAG?
顾名思义,RAG的全拼是Retrieval-augmented Generation,检索增强天生,R——代表的是Retrieval-检索器,G代表的是Generation-天生器,所以RAG重要有两大块构成,检索与天生。
检索
检索的过程包括数据的加载与切分,嵌入向量并构建索引,再通过向量检索召回干系效果。而天生过程则是利用基于检索效果增强的提示词(prompt)来激活LLM天生回答。
RAG技术的关键在于结合了检索与天生的优点,检索体系能提供详细干系的究竟和数据;而天生模型可以大概灵活的构建回答,并融入更广泛的语境和信息。
这种结合使得 RAG 模型在处理复杂的查询和天生信息丰富的回答方面非常有用,在问答体系、对话体系和其他必要明白和天生自然语言的应用中非常有用。
相较于大型模型本身的能力,搭配 RAG 可以解决大模型天生的缺陷问题:
减少“幻觉”问题
:RAG 通过检索外部信息作为输入,辅助大型模型回答问题,这种方式能大大降低大模型的幻觉问题,增加回答的可追溯性。
数据隐私和安全
:RAG 可以将知识库作为管理私有数据的一种方式,避免企业内部数据外泄。
信息的实时性
:RAG 允许从外部数据源实时检索信息,因此可以获取最新的、领域特定的知识,解决知识时效性问题。
虽然大模型的前沿研究也在致力于解决以上的问题,例如基于私有数据的微调、提拔模型自身的长文本处理能力,openAI CEO奥特曼还曾说要再近两年内解决大模型的幻觉问题。
虽然这些研究有助于推动大型模型技术的进步,然而在更通用的场景下,RAG 依然是一个稳定、可靠且性价比高的选择。
这重要是由于 RAG 具有以下的优势:
白盒模型
:相较于微调和长文本处理的“黑盒”效应,RAG 模块之间的关系更为清晰紧密,而且更加一目了然;此外,在检索召回内容质量和置信度(Certainty)不高的情况下,RAG 体系甚至可以克制 LLMs 的参与,直接回复“不知道”而非胡编乱造。
成本和相应速率
:RAG 相比于微调模型具有练习时间短和成本低的优势;而与长文本处理相比,则拥有更快的相应速率和更低的推理成本。在研究和实行阶段,效果和精确水平是最吸引人的;但在工业和产业落地方面,成本则是不容忽视的决定性因素。
私有数据管理
:通过将知识库与大型模型解耦,RAG 不仅提供了一个安全可落地的实践基础,同时也能更好地管理企业现有和新增的知识,解决知识依赖问题。而与之干系的另一个角度则是访问权限控制和数据管理,这对 RAG 的底座数据库来说是很容易做到的,但对于大模型来说却很难。
因此在作者看来,随着对大型模型研究的不断深入,RAG 技术并不会被取代,相反会在相称长的时间内保有重要地位。这重要得益于其与 LLM 的自然互补性,这种互补性使得基于 RAG 构建的应用能在很多领域大放异彩。
而 RAG 提拔的关键一方面在 LLMs 能力的提拔,而另一方面则依赖于检索(Retrieval)的各类提拔和优化。
RAG 检索的底座:向量数据库
在业界实践中,RAG 检索通常与向量数据库密切结合,也催生了基于 ChatGPT + Vector Database + Prompt 的 RAG 解决方案,简称为 CVP 技术栈。
这一解决方案依赖于向量数据库高效检索干系信息以增强大型语言模型(LLMs),通过将 LLMs 天生的查询转换为向量,使得 RAG 体系能在向量数据库中敏捷定位到相应的知识条目。这种检索机制使 LLMs 在面对详细问题时,可以大概利用存储在向量数据库中的最新信息,有用解决 LLMs 固有的知识更新耽误和幻觉的问题。
尽管信息检索领域也存在选择众多的存储与检索技术,包括搜索引擎、关系型数据库和文档数据库等,向量数据库在 RAG 场景下却成为了业界首选。
这一选择的背后,是向量数据库在高效地存储和检索大量嵌入向量方面的出色能力。这些嵌入向量由机器学习模型天生,不仅可以大概表征文本和图像等多种数据类型,还可以大概捕捉它们深层的语义信息。
在 RAG 体系中,检索的任务是快速且精确地找出与输入查询语义上最匹配的信息,而向量数据库正因其在处理高维向量数据和进行快速相似性搜索方面的显著优势而脱颖而出。
首先在实现原理方面,向量是模型对语义含义的编码形式,向量数据库可以更好地明白查询的语义内容,由于它们利用了深度学习模型的能力来编码文本的含义,不仅仅是关键字匹配。受益于 AI 模型的发展,其背后语义准确度也正在稳步提拔,通过用向量的间隔相似度来体现语义相似度已经发展成为了 NLP 的主流形态,因此表意的 embedding 就成了处理信息载体的首选。
其次在检索效率方面,由于信息可以体现成高维向量,针对向量加上特殊的索引优化和量化方法,可以极大提拔检索效率并压缩存储成本,随着数据量的增长,向量数据库可以大概水平扩展,保持查询的相应时间,这对于必要处理海量数据的 RAG 体系至关重要,因此向量数据库更擅长处理超大规模的非结构化数据。
至于泛化能力这个维度,传统的搜索引擎、关系型或文档数据库多数只能处理文本,泛化和扩展的能力差,向量数据库不仅限于文本数据,还可以处理图像、音频和其他非结构化数据类型的嵌入向量,这使得 RAG 体系可以更加灵活和多功能。
最后在总拥有成本上,相比于其他选项,向量数据库的部署都更加方便、易于上手,同时也提供了丰富的 API,使其易于与现有的机器学习框架和工作流程集成,因而深受很多 RAG 应用开发者的喜爱。
场景对向量数据库的需求
虽然向量数据库成为了检索的重要方式,但随着 RAG 应用的深入以及人们对高质量回答的需求,检索引擎依旧面对着诸多挑战。
这里以一个最基础的 RAG 构建流程为例:检索器的构成包括了语料的预处理如切分、数据清洗、embedding 入库等,然后是索引的构建和管理,最后是通过 vector search 找到相近的片段提供给 prompt 做增强天生。大多数向量数据库的功能还只落在索引的构建管理和搜索的盘算上,进一步则是包罗了 embedding 模型的功能。
但在更高级的 RAG 场景中,由于召回的质量将直接影响到天生模型的输出质量和干系性,因此作为检索器底座的向量数据库应该更多的对检索质量负责。
为了提拔检索质量,这里其实有很多工程化的优化手段,如 chunk_size 的选择,切分是否必要 overlap,怎样选择 embedding model,是否必要额外的内容标签,是否参加基于词法的检索来做 hybrid search,重排序 reranker 的选择等等,其中有不少工作是可以纳入向量数据库的考量之中。
而检索体系对向量数据库的需求可以抽象描述为:
高精度的召回
:向量数据库必要可以大概准确召回与查询语义最干系的文档或信息片段。这要求数据库可以大概明白和处理高维向量空间中的复杂语义关系,确保召回内容与查询的高度干系性。这里的效果既包括向量检索的数学召回精度也包括嵌入模型的语义精度。
快速相应
:为了不影响用户体验,召回操作必要在极短的时间内完成,通常是毫秒级别。这要求向量数据库具备高效的查询处理能力,以快速从大规模数据集中检索和召回信息。此外,随着数据量的增长和查询需求的变革,向量数据库必要可以大概灵活扩展,以支持更多的数据和更复杂的查询,同时保持召回效果的稳定性和可靠性。
处理多模态数据的能力
:随着应用场景的多样化,向量数据库可能必要处理不仅仅是文本,还有图像、视频等多模态数据。这要求数据库可以大概支持不同种类数据的嵌入,并能根据不同模态的数据查询进行有用的召回。
可表明性和可调试性
:在召回效果不抱负时,可以大概提供足够的信息帮助开发者诊断和优化黑白常有价值的。因此,向量数据库在设计时也应考虑到体系的可表明性和可调试性。
最后的最后
感谢你们的阅读和喜好,我收藏了很多技术干货,可以共享给喜好我文章的朋侪们,如果你肯花时间沉下心去学习,它们一定能帮到你。
由于这个行业不同于其他行业,知识体系实在是过于庞大,知识更新也非常快。作为一个平凡人,无法全部学完,所以我们在提拔技术的时候,首先必要明白一个目标,然后制定好完备的筹划,同时找到好的学习方法,这样才气更快的提拔自己。
这份完备版的大模型 AI 学习资料已经上传CSDN,朋侪们如果必要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】
大模型知识脑图
为了成为更好的 AI大模型 开发者,这里为大家提供了总的路线图。它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
经典册本阅读
阅读AI大模型经典册本可以帮助读者提高技术水平,开辟视野,掌握核心技术,提高解决问题的能力,同时也可以借鉴他人的经验。对于想要深入学习AI大模型开发的读者来说,阅读经典册本黑白常有须要的。
实战案例
光学理论是没用的,要学会跟着一起敲,要动手实操,才气将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
面试资料
我们学习AI大模型一定是想找到高薪的工作,下面这些面试题都是总结当前最新、最热、最高频的面试题,并且每道题都有详细的答案,面试前刷完这套面试题资料,小小offer,不在话下
640套AI大模型报告合集
这套包罗640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。
这份完备版的大模型 AI 学习资料已经上传CSDN,朋侪们如果必要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
民工心事
金牌会员
这个人很懒什么都没写!
楼主热帖
Cilium系列-10-启用 IPv6 BIG TCP和启 ...
【云原生】Spring Cloud是什么?Spring ...
如火如荼的「云原生」,你了解多少? ...
Spark快速上手(4)Spark核心编程-Spark ...
容器化|自建 MySQL 集群迁移到 Kubern ...
超详细的手把手撸代码---教你你⾃定义 ...
[源码阅读]-Redis核心事件流程 ...
大数据开源项目,一站式全自动化全生命 ...
一文看懂java单例模式
Java中如何将“日期字符串”转换为java ...
标签云
挺好的
服务器
快速回复
返回顶部
返回列表