大模型知识库——检索增强(RAG)技术与向量数据库的选择 ...

打印 上一主题 下一主题

主题 1032|帖子 1032|积分 3096

前言

RAG的核心在于准确与快速的检索
在之前关于RAG技术的文章中有先容过知识库与检索增强的关系;也简单先容了RAG的使用场景。
而RAG和向量数据库的实现原理,以及怎么选择向量数据库,是在智能客服,推荐系统等领域必须要解决的一个问题。
RAG与向量数据库
先来答复第一个问题, 什么是检索增强——RAG?
顾名思义,RAG的全拼是Retrieval-augmented Generation,检索增强天生,R——代表的是Retrieval-检索器,G代表的是Generation-天生器,所以RAG主要有两大块组成,检索与天生。
检索
检索的过程包括数据的加载与切分,嵌入向量并构建索引,再通过向量检索召回相关效果。而天生过程则是利用基于检索效果增强的提示词(prompt)来激活LLM天生答复。
RAG技术的关键在于结合了检索与天生的优点,检索系统能提供详细相关的事实和数据;而天生模型可以或许灵活的构建答复,并融入更广泛的语境和信息。
这种结合使得 RAG 模型在处理复杂的查询和天生信息丰富的答复方面非常有用,在问答系统、对话系统和其他需要明确和天生自然语言的应用中非常有用。

相较于大型模型自己的本领,搭配 RAG 可以解决大模型天生的缺陷问题:
减少“幻觉”问题:RAG 通过检索外部信息作为输入,辅助大型模型答复问题,这种方式能大大低落大模型的幻觉问题,增加答复的可追溯性。
数据隐私和安全:RAG 可以将知识库作为管理私有数据的一种方式,避免企业内部数据外泄。
信息的实时性:RAG 允许从外部数据源实时检索信息,因此可以获取最新的、领域特定的知识,解决知识时效性问题。
固然大模型的前沿研究也在致力于解决以上的问题,比方基于私有数据的微调、提拔模型自身的长文本处理本领,openAI CEO奥特曼还曾说要再近两年内解决大模型的幻觉问题。
固然这些研究有助于推动大型模型技术的进步,然而在更通用的场景下,RAG 依然是一个稳定、可靠且性价比高的选择。
这主要是因为 RAG 具有以下的上风:
白盒模型:相较于微调和长文本处理的“黑盒”效应,RAG 模块之间的关系更为清楚精密,而且更加一目了然;此外,在检索召回内容质量和置信度(Certainty)不高的环境下,RAG 系统甚至可以克制 LLMs 的加入,直接回复“不知道”而非胡编乱造。
成本和相应速度:RAG 相比于微调模型具有训练时间短和成本低的上风;而与长文本处理相比,则拥有更快的相应速度和更低的推理成本。在研究和实验阶段,效果和精确水平是最吸引人的;但在工业和产业落地方面,成本则是不容忽视的决定性因素。
私有数据管理:通过将知识库与大型模型解耦,RAG 不光提供了一个安全可落地的实践基础,同时也能更好地管理企业现有和新增的知识,解决知识依靠问题。而与之相关的另一个角度则是访问权限控制和数据管理,这对 RAG 的底座数据库来说是很容易做到的,但对于大模型来说却很难。
因此在作者看来,随着对大型模型研究的不停深入,RAG 技术并不会被取代,相反会在相当长的时间内保有紧张职位。这主要得益于其与 LLM 的自然互补性,这种互补性使得基于 RAG 构建的应用能在很多领域大放异彩。
而 RAG 提拔的关键一方面在 LLMs 本领的提拔,而另一方面则依靠于检索(Retrieval)的各类提拔和优化。
RAG 检索的底座:向量数据库
在业界实践中,RAG 检索通常与向量数据库密切结合,也催生了基于 ChatGPT + Vector Database + Prompt 的 RAG 解决方案,简称为 CVP 技术栈。
这一解决方案依靠于向量数据库高效检索相关信息以增强大型语言模型(LLMs),通过将 LLMs 天生的查询转换为向量,使得 RAG 系统能在向量数据库中灵敏定位到相应的知识条目。这种检索机制使 LLMs 在面对详细问题时,可以或许利用存储在向量数据库中的最新信息,有用解决 LLMs 固有的知识更新耽误和幻觉的问题。

尽管信息检索领域也存在选择浩繁的存储与检索技术,包括搜索引擎、关系型数据库和文档数据库等,向量数据库在 RAG 场景下却成为了业界首选。
这一选择的背后,是向量数据库在高效地存储和检索大量嵌入向量方面的出色本领。这些嵌入向量由呆板学习模型天生,不光可以或许表征文本和图像等多种数据范例,还可以或许捕获它们深层的语义信息。
在 RAG 系统中,检索的任务是快速且精确地找出与输入查询语义上最匹配的信息,而向量数据库正因其在处理高维向量数据和举行快速相似性搜索方面的明显上风而脱颖而出。
起首在实现原理方面,向量是模型对语义含义的编码情势,向量数据库可以更好地明确查询的语义内容,因为它们利用了深度学习模型的本领来编码文本的含义,不光仅是关键字匹配。受益于 AI 模型的发展,其背后语义准确度也正在稳步提拔,通过用向量的距离相似度来表示语义相似度已经发展成为了 NLP 的主流形态,因此表意的 embedding 就成了处理信息载体的首选。
其次在检索服从方面,由于信息可以表示成高维向量,针对向量加上特殊的索引优化和量化方法,可以极大提拔检索服从并压缩存储成本,随着数据量的增长,向量数据库可以或许水平扩展,保持查询的相应时间,这对于需要处理海量数据的 RAG 系统至关紧张,因此向量数据库更善于处理超大规模的非结构化数据。
至于泛化本领这个维度,传统的搜索引擎、关系型或文档数据库多数只能处理文本,泛化和扩展的本领差,向量数据库不光限于文本数据,还可以处理图像、音频和其他非结构化数据范例的嵌入向量,这使得 RAG 系统可以更加灵活和多功能。
末了在总拥有成本上,相比于其他选项,向量数据库的部署都更加方便、易于上手,同时也提供了丰富的 API,使其易于与现有的呆板学习框架和工作流程集成,因而深受很多 RAG 应用开发者的喜爱。
场景对向量数据库的需求
固然向量数据库成为了检索的紧张方式,但随着 RAG 应用的深入以及人们对高质量答复的需求,检索引擎依旧面对着诸多挑战。
这里以一个最基础的 RAG 构建流程为例:检索器的组成包括了语料的预处理如切分、数据清洗、embedding 入库等,然后是索引的构建和管理,末了是通过 vector search 找到相近的片段提供给 prompt 做增强天生。大多数向量数据库的功能还只落在索引的构建管理和搜索的计算上,进一步则是包含了 embedding 模型的功能。

但在更高级的 RAG 场景中,因为召回的质量将直接影响到天生模型的输出质量和相关性,因此作为检索器底座的向量数据库应该更多的对检索质量负责。
为了提拔检索质量,这里实在有很多工程化的优化手段,如 chunk_size 的选择,切分是否需要 overlap,如何选择 embedding model,是否需要额外的内容标签,是否参加基于词法的检索来做 hybrid search,重排序 reranker 的选择等等,此中有不少工作是可以纳入向量数据库的考量之中。
而检索系统对向量数据库的需求可以抽象描述为:
高精度的召回:向量数据库需要可以或许准确召回与查询语义最相关的文档或信息片段。这要求数据库可以或许明确和处理高维向量空间中的复杂语义关系,确保召回内容与查询的高度相关性。这里的效果既包括向量检索的数学召回精度也包括嵌入模型的语义精度。
快速相应:为了不影响用户体验,召回操纵需要在极短的时间内完成,通常是毫秒级别。这要求向量数据库具备高效的查询处理本领,以快速从大规模数据集中检索和召复书息。此外,随着数据量的增长和查询需求的变化,向量数据库需要可以或许灵活扩展,以支持更多的数据和更复杂的查询,同时保持召回效果的稳定性和可靠性。
处理多模态数据的本领:随着应用场景的多样化,向量数据库可能需要处理不光仅是文本,另有图像、视频等多模态数据。这要求数据库可以或许支持不同种类数据的嵌入,并能根据不同模态的数据查询举行有用的召回。
可解释性和可调试性:在召回效果不理想时,可以或许提供足够的信息帮助开发者诊断和优化是非常有代价的。因此,向量数据库在设计时也应思量到系统的可解释性和可调试性。
末了的末了

感谢你们的阅读和喜欢,我收藏了很多技术干货,可以共享给喜欢我文章的朋友们,假如你肯花时间沉下心去学习,它们肯定能帮到你。
因为这个行业不同于其他行业,知识体系着实是过于巨大,知识更新也非常快。作为一个普通人,无法全部学完,所以我们在提拔技术的时间,起首需要明确一个目标,然后制定好完整的筹划,同时找到好的学习方法,这样才气更快的提拔自己。
这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们假如需要可以微信扫描下方CSDN官方认证二维码免费领取【包管100%免费】
大模型知识脑图

为了成为更好的 AI大模型 开发者,这里为各人提供了总的路线图。它的用处就在于,你可以按照上面的知识点去找对应的学习资源,包管自己学得较为全面。

经典书籍阅读

阅读AI大模型经典书籍可以帮助读者提高技术水平,开拓视野,掌握核心技术,提高解决问题的本领,同时也可以鉴戒他人的履历。对于想要深入学习AI大模型开发的读者来说,阅读经典书籍是非常有必要的。

实战案例

光学理论是没用的,要学会跟着一起敲,要动手实操,才气将自己的所学运用到实际当中去,这时间可以搞点实战案例来学习。

口试资料

我们学习AI大模型一定是想找到高薪的工作,下面这些口试题都是总结当前最新、最热、最高频的口试题,而且每道题都有详细的答案,口试前刷完这套口试题资料,小小offer,不在话下

640套AI大模型陈诉合集

这套包含640份陈诉的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套陈诉合集都将为您提供宝贵的信息和启示。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们假如需要可以微信扫描下方CSDN官方认证二维码免费领取【包管100%免费】

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

鼠扑

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表