首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
SAAS
ToB门户
了解全球最新的ToB事件
论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
微博
Follow
记录
Doing
博客
Blog
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
排行榜
Ranklist
相册
Album
应用中心
qidao123.com ToB IT社区-企服评测·应用市场
»
论坛
›
数据库
›
图数据库
›
《向量数据库指南》——一起来认识向量数据库Milvus Clo ...
返回列表
发新帖
《向量数据库指南》——一起来认识向量数据库Milvus Cloud GPU-Cagra 索引
[复制链接]
发表于 2024-8-10 23:26:14
|
显示全部楼层
|
阅读模式
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要
登录
才可以下载或查看,没有账号?
立即注册
×
Context about GPU-based Index
向量搜索是一个非常典型计算密集型的场景。作为天下上最快的向量
数据库
,Milvus Cloud的向量检索引擎Knowhere占用了高出整个系统80%的计算资源。而当我们谈论到高
性能
的计算,GPU总是一个绕不开的话题,在向量领域也不破例。
通过跟Nvidia的合作,Milvus Cloud成为了天下上第一个支持使用GPU加速的向量
数据库
。基于Nvidia的向量检索库RAFT,Milvus Cloud在2.3
版本
正式支持了GPU索引,而且以此为基础支持了Nvidia的保举系统Merlin。
Milvus Cloud在2.3
版本
支持了两种索引,IVFFLAT 和 IVFPQ,并在测试中体现出了远超目前最流行的HNSW的
性能
。然而,怎样在小批量查询中获得
性能
提升,怎样让基于GPU的索引更有性价比等问题让让我们持续探索新的办理方案。
Graph-based的向量搜索算法依赖强大的性能在比年来取代了IVF-based的算法成为了主流。同样在GPU上,工程师们也在积极探索可行的GPU图算法的实现,包括GGNN,SONG等。但是由于Graph-based算法的计算方式,它很难被直接搬到GPU上,这些实现方法都没能在小batch搜索下达到预想的性能。
NVIDIA在近来推出了基于GPU的图索引CAGRA,同时帮助Milvus Cloud在最新的2.4
版本
完成了相关支持。
Performance
性能是GPU索引的关键。We evaluated the Milvus Cloud' performance through the open-source vector database benchmark tool and compared the performance between CPU-base HNSW, GPU-based IVFFLAT and CAGRA.
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复
使用道具
举报
返回列表
浏览过的版块
开源技术
郭卫东
+ 我要发帖
登录后关闭弹窗
登录参与点评抽奖 加入IT实名职场社区
去登录
微信订阅号
微信服务号
微信客服(加群)
H5
小程序
快速回复
返回顶部
返回列表