Milvus 核心设计 (4) ---- metric及index原理详解与示例(2) ...

打印 上一主题 下一主题

主题 617|帖子 617|积分 1851

目录
背景
Binary Embedding
界说与特点
常见算法
应用场景
间隔丈量的方式
Jaccard
Hamming
代码实现
Index
BIN_FLAT
BIN_IVF_FLAT
Sparse embeddings
界说
应用场景
长处
实现方式
间隔丈量方式
IP
Index
SPARSE_INVERTED_INDEX
应用场景
优势
SPARSE_WAND
工作原理
性能特点
应用场景
小结


背景

接着上面的Milvus metric 及index 继续写下剩余的两种方式。这样对于 vector db 的metric 及index 你将全面明白并学会利用。由于当你看完 Chroma 源码,再看Milvus 时,某些时间总会产生共鸣,虽然两个都是很优秀的开源vector db,来自差别的设计团队,但是你总能感受到来自底层 design 的共鸣。比如对于 HNSW 算法,设置M,efConstruction,ef 都是不变的旋律。或许高手忘记所有招式,只重其意,不看其形,那就能自创门派了。
Binary Embedding

顾名思义,就是二进制嵌入,说直白点就是只有 0 与 1 的编码。这里不是指盘算机底层硬件表示,无论怎样目前都是0 与 1 的存储,是指上层应用转换为了一组0 与 1 的 向量存储。
简单来说,二进制嵌入是嵌入技术中的一种,它主要将高维数据转换为低维的二进制向量表示。这种表示方法具有存储效率高、盘算速率快等长处,因此在很多领域,如信息检索、推荐体系、图像辨认等中得到了广泛应用。以下是对Binary embeddings的详细解释:
界说与特点



  • 界说:Binary embeddings是指将原始数据(如文本、图像等)通过某种算法转换成固定长度的二进制向量(即只包罗0和1的向量)的过程。
  • 特点</

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

魏晓东

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表