魏晓东 发表于 2024-7-19 16:15:48

Milvus 核心设计 (4) ---- metric及index原理详解与示例(2)

目录
背景
Binary Embedding
界说与特点
常见算法
应用场景
间隔丈量的方式
Jaccard
Hamming
代码实现
Index
BIN_FLAT
BIN_IVF_FLAT
Sparse embeddings
界说
应用场景
长处
实现方式
间隔丈量方式
IP
Index
SPARSE_INVERTED_INDEX
应用场景
优势
SPARSE_WAND
工作原理
性能特点
应用场景
小结

背景

接着上面的Milvus metric 及index 继续写下剩余的两种方式。这样对于 vector db 的metric 及index 你将全面明白并学会利用。由于当你看完 Chroma 源码,再看Milvus 时,某些时间总会产生共鸣,虽然两个都是很优秀的开源vector db,来自差别的设计团队,但是你总能感受到来自底层 design 的共鸣。比如对于 HNSW 算法,设置M,efConstruction,ef 都是不变的旋律。或许高手忘记所有招式,只重其意,不看其形,那就能自创门派了。
Binary Embedding

顾名思义,就是二进制嵌入,说直白点就是只有 0 与 1 的编码。这里不是指盘算机底层硬件表示,无论怎样目前都是0 与 1 的存储,是指上层应用转换为了一组0 与 1 的 向量存储。
简单来说,二进制嵌入是嵌入技术中的一种,它主要将高维数据转换为低维的二进制向量表示。这种表示方法具有存储效率高、盘算速率快等长处,因此在很多领域,如信息检索、推荐体系、图像辨认等中得到了广泛应用。以下是对Binary embeddings的详细解释:
界说与特点



[*]界说:Binary embeddings是指将原始数据(如文本、图像等)通过某种算法转换成固定长度的二进制向量(即只包罗0和1的向量)的过程。
[*]特点</

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页: [1]
查看完整版本: Milvus 核心设计 (4) ---- metric及index原理详解与示例(2)