qidao123.com技术社区-IT企服评测·应用市场

标题: 【Milvus】向量数据库pymilvus利用教程 [打印本页]

作者: 瑞星 时间: 2025-3-2 14:09
标题: 【Milvus】向量数据库pymilvus利用教程
以下是根据 Milvus 官方文档整理的具体 PyMilvus 利用教程，基于 Milvus 2.5.x 版本：

PyMilvus 利用教程

目次

安装与情况准备

搭建 Milvus 服务基于Docker

# 记得提前安装Docker
curl -sfL https://raw.githubusercontent.com/milvus-io/milvus/master/scripts/standalone_embed.sh -o standalone_embed.sh
bash standalone_embed.sh start
# 数据可视化工具
docker run -p 8000:3000 -e MILVUS_URL=你的IP:19530 zilliz/attu:v2.5

复制代码

复制代码

要求：

毗连 Milvus 服务

复制代码

数据模型基础概念

创建集合（Collection）

复制代码

参数说明：

插入数据

复制代码

创建索引

复制代码

常用索引类型：

向量搜索

复制代码

删除操作

复制代码

完备示例

from pymilvus import connections, FieldSchema, CollectionSchema, DataType, Collection
# 连接服务
connections.connect(host='localhost', port='19530')
# 创建集合
fields = [
FieldSchema(name="id", dtype=DataType.INT64, is_primary=True, auto_id=True),
FieldSchema(name="vector", dtype=DataType.FLOAT_VECTOR, dim=128)
]
schema = CollectionSchema(fields)
collection = Collection("test_collection", schema)
# 插入数据
data = [[[random.random() for _ in range(128)] for _ in range(1000)]]
collection.insert(data)
# 创建索引
index_params = {"index_type": "IVF_FLAT", "metric_type": "L2", "params": {"nlist": 100}}
collection.create_index("vector", index_params)
collection.load()
# 搜索
search_params = {"metric_type": "L2", "params": {"nprobe": 10}}
results = collection.search(
data=[[0.5]*128],
anns_field="vector",
param=search_params,
limit=3
)
# 输出结果
print("搜索结果:")
for hits in results:
for hit in hits:
print(f"ID: {hit.id}, 距离: {hit.distance}")
# 清理
collection.drop()

复制代码

注意事项

官方文档参考：

建议结合具体业务需求调解参数，并针对实际数据量进行性能测试。

免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！更多信息从访问主页：qidao123.com:ToB企服之家，中国第一个企服评测及商务社交产业平台。

欢迎光临 qidao123.com技术社区-IT企服评测·应用市场 (https://dis.qidao123.com/)