【向量数据库 pymilvus】Milvus Standalone(单机模式)怎样安装 ...

打印 上一主题 下一主题

主题 1078|帖子 1078|积分 3234

在龙晰操作系统(CentOS 8)上安装 Milvus Standalone(单机模式)而不使用 Docker,可以按照以下步调举行。以下是一个详细的安装指南:

1. 环境准备

在开始安装之前,确保系统满足以下要求:


  • 操作系统:CentOS 8(龙晰操作系统基于 CentOS 8)。
  • 硬件要求

    • CPU:支持 AVX 指令集(推荐 Intel Haswell 或更高版本)。
    • 内存:至少 8 GB(发起 16 GB 或更高)。
    • 磁盘:SSD 磁盘,至少 50 GB 可用空间。

  • 依赖项

    • Python 3.8 或更高版本。
    • GCC 7 或更高版本。
    • CMake 3.18 或更高版本。


2. 安装依赖项

2.1 更新系统

  1. sudo dnf update -y
复制代码
2.2 安装 GCC 和 CMake

  1. sudo dnf install -y gcc gcc-c++ make cmake
复制代码
2.3 安装 Python 3.8

假如系统未安装 Python 3.8,可以通过以下步调安装:
  1. sudo dnf install -y python38 python38-devel
  2. sudo alternatives --set python3 /usr/bin/python3.8
复制代码
2.4 安装其他依赖项

  1. sudo dnf install -y openssl-devel libcurl-devel zlib-devel
复制代码

3. 下载 Milvus Standalone

3.1 下载 Milvus 二进制包

从 Milvus 的 GitHub Releases 页面下载最新版本的二进制包:
  1. wget https://github.com/milvus-io/milvus/releases/download/v2.3.3/milvus-standalone-linux-amd64.tar.gz
复制代码
3.2 解压二进制包

  1. tar -xzf milvus-standalone-linux-amd64.tar.gz
  2. cd milvus-standalone-linux-amd64
复制代码

4. 设置 Milvus

4.1 修改设置文件

Milvus 的设置文件位于 conf/standalone.yaml。你可以根据必要修改以下参数:


  • 存储路径:设置数据存储路径(确保路径有充足的磁盘空间)。
    1. storage:
    2.   path: /path/to/milvus/data
    复制代码
  • 缓存大小:根据内存大小调整缓存。
    1. cache:
    2.   cache_size: 4GB
    复制代码
4.2 创建数据存储目次

  1. sudo mkdir -p /path/to/milvus/data
  2. sudo chown -R $USER:$USER /path/to/milvus/data
复制代码

5. 启动 Milvus

5.1 启动 Milvus 服务

在解压后的 Milvus 目次中运行以下下令:
  1. ./bin/milvus run
复制代码
5.2 验证服务状态

Milvus 默认监听端口为 19530。你可以通过以下下令查抄服务是否正常运行:
  1. curl http://localhost:19530/version
复制代码
假如返回类似以下内容,阐明 Milvus 已乐成启动:
  1. {"version":"2.3.3"}
复制代码

6. 使用 Milvus

6.1 安装 PyMilvus

Milvus 提供了 Python SDK(PyMilvus),可以通过以下下令安装:
  1. pip install pymilvus
复制代码
6.2 毗连 Milvus

在 Python 中毗连 Milvus:
  1. from pymilvus import connections
  2. connections.connect("default", host="localhost", port="19530")
复制代码
6.3 创建集合和插入数据

以下是一个简朴的示例:
  1. from pymilvus import CollectionSchema, FieldSchema, DataType, Collection
  2. # 定义集合结构
  3. fields = [
  4.     FieldSchema(name="id", dtype=DataType.INT64, is_primary=True),
  5.     FieldSchema(name="embedding", dtype=DataType.FLOAT_VECTOR, dim=128)
  6. ]
  7. schema = CollectionSchema(fields, "example_collection")
  8. # 创建集合
  9. collection = Collection("example_collection", schema)
  10. # 插入数据
  11. data = [
  12.     [1, 2, 3],  # ID
  13.     [[0.1, 0.2, ...], [0.3, 0.4, ...], [0.5, 0.6, ...]]  # 向量数据
  14. ]
  15. collection.insert(data)
复制代码

7. 性能优化

7.1 使用 SSD 磁盘

确保 Milvus 的数据存储路径位于 SSD 磁盘上,以提拔 I/O 性能。
7.2 调整缓存大小

根据系统内存大小,得当增加 cache.cache_size 参数,确保缓存充足容纳全部数据。
7.3 预加载索引

在插入数据后,立即创建索引并预加载到内存中:
  1. collection.create_index("embedding", {"index_type": "IVF_FLAT", "metric_type": "L2", "params": {"nlist": 128}})
  2. collection.load()
复制代码

8. 总结

通过以上步调,你可以在龙晰操作系统(CentOS 8)上乐成安装和运行 Milvus Standalone(单机模式)。假如必要进一步优化性能,可以参考 Milvus 的官方文档或社区资源。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

笑看天下无敌手

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表