【向量数据库】chroma 向量数据库使用教程

知者何南 · 2025-3-23 02:30:22

以下是 Chroma 向量数据库的使用教程：
安装

使用 Python 的 pip 包管理器安装 Chroma：
bash复制
1. pip install chromadb
复制代码
如果只需要使用 Chroma 的客户端功能，可以安装轻量级的客户端库：
bash复制
1. pip install chromadb-client
复制代码

初始化客户端

本地恒久化客户端：将数据保存到本地指定路径，并在启动时主动加载。
Python复制
1. import chromadb
2. client = chromadb.PersistentClient(path="/path/to/save/to")
复制代码
HTTP 客户端：毗连到运行中的 Chroma 服务器。
Python复制
1. chroma_client = chromadb.HttpClient(host='localhost', port=8000)
复制代码

创建集合

集合是 Chroma 中存储数据的根本单元。可以通过以下代码创建集合：
Python复制

复制代码

添加数据

向集合中添加数据时，需要提供以下内容：

示例代码：
Python复制

collection.add(
documents=["This is a document about engineer", "This is a document about steak"],
metadatas=[{"source": "doc1"}, {"source": "doc2"}],
ids=["id1", "id2"]
)

复制代码

查询数据

可以通过嵌入向量或文本举行查询。以下是两种查询方式的示例：

基于嵌入向量查询：
Python复制
1. results = collection.query(
2. query_embeddings=[[11.1, 12.1, 13.1]],
3. n_results=2 # 返回最相关的 2 个结果
4. )
复制代码
基于文本查询：Chroma 会主动将文本转换为嵌入向量举行查询。
Python复制
1. results = collection.query(
2. query_texts=["Which food is the best?"],
3. n_results=2
4. )
复制代码

查询结果是一个字典，包罗以下字段：

其他操作

更新数据：
Python复制
1. collection.update(
2. ids=["id1", "id2"],
3. documents=["Updated document 1", "Updated document 2"]
4. )
复制代码
删除数据：
Python复制
1. collection.delete(ids=["id1"])
复制代码
过滤查询：可以通过元数据或文档内容举行过滤查询。
Python复制
1. results = collection.query(
2. query_embeddings=[[11.1, 12.1, 13.1]],
3. n_results=2,
4. where={"source": "doc1"} # 按元数据过滤
5. )
复制代码
指定返回字段：在查询时可以通过 include 参数指定返回的字段，例如：
Python复制
1. results = collection.query(
2. query_embeddings=[[11.1, 12.1, 13.1]],
3. include=["documents", "metadatas"]
4. )
复制代码

免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！更多信息从访问主页：qidao123.com:ToB企服之家，中国第一个企服评测及商务社交产业平台。

		自动登录	找回密码
密码			立即注册

0 个回复