SpringAI用嵌入模型操纵向量数据库！

水军大提督 · 2025-5-5 13:04:03

嵌入模型（Embedding Model）和向量数据库（Vector Database/Vector Store）是一对亲密无间的合作伙伴，也是 AI 技能栈中紧密关联的两大焦点组件，两者的协同作用构成了现代语义搜索、保举体系和 RAG（Retrieval Augmented Generation，检索增强生成）等应用的技能底子。
PS：准确来说 Vector Database 和 Vector Store 不完全相同，前者主要用于“向量”数据的存储，而 Vector Store 是用于存储和检索向量数据的组件。
在 Spring AI 中，嵌入模型 API 和 Spring AI Model API 和嵌入模型的关系如下：

体系团体交互流程如下：

接下来我们利用以下技能：

Spring AI
阿里云文本嵌入模型 text-embedding-v3
SimpleVectorStore（内存级别存储和检索向量数据组件）

实现嵌入模型操纵内存级别向量数据库的案例。
1.添加项目依靠

我们利用阿里云百炼平台的嵌入模型 text-embedding-v3 是兼容 OpenAI 的 SDK 的，因此，我们只需要添加 OpenAI 依靠即可：

<dependency>
<groupId>org.springframework.ai</groupId>
<artifactId>spring-ai-starter-model-openai</artifactId>
</dependency>

复制代码

2.设置嵌入模型

阿里云百炼平台支持的向量模型：

项目设置文件设置向量模型：

spring:
ai:
openai:
api-key: ${aliyun-ak}
embedding:
options:
model: text-embedding-v3
chat:
options:
model: deepseek-r1

复制代码

3.设置向量模型

将 EmbeddingModel 和 VectorStore 进行关联，如下代码所示：

@Bean
public VectorStore vectorStore(EmbeddingModel embeddingModel) {
return SimpleVectorStore.builder(embeddingModel).build();
}

复制代码

4.向量数据库添加数据

VectorStore 提供的常用方法如下：

add(List documents) ：添加文档。
delete(List idList) ：按 ID 删除文档。
delete(Filter.Expression filterExpression) ：按过滤表达式删除文档。
similaritySearch(String query) 和 similaritySearch(SearchRequest request) ：相似性搜索。

向数据库添加向量数据的方法如下：

// 构建测试数据
List<Document> documents =
List.of(new Document("I like Spring Boot"),
new Document("I love Java"));
// 添加到向量数据库
vectorStore.add(documents);

复制代码

固然，向量数据的数据源可以是文件、图片、音频等资源，这里为了简单演示团体执行流程，利用了更简单直观的文本作为数据源。
5.查询数据

@RestController
@RequestMapping("/vector")
public class VectorController {
@Resource
private VectorStore vectorStore;
@RequestMapping("/find")
public List find(@RequestParam String query) {
// 构建搜索请求，设置查询文本和返回的文档数量
SearchRequest request = SearchRequest.builder()
.query(query)
.topK(3)
.build();
List<Document> result = vectorStore.similaritySearch(request);
System.out.println(result);
return result;
}
}

复制代码

执行结果如下：

从上述结果可以看出，和“java”相似度最高的向量为“I love Java”，相似度评分为 0.77，如果我们 SearchRequest 对象中的 topK 设置为 1 的话，只会查询“I love Java”这条数据，如下图所示：

想要获取完整案例的同砚加V：vipStone【备注：向量】
小结

嵌入模型和向量数据库是实现 RAG（检索增强生成）的技能底子，固然除了以上案例外，你可以利用 Redis 或 ES 来存储向量数据，并实验加入 DeepSeek 实现 RAG 功能，这种形式更符合企业真实的技能应用。我是磊哥，如果觉得文章有资助接待点赞、转发支持一下，我们下期再见。
本文已收录到我的面试小站 www.javacn.site，此中包罗的内容有：场景题、并发编程、MySQL、Redis、Spring、Spring MVC、Spring Boot、Spring Cloud、MyBatis、JVM、计划模式、消息队列等模块。

免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！更多信息从访问主页：qidao123.com:ToB企服之家，中国第一个企服评测及商务社交产业平台。

		自动登录	找回密码
密码			立即注册

SpringAI用嵌入模型操纵向量数据库！

本帖子中包含更多资源

0 个回复

快速回复

楼主热帖

标签云

浏览过的版块