【Elasticsearch】使用阿里云 infererence API 及 semantic text 进行向量 ...

勿忘初心做自己 · 2024-12-18 06:34:02

原作者：Elastic布道师刘晓国
在之前的文章 “Elasticsearch 开放推理 API 新增阿里云 AI 搜索支持”，它详细形貌了如何使用 Elastic inference API 来针对阿里的麋集向量模子，希罕向量模子，重新排名及 completion 进行展示。在那篇文章里，它使用了许多的英文的例子。但是阿里的模子更适合中文字来进行展示。我们知道 Elastic 的开箱即用的希罕向量模子 ELSER 只适合英文。现在它不支持中文。恰好阿里的希罕向量模子填补了这个空白。希罕向量可以开箱即用。对于许多不是很醒目人工智能的开发者来说，这无疑是个福音，而且它使用的资源很小。
更多阅读，可参阅 Elasticsearch 的“阿里云 AI 搜索推理服务”。
希罕向量

根据文档，我们使用如下的下令来创建希罕向量的推理 API 端点：

PUT _inference/sparse_embedding/alibabacloud_ai_search_sparse
{
"service": "alibabacloud-ai-search",
"service_settings": {
"api_key": "<api_key>",
"service_id": "ops-text-sparse-embedding-001",
"host": "default-j01.platform-cn-shanghai.opensearch.aliyuncs.com",
"workspace": "default"
}
}

复制代码

在上面，我们须要从阿里云得到 api_key 来进行。运行上面的下令：

我们接下来可以通过如下的方式来测试（如下信息由地点得到）：

POST _inference/alibabacloud_ai_search_sparse
{
"input": "阿里巴巴（中国）有限公司成立于2007年03月26日，法定代表人蒋芳"
}

复制代码

上面的下令表现的效果为：

我们从上面的表现效果可以看出来，它和我们之前的 Elastic ELSER 输出是差别的。这里应该是 unicode。

上面的下令和下面的下令是一样的：

POST _inference/sparse_embedding/alibabacloud_ai_search_sparse
{
"input": "阿里巴巴（中国）有限公司成立于2007年03月26日，法定代表人蒋芳"
}

复制代码

因为每个 endpoint 在 Elasticsearch 创建时，都会自动检测并识别出它是什么类型的模子，以是上面路径中的 sparse_embedding 是可以省去的。
麋集向量

同样，我们使用如下的下令来创麋集向量的推理 API 端点：

PUT _inference/text_embedding/alibabacloud_ai_search_embeddings
{
"service": "alibabacloud-ai-search",
"service_settings": {
"api_key": "<api_key>",
"service_id": "ops-text-embedding-001",
"host": "default-j01.platform-cn-shanghai.opensearch.aliyuncs.com",
"workspace": "default"
}
}

复制代码

运行上面的下令，我们可以看到：

我们可以使用如下的下令来天生麋集向量：

POST _inference/alibabacloud_ai_search_embeddings
{
"input": "阿里巴巴（中国）有限公司成立于2007年03月26日，法定代表人蒋芳"
}

复制代码

麋集向量是一个浮点数的数组。我们在天生的时候，其实还是可以对它进行标量量化，这样可以节省内存斲丧，并进步搜索的速度。
完成 - completion

我们甚至可以针对搜索的效果运用大模子来得到一个 completion 的效果，比如，我们使用如下的下令来天生一个 completion 的推理 API 端点：

PUT _inference/completion/alibabacloud_ai_search_completion
{
"service": "alibabacloud-ai-search",
"service_settings": {
"host" : "default-j01.platform-cn-shanghai.opensearch.aliyuncs.com",
"api_key": "{{API_KEY}}",
"service_id": "ops-qwen-turbo",
"workspace" : "default"
}
}

复制代码

我们可以通过如下的例子来展示 completion：

POST _inference/completion/alibabacloud_ai_search_completion
{
"input": "阿里巴巴（中国）有限公司是什么时候成立的?"
}

复制代码

这个效果是联合大模子而天生的。大模子提供了一个基于在大模子训练时得到的效果。
重新排名 - rerank

同样，我们可以按照如下的下令来天生一个 rerank 的推理 API 端点：

PUT _inference/rerank/alibabacloud_ai_search_rerank
{
"service": "alibabacloud-ai-search",
"service_settings": {
"api_key": "<api_key>",
"service_id": "ops-bge-reranker-larger",
"host": "default-j01.platform-cn-shanghai.opensearch.aliyuncs.com",
"workspace": "default"
}
}

复制代码

在上面的 input 里，我们枚举了两个文档。我们可以通过 rerank 端点来针对这两个文档重新进行排序。假如我们想搜索的文字是 “阿里巴巴（中国）有限公司是哪一年成立的？”。那么 rerank 返返来的效果是：

从上面，我们可以看出来，第二个文档比第一个文档更为贴近，也就是它的相关度更高。
RAG 应用

在许多环境下，我们企业有许多的业务数据大概私有数据每时每刻都在天生，而大模子的知识仅限于在它天生的时候，以是许多的时候，大模子有许多的知识是不知道的。如果我们不对大模子的答复进行限制，那么它可能给出的答案就是错误的，从而产生幻觉。在实际的应用中，我们通常把业务或私有数据生存于像 Elasticsearch 这样的向量数据库中。在搜索时，我们首先搜索 Elasticsearch，并把搜索的效果发送给大模子做为 prompt 的一部门，这样就可以解决幻觉的题目。

首先，我们来创建一个希罕向量索引：

PUT alibaba_sparse
{
"mappings": {
"properties": {
"inference_field": {
"type": "semantic_text",
"inference_id": "alibabacloud_ai_search_sparse"
}
}
}
}

复制代码

然后，我们写入如下的两个文档

PUT alibaba_sparse/_bulk
{"index": {"_id": "1"}}
{"inference_field": "阿里巴巴（中国）有限公司成立于2007年03月26日，法定代表人蒋芳"}
{"index": {"_id": "2"}}
{"inference_field": "阿里云（Alibaba Cloud Computing Co. Ltd，又名：阿里云计算有限公司）创立于2009年，总部设在杭州，为阿里巴巴集团的数字技术与智能骨干业务，向全球客户提供全方位云服务，包括自有服务器、弹性计算、存储、网络安全、数据库和大数据等服务。"}

复制代码

我们通过如下的下令来进行搜索：

GET alibaba_sparse/_search
{
"query": {
"semantic": {
"field": "inference_field",
"query": "阿里云是什么时候成立的？"
}
}
}

复制代码

上面搜索效果为：

阿里云排第一位

"阿里云（Alibaba Cloud Computing Co. Ltd，又名：阿里云计算有限公司）创立于2009年，总部设在杭州，为阿里巴巴集团的数字技术与智能骨干业务，向全球客户提供全方位云服务，包括自有服务器、弹性计算、存储、网络安全、数据库和大数据等服务。"

阿里巴巴排第二位

"阿里巴巴（中国）有限公司成立于2007年03月26日，法定代表人蒋芳"

含有阿里云的文档排在第一的位置。这个就是我们所说的向量搜索。

在实际的许多例子中，我们有时想得到一个唯一的答案，甚至这个答案是推理出来的，而不原始的文档。这个时候我们就须要用到大模子，也就是使用 completion 这个推理端点。

我们首先来做如下的搜索：

GET alibaba_sparse/_search
{
"query": {
"semantic": {
"field": "inference_field",
"query": "阿里巴巴公司的法人是谁？"
}
}
}

复制代码

这次只有一个文档被列出来了。我们在下面使用 completion 端点：

POST _inference/completion/alibabacloud_ai_search_completion
{
"input": "<|system|>
你是一个知识渊博的人.</s>
<|user|>
CONTEXT:
阿里巴巴（中国）有限公司成立于2007年03月26日，法定代表人蒋芳
QUESTION:
阿里巴巴公司的法人是谁？</s>
<|assistant|>"
}

复制代码

在上面，我们把上面搜索的效果文档 “阿里巴巴（中国）有限公司成立于2007年03月26日，法定代表人蒋芳” 作为 context 的一部门，并把搜索的题目也一并提交。我们使用 completion 端点 API 来检察效果：

上面表现的效果是 “阿里巴巴公司的法定代表人是蒋芳”。很显然这个和之前的直接使用 completion 而没有 context 的效果是完全差别的：

POST _inference/completion/alibabacloud_ai_search_completion
{
"input": "阿里巴巴法定代表是谁?"
}

复制代码

可以这样明白，有了从 Elasticsearch 向量数据库（及时业务数据或私有数据）中搜索来的效果并提供给大模子，大模子可以根据这些上下文，得到更为贴近答案的搜索效果。这个在实际的使用中避免幻觉！

另外一个例子：

POST _inference/completion/alibabacloud_ai_search_completion
{
"input": "<|system|>
你是一个知识渊博的人.</s>
<|user|>
CONTEXT:
阿里巴巴（中国）有限公司成立于2007年03月26日，法定代表人蒋芳
QUESTION:
阿里巴巴（中国）有限公司是什么时候成立的？</s>
<|assistant|>"
}

复制代码

有关如何构建提示（prompt）

按照构建提示（prompt）的方法，我们来创建一个麋集向量的索引：

PUT alibaba_dense
{
"mappings": {
"properties": {
"inference_field": {
"type": "semantic_text",
"inference_id": "alibabacloud_ai_search_embeddings"
}
}
}
}

复制代码

我们按照同样的方法来写入文档：

PUT alibaba_dense/_bulk
{"index": {"_id": "1"}}
{"inference_field": "阿里巴巴（中国）有限公司成立于2007年03月26日，法定代表人蒋芳"}
{"index": {"_id": "2"}}
{"inference_field": "阿里云 (又名：阿里云计算有限公司）创立于2009年，总部设在杭州，为阿里巴巴集团的数字技术与智能骨干业务，向全球客户提供全方位云服务"}

复制代码

我们来对这个麋集向量索引 alibaba_dense 来进行搜索：

GET alibaba_dense/_search
{
"query": {
"semantic": {
"field": "inference_field",
"query": "Alibaba 的法人是谁？"
}
}
}

复制代码

很显然，在我们的搜索中，我们并没有使用 “阿里巴巴”，我们查询的是 Alibaba。在向量空间里 “阿里巴巴” 等同于 “Alibaba”。同样地，

GET alibaba_dense/_search
{
"query": {
"semantic": {
"field": "inference_field",
"query": "Aliyun是什么样的公司？"
}
}
}

复制代码

上面的搜索的效果是：

很显然，含有 “阿里云” 的文档排名为第一尽管我们搜索的是 “Alibaba”。
自动分块

我们知道 semantic_text 字段可以帮我们自动把一大段的文字进行分块，而不须要我们手动去分块。这个是 semantic_text 一个非常大的好处。我们来创建一个叫做 alibaba_dense_large_text 的索引：

PUT alibaba_dense_large_text
{
"mappings": {
"properties": {
"inference_field": {
"type": "semantic_text",
"inference_id": "alibabacloud_ai_search_embeddings"
}
}
}
}

复制代码

我们也为这个索引创建一个大的文档：

PUT alibaba_dense_large_text/_doc/1
{
"inference_field": "
阿里巴巴集团简介
阿里巴巴集团（Alibaba Group）是一家总部位于中国浙江省杭州市的全球知名科技公司，成立于1999年，由马云及其团队创建。作为一家以科技驱动为核心的企业，阿里巴巴在电子商务、云计算、金融科技、数字媒体、物流等领域拥有广泛布局，成为全球互联网行业的重要参与者。
创立背景与早期发展
阿里巴巴的诞生始于1999年，当时中国的互联网刚刚兴起。马云和他的团队怀着通过互联网赋能中小企业的愿景，推出了全球批发交易市场阿里巴巴网站（Alibaba.com）。最初，这个平台主要为中小企业提供展示产品和寻找国际买家的机会，帮助中国的制造商走向全球市场。经过几年发展，阿里巴巴迅速崭露头角，成为全球领先的B2B电子商务平台。
2003年，阿里巴巴推出了面向个人消费者的C2C平台淘宝网（Taobao），迅速吸引了大量用户。凭借“免费开店”的模式，淘宝在短时间内与其他电商平台展开竞争并取得成功。为了增强用户体验，阿里巴巴在2004年推出了第三方支付平台支付宝（Alipay），解决了在线支付的信任问题，这一创新奠定了中国电子商务快速发展的基础。
业务生态与战略布局
阿里巴巴通过不断拓展业务，逐步构建了涵盖电商、金融、物流和云计算等领域的多元化生态系统。
电子商务领域
作为阿里巴巴的核心业务，电子商务包括淘宝、天猫（Tmall）和全球速卖通（AliExpress）等平台。其中，淘宝以满足个人消费者需求为主，天猫则面向品牌和企业，提供高品质的商品和服务。全球速卖通致力于连接海外买家与中国卖家，在国际市场上影响力日益增强。
云计算与大数据
阿里云（Alibaba Cloud）是阿里巴巴集团的核心技术部门，成立于2009年，提供云计算服务、人工智能解决方案和大数据技术支持。如今，阿里云已成为全球领先的云服务提供商，为企业数字化转型提供支撑。
金融科技
支付宝的母公司蚂蚁集团是阿里巴巴金融科技布局的重要组成部分。通过支付宝，阿里巴巴为用户提供线上支付、理财、贷款等服务，推动了中国无现金社会的发展。
物流与供应链
菜鸟网络（Cainiao Network）成立于2013年，致力于优化物流效率，构建覆盖全球的智能物流网络。菜鸟的技术和平台能力提升了电商物流服务的速度和可靠性。
数字媒体与娱乐
阿里巴巴还在数字媒体领域积极布局，包括优酷、阿里影业和虾米音乐等，推动内容生态的建设。此外，集团通过投资文化创意产业和拓展体育事业，进一步丰富了品牌内涵。
国际化与创新
近年来，阿里巴巴不断加快国际化步伐，旨在成为全球消费者与企业的桥梁。集团通过并购和合作，扩展了其在东南亚、欧洲和北美等市场的业务。例如，通过收购Lazada，阿里巴巴增强了其在东南亚地区的电商影响力。
此外，阿里巴巴还积极探索新技术，包括人工智能、区块链和物联网。这些技术的应用不仅优化了集团的现有业务，还为未来的创新奠定了基础。
企业文化与社会责任
阿里巴巴的企业文化以“让天下没有难做的生意”为核心使命，鼓励员工创新和协作。马云强调企业的社会责任，并倡导将资源用于公益事业。例如，阿里巴巴基金会支持环境保护、教育发展和扶贫工作，为社会创造长期价值。
面临的挑战与未来展望
尽管阿里巴巴取得了显著成就，但也面临着国际竞争加剧、行业监管加强和技术创新压力等挑战。为了保持领先地位，阿里巴巴需要在全球范围内持续创新，同时积极适应不同市场的法规和文化。
展望未来，阿里巴巴将继续推动科技与商业的融合，助力中小企业和消费者实现更多价值。同时，通过技术研发和全球化布局，阿里巴巴有望在全球数字经济的发展中扮演更加重要的角色。
结语
作为中国乃至全球最具影响力的互联网公司之一，阿里巴巴的成长历程展现了科技对商业模式的深刻变革。通过不断创新和拓展，阿里巴巴正在为全球经济注入新的活力，也为无数企业和消费者创造了前所未有的机会。未来，阿里巴巴仍将以技术和商业为驱动，为构建更加便捷和高效的数字化世界而努力。
"
}

复制代码

上面的文章的字数大概在1000个字左右。
我们可以通过如下的方法来检察写入的文档：

GET alibaba_dense_large_text/_search

复制代码

从上面，我们可以看出来，semantic_text 字段自动将一个很长文字的文档分块，并分别对它们进行向量化。
盼望本文能为您在使用阿里云和Elasticsearch进行向量搜索的探索中提供有价值的参考和启发。将来，随着技术的不断演进，我们等待看到更多基于语义明白的智能应用落地，推动搜索技术向更高的条理发展。

免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！更多信息从访问主页：qidao123.com:ToB企服之家，中国第一个企服评测及商务社交产业平台。

		自动登录	找回密码
密码			立即注册

【Elasticsearch】使用阿里云 infererence API 及 semantic text 进行向量 ...

0 个回复

快速回复

楼主热帖

标签云