qidao123.com技术社区-IT企服评测·应用市场
标题:
AI大模型 向量Embeddings+向量数据库实现文搜文、图搜图
[打印本页]
作者:
立聪堂德州十三局店
时间:
2025-4-6 20:07
标题:
AI大模型 向量Embeddings+向量数据库实现文搜文、图搜图
文搜文、图搜图先容:
IT营大地老师主讲AI大模型 向量Embeddings+向量数据库实现文搜文、图搜图学习: AI教程
文搜文
:即文本搜索文本,是指通过输入关键词或短语,在大量文本数据中检索出与之相干的内容 。
搜
索引擎(百度、谷歌、
360
)
、
文档管理系统
、
电商搜索
。
图搜图
:即图像搜索图像,是一种基于图像内容的搜索技能 。
电商平台
、
版权掩护
、
计划行业
、
智
慧医疗
( 医生可以通过图搜图技能检索医学影像库中的相似病例,辅助病情诊断和治疗方案的制定 )、
旅游出行
。
传统的 Elasticsearch 全文搜索引擎可以通过分词实现搜索功能,但是要实现图搜图就无从动手了。
向量 Embeddings 联合向量数据库不但可以实现文搜文,还实现图搜图。
向量 Embeddings 联合向量数据库在向量搜索领域相比 Elasticsearch 具有更高的性能(好比相似度)、更强的灵活性和可扩展性、更低的开辟门槛和成本效益,以及更广泛的应用场景。
好比 Milvus 向量数据库,在
万亿条
向量数据中检索数据可以实现毫秒级别的速度。
向量
Embeddings
先容:
向量 Embeddings 也叫向量嵌入( Vector Embeddings ),是天然语言处理( NLP )和呆板学习领域中一个非常紧张的概念,它是一种将高维数据(如文本、图像、音频或视频等)映射到低维空间(向量)的技能。这种转换使得这些数据(如文本、图像、音频或视频等)可以大概在数学上被处理,从而可以大概举行天然语言搜索、分类、盘算等操作。
非结构化数据
( 如 WORD 、 PDF 、 TXT 等 ) ,通过
深度学习模型
( 神经网络 ) ,把
天然语言
转换成
向量
,这样就可以实现天然语言搜索、分类、盘算等操作。
深度学习向量模型
(神经网络)目前已经非常成熟,怎样借助深度学习模型把
非结构化数据转换成向
量
,
并对向量举行处理
是目前开辟 AI 大模型应用开辟比较关注的问题。
向量
Embeddings
在多个领域都有广泛的应用,包括但不限于:
1、天然语言处理(
NLP
)
:在 NLP 中,单词 Embedding (词嵌入)是一种常见的技能,用于将单词转换为一连向量表现。这种表现方法有助于捕获单词之间的语义关系,从而进步NLP 任务的性能, 如文天职类、情绪分析、呆板翻译等。
2、图像处理
:在图像处理领域,图像 Embedding 技能可以将图像转换为向量表现,从而便于举行图像分类、识别、检索等任务。
3、推荐系统
:推荐系统可以利用用户行为数据(如点击、购买、评分等)和物品属性数据(如标题、形貌、图片等)生成向量表现,进而盘算用户与物品之间的相似度,从而为用户推荐可能感兴趣的物品。
这张图片通过坐标系和向量化表现的方法,展示了四种动物(猫、狗、牛、羊)在某种
抽象空间
中的位置关系 。
通过把自燃语言向量转化为向量,可以让我们在向量空间中举行语义搜索、分类、盘算等操作。
好比我们把 “ 宠物 ” 向量化,然后用对应的向量举行搜索,就可以获取猫和狗的向量数据。好比我们把 “ 家畜“ 向量化,然后用应的向量举行搜索就可以搜索到牛和羊对应的向量,从而实现语言搜索。
Embeddings
大模型
: BERT
( Google 开辟 ) 、
GPT
系列
、
Word2Vec
、
百度文心大模型
、
bge-large-
zh
、
智谱
、
讯飞新火
等。
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
欢迎光临 qidao123.com技术社区-IT企服评测·应用市场 (https://dis.qidao123.com/)
Powered by Discuz! X3.4