论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
应用中心
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
qidao123.com技术社区-IT企服评测·应用市场
»
论坛
›
数据库
›
Nosql
›
AI大模型 向量Embeddings+向量数据库实现文搜文、图搜图 ...
AI大模型 向量Embeddings+向量数据库实现文搜文、图搜图 ...
立聪堂德州十三局店
论坛元老
|
2025-4-6 20:07:09
|
显示全部楼层
|
阅读模式
楼主
主题
2356
|
帖子
2356
|
积分
7068
文搜文、图搜图先容:
IT营大地老师主讲AI大模型 向量Embeddings+向量数据库实现文搜文、图搜图学习: AI教程
文搜文
:即文本搜索文本,是指通过输入关键词或短语,在大量文本数据中检索出与之相干的内容 。
搜
索引擎(百度、谷歌、
360
)
、
文档管理系统
、
电商搜索
。
图搜图
:即图像搜索图像,是一种基于图像内容的搜索技能 。
电商平台
、
版权掩护
、
计划行业
、
智
慧医疗
( 医生可以通过图搜图技能检索医学影像库中的相似病例,辅助病情诊断和治疗方案的制定 )、
旅游出行
。
传统的 Elasticsearch 全文搜索引擎可以通过分词实现搜索功能,但是要实现图搜图就无从动手了。
向量 Embeddings 联合向量数据库不但可以实现文搜文,还实现图搜图。
向量 Embeddings 联合向量数据库在向量搜索领域相比 Elasticsearch 具有更高的性能(好比相似度)、更强的灵活性和可扩展性、更低的开辟门槛和成本效益,以及更广泛的应用场景。
好比 Milvus 向量数据库,在
万亿条
向量数据中检索数据可以实现毫秒级别的速度。
向量
Embeddings
先容:
向量 Embeddings 也叫向量嵌入( Vector Embeddings ),是天然语言处理( NLP )和呆板学习领域中一个非常紧张的概念,它是一种将高维数据(如文本、图像、音频或视频等)映射到低维空间(向量)的技能。这种转换使得这些数据(如文本、图像、音频或视频等)可以大概在数学上被处理,从而可以大概举行天然语言搜索、分类、盘算等操作。
非结构化数据
( 如 WORD 、 PDF 、 TXT 等 ) ,通过
深度学习模型
( 神经网络 ) ,把
天然语言
转换成
向量
,这样就可以实现天然语言搜索、分类、盘算等操作。
深度学习向量模型
(神经网络)目前已经非常成熟,怎样借助深度学习模型把
非结构化数据转换成向
量
,
并对向量举行处理
是目前开辟 AI 大模型应用开辟比较关注的问题。
向量
Embeddings
在多个领域都有广泛的应用,包括但不限于:
1、天然语言处理(
NLP
)
:在 NLP 中,单词 Embedding (词嵌入)是一种常见的技能,用于将单词转换为一连向量表现。这种表现方法有助于捕获单词之间的语义关系,从而进步NLP 任务的性能, 如文天职类、情绪分析、呆板翻译等。
2、图像处理
:在图像处理领域,图像 Embedding 技能可以将图像转换为向量表现,从而便于举行图像分类、识别、检索等任务。
3、推荐系统
:推荐系统可以利用用户行为数据(如点击、购买、评分等)和物品属性数据(如标题、形貌、图片等)生成向量表现,进而盘算用户与物品之间的相似度,从而为用户推荐可能感兴趣的物品。
这张图片通过坐标系和向量化表现的方法,展示了四种动物(猫、狗、牛、羊)在某种
抽象空间
中的位置关系 。
通过把自燃语言向量转化为向量,可以让我们在向量空间中举行语义搜索、分类、盘算等操作。
好比我们把 “ 宠物 ” 向量化,然后用对应的向量举行搜索,就可以获取猫和狗的向量数据。好比我们把 “ 家畜“ 向量化,然后用应的向量举行搜索就可以搜索到牛和羊对应的向量,从而实现语言搜索。
Embeddings
大模型
: BERT
( Google 开辟 ) 、
GPT
系列
、
Word2Vec
、
百度文心大模型
、
bge-large-
zh
、
智谱
、
讯飞新火
等。
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
继续阅读请点击广告
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
立聪堂德州十三局店
论坛元老
这个人很懒什么都没写!
楼主热帖
零信任介绍
哈夫曼应用
WPF开发随笔收录-获取软件当前目录的坑 ...
《微信小程序-基础篇》什么是组件化以 ...
【iOS逆向与安全】frida-trace入门 ...
VMware虚拟机安装Linux教程(超详细) ...
2021年7月整理--简单方法 暴力破解WIFI ...
django使用多个数据库实现
sqlserver字符串拼接
计算机等级考试二级C语言上机题集(第1 ...
标签云
国产数据库
集成商
AI
运维
CIO
存储
服务器
浏览过的版块
云原生
快速回复
返回顶部
返回列表