AI大模型 向量Embeddings+向量数据库实现文搜文、图搜图 ...

打印 上一主题 下一主题

主题 2356|帖子 2356|积分 7068

文搜文、图搜图先容:     IT营大地老师主讲AI大模型 向量Embeddings+向量数据库实现文搜文、图搜图学习:          AI教程
   
    文搜文  :即文本搜索文本,是指通过输入关键词或短语,在大量文本数据中检索出与之相干的内容 。    索引擎(百度、谷歌、  360    、   文档管理系统   、   电商搜索   。   
   图搜图  :即图像搜索图像,是一种基于图像内容的搜索技能 。   电商平台   、   版权掩护   、   计划行业   、     慧医疗   ( 医生可以通过图搜图技能检索医学影像库中的相似病例,辅助病情诊断和治疗方案的制定 )、  旅游出行   。   
   传统的  Elasticsearch   全文搜索引擎可以通过分词实现搜索功能,但是要实现图搜图就无从动手了。   
   向量  Embeddings  联合向量数据库不但可以实现文搜文,还实现图搜图。   
   向量  Embeddings  联合向量数据库在向量搜索领域相比   Elasticsearch   具有更高的性能(好比相似度)、更强的灵活性和可扩展性、更低的开辟门槛和成本效益,以及更广泛的应用场景。   
   好比  Milvus   向量数据库,在  万亿条  向量数据中检索数据可以实现毫秒级别的速度。  

   向量  Embeddings  先容:  
   向量  Embeddings  也叫向量嵌入(  Vector Embeddings  ),是天然语言处理(  NLP  )和呆板学习领域中一个非常紧张的概念,它是一种将高维数据(如文本、图像、音频或视频等)映射到低维空间(向量)的技能。这种转换使得这些数据(如文本、图像、音频或视频等)可以大概在数学上被处理,从而可以大概举行天然语言搜索、分类、盘算等操作。  

   非结构化数据  (  如  WORD  、  PDF  、  TXT  等  )  ,通过  深度学习模型  (  神经网络  )  ,把  天然语言  转换成  向量  ,这样就可以实现天然语言搜索、分类、盘算等操作。   
   深度学习向量模型  (神经网络)目前已经非常成熟,怎样借助深度学习模型把  非结构化数据转换成向    ,  并对向量举行处理  是目前开辟  AI  大模型应用开辟比较关注的问题。   
   向量  Embeddings  在多个领域都有广泛的应用,包括但不限于:   
   1、天然语言处理(  NLP    :在  NLP  中,单词  Embedding  (词嵌入)是一种常见的技能,用于将单词转换为一连向量表现。这种表现方法有助于捕获单词之间的语义关系,从而进步NLP  任务的性能, 如文天职类、情绪分析、呆板翻译等。   
   2、图像处理  :在图像处理领域,图像  Embedding  技能可以将图像转换为向量表现,从而便于举行图像分类、识别、检索等任务。   
   3、推荐系统  :推荐系统可以利用用户行为数据(如点击、购买、评分等)和物品属性数据(如标题、形貌、图片等)生成向量表现,进而盘算用户与物品之间的相似度,从而为用户推荐可能感兴趣的物品。   

   这张图片通过坐标系和向量化表现的方法,展示了四种动物(猫、狗、牛、羊)在某种  抽象空间  中的位置关系 。   
   通过把自燃语言向量转化为向量,可以让我们在向量空间中举行语义搜索、分类、盘算等操作。   
   好比我们把  “  宠物  ”  向量化,然后用对应的向量举行搜索,就可以获取猫和狗的向量数据。好比我们把  “  家畜“  向量化,然后用应的向量举行搜索就可以搜索到牛和羊对应的向量,从而实现语言搜索。   
   Embeddings  大模型  : BERT   ( Google  开辟   )  、   GPT  系列   、   Word2Vec   、   百度文心大模型   、  bge-large-  zh  、  智谱  、  讯飞新火  等。  

  

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
继续阅读请点击广告

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

立聪堂德州十三局店

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表