Jina AI建立于2020年,总部位于德国柏林,重要从事提示工程和嵌入模子业务,已敏捷成长为多模态AI领导者。Jina AI积极推动开源和开放研究,致力于弥合先辈AI理论与开发者及数据科学家构建的AI驱动型真实世界应用程序之间的差距。目前,Jina AI平台已拥有凌驾40万名注册用户。
Jina AI创始人兼CEO肖涵博士在论述公司使命时表现:“我们盼望可以或许为多模态AI未来的实现铺平道路。我们发现当前的机器学习和软件生态系统在处置惩罚多模态AI方面面临着一些挑衅。 鉴于此,我们大力研发开创性工具和平台,助力企业和开发者办理这些复杂标题。我们的愿景是发挥自身的关键作用,帮助全球用户充实利用多模态AI的巨大潜力并彻底改变信息的解读和互动方式。”
Jina AI在嵌入模子范畴的研究引起了业界的广泛兴趣和关注。因为如今许多开发者都已熟悉到嵌入技术对于生成式AI的紧张意义。嵌入模子好坏常复杂的算法,可以将恣意结构的数据转化并嵌入到多维数字编码(即向量)中。这些向量通过捕捉数据的模式和关系来赋予数据相应的语义信息。 这意味着,我们可以利用与结构化业务数据雷同的方式来分析和搜索非结构化数据。考虑到我们每天生成的数据中有80%以上好坏结构化数据,我们开始对嵌入模子与MongoDB Atlas Vector Search 等先辈办理方案相结合对生成式AI带来的变革性影响充满等待。 Jina AI推出的jina-embeddings-v2是目前首个开源8K文本嵌入模子。该模子的标记长度到达8K,这使其可以或许更深入地理解上下文,从而明显提高检索增强生成(RAG)和语义搜索等使命的准确性和相关性。Jina AI的嵌入模子具有增强型数据索引和搜索能力,并支持双语环境。 嵌入模子专注于单一语言和语言对,确保在特定语言基准测试中到达最先辈的性能。Jina Embeddings v2目前已经发布了德语-英语和汉语-英语的双语模子,其他双语模子正在开发中。 Jina AI的嵌入模子在分类、重排、检索和摘要等方面均有优秀体现,因此适用于各种应用场景,尤其是跨语言使命。 近期,该嵌入模子在跨国企业客户中的部门应用案例包括:销售序列自动化、人力资源技能匹配以及附带欺诈检测功能的付款对账等。