论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
只需一步,快速开始
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
IT评测·应用市场-qidao123.com技术社区
»
论坛
›
数据库
›
Postrge-SQL技术社区
›
登顶GitHub热榜的开源AI神器DocsGPT团队选择 MongoDB At ...
登顶GitHub热榜的开源AI神器DocsGPT团队选择 MongoDB Atlas作为托管数据库 ...
篮之新喜
论坛元老
|
2024-7-25 13:55:44
|
显示全部楼层
|
阅读模式
楼主
主题
1851
|
帖子
1851
|
积分
5563
自 2019 年成立以来,Arc53 便不停致力于为客户打造猜测式 AI/ML 办理方案,应用场景涵盖推荐引擎到欺诈检测等多个领域。而 2022 年 11 月 OpenAI 推出 ChatGPT 后,Arc53 便意识到 AI 的发展轨迹在极短的时间内发生了新的变化。
Arc53 联合创始人 Alex Tushynski 表现,“生成式 AI 迅速赢得市场关注是有迹可循的。
开发
职员和数据团队转瞬之间就面临挑衅,迫使将公司的专有数据导入生成式 AI 模型,并搭建如今所谓的
检索加强生成 (RAG)
框架。为此,他们必须拓展新领域,学习新技能。这并非易事,
因为他们不仅需要整合公司的所有数据库、数据湖、文件系统和搜刮引擎,而且要想法将这些系统中的数据输入到全新的向量存储中。
然后,他们还需要统筹所有要素并构建完备的办理方案。为此,我们想到了一个可以或许帮助这些团队化繁为简的方法,那就是 DocsGPT。”
DocsGPT 是一款开源文档助手,可以帮助
开发
职员轻松地在自己的数据上运用自然语言处理(NLP)技术,构建出会话式的用户体验。例如,在公司网站上配置一个客服谈天机器人,或者在内部数据存储库中提供一个接口来帮助员工提高工作服从。
开发
职员只需要将其数据源连接到 DocsGPT,即可利用各种嵌入模型和大语言模型 (LLM) 来优化其详细实例。
大语言模型 (LLM) 选项目前包括 ChatGPT 3.5 和 ChatGPT 4.0,以及基于 Mistral 的 DocsGPT-7B。
开发
职员不仅可以选择模型,还可以选择在何处部署 DocsGPT。他们可以下载开源代码并在自己的环境中实行,也可以将 DocsGPT 作为 Arc53 的托管服务来使用。
DocsGPT 技术堆栈
DocsGPT 赋予了
开发
职员极高的自由度,这从 DocsGPT 的采用率可见一斑。
自客岁发布以来,DocsGPT 在 GitHub 上共获得 14,000 星数,其社区亦相称活跃,拥有超过 100 位独立撰稿人。
Tushynski 称:“DocsGPT 获得了英国就业及退休保障部、制药行业办理方案提供商 NoDeviation 等 20000 多家用户的青睐。”
Tushynski 及其团队选择了 MongoDB Atlas 作为 DocsGPT 托管服务的数据库。
“我们之前已经在许多猜测式 AI 项目中使用过 MongoDB。
MongoDB 可以或许机动地存储各种布局的数据,也可以扩展为庞大的数据集,并且易于
开发
职员和数据科学家使用,这意味着我们可以更快地交付更为丰富的 AI 驱动办理方案。
利用 MongoDB 来支持 DocsGPT 无疑是最优选择。
开发
职员将文档连接到 DocsGPT 时,MongoDB 会存储所有元数据以及谈天记载和用户账户信息。”
从 Elasticsearch 迁移到 MongoDB Atlas Vector Search
自 Atlas Vector Search 推出后,DocsGPT 团队便开始将其向量数据库从Elasticsearch 迁移到 MongoDB Atlas。
Tushynski 认为,“MongoDB 是一款卓有成效的 OLTP 数据库,不仅可以或许处理较高的读写吞吐量,而且可以提供事件包管。假如能将这些功能融入向量搜刮和实时生成式 AI 应用,必将创造巨大价值。
Atlas 可以或许以多种方式处理嵌入内容快速变化且高度动态的工作负载,而这是 Elasticsearch 无法比拟的。
Elasticsearch 在将更新合并到现有索引中时有一定耽误,说明该应用经常检索陈旧数据,而这会影响模型输出的质量和可靠性。”
Tushynski 还表现,“我们试用过多款独立的向量数据库。有些数据库的技术程度确实不错,但在共同高度动态的生成式 AI 应用方面,仍然无法满足我们的需求。我们注意到,当用户的应用开始发展强大之后,用户就会产生调整嵌入模型的想法,而调整嵌入模型时,需要对数据进行重新编码并更新向量搜刮索引。例如,我们先将自己的默认嵌入模型从 OpenAI 迁移到了 Hugging Face 上的多个托管开源模型上,现在又迁移到了 BGE 上。
MongoDB 以 OLTP 为基础,让流程变得快捷、简单、省事。”
Arc53 联合创始人 Alex Tushynski
“源数据、元数据和向量嵌入在同一个平台上,实现了统一和同步,并且可以或许通过同一个 API 访问,这帮助用户加快了构建生成式 AI 应用的速度,降低了成本和复杂性。”
Tushynski 在其名为“使用最佳嵌入,强大 DocsGPT ”(Amplify DocsGPT with optimal embeddings) 的博文中探究了嵌入模型的紧张性。这篇文章通过一个示例描述了某客户如何仅通过更新其嵌入模型,便将测得的用户体验优化了 50%。
显现向量嵌入选择的影响
“在这一方面,
MongoDB Atlas的一大突出特点是它可以娴熟地处理多个嵌入。无需创建单独的聚集或表单,MongoDB Atlas就能直接将各种嵌入直接链接到一个或多个大语言模型,这一功能非常实用,
”Tushynski 说道。“这种方法不仅简化了数据架构,还避免了数据复制,轻松办理了传统数据库设置过程中广泛存在的困难。MongoDB 为存储和管理多个嵌入提供了便利条件,在不同的大语言模型及其各自的嵌入之间实现了更加无缝且机动的互动。”
作为 AI 创新者筹划的一员,DocsGPT 工程团队不仅可以享有 Atlas 免费积分,还可以获取专业技术知识,为迁移过程保驾护航。AI 创新者筹划面向所有使用 MongoDB 构建 AI 办理方案的初创企业。
点击了解AI创新者筹划
MongoDB Atlas
MongoDB Atlas 是 MongoDB 公司提供的 MongoDB 云服务,由 MongoDB 数据库的
开发
团队构建和
运维
,可以在亚马逊云科技、Microsoft Azure、Google Cloud Platform 云平台上轻松部署、运营和扩展。MongoDB Atlas 内建了 MongoDB 安全和
运维
最佳实践,可自动完成基础办法的部署、数据库的构建、高可用部署、数据的环球分发、备份等即费时又需要大量履历
运维
工作。让您通过简单的界面和 API 就 可以完成这些工作,由此您可以将更多名贵的时间花在构建您的应用上。
点击了解更多
MongoDB Atlas
的干系内容
点击了解更多
MongoDB Atlas Vector Search
的干系内容
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
0 个回复
正序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
发新帖
回复
篮之新喜
论坛元老
这个人很懒什么都没写!
楼主热帖
XtraBackup 搭建从库的一般步骤及 Xtra ...
Docker三剑客之Machine
rustdesk自建服务器总是掉线 未就绪, ...
[回馈]ASP.NET Core MVC开发实战之商城 ...
8行代码实现快速排序,简单易懂图解! ...
通过Go语言创建CA与签发证书 ...
三天吃透Kafka面试八股文
Java毕业设计-音乐管理系统
sqlserver 软件授权
教你几招百度网盘不限速的方法 ...
标签云
集成商
AI
运维
CIO
存储
服务器
浏览过的版块
Java
快速回复
返回顶部
返回列表