DeepSeek R1 + Cherry Studio 打造本地 AI 知识库:真的太香了! ...

打印 上一主题 下一主题

主题 1837|帖子 1837|积分 5511

大家好,我是R哥。
今天继续聊聊 DeepSeek R1,不过这次我们要搭配 Cherry Studio 来打造一个本地知识库,让 AI 更懂你、更贴合你的需求。
相比于上一期的 DeepSeek R1 + ima 个人知识库,这次的方案更强盛,支持的格式更多,还能方便地管理和检索你的知识内容,简直不要太香!
Cherry Studio 的介绍及安装使用看这篇:《DeepSeek R1 + Ollama + Cherry Studio 实现本地化部署 + 可视化访问,真的太香了!
1、知识库的痛点

在实际工作和学习中,我们常常需要查阅各种资料,比如技术文档、论文、书籍、博客等等。
如果这些资料散落在差别的文件夹分布在差别的云存储,甚至存储在各种笔记软件,查找起来就很麻烦。而且,如果这些知识点能跟 AI 结合,实现智能搜索和内容生成,那工作效率肯定会大大提升。
上一期的 DeepSeek R1 + ima 个人知识库,它知识库的文档全在云上,对于数据比力敏感的人/公司来说大概是个隐患,这时候搭建一个本地 AI 知识库就尤为重要了。
这就是我们今天要解决的问题:如何用 DeepSeek R1 + Cherry Studio 搭建一个本地 AI 知识库,让 AI 帮你管理和搜索你的知识!
2、Cherry Studio 知识库

介绍

Cherry Studio 目前已上线知识库功能,支持多种格式文件的导入和网页导入等来搭建个性化知识库。搭配 DeepSeek R1 之后,我们可以让 AI 在我们的知识库里搜索内容,并提供更加贴合个人需求的回答。
最最重要的是,Cherry Studio 数据本地储存,无需担心隐私泄露!
Cherry Studio 知识库中添加的数据全部存储在本地,不会上传到任何第三方服务器,在添加过程中会复制一份文档放在 Cherry Studio 数据存储目次,并且支持本地部署的模型调用。
知识库处理流程图如下:

向量数据库:https://turso.tech/libsql
当文档被添加到 Cherry Studio 知识库之后,文件会被切分为多少个片段,然后这些片段会交给嵌入模型进行处理,当使用大模型进行问答的时候,会查询和问题相关的文本片段一并交个大语言模型处理
如果对数据隐私有要求,发起使用本地嵌入数据库和本地大语言模型。
设置模型

上面说到了,AI 知识库需要一个嵌入模型进行分段处理,以是它需要一个嵌入模型。
我们可以在 Ollama 中筛选嵌入模型:
https://ollama.com/search?c=embedding

然后我们以 bge-m3 为例进行下载:
ollama pull bge-m3
下载成功后可以使用 ollama list 列出模型:
  1. $ ollama list
  2. NAME               ID              SIZE      MODIFIED
  3. bge-m3:latest      790764642607    1.2 GB    19 hours ago
  4. deepseek-r1:14b    ea35dfe18182    9.0 GB    4 weeks ago
复制代码
然后回到 Cherry Studio 模型服务中,把推理模型和嵌入模型都添加进来:


创建知识库

比如,我添加一个文章知识库:


CherryStudio 支持多种添加数据的方式:

  • 文件夹目次: 可以添加整个文件夹目次,该目次下支持格式的文件会被自动向量化。
  • 网址链接: 支持网址 url。
  • 站点舆图: 支持 xml 格式的站点舆图。
  • 纯文本笔记: 支持输入纯文本的自界说内容。
我这里上传了一些我写的 DeepSeek 文章:

当文件等资料向量化完成后,即可进行搜索,点击下面的「搜索知识库」按钮可以搜索知识库:

基于知识库对话

在助手对话框中选择刚创建的「文章」知识库进行对话:

问它一个问题:
deepseek是什么,300字总结
如图所示,它参考了我们指定的文章知识库进行思考和输出内容:


3、总结

以上,我们通过 DeepSeek R1 + Cherry Studio,我们实现了一个本地 AI 知识库:

  • 读取本地文档(Markdown、PDF、Word、TXT)
  • 智能搜索知识点(基于 Cherry Studio)
  • AI 生成智能回答(基于 DeepSeek R1)
  • 完全本地化运行(数据安全,不依赖外网)
相比于之前分享的ima 云知识库方案,这种本地 AI 知识库既能掩护数据隐私,又能让 AI 变得更懂你。
这样,我们可以把所有的文档、笔记、网站都添加到本地知识库中,方便我们进行搜索、总结、对话、写作等操作,真的太香了!
未完待续,公众号持续分享「DeepSeek」及 AI 实战干货,关注「AI技术宅」公众号和我一起学 AI。
最后,如果你还没用过 DeepSeek,清华大学出的《DeepSeek 从入门到精通》推荐你好悦目看吧,质量非常高,从原理到应用实践,写得非常好。
版权声明: 本文系公众号 "AI技术宅" 原创,转载、引用本文内容请注明出处,抄袭、洗稿一律投诉侵权,后果自负,并保存追究其法律责任的权利。
更多文章推荐:
1.Spring Boot 3.x 教程,太全了!
2.3,000+ 道 Java面试题及答案整理(最新版)
3.免费获取 IDEA 激活码的 7 种方式(最新版)
4.Java & DeepSeek & AI 学习资料分享
5.程序员精致简历模板分享
觉得不错,别忘了顺手点赞+转发哦!

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

乌市泽哥

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表