本地部署deepseek,并投喂数据

打印 上一主题 下一主题

主题 1932|帖子 1932|积分 5796

话说回来了,为啥要本地部署呢?
① 在利用DeepSeek中,常常会出现服务器繁忙,请稍后再试。
② 不想让个人隐私数据暴露出去
③ 可将各种格式的文件,如pdf、csv、txt、md 格式的数据投喂给它。好比你想让 DeepSeek 了解你的公司业务,就把干系的文档上传给它。
DeepSeek 就能吃下你给它的各种“知识大餐”,然后变得更智慧,更懂你。
1.RAG是什么?

为了投喂数据,我们要用到RAG。首先,我们先来了解下什么是RAG?
首先我们在下令行输入:ollama run deepseek-r1:7b 下令,启动DeepSeek

然后打开欣赏器并输入快捷键:ctrl+shift+l 调出WebUI可视化AI界面
输入:RAG是什么?

翻译成大白话就是:我们把知识放到知识库里,然后把它投喂给人工智能。我们必要用一个量化的工具,把各种格式的数据量化给人工智能,让它能看得懂。
人工智能通过对这些知识的学习后,以后你再问它的时候,他就能将知识提取出来,加工处置处罚后答复你的问题。
RAG 就是让 DeepSeek 不仅能靠本身的知识库答复问题,还能通过检索外部数据来加强答复的准确性和丰富性。就好比你测验时偷偷带了小抄,但 DeepSeek 是光明正大地“作弊”,还能把答案说得头头是道。
2.拉取nomic-embed-text

刚说了RAG是啥?我们必要一个RAG工具来完成量化工作。
各种开源免费的RAG工具挺多,我们这里选择最近比力获得ollama 提供的nomic-embed-text。
https://ollama.com/library/nomic-embed-text

我们利用上面圈出来的下令拉取即可,274M,大约1min左右就可以下完,出现【success】字样表示下载成功。


3.RAG设置

打开WebUI界面,我们会看到一个RAG设置文本嵌入模型。
文本嵌入模型就是把我们投喂的各种文档数据量化成DeepSeek认识的数据。

4.添加新知识

工具都预备好后,我们开始预备给DeepSeek投喂数据......
4.1 投喂前不认识陈仕宝


4.2 预备投喂的数据

接下来,将陈仕宝事先预备好的关于陈仕宝的简介【程序员陈仕宝.md】文档投喂给它,文档内容如下。

4.3 投喂数据


投喂数据

上传数据成功

投喂完成后,已经认识陈仕宝了,重新验证数据

以上就是投喂数据的过程。
参考文档:https://www.cnblogs.com/xiezhr/p/18714692

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
继续阅读请点击广告

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

尚未崩坏

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表