玛卡巴卡的卡巴卡玛 发表于 2025-2-26 14:25:07

轻松搭建本地大语言模子(五)Dify知识库:本地大语言模子弹药库(deepseek

弁言

为什么要使用知识库?

(1)补充模子的范围性

在未联网的环境下,大语言模子虽然颠末海量数据的训练,但其知识是静态的,通常停留在训练数据的停止日期之前。对于最新的事件、行业动态或小众领域的专业知识,模子无法提供准确的信息,通过引入本地摆设的知识库,我们可以为模子提供最新的、特定领域的知识,从而弥补其知识的空白,确保在未联网环境中也能获取准确和有用的信息。
(2)提升准确性和可靠性

知识库中的信息颠末精心整理和验证,能够为模子提供高质量的知识支持。当模子在生成答复时,可以参考知识库中的准确信息,避免因自身的不确定性和偏差而产生错误。比方,在医疗、法律等专业领域,准确的知识库能够确保模子生成的内容符合行业尺度,减少误导性信息的流传。
(3)增强模子的个性化能力

不同的应用场景和用户群体对知识的需求各不相同。通过定制化的知识库,我们可以为模子注入特定领域的知识,使其更好地顺应特定用户的需求。比如,一个面向金融行业的谈天机器人可以使用包罗金融市场数据和法规的知识库,从而为用户提供更精准的服务。
   基于以上的缘故原由,我们就引入了今天的目标,通过设置知识库,让大语言模子能够根据知识库答复题目。
目标

基于dify知识库功能实现大模子根据知识库答复题目。
结果如下:
https://i-blog.csdnimg.cn/img_convert/91a112f5a7e024825903080ba393e8b0.png
环境要求



[*]dify运行环境
[*]ollama环境(非必选,可以用其他模子供应商取代)
可参考以下文章搭建:
轻松搭建本地大语言模子(一)Ollama安装与使用
轻松搭建本地大语言模子(四)Dify 对接 Ollama:让本地大模子变得触手可及
一、创建一个谈天助手

https://i-blog.csdnimg.cn/img_convert/0f0d5049f3263cda0e28bcac8894733e.png
选择谈天助手,填写应用名称
https://i-blog.csdnimg.cn/img_convert/ae21144fef8c75a3fcd9f805ad798162.png
二、测试谈天

https://i-blog.csdnimg.cn/img_convert/bd3a5abdb920130cdaf384213db66d73.png
   可以看到,查询只有影子是谁,并不能返回啥信息,所以我们就要举行下一步,创建知识库并与谈天助手关联。
三、创建知识库并导入文件

(1)创建知识库

https://i-blog.csdnimg.cn/img_convert/4885b87fbdc9ca6c9194aae741c44c4c.png
https://i-blog.csdnimg.cn/img_convert/18c85c7606c2fc383e5fc537f8c27db6.png
(2)导入现有的知识文件

支持 TXT、 MARKDOWN、 MDX、 PDF、 HTML、 XLSX、 XLS、 DOCX、 CSV、 MD、 HTM格式。
我这里只是演示,就导入一个简单的txt
文件内容:
https://i-blog.csdnimg.cn/img_convert/1f8e00f5a4c583f5ae50e31ff7a5ef06.png
导入
https://i-blog.csdnimg.cn/img_convert/33c8c1da666d469e9be423394c62ee82.png
(3)设置Embedding模子

这里大概会碰到一个题目,没有Embedding模子(Embedding模子为空或报错)。
https://i-blog.csdnimg.cn/img_convert/78095f8317b75cc55af294fd5b233ef3.png
我们就需要设置Embedding模子
   Embedding模子是一种将文本转换为向量表现的技术。它能够将文本中的语义信息编码为高维向量,使得语义相似的文本在向量空间中距离更近。这种向量化的表现方式为后续的语义检索和知识匹配提供了底子。
拉取Embedding模子

使用ollama实行以下命令
ollama pull bge-m3
https://i-blog.csdnimg.cn/img_convert/1195d25197a3c4b91f906f9cfee4e3f9.png
这里使用了bge-m3,更多Embedding模子选择
地址: https://ollama.com/search?c=embedding&q=bge
https://i-blog.csdnimg.cn/img_convert/ae0a76060f389fb643a4e3a2e775345e.png
添加Embedding模子

模子拉取成功后,点击右上角设置,在模子供应商中添加模子
https://i-blog.csdnimg.cn/img_convert/89724e3e32afd5ebdf3489a4be9a5aea.png
https://i-blog.csdnimg.cn/img_convert/44440ea7d3060443eda1dcea1ce9bfca.png
添加成功后,刷新界面,重新导入文件就可以选择Embedding模子了
https://i-blog.csdnimg.cn/img_convert/e099b4a3ff64f0b864b546c82c816fbe.png
(4)保存设置

https://i-blog.csdnimg.cn/img_convert/4686fcd30cc379a90a7d682c8c7e58b5.png
直接点保存并处理惩罚,即可使用
等候一小会后,这里就嵌入完成了
https://i-blog.csdnimg.cn/img_convert/5aba4dd393f0182232ec2471b296f62d.png
四、谈天助手关联知识库

回到谈天助手设置界面,在界面挂接知识库
https://i-blog.csdnimg.cn/img_convert/c09e266a88d17b02e57f9e998518d612.png
https://i-blog.csdnimg.cn/img_convert/d05866820ee883de3f8ea69f267dc3c4.png
接着问刚才提问的题目,他就可以根据知识库的内容复兴题目了
https://i-blog.csdnimg.cn/img_convert/91a112f5a7e024825903080ba393e8b0.png
总结

本文主要先容了怎样使用Dify知识库功能实现本地大语言模子基于知识库答复题目,并详细阐述了创建谈天助手、测试谈天、创建知识库、导入文件、设置Embedding模子以及关联知识库等操纵步调。通过这些步调,用户可以实现大模子根据知识库答复题目,从而弥补模子在离线场景下的知识范围性,提升其准确性和个性化能力。
参考资料

dify官方知识库先容

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页: [1]
查看完整版本: 轻松搭建本地大语言模子(五)Dify知识库:本地大语言模子弹药库(deepseek