怀念夏天 发表于 2024-8-20 09:31:49

Ollama+AnythingLLM 搭建本地知识库

一、搭建本地知识库业务背景

         数据自主可控

           将关键知识和信息存储在本地服务器上,意味着企业或组织可以或许完全控制数据的访问权限、存储方式以及备份计谋。这避免了将数据托管在第三方云服务上可能带来的数据泄露风险,由于云服务提供商的安全毛病或不当操作都可能影响数据的安全性。
         减少网络攻击面

          当知识库摆设在本地时,它不会直接暴露在互联网上,从而减少了遭受网络攻击的风险。互联网上的恶意流量、钓鱼攻击、DDoS攻击等威胁很难直接作用于内部网络中的知识库系统。纵然本地网络通过VPN等方式与外部网络相连,也可以通过严格的访问控制和安全计谋来限制外部访问,进一步降低被攻击的风险。
         合规性要求

          在某些行业或地域,由于法律法规的要求,企业或组织可能需要将敏感数据存储在本地,以确保数据的隐私性和合规性。例如,金融行业、医疗行业等对于数据的安全性和隐私性有极高的要求,搭建本地知识库可以更好地满意这些合规性要求。本地存储还便于举行定期的审计和查抄,以确保数据的使用和处理符合相干规定和尺度。
        快速规复和容灾能力

         本地知识库可以更容易地实现数据的快速规复和容灾备份。当发生硬件故障、天然劫难等突发变乱时,只要本地存储设备完好无损,就可以迅速规复数据,减少业务中断的时间。与此同时,本地存储还可以结合异地备份计谋,进一步提高数据的可靠性和安全性。
  二、什么是RAG 和LLM又是什么关系

        RAG的界说

         RAG代表检索增强生成(Retrieval-Augmented Generation),是一种结合检索和生成的天然语言处理模型架构。RAG通过将检索模型和生成模型结合在一起,提高了生成内容的相干性和质量。具体而言,RAG使用检索模型从给定的文档或知识库中检索相干信息,并将其与生成模型结合,以生成更准确、更有价值的输出。这种架构特别适用于需要引用外部信息或特定领域知识的任务,如问答系统、文本摘要和对话系统等。
       LLM的界说

LLM代表大型语言模型(Large Language Model),是一种基于深度学习的人工智能算法,通过训练大量文本数据,学习语言的语法、语义和上下文信息,从而可以或许对天然语言文本举行建模。LLM在天然语言处理领域具有广泛的应用,包罗但不限于文本生成、文本分类、机器翻译、情绪分析等。
      RAG与LLM的关系


[*]优化与扩展:RAG是对LLM的一种优化和扩展。LLM在面临特定领域或高度专业化的查询时,有时会假造究竟,且当所寻求的信息超出模型训练数据范围或需要最新数据时,可能无法提供准确答案。RAG通过整合检索到的外部数据,不仅提高了生成文本的准确性,还增强了文本的相干性,从而办理了LLM的某些范围性。
[*]协同工作:在RAG架构中,LLM和检索模型协同工作。检索模型负责从大量数据中检索与生成任务相干的信息,而LLM则使用这些信息生成最终的输出。这种结合使得RAG可以或许在处理复杂任务时表现出更高的准确性和实用性。
[*]应用场景:RAG和LLM在天然语言处理领域各有其独特的功能和应用。RAG特别适用于需要外部知识支持的场景,如问答系统、文本摘要等;而LLM则作为天然语言处理应用的基础模型,为各种任务提供强盛的生成能力。在实际应用中,RAG和LLM经常结合使用,以更好地满意各种天然语言处理任务的需求。
三、AnythingLLM和Ollama 集成

      1、安装软件

        1)安装Ollama 及大模型
        2)安装 AnythingLLM,下载地址:https://useanything.com/download
      2、配置AnythingLLM环境

        1)  主界面、设置本地模型、向量转换模型、向量数据库
https://i-blog.csdnimg.cn/direct/511e174e38f344fe9e77636a89846bc1.pnghttps://i-blog.csdnimg.cn/direct/90be3162c1b54baaaae2fb668cb1118e.png
https://i-blog.csdnimg.cn/direct/b0f4c31b95b9405a969a7689bb23f4f5.pnghttps://i-blog.csdnimg.cn/direct/764b6444db454ff38ae8d27c0de77daf.png

















































3、使用默认大模型,咨询你对萝卜快跑了解吗 

https://i-blog.csdnimg.cn/direct/48fb5ad17875437684b97fc2047e8298.png


4、上传本地数据,再次咨询你对萝卜快跑了解吗

    1)上传本地文件到工作空间
https://i-blog.csdnimg.cn/direct/a0812f9c6bb94a4f916b65144a44e889.png
https://i-blog.csdnimg.cn/direct/02b44398f476401cb749d6f149cd868c.png
    2)转换成向量数据存储
https://i-blog.csdnimg.cn/direct/512343537bab41ebbab1f9a16bf3cca5.png
    3)再次使用大模型问答 
https://i-blog.csdnimg.cn/direct/682dac018d774b75a2fc2932192eb81d.png


免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页: [1]
查看完整版本: Ollama+AnythingLLM 搭建本地知识库