无需 GPU 服务器,借助 OpenRouter 零成本搭建自己的大模子助手 ...

打印 上一主题 下一主题

主题 542|帖子 542|积分 1626

一、搭建自己的大模子助手

大型模子的出现为很多领域带来了革命性的变化,从自然语言处理到盘算机视觉,乃至是医学和金融领域。然而,对于很多开辟者来说,使用一些开源的模子进行实验和应用却是一个挑战,因为它们通常需要昂贵的硬件资源来运行。大多数情况下,使用这些模子需要拥有一台配备高性能GPU的服务器,而这每每是一项昂贵的投资。而 OpenRouter 为使用者提供了部分开源模子的实现,可以通过API免费使用,重要聚焦在7B规模大小的模子,比如谷歌的 gemma-7b ,Mistral AI 的 mistral-7b-instruct,肯定程度避免了自己去部署大模子的成本。
本文就基于 OpenRouter 中免费模子接口的本事,使用谷歌的 gemma-7b 模子,搭建自己的大模子助手,实现效果如下:



二、OpenRouter 使用

在实验前起首了解下 OpenRouter 是什么。OpenRouter 是一款整合了各类大模子的中间署理商,而且在国内无需梯子即可访问,通过 OpenRouter 可以调用超 100 种良好的大模子,此中包罗比较盛行的 OpenAI 的 ChatGPT 系列(包罗GPT4V),Anthropic 的 Claude 系列,谷歌的 PaLM 和 Gemini 系列等,而且更换模子仅需修改模子的名字即可,无需修改调用代码得逻辑:



官方地点如下:
   https://openrouter.ai/
  OpenRouter 没有对QQ邮箱做限定,支持 QQ 邮箱登录注册,肯定程度上给国内的一些用户提供了便利,并且还免费提供了一批7B的模子,包罗 nous-capybara-7b、mistral-7b-instruct、mythomist-7b、toppy-m-7b、cinematika-7b、gemma-7b-it:

因此,当我们没有 GPU 服务器的时候,又想借助开源模子搭建一套自己的大模子助手时,就可以考虑使用 OpenRouter 了,注意使用前需要先注册账号,并生成 Api key:

OpenRouter 重要以 http 的交互方式,因此险些可以使用任何支持 http 的语言和框架去调用 ,同时也支持通过 OpenAI 的 client.chat.completions.create 方式调用:
比方:使用 Python 语言 http 的方式,调用 gemma-7b 模子:
  1. import requests
  2. import json
  3. url = "https://openrouter.ai/api/v1/chat/completions"
  4. model = "google/gemma-7b-it:free"
  5. request_headers = {
  6.     "Authorization": "Bearer 你的api_key",
  7.     "HTTP-Referer": "http://localhost:8088",
  8.     "X-Title": "test"
  9. }
  10. default_prompt = "You are an AI assistant that helps people find information."
  11. def llm(user_prompt,system_prompt=default_prompt):
  12.     messages = [
  13.         {"role": "system", "content": system_prompt},
  14.         {"role": "user", "content": user_prompt},
  15.     ]
  16.     request_json = {
  17.         "model": model,
  18.         "messages": messages,
  19.         "max_tokens": 2048
  20.     }
  21.     respose = requests.request(
  22.         url=url,
  23.         method="POST",
  24.         json=request_json,
  25.         headers=request_headers
  26.     )
  27.     return json.loads(respose.content.decode('utf-8'))['choices'][0]['message']['content']
  28. if __name__ == '__main__':
  29.     print(llm("你好,介绍一下你自己"))
复制代码
运行输出:

使用 OpenAI 的 client.chat.completions.create 方式,调用 gemma-7b 模子:
  1. from openai import OpenAI
  2. model = "google/gemma-7b-it:free"
  3. default_prompt = "You are an AI assistant that helps people find information."
  4. client = OpenAI(
  5.     base_url="https://openrouter.ai/api/v1",
  6.     api_key="你的api_key",
  7. )
  8. def llm(user_prompt, system_prompt=default_prompt):
  9.     messages = [
  10.         {"role": "system", "content": system_prompt},
  11.         {"role": "user", "content": user_prompt},
  12.     ]
  13.     completion = client.chat.completions.create(
  14.         extra_headers={
  15.             "HTTP-Referer": "http://localhost:8088",
  16.             "X-Title": "test",
  17.         },
  18.         model=model,
  19.         messages=messages,
  20.         max_tokens = 2048
  21.     )
  22.     return completion.choices[0].message.content
  23. if __name__ == '__main__':
  24.     print(llm("你好,介绍一下你自己"))
复制代码
运行输出:

流式输出示例:
  1. from openai import OpenAI
  2. model = "google/gemma-7b-it:free"
  3. default_prompt = "You are an AI assistant that helps people find information."
  4. client = OpenAI(
  5.     base_url="https://openrouter.ai/api/v1",
  6.     api_key="你的api_key",
  7. )
  8. def llm(user_prompt, system_prompt=default_prompt):
  9.     messages = [
  10.         {"role": "system", "content": system_prompt},
  11.         {"role": "user", "content": user_prompt},
  12.     ]
  13.     completion = client.chat.completions.create(
  14.         extra_headers={
  15.             "HTTP-Referer": "http://localhost:8088",
  16.             "X-Title": "test",
  17.         },
  18.         model=model,
  19.         messages=messages,
  20.         max_tokens = 2048,
  21.         stream=True
  22.     )
  23.     for respose in completion:
  24.         if respose and respose.choices and len(respose.choices) > 0:
  25.             msg = respose.choices[0].delta.content
  26.             print(msg, end='', flush=True)
  27. if __name__ == '__main__':
  28.     llm("你好,介绍一下你自己")
复制代码
运行输出:

三、搭建大模子助手

上面简单认识了 OpenRouter 的本事,下面基于 OpenRouter 上谷歌的 gemma-7b 模子搭建一个自己的大模子助手,简单的实行过程如下。

此中后端服务使用 Python + tornado 实现 Web 服务,前端使用根本的 Html + Jquery 的方式。
3.1 服务端搭建

所属依赖版本如下:
  1. openai==0.27.8
  2. tornado==6.3.2
复制代码
构建问答助手接口 server.py :
接口我们吸取两个参数 questions 和 history ,此中 history 由后端维护并追加谈天记录,前端只负责临时存储,每次请求携带上一次请求返回的 history 即可,调用 OpenRouter 使用 OpenAI 库的方式。
团体实现逻辑如下:
  1. from tornado.concurrent import run_on_executor
  2. from tornado.web import RequestHandler
  3. import tornado.gen
  4. from openai import OpenAI
  5. import json
  6. class Assistant(RequestHandler):
  7.     model = "google/gemma-7b-it:free"
  8.     client = OpenAI(
  9.         base_url="https://openrouter.ai/api/v1",
  10.         api_key="你的api_key",
  11.     )
  12.     default_prompt = "You are an AI assistant that helps people find information."
  13.     def prepare(self):
  14.         self.executor = self.application.pool
  15.     def set_default_headers(self):
  16.         self.set_header('Access-Control-Allow-Origin', "*")
  17.         self.set_header('Access-Control-Allow-Headers', "Origin, X-Requested-With, Content-Type, Accept")
  18.         self.set_header('Access-Control-Allow-Methods', "GET, POST, PUT, DELETE, OPTIONS")
  19.     @tornado.gen.coroutine
  20.     def post(self):
  21.         json_data = json.loads(self.request.body)
  22.         if 'questions' not in json_data or 'history' not in json_data:
  23.             self.write({
  24.                 "code": 400,
  25.                 "message": "缺少必填参数"
  26.             })
  27.             return
  28.         questions = json_data['questions']
  29.         history = json_data['history']
  30.         result = yield self.do_handler(questions, history)
  31.         self.write(result)
  32.     @run_on_executor
  33.     def do_handler(self, questions, history):
  34.         try:
  35.             answer, history = self.llm(questions, history)
  36.             return {
  37.                 "code": 200,
  38.                 "message": "success",
  39.                 "answer": answer,
  40.                 "history": history
  41.             }
  42.         except Exception as e:
  43.             return {
  44.                 "code": 400,
  45.                 "message": str(e)
  46.             }
  47.     def llm(self, user_prompt, messages, system_prompt=default_prompt):
  48.         if not messages:
  49.             messages = []
  50.         messages.append({"role": "user", "content": user_prompt})
  51.         completion = self.client.chat.completions.create(
  52.             extra_headers={
  53.                 "HTTP-Referer": "http://localhost:8088",
  54.                 "X-Title": "test",
  55.             },
  56.             model=self.model,
  57.             messages=messages,
  58.             max_tokens=2048
  59.         )
  60.         answer = completion.choices[0].message.content
  61.         messages.append({"role": "assistant", "content": answer})
  62.         return answer, messages
复制代码
路由配置,并启动服务 app.py :
  1. import tornado.web
  2. import tornado.ioloop
  3. import tornado.httpserver
  4. import os
  5. from concurrent.futures.thread import ThreadPoolExecutor
  6. from server import Assistant
  7. ## 配置
  8. class Config():
  9.     port = 8081
  10.     base_path = os.path.dirname(__file__)
  11.     settings = {
  12.         # "debug":True,
  13.         # "autore load":True,
  14.         "static_path": os.path.join(base_path, "resources/static"),
  15.         "template_path": os.path.join(base_path, "resources/templates"),
  16.         "autoescape": None
  17.     }
  18. # 路由
  19. class Application(tornado.web.Application):
  20.     def __init__(self):
  21.         handlers = [
  22.             ("/assistant", Assistant),
  23.             ("/(.*)$", tornado.web.StaticFileHandler, {
  24.                 "path": os.path.join(Config.base_path, "resources/static"),
  25.                 "default_filename": "index.html"
  26.             })
  27.         ]
  28.         super(Application, self).__init__(handlers, **Config.settings)
  29.         self.pool = ThreadPoolExecutor(10)
  30. if __name__ == '__main__':
  31.     app = Application()
  32.     httpserver = tornado.httpserver.HTTPServer(app)
  33.     httpserver.listen(Config.port)
  34.     print("start success", "prot = ", Config.port)
  35.     print("http://localhost:" + str(Config.port) + "/")
  36.     tornado.ioloop.IOLoop.current().start()
复制代码

下面可以使用 Postman 进行测试:
请求内容:
  1. {
  2.         "questions":"你好,介绍下你自己",
  3.         "history":[]
  4. }
复制代码
输出示例:

从结果看接口访问正常,下面开始前端的搭建。
3.2 前端搭建

前端需要构建一个问答谈天界面,需要注意的是,模子返回的内容可能是 MD 格式,前端需要剖析成html 格式展示,团体实现过程如下:
  1. <!DOCTYPE html>
  2. <html>
  3. <head>
  4.     <meta charset="UTF-8">
  5.     <title>AI 聊天对话</title>
  6.     <style>
  7.         body {
  8.             font-family: Arial, sans-serif;
  9.             margin: 0;
  10.             padding: 0;
  11.         }
  12.         .container {
  13.             display: flex;
  14.             height: 100vh;
  15.         }
  16.         .left-panel {
  17.             flex: 15%;
  18.             background-color: #f2f2f2;
  19.             padding: 10px;
  20.         }
  21.         .right-panel {
  22.             flex: 85%;
  23.             background-color: #ffffff;
  24.             display: flex;
  25.             flex-direction: column;
  26.         }
  27.         .chat-log {
  28.             flex: 1;
  29.             overflow-y: auto;
  30.             padding: 20px;
  31.         }
  32.         .chat-bubble {
  33.             display: flex;
  34.             align-items: center;
  35.             margin-bottom: 10px;
  36.         }
  37.         .user-bubble {
  38.             justify-content: flex-end;
  39.         }
  40.         .bubble-content {
  41.             padding: 10px 15px;
  42.             border-radius: 20px;
  43.         }
  44.         .user-bubble .bubble-content {
  45.             background-color: #d6eaff;
  46.             color: #000000;
  47.         }
  48.         .ai-bubble .bubble-content {
  49.             background-color: #e5ece7;
  50.             color: #000;
  51.         }
  52.         .input-area {
  53.             display: flex;
  54.             align-items: center;
  55.             padding: 20px;
  56.         }
  57.         .input-text {
  58.             flex: 1;
  59.             padding: 10px;
  60.             margin-right: 10px;
  61.         }
  62.         .submit-button {
  63.             padding: 10px 20px;
  64.             background-color: #2196f3;
  65.             color: #ffffff;
  66.             border: none;
  67.             cursor: pointer;
  68.         }
  69.         li {
  70.             margin-top: 10px;
  71.         }
  72.         a {
  73.             text-decoration: none;
  74.         }
  75.         table {
  76.             border: 1px solid #000;
  77.             border-collapse: collapse;
  78.         }
  79.         table td, table th {
  80.             border: 1px solid #000;
  81.         }
  82.         table td, table th {
  83.             padding: 10px;
  84.         }
  85.         .language-sql {
  86.             width: 95%;
  87.             background-color: #F6F6F6;
  88.             padding: 10px;
  89.             font-weight: bold;
  90.             border-radius: 5px;
  91.             word-wrap: break-word;
  92.             white-space: pre-line;
  93.             /* overflow-wrap: break-word; */
  94.             display: block;
  95.         }
  96.         select {
  97.             width: 100%;
  98.             height: 30px;
  99.             border: 2px solid #6089a4;
  100.             font-size: 15px;
  101.             margin-top: 5px;
  102.         }
  103.         .recommendation{
  104.             color: #1c4cf3;
  105.             margin-top: 10px;
  106.         }
  107.     </style>
  108. </head>
  109. <body>
  110. <div class="container">
  111.     <div class="left-panel">
  112.         <h2>智能问答助手</h2>
  113.         <h3>常用问题</h3>
  114.         <div class="recommendation">帮我写一个Java快速排序</div>
  115.         <div class="recommendation">Java 8有什么新特性</div>
  116.         <div class="recommendation">JVM优化建议</div>
  117.         <div class="recommendation">内存占用高,如何优化</div>
  118.         <div class="recommendation">MySQL优化建议</div>
  119.         <div class="recommendation">MySQL如何查看执行计划</div>
  120.     </div>
  121.     <div class="right-panel">
  122.         <div class="chat-log" id="chat-log">
  123.         </div>
  124.         <div class="input-area">
  125.             <input type="text" id="user-input" class="input-text" placeholder="请输入您的问题,回车或点击发送确定。">
  126.             <button id="submit" style="margin-left: 10px;width: 100px" onclick="sendMessage()" class="submit-button">
  127.                 发送
  128.             </button>
  129.             <button style="margin-left: 20px;width: 100px;background-color: red" onclick="clearChat()"
  130.                     class="submit-button">清除记录
  131.             </button>
  132.         </div>
  133.     </div>
  134. </div>
  135. <script type="text/javascript" src="http://code.jquery.com/jquery-3.7.0.min.js"></script>
  136. <script src="https://cdn.jsdelivr.net/npm/marked/marked.min.js"></script>
  137. <script>
  138.     // 聊天历史记录
  139.     var messageHistory = [];
  140.     // 添加AI信息
  141.     function addAIMessage(message) {
  142.         $("#chat-log").append(
  143.             "<div class="chat-bubble ai-bubble">\n" +
  144.             "    <div class="bubble-content">" + message + "</div>\n" +
  145.             "</div>"
  146.         )
  147.     }
  148.     // 添加人类信息
  149.     function addUserMessage(message) {
  150.         $("#chat-log").append(
  151.             "<div class="chat-bubble user-bubble">\n" +
  152.             "    <div class="bubble-content">" + message + "</div>\n" +
  153.             "</div>"
  154.         )
  155.     }
  156.     // 滑动到底部
  157.     function slideBottom() {
  158.         let chatlog = document.getElementById("chat-log");
  159.         chatlog.scrollTop = chatlog.scrollHeight;
  160.     }
  161.     // 调用api
  162.     function chatApi(message) {
  163.         slideBottom();
  164.         data = {
  165.             questions: message,
  166.             history: messageHistory
  167.         };
  168.         $.ajax({
  169.             url: "http://127.0.0.1:8081/assistant",
  170.             type: "POST",
  171.             contentType: "application/json",
  172.             dataType: "json",
  173.             data: JSON.stringify(data),
  174.             success: function (res) {
  175.                 if (res.code === 200) {
  176.                     let answer = res.answer;
  177.                     answer = marked.parse(answer);
  178.                     addAIMessage(answer);
  179.                     messageHistory = res.history;
  180.                 } else {
  181.                     addAIMessage("服务接口调用错误。");
  182.                 }
  183.             },
  184.             error: function (e) {
  185.                 addAIMessage("服务接口调用异常。");
  186.             }
  187.         });
  188.     }
  189.     // 发送消息
  190.     function sendMessage() {
  191.         let userInput = $('#user-input');
  192.         let userMessage = userInput.val();
  193.         if (userMessage.trim() === '') {
  194.             return;
  195.         }
  196.         userInput.val("");
  197.         addUserMessage(userMessage);
  198.         chatApi(userMessage);
  199.     }
  200.     // 清空聊天记录
  201.     function clearChat() {
  202.         $("#chat-log").empty();
  203.         messageHistory = [];
  204.         addAIMessage("你好,请输入你想问的问题。");
  205.     }
  206.     // 初始化
  207.     function init() {
  208.         addAIMessage("你好,请输入你想问的问题。");
  209.         var submit = $("#submit");
  210.         var userInput = $("#user-input");
  211.         var focus = false;
  212.         // 监听输入框焦点
  213.         userInput.focus(function () {
  214.             focus = true;
  215.         }).blur(function () {
  216.             focus = false;
  217.         });
  218.         // 回车监听事件
  219.         document.addEventListener("keydown", function (event) {
  220.             if (event.keyCode === 13) {
  221.                 console.log(focus);
  222.                 if (focus) {
  223.                     submit.click();
  224.                 }
  225.             }
  226.         });
  227.     }
  228.     init();
  229. </script>
  230. </body>
  231. </html>
复制代码
运行效果:



到此,我们自己的大模子助手就根本做好了!

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

曂沅仴駦

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表