webscoket 渲染AI返回流式 markdown 格式数据

打印 上一主题 下一主题

主题 987|帖子 987|积分 2961

背景

        去年的时候做了一个对接ai 模块的业务,当时因为那个模块说的返回的都是文章纯文本,所以没有分析markdown,今年来了就弄一个PC H5的ai版本 本文章重要就写 写这次ai的心路进程。
重要就三个问题
1. 对话框
2. websocket 发消息/接消息
3. markdown 的渲染
OK 开始
重要是写在vue里面的  去年的是写在blade模板里面的,但是思路都大致差不多
页面结构这个样子

问答完这样 

和市面上的AI 问答基本上差不多(测试环境 请忽略思考用时)
渲染地区分为思考的地区 和 正式回答的地区,因为之前的时候是在php里面写的blade模板,所以利用的innerHtml 现在是在vue里面所以利用v-html 关于这俩后面还有个问题,后面再提,
基础页面都很好处理 重要就是textarea 的问题 下面是处理好的textarea结构
  1. <div :class="['footer', focusText ? 'borderi' : '']">
  2.   <div class="chat-input">
  3.     <span>{{ message }}</span>
  4.     <textarea
  5.       ref="textarea"
  6.       v-model="message"
  7.       inputmode="text"
  8.       placeholder="试试输入关键词引导AI生成点评 shift + enter 换行"
  9.       rows="1"
  10.       @keydown.enter.exact.prevent="sendMessage"
  11.       @keydown.shift.enter.prevent="insertLineBreak"
  12.       @blur="blurTeaxarea"
  13.       @focus="focusTeaxarea"
  14.     />
  15.     <div class="uplaod" @click="sendMessage">
  16.       <img
  17.         :style="{ cursor: message ? 'pointer' : 'not-allowed' }"
  18.         :src="
  19.           message
  20.             ? require('@/assets/images/ai-submit-active.png')
  21.             : require('@/assets/images/ai-submit.png')
  22.         "
  23.         alt=""
  24.       >
  25.     </div>
  26.   </div>
  27. </div>
复制代码

js部门
  1. sendMessage() {
  2.   if (this.isComposing) return // 中文输入法组合期间不发送
  3.   if (this.message == '' && !this.fileList.length) {
  4.     this.$message.warning('请输入后提问')
  5.     return
  6.   }
  7.   // 判断wss 的连接状态
  8.   this.$refs.textarea.blur()
  9.   this.focusText = false
  10.   this.state = 2
  11.   this.startChat()
  12. },
  13. insertLineBreak(event) {
  14.   if (this.message.trim() == '') {
  15.     this.$message.warning('请输入后再换行')
  16.     event && event.preventDefault()
  17.     return
  18.   }
  19.   document.execCommand('insertLineBreak') // 更好的换行兼容性
  20.   this.updateMessage()
  21. },
  22. this.$refs.textarea.addEventListener(
  23.   'compositionstart',
  24.   this.handleComposition
  25. )
  26. this.$refs.textarea.addEventListener(
  27.   'compositionend',
  28.   this.handleComposition
  29. )
  30. // 中文输入法状态处理
  31. handleComposition(e) {
  32.   this.isComposing = e.type !== 'compositionend'
  33. },
复制代码

insertLineBreak 重要是处理huan
css样式 原来UI图是渐变的边框但是和border-radius 冲突了,这里就不写怎么实现的了
  1. .footer {
  2.       margin: 10px 0;
  3.       border: 1px solid #f0f1f4;
  4.       border-radius: 10px;
  5.       overflow: hidden;
  6.       padding: 6px 10px;
  7.       .chat-input {
  8.         position: relative;
  9.         display: flex;
  10.         align-items: flex-end;
  11.         background: #ffffff;
  12.         max-height: 200px;
  13.         span {
  14.           display: block;
  15.           min-height: 42px;
  16.           white-space: pre-wrap;
  17.           word-wrap: break-word;
  18.           visibility: hidden;
  19.           padding: 10px;
  20.           width: calc(100% - 62px);
  21.           box-sizing: border-box;
  22.           font-size: 14px;
  23.           line-height: 1.5;
  24.         }
  25.         textarea {
  26.           font-size: 14px;
  27.           width: calc(100% - 62px);
  28.           background: #ffffff;
  29.           padding: 10px;
  30.           border: none;
  31.           box-sizing: border-box;
  32.           resize: none;
  33.           overflow-y: auto;
  34.           scrollbar-width: none; /* 隐藏滚动条(Firefox) */
  35.           -ms-overflow-style: none; /* 隐藏滚动条(IE 10+) */
  36.           resize: none;
  37.           height: 100%;
  38.           position: absolute;
  39.           left: 0;
  40.           top: 0;
  41.           line-height: 1.5;
  42.           &::-webkit-scrollbar {
  43.             display: none;
  44.           }
  45.         }
  46.         textarea::placeholder {
  47.           color: #999;
  48.           text-align: left;
  49.           // text-align: center; /* 水平居中 */
  50.           vertical-align: middle; /* 垂直居中 */
  51.         }
  52.         .uplaod {
  53.           // width: 42px;
  54.           height: 42px;
  55.           z-index: 1;
  56.           background: #fff;
  57.           display: flex;
  58.           align-items: center;
  59.           cursor: pointer;
  60.         }
  61.         img {
  62.           width: 60px;
  63.           height: 36px;
  64.         }
  65.       }
  66.     }
  67.     .borderi {
  68.       border-color: #ff9327;
  69.       // border-image: linear-gradient(0deg, #FF9327 0%, #FF5627 100%) 1;
  70.       border-radius: 10px;
  71.       // border-radius: 20px;
  72.       // background-clip: padding-box, border-box;
  73.       // background-origin: padding-box, border-box;
  74.       // background-image: linear-gradient(to right, #222, #222),
  75.       //   linear-gradient(90deg, #8f41e9, #578aef);
  76.     }
复制代码
 关于websocket ,当初想的是想用sse的但是 小程序不支持sse所以后面都选websocket了,
  1. initWebsocket(msg) {
  2.   // 初始化 WebSocket 连接
  3.   this.websocket = new WebSocket(process.env.VUE_APP_WEBSOCKETBASE_URL)
  4.   // 连接成功建立的回调方法
  5.   const cb = () => {
  6.     this.websocket.send(JSON.stringify(msg))
  7.   }
  8.   this.websocket.addEventListener('open', () => {
  9.     let content
  10.     if (this.sessionId) {
  11.       const obj = {}
  12.       obj.sessionId = this.sessionId
  13.       obj.token = getToken()
  14.       content = obj
  15.     } else {
  16.       content = {
  17.         sessionId: null,
  18.         token:getToken()
  19.       }
  20.     }
  21.     const msgToken = { type: 'auth', content: content }
  22.     this.websocket.send(JSON.stringify(msgToken))
  23.     this.callbackWebSocket(cb)
  24.   })
  25. },
  26. callbackWebSocket(cb) {
  27.   // 收到消息事件
  28.   this.websocket.onmessage = (msg) => {
  29.     // 如果返回对象里面有结束标志的话 就把对象存起来
  30.     const res = JSON.parse(msg.data)
  31.     // console.log("msg", msg);
  32.     if (res.type == 'connected') {
  33.       // 开启会话,返回websocketid
  34.       if (cb) {
  35.         cb()
  36.       }
  37.       this.qaData[this.indexUse].socketId = res.content
  38.       this.socketId = res.content
  39.       //
  40.     } else if (res.type == 'new_session') {
  41.       // 创建会话,返回会话id、title
  42.       //
  43.       // if (res.content.length > 19) {
  44.       const content = JSON.parse(res.content)
  45.       this.qaData[this.indexUse].sessionId = content.sessionId
  46.       this.sessionId = content.sessionId
  47.       this.qaData[this.indexUse].id = content.id
  48.       // }
  49.     } else if (res.type == 'finish' || res.type == 'stop') {
  50.       // 有可能超时
  51.       this.$set(this.qaData[this.indexUse].data.answer, 'id', res.content)
  52.       // 停止或回答完
  53.       this.doingAnswer = false
  54.       this.$set(this.qaData[this.indexUse].data.answer, 'status', 2)
  55.       const loading = document.querySelector('#loading')
  56.       if (loading && loading.parentNode) {
  57.         loading.parentNode.removeChild(loading)
  58.       }
  59.       this.scrollTop = false
  60.       this.scrolltoBottom()
  61.     } else if (res.type == 'answer') {
  62.       // 答案
  63.       if (res.thinking == 1) {
  64.         this.$set(this.qaData[this.indexUse].data.answer, 'thinkFlag', true)
  65.         // 计算时间
  66.         this.thinkingTime = +new Date()
  67.         this.thinking = true
  68.         this.$forceUpdate()
  69.       } else if (res.thinking == 3) {
  70.         // 计算时间
  71.         const thinkingTime = Math.ceil(
  72.           (+new Date() - this.thinkingTime) / 1000
  73.         )
  74.         this.$set(
  75.           this.qaData[this.indexUse].data.answer,
  76.           'thinkingTime',
  77.           thinkingTime
  78.         )
  79.         this.thinking = false
  80.         console.log(2)
  81.       } else if (res.thinking == 2) {
  82.         // 正在思考中
  83.         if (!this.qaData[this.indexUse].data) return
  84.         if (res.content.length) {
  85.           const thinkContent =
  86.             this.qaData[this.indexUse].data.answer.thinkContent || ''
  87.           this.$set(
  88.             this.qaData[this.indexUse].data.answer,
  89.             'thinkContentCopy',
  90.             thinkContent + res.content
  91.           )
  92.           this.$set(
  93.             this.qaData[this.indexUse].data.answer,
  94.             'thinkContent',
  95.             thinkContent + res.content
  96.           )
  97.           this.$forceUpdate()
  98.           this.scrolltoBottom()
  99.         }
  100.       } else {
  101.         if (!res.content) return
  102.         const answerCopy =
  103.           this.qaData[this.indexUse].data.answer.answerCopy || ''
  104.         this.$set(
  105.           this.qaData[this.indexUse].data.answer,
  106.           'answerCopy',
  107.           answerCopy + res.content
  108.         )
  109.         this.streamBuffer += res.content + ''
  110.         const elImg = '![diy-loading-img](/img/loading.gif)'
  111.         this.rawMarkdown += this.streamBuffer
  112.         console.log('this.rawMarkdown', this.rawMarkdown)
  113.         const mdSring = this.md.render(this.rawMarkdown + elImg)
  114.         this.$set(this.qaData[this.indexUse].data.answer, 'answer', mdSring)
  115.         this.$forceUpdate()
  116.         this.streamBuffer = ''
  117.         // 需要the-main 滚动到底部
  118.         console.log(4)
  119.         this.scrolltoBottom()
  120.       }
  121.     } else if (res.type == 'error') {
  122.       console.log('error', res, this.indexUse)
  123.       this.doingAnswer = false
  124.       this.thinking = false
  125.     } else if (res.type == 'timeout') {
  126.       // 超时
  127.       const answer = this.qaData[this.indexUse].data.answer.answer || ''
  128.       this.$set(
  129.         this.qaData[this.indexUse].data.answer,
  130.         'answer',
  131.         answer + res.content
  132.       )
  133.       this.$set(this.qaData[this.indexUse].data.answer, 'status', 3)
  134.       this.$refs['a' + this.indexUse][0].innerHTML = res.content || ''
  135.       this.doingAnswer = false
  136.       this.streamBuffer = ''
  137.       this.rawMarkdown = ''
  138.       this.scrolltoBottom()
  139.     }
  140.   }
  141.   // 连接关闭事件
  142.   this.websocket.onclose = function () {
  143.     console.log('Socket已关闭')
  144.     this.doingAnswer = false
  145.   }
  146.   // 发生了错误事件
  147.   this.websocket.onerror = function () {
  148.     // alert('Socket发生了错误')
  149.   }
  150. },
  151. startChat() {
  152.   const msg = { type: 'chat', content: q }
  153.   if (typeof WebSocket == 'undefined') {
  154.     console.log('遗憾:您的浏览器不支持WebSocket')
  155.     this.$message.warning('遗憾:您的浏览器不支持WebSocket')
  156.   } else {
  157.     if (this.websocket && this.websocket.readyState == 1) {
  158.       // 已经连接 了
  159.       console.log('===', msg)
  160.       this.websocket.send(JSON.stringify(msg))
  161.     } else {
  162.       this.initWebsocket(msg)
  163.     }
  164.   }
  165. }
复制代码
 如果有seesionId的话 就可以继承毗连websockt利用,如果状态不是毗连状态的话 就去重新毗连,对返回的数据类型 举行归纳重新渲染数据 ,我是把他存在了一个qaData里面 ,qaData的数据结构如下
  1. this.qaData[index + 1] = {
  2.   socketId: '',
  3.   sessionId: item.sessionId,
  4.   id: item.id,
  5.   listIndex: index + 1,
  6.   data: {
  7.     question: item.question,
  8.     imageList,
  9.     answer: {
  10.       id: item.answerList && item.answerList[0].id,
  11.       status: item.status,
  12.       answer:
  13.         item.answerList && this.md.render(item.answerList[0].answer),
  14.       answerCopy: item.answerList && item.answerList[0].answer,
  15.       thinkContent: item.answerList && item.answerList[0].think,
  16.       thinkContentCopy: item.answerList && item.answerList[0].think,
  17.       thumbsUp: item.answerList ? item.answerList[0].thumbsUp : null,
  18.       thinkingTime:
  19.         item.answerList &&
  20.         item.answerList[0].thinkTime &&
  21.         Math.ceil(item.answerList[0].thinkTime / 1000),
  22.       thinkFlag: item.answerList && item.answerList[0].thinkTime,
  23.     },
  24.   },
复制代码
 这样可以兼顾回显,新建和回显都用同一套数据结构,比较方便
第三点markdown的渲染
先说上面innerHtml和v-html  因为最开始的时候是利用的innerHtml 然后这个版本是利用的v-html,最开始写的时候 我没有直接改变v-html 绑定的值而是利用innerHtml改变的,然后就出现了渲染中如果往上滚动的话 markdown格式就是丢失,我查了之后才发现 如果改变v-html 的innerHtml的话 就会有渲染问题,
我利用了markdown-it 插件 但是 直接引入有问题,这个项目没支持.mjs 的引入,所以利用dist/index.js 或者直接把min.js 复制一份放到项目标静态资源里面 ,我看了两种方式的打包后的结果巨细基本都是一样的。
在利用Markdown-it之前先要做些设置特殊处理一些 样式,例如表格,毗连。。。
  1. initMd() {
  2.   this.md = markdownit()
  3.   // 自定义代码块渲染器
  4.   this.md.renderer.rules.code_block = function (
  5.     tokens,
  6.     idx,
  7.     options,
  8.     env,
  9.     self
  10.   ) {
  11.     const token = tokens[idx]
  12.     const content = token.content
  13.     const lang = token.info ? token.info.trim() : ''
  14.     return `<div class="code-block"><pre><code class="language-${lang}" style="white-space: pre-wrap;">${content}</code></pre></div>`
  15.   }
  16.   this.md.renderer.rules.table_open = function () {
  17.     return '<div class="table-wrapper" style="overflow:auto;"><table border>'
  18.   }
  19.   this.md.renderer.rules.table_close = function () {
  20.     return '</table></div>'
  21.   }
  22.   this.md.renderer.rules.link_open = function (
  23.     tokens,
  24.     idx,
  25.     options,
  26.     env,
  27.     self
  28.   ) {
  29.     // 获取链接的 href 和 title 属性
  30.     const hrefIndex = tokens[idx].attrIndex('href')
  31.     const href = hrefIndex > -1 ? tokens[idx].attrs[hrefIndex][1] : null
  32.     const titleIndex = tokens[idx].attrIndex('title')
  33.     const title = titleIndex > -1 ? tokens[idx].attrs[titleIndex][1] : null
  34.     // 返回一个禁止点击的链接
  35.     return `<a href="${href}" class="no-href" data-link="a" title="${title}">`
  36.   }
  37.   this.md.renderer.rules.image = function (
  38.     tokens,
  39.     idx,
  40.     options,
  41.     env,
  42.     self
  43.   ) {
  44.     const token = tokens[idx]
  45.     const aIndex = token.attrIndex('src')
  46.     if (token.content == 'diy-loading-img') {
  47.       return `<img
  48.           id="loading"
  49.           src="/img/loading.gif"
  50.           style="width:20px;height:20px;vertical-align: middle;margin:0;"
  51.         />`
  52.     } else {
  53.       return `<img src="${token.attrs[aIndex][1]}" alt="${token.content}" />`
  54.     }
  55.   }
  56. }
复制代码
天生表格的时候外面加了一层 div 防止表格过于宽 ,链接 加了一个禁止点击 根据data-link="a" 事件委托举行处理

然后每次返回的数据 拼接渲染就行了
  1. this.streamBuffer += res.content + ''
  2. const elImg = '![diy-loading-img](/img/loading.gif)'
  3. this.rawMarkdown += this.streamBuffer
  4. console.log('this.rawMarkdown', this.rawMarkdown)
  5. const mdSring = this.md.render(this.rawMarkdown + elImg)
  6. this.$set(this.qaData[this.indexUse].data.answer, 'answer', mdSring)
  7. this.$forceUpdate()
复制代码
elImg 是每次文本后面的loading,this.forceUpdate() 因为是深层的对象,所以须要利用 逼迫渲染,大概就是这些,当然 还有更细节的处理方式

下面是一个对markdown流的处理
  1. // import MarkdownIt from 'markdown-it/dist/markdown-it.js'
  2. export class MarkdownStateMachine {
  3.   constructor() {
  4.     this.state = {
  5.       inCodeBlock: false,    // 是否在代码块内
  6.       codeBlockLanguage: '', // 代码块语言
  7.       inList: false,         // 是否在列表项中
  8.       listDepth: 0,          // 列表嵌套深度
  9.       inBlockquote: false,   // 是否在引用块中
  10.       tableStage: 0,          // 表格解析阶段 (0: 未开始, 1: 表头, 2: 分隔线, 3: 表体)
  11.       table: {
  12.         stage: 0,
  13.         header: [],
  14.         body: [],
  15.         buffer: []
  16.       },
  17.       activeBlock: null,
  18.     };
  19.     this.buffer = '';        // 原始未处理文本
  20.     this.openBlocks = [];    // 未闭合块堆栈
  21.     this.renderedHtml = '';  // 已安全渲染的HTML
  22.   }
  23.   getMd(md) {
  24.     this.md = md
  25.   }
  26.   // 更新状态机
  27.   updateState(chunk) {
  28.     const lines = chunk.split('\n');
  29.     lines.forEach(line => {
  30.       if (this.state.inCodeBlock) {
  31.         if (line.startsWith('```')) this.state.inCodeBlock = false;
  32.         return; // 代码块内的内容不触发其他状态变化
  33.       }
  34.       if (line.startsWith('```')) {
  35.         this.state.inCodeBlock = true;
  36.         // this.state.codeBlockLanguage = line.replace('```', '').trim();
  37.         // 处理代码块
  38.       } else if (/^(\*|\-|\+)\s/.test(line)) {
  39.         this.state.inList = true;
  40.         this.state.listDepth = line.match(/^\s*/)[0].length / 2; // 假设缩进为2空格
  41.       } else if (line.startsWith('> ')) {
  42.         this.state.inBlockquote = true;
  43.       } else if (line.includes('|') && line.includes('-')) {
  44.         this.state.tableStage = this.state.tableStage < 2 ? 2 : 3;
  45.         this.state.table.stage = this.state.tableStage
  46.       }
  47.     });
  48.   }
  49.   // 判断当前缓冲区是否可安全渲染
  50.   isSafeToRender(buffer) {
  51.     // if (this.state.inCodeBlock) return false;
  52.     // if (this.state.tableStage % 2 !== 0) return false; // 表格需要成对渲染
  53.     return true;
  54.   }
  55. }
复制代码
isSafeToRender() 可以判断 现在正在举行的是什么表格 或者 代码块啦,这样 就可以根据具体的需求来处理,例如,天生表格的时候加一个处理进度什么之类的。
大概就是这些,每年都有提升,还不错,加油!

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

干翻全岛蛙蛙

金牌会员
这个人很懒什么都没写!
快速回复 返回顶部 返回列表