Langchain 流式输出到前端（真正解决方法，附最佳实践的完备代码） - qidao123.com技术社区-IT企服评测·应用市场

复制代码

import os
from dotenv import load_dotenv
from langchain.chat_models import ChatOpenAI
from langchain.callbacks import StreamingStdOutCallbackHandler
from fastapi import FastAPI
from sse_starlette.sse import EventSourceResponse
from typing import Generator
import threading
import uvicorn
os.system('clear')
app = FastAPI()
load_dotenv()
class My_StreamingStdOutCallbackHandler(StreamingStdOutCallbackHandler):
# def __init__(self):
tokens = []
# 记得结束后这里置true
finish = False
def on_llm_new_token(self, token: str, **kwargs) -> None:
self.tokens.append(token)
def on_llm_end(self, response, **kwargs) -> None:
self.finish = True
def on_llm_error(self, error: Exception, **kwargs) -> None:
self.tokens.append(str(error))
def generate_tokens(self) -> Generator:
while not self.finish: # or self.tokens:
if self.tokens:
token = self.tokens.pop(0)
yield {'data': token}
else:
pass
# time.sleep(0.02) # wait for a new token
# 用于在另一个线程中运行的方法
def f(llm, query):
llm.predict(query)
@app.post('/qa')
def test(query='你好'):
callback = My_StreamingStdOutCallbackHandler()
llm = ChatOpenAI(model='chatglm3',
streaming=True,
callbacks=[callback],
max_tokens=1024)
thread = threading.Thread(target=f, args=(llm, query))
thread.start()
return EventSourceResponse(callback.generate_tokens(), media_type="text/event-stream")
if __name__ == '__main__':
uvicorn.run(app=app, host='0.0.0.0')

复制代码

import gradio as gr
import asyncio
from langchain.chat_models import ChatOpenAI
#使用异步的 Callback AsyncIteratorCallbackHandler
from langchain.callbacks import AsyncIteratorCallbackHandler
async def f():
callback = AsyncIteratorCallbackHandler()
llm = ChatOpenAI(engine='GPT-35',streaming=True,callbacks=[callback])
coro = llm.apredict("写一个1000字的修仙小说") # 这里如果是 LLMChain的话可以换成 chain.acall()
asyncio.create_task(coro)
text = ""
async for token in callback.aiter():
text = text+token
yield gr.TextArea.update(value=text)
with gr.Blocks() as demo:
with gr.Column():
摘要汇总 = gr.TextArea(value="",label="摘要总结",)
bn = gr.Button("触发", variant="primary")
bn.click(f,[],[摘要汇总])
demo.queue().launch(share=False, inbrowser=False, server_name="0.0.0.0", server_port=8001)

复制代码