慢吞云雾缓吐愁 发表于 2025-3-14 21:20:58

Nginx的流式响应配置详解

现在大模型场景繁多,项目中涉及nginx转发大模型的流式数据时,需配置nginx的转发策略:
location /streaming {
    proxy_pass http://backend_server;

    proxy_cache off; # 关闭缓存
    proxy_buffering off; # 关闭代理缓冲
    chunked_transfer_encoding on; # 开启分块传输编码
    tcp_nopush on; # 开启TCP NOPUSH选项,禁止Nagle算法
    tcp_nodelay on; # 开启TCP NODELAY选项,禁止延迟ACK算法
    keepalive_timeout 300; # 设定keep-alive超时时间为300秒
}

原文地点:点击跳转

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页: [1]
查看完整版本: Nginx的流式响应配置详解