国内Ubuntu环境Docker部署 SenseVoice

打印 上一主题 下一主题

主题 853|帖子 853|积分 2559

国内Ubuntu环境Docker部署 SenseVoice


趁热搞定了 docker 部署 SenseVoice。在这里记录一下相关的文件。
SenseVoice是一个大模型语音识别库, 支持多种语言识别,速度快,准确率高,详细先容请参考GitHub官网:
https://github.com/FunAudioLLM/SenseVoice
本笔记主要记录使用 docker 进行部署的相关文件,文件内容放在末了。


  • Dockerfile
  • compose.yaml
  • requirements.txt
  • start.sh
  • webui.py
  • model_download.py
部署过程

1. 下载须要的模型

model_download.py
  1. import os
  2. import argparse
  3. parser = argparse.ArgumentParser(description='modelscope模型下载')
  4. parser.add_argument('--model_name', type=str, help='the model name from modelscope, example AI-ModelScope/stable-diffusion-2-1', required=True)
  5. parser.add_argument('--local_dir', type=str, help='the model cache path.', default=os.getcwd(), required=True)
  6. if __name__ == '__main__':
  7.     args = parser.parse_args()
  8.     print(f"current workspace is {os.getcwd()}")
  9.     print(f"the model_name is {args.local_dir}/{args.model_name}")
  10.     print(f"the local_dir is {args.local_dir}")
  11.     try:
  12.         from modelscope import snapshot_download
  13.         model_dir = snapshot_download(args.model_name, local_dir=args.local_dir)
  14.     except ImportError:
  15.         print("modelscope was not installed! try to install...")
  16.         os.system("pip install modelscope")
  17.     except Exception as e:
  18.         print(f"An error occurred: {e}")
复制代码
在SenseVoice项目的根目次下创建一个 download_model.py 文件,并将上述内容写入。
执行以下命令分别下载 SenseVoiceSmall  和 speech_fsmn_vad_zh-cn-16k-common-pytorch 模型。
   python3 model_download.py --model_name=iic/SenseVoiceSmall --local_dir=models/iic/SenseVoiceSmall
python3 model_download.py --model_name=iic/speech_fsmn_vad_zh-cn-16k-common-pytorch --local_dir=models/iic/speech_fsmn_vad_zh-cn-16k-common-pytorch
  2、docker部署



  • Dockerfile
  • compose.yaml
  • requirements.txt
  • start.sh
  • webui.py
请在 SenseVoice项目的根目次下创建一个 docker 文件夹,并将上述文件放入 docker 文件夹内。
修改 webui.py 文件18行的 model 变量为 models/iic/SenseVoiceSmall (上述1下载模型设置的本地路径); 20行的vad_model参数修改为 models/iic/speech_fsmn_vad_zh-cn-16k-common-pytorch。

webui.py
[code]# coding=utf-8

import os
import librosa
import base64
import io
import gradio as gr
import re

import numpy as np
import torch
import torchaudio
from argparse import ArgumentParser


from funasr import AutoModel

model = "models/iic/SenseVoiceSmall"
model = AutoModel(model=model,
                                  vad_model="models/iic/speech_fsmn_vad_zh-cn-16k-common-pytorch",
                                  vad_kwargs={"max_single_segment_time": 30000},
                                  trust_remote_code=True,
                                  )

import re

emo_dict = {
        "<|HAPPY|>": "

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

半亩花草

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表