DevOps与敏捷开发再升级!MoneyPrinterPlus集成GPT_SoVITS

冬雨财经 发表于 2024-8-15 19:20:37

再升级!MoneyPrinterPlus集成GPT_SoVITS

最近有许多良好的语音合成TTS工具，目前MoneyPrinterPlus已经集成了ChatTTS和fasterWhisper。应朋友们的要求，最近MoneyPrinterPlus也集成了GPT_SoVITS这个良好的语音合成工具。
今天给各人详细讲解一下，怎样在MoneyPrinterPlus中使用GPT_SoVITS。
软件准备

当然，条件条件就是你需要下载MoneyPrinterPlus软件啦。
下载地点： https://github.com/ddean2009/MoneyPrinterPlus
用得好的朋友，不妨给个star支持一下。在软件v4.4版本之后，MoneyPrinterPlus已经支持GPT_SoVITS当地TTS语音服务啦。
启动GPT_SoVITS

GPT_SoVITS这个工具怎么安装这里就不多讲了。
我们讲下怎样跟MoneyPrinterPlus举行合作配置。
GPT_SoVITS有许多功能，包括语音训练，模子微调，TTS语音推理，变声等功能。
这里我们使用的是GPT_SoVITS的核心TTS语音推理功能。
起首我们启动GPT_SoVITS：
在1-GPT-SoVITS-TTS —》 1C推理 —》开启TTS推理webUI
https://img-blog.csdnimg.cn/img_convert/2778c1a27a8e7ac0306eb60a12759b2e.png
然后你就可以看到这样的TTS推理界面：
https://img-blog.csdnimg.cn/img_convert/59408b76a484d305f367d9f5d6a92721.png
你可以选择参考音频，参考文本，参考音频的语言。
然后可以输入要合成的文本，合成语音的类别，语速，top_k, top_p和temperature。
当然，上面的都不重要，我们不需要通过webUI来调用GPT_SoVITS，我们需要的是通过API来和GPT_SoVITS举行交互。
API启动GPT_SoVITS

如果下载的是GPT_SoVITS的集合包，那么可以直接执行下面的下令来启动GPT_SoVITS的API：
启动api: runtime\python.exe api.py
启动之后，你会看到下面的内容：
https://img-blog.csdnimg.cn/img_convert/28a499ff0399edaa0ed3f5441cba6886.png
上面的启动是最简单的启动，没有指定参考音频，如果你想指定参考音频的话，可以执行下面的下令：
python api.py -dr "123.wav" -dt "一二三。" -dl "zh"
当然，还有其他的一些启动参数如下：
`-dr` - `默认参考音频路径`
`-dt` - `默认参考音频文本`
`-dl` - `默认参考音频语种, "中文","英文","日文","韩文","粤语,"zh","en","ja","ko","yue"`

`-d` - `推理设备, "cuda","cpu"`
`-a` - `绑定地址, 默认"127.0.0.1"`
`-p` - `绑定端口, 默认9880, 可在 config.py 中指定`
`-fp` - `覆盖 config.py 使用全精度`
`-hp` - `覆盖 config.py 使用半精度`
`-sm` - `流式返回模式, 默认不启用, "close","c", "normal","n", "keepalive","k"`
·-mt` - `返回的音频编码格式, 流式默认ogg, 非流式默认wav, "wav", "ogg", "aac"`
·-cp` - `文本切分符号设定, 默认为空, 以",.，。"字符串的方式传入`

`-hb` - `cnhubert路径`
`-b` - `bert路径`
各人可以根据需要自行选择。
默认情况下API会启动在9880端口，我们可以使用下面的下令来测试API的启动效果：
使用执行参数指定的参考音频:
GET:
`http://127.0.0.1:9880?text=先帝创业未半而中道崩殂，今天下三分，益州疲弊，此诚危急存亡之秋也。&text_language=zh`
POST:
```json
{
"text": "先帝创业未半而中道崩殂，今天下三分，益州疲弊，此诚危急存亡之秋也。",
"text_language": "zh"
}
```
配置MoneyPrinterPlus

好了,回到我们的MoneyPrinterPlus页面。
在根本配置页面，当地语音TTS，我们选择GPTSoVITS, 然后输入GPTSoVITS的地点。
https://img-blog.csdnimg.cn/img_convert/784d3214716812ead652489011baaac1.png
在AI视频或者视频混剪区，在视频TTS语音合成区，我们选择当地服务。
https://img-blog.csdnimg.cn/img_convert/92d12ab46c84199ebb452e5dc3ededa4.png
这里列出来GPTsoVITS所需要的大部分参数。
你可以使用参考音频，参考音频文本，参考音频语音。
然后可以条件temperature,top_P, top_K等信息。
https://img-blog.csdnimg.cn/img_convert/5c71c3c01112c871e2a0a61eb17f3fa5.png
点击试听声音，如果你听到合成的声音，那么恭喜你，你的配置成功了。
同时，在GPTsoVITS服务的日记文件中，你可以看到一些语音合成的进度。
https://img-blog.csdnimg.cn/img_convert/81deb0260d6c86f0b14e11b018873c02.png
总结

GPTsoVITS是一个非常强大的服务，和MoneyPrinterPlus结合起来使用，你将会无往不利。
点我检察更多出色内容:www.flydean.com

免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！更多信息从访问主页：qidao123.com:ToB企服之家，中国第一个企服评测及商务社交产业平台。

页: [1]

ToB企服应用市场:ToB评测及商务社交产业平台's Archiver

再升级!MoneyPrinterPlus集成GPT_SoVITS