南飓风 发表于 2024-7-22 07:58:14

i人的福音!一个强盛开源的文本转语音工具!

各人好,我是 Java陈序员。
如今的自媒体可谓黑白常火热,各个视频剪辑软件提供了文本天生语音的功能,但大多都是千篇一律的音色,比如“这个男人叫小帅”。
如果你想做自媒体,既不想录制本身的语音,又想本身的视频配音与他人不同,可以考虑使用大模型来训练天生本身的语音。
今天,给各人介绍一个开源免费的文本转语音工具,支持十几种语言天生!
关注微信公众号:【Java陈序员】,获取开源项目分享、AI副业分享、超200本经典计算机电子书籍等。
项目介绍

EmotiVoice —— 一个强盛的开源 TTS 引擎(Text To Speech,即文本转语音),完全免费开源!
EmotiVoice 供了一个易于使用的 Web 界面用于文本转语音,支持中英文双语,包含 2000 多种不同的音色,以及特色的情感合成功能,支持合成包含快乐、高兴、伤心、愤怒等广泛情感的语音。
https://chen-coding.oss-cn-shenzhen.aliyuncs.com/create-center/EmotiVoice/img-20240720122501.png
别的,EmotiVoice 还提供了用于批量天生结果的 API 接口。
https://chen-coding.oss-cn-shenzhen.aliyuncs.com/create-center/EmotiVoice/img-20240720123234.png
项目使用

启动工具

EmotiVoice 的使用方法非常简单,在 Windows 环境下,解压软件压缩包后,双击运行 start.bat 即可启动。
https://chen-coding.oss-cn-shenzhen.aliyuncs.com/create-center/EmotiVoice/img-20240720125425.png
双击运行 start.bat 后,将会在 CMD 命令窗口中运行服务:
https://chen-coding.oss-cn-shenzhen.aliyuncs.com/create-center/EmotiVoice/img-20240720125626.png
并在欣赏器中自动打开 Web 界面:
https://chen-coding.oss-cn-shenzhen.aliyuncs.com/create-center/EmotiVoice/img-20240720130059.png
单句合成

1、选择语言人,工具提供了十几种不同的男女音色供选择
https://chen-coding.oss-cn-shenzhen.aliyuncs.com/create-center/EmotiVoice/img-20240720130555.png
2、选择感情,工具提供了平凡、生气、开心、惊奇、伤心、厌恶、恐惧等语音感情
https://chen-coding.oss-cn-shenzhen.aliyuncs.com/create-center/EmotiVoice/img-20240720130712.png
3、输入合成文本
https://chen-coding.oss-cn-shenzhen.aliyuncs.com/create-center/EmotiVoice/img-20240720130955.png
4、点击合成
https://chen-coding.oss-cn-shenzhen.aliyuncs.com/create-center/EmotiVoice/img-20240720131025.png
5、合成的音频可以进行在线播放和下载,或者在合成时勾选天生音频后直接生存在wav_file目录下
https://chen-coding.oss-cn-shenzhen.aliyuncs.com/create-center/EmotiVoice/img-20240720131332.png
故事剧本多人合成

EmotiVoice 除了提供单句合成,还提供了故事剧本多人合成的功能。
1、输入角色和文本
https://chen-coding.oss-cn-shenzhen.aliyuncs.com/create-center/EmotiVoice/img-20240720131651.png
2、为角色选定声音情感
https://chen-coding.oss-cn-shenzhen.aliyuncs.com/create-center/EmotiVoice/img-20240720131804.png
3、为角色选定配音员
https://chen-coding.oss-cn-shenzhen.aliyuncs.com/create-center/EmotiVoice/img-20240720132027.png
4、点击合成音频
快速上手

完整安装

conda create -n EmotiVoice python=3.8 -y
conda activate EmotiVoice
pip install torch torchaudio
pip install numpy numba scipy transformers soundfile yacs g2p_en jieba pypinyin pypinyin_dict更多的模型训练,可参考项目文档。
Docker 摆设

尝试 EmotiVoice 最简单的方法是运行 Docker 镜像,需要一台带有 NVidia GPU 的机器!
docker run -dp 127.0.0.1:8501:8501 syq163/emoti-voice:latest容器启动成功后,访问:
http://localhost:8501/EmotiVoice 作为一款 TTS 引擎,可以说功能非常强盛,而且开源免费,各人快去围观体验吧~
项目地址:https://github.com/netease-youdao/EmotiVoice末了

推荐的开源项目已经收录到 GitHub 项目,接待 Star:
https://github.com/chenyl8848/great-open-source-project或者访问网站,进行在线欣赏:
https://chencoding.top:8090/#/https://chen-coding.oss-cn-shenzhen.aliyuncs.com/%E5%BE%AE%E4%BF%A1%E5%9B%BE%E7%89%87_20240629100336.png
各人的点赞、收藏和评论都是对作者的支持,如文章对你有帮助还请点赞转发支持下,谢谢!

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页: [1]
查看完整版本: i人的福音!一个强盛开源的文本转语音工具!