[AI]从零开始的so-vits-svc webui部署教程(具体)

打印 上一主题 下一主题

主题 845|帖子 845|积分 2535

一、本次教程是给谁的?

        如果你点进了这篇教程,相信你已经知道so-vits-svc是什么了,那么我们这里就不过多讲述了。如果你还不知道so-vits-svc能做什么,可以去b站搜索一下,你大概率会搜索到一些AI合成的音乐,是的简单来讲,so-vits-svc是一个练习并且推理声音的开源项目。它可以大概模拟某些脚色的声音来唱歌或者单纯的笔墨朗读。那么,我们回到正题,本次教程是给谁的?如果你是一位开源项目爱好者并且有项目部署的经验,那么本次的教程可以作为你的参考。如果你是以为音乐爱好者,并且没有盘算机基础,那么你大概必要花一些时间来学习盘算机基础,在拥有了盘算机基础以后,可以跟着本教程尝试部署so-vits-svc,但是如果你没有太多的时间,大概这个项目标一键包更适合你。如果你是以为ACG爱好者,想使用本教程部署so-vits-svc,并且通过这个项目推理自己喜欢的脚色的声音,那么你也必要一些盘算机基础,如果你时间有限,我同样发起你使用so-vits-svc的一键包。总的来说,不管是哪一类人群,不管声音推理是你的专业照旧爱好,在部署so-vits-svc时,你都必要一定的盘算机基础对编程语言有一定的了解并且具有办理标题的能力。
二、关于细节和碰到标题的办理方案

        在本次教程之前,我已经在别的教程中讲述过pytorch的安装以及conda情况的安装,在本次教程中,我也会将往期的教程放在对应的位置。这次教程很具体,但是不会像每个单独教程那么具体。如果你想看到更多的细节,发起照旧去看单独的教程。在本次的教程中,我们做的事有非常强的前后逻辑性,必须在完成前面的步骤以后你才能举行下一步。当然,在你安装时,肯定会碰到非常多的标题,所以这必要你具有一定办理标题的能力,项目开源已经有一段时间了,所以网络上的资料非常多。当你碰到标题以后,你可以在欣赏器中用尽量简短的话去描述并且搜索你的标题。或者直接将报错的那一行信息直接复制到欣赏器中举行搜索,这大概也必要你会查看python的报错,python报错一般都伴随着很多文件。直接搜索报错信息这种办法非常有效,可以让你快速定位错误原因和办理办法。如果你在直接搜索时没有搜素到你对应的错误那你就可以考虑用比较具体的话语描述你的错误并提交给AI,如果你使用的是目前比较新的AI语言模型,它应该都能给出比较有效的办理方案。当你在举行了以上的步骤以后,依然不能办理你的标题,那你就可以考虑去社区或者论坛中寻求资助,但是请注意提问的艺术,你必要具体的描述你的标题并且描述你在出现这个标题之前举行了什么操纵,只有如许,大佬才知道你的标题在哪儿并且给出办理方案。总的来说,这次部署过程黑白常不容易的,如果你准备好了,那就让我们开始吧!
三、miniconda情况安装

        本次我们将在虚拟情况中演示怎样部署,这里我选择miniconda来实现虚拟情况。背面的演示也都会基于miniconda,如果你已经可以大概分清在体系中直接安装python和python虚拟情况的区别,那么你就可以选择自己喜欢的方式来举行下一步,如果你是一位小白,那么请跟着我举行操纵。我们必要使用conda将情况隔离出来,防止别的依靠冲突标题。你可以跟着我当前的文章举行操纵,也可以去看我以前的文章,那个教程会具体很多,我也发起小白前去下面的链接查看教程:
miniconda安装教程:[python]我们应该怎样安装Miniconda虚拟情况?(具体)_miniconda创建虚拟情况-CSDN博客
如果你已经跟着上面的教程成功安装了miniconda,那么你可以直接跳过这个大点。下面我们开始安装miniconda。
起首我们去到miniconda官网下载安装包:


下载好以后如下图所示:

开始安装:





这里最好把所有勾打上。



在安装完成以后,启动测试一下,直接在搜索框中搜索“miniconda”,并且启动:


使用下面的下令来创建一个虚拟情况:
  1. conda create --name so-vits-svc python=3.8
复制代码

使用下面的下令进入虚拟情况:
  1. conda activate so-vits-svc
复制代码

在成功进入虚拟情况以后,conda的安装步骤就已经结束了,值得注意的是这里将python版本最好固定在3.8附近。
四、pytorch安装

        因为我们的so-vits-svc依靠于pytorch运行,我们在这里必要自行安装pytorch。这里一定要将pytorch单独安装。这里pytorch的安装在以前我也提供了教程,如果你要获取具体的安装教程,请参考下面的文章,下面我会演示怎样在虚拟情况中安装pytorch:
pytorch安装:[python]怎样正确的安装pytorch?(具体)_pytorch安装-CSDN博客
下面我会简单的演示我的安装步骤,有一点要注意的是,我们这里要将pytorch的CUDA版本固定在11.7或者11.8,在12以后的版本都不实用,使用CPU部署的可以忽略这一条。
查看cuda版本:

去官网下载对应CUDA的最新驱动安装包:

选择好对应版本:



下载好以后如图:

下载好以后不着急安装,我们先去安装一个Visual Studio,这里在安装CUDA驱动时会用到它的C++编译情况,包罗背面安装python包时也会用到,发起大家在现在就安装好。
去到Visual Studio官网下载安装包:

这里我们选择图中所示的版本:


下载好以后如图:

开始安装Visual Studio。

等待完成:

这里把C++桌面开发勾上:

更换一下安装的路径。否则默认安装在C盘。

选择好安装路径以后,直接点击安装:

等待安装完成:

在安装完成以后就可以了,出现如下界面:

可以不登录,直接关掉即可,在安装完成以后发起重启一次电脑。
在安装好vs以后,我们就可以继承安装CUDA驱动了。






等待安装完成。


打开cmd输入下面的下令查看安装是否成功。
  1. nvcc -V
复制代码
注意这里的V是大写的。出现下面的输出表现CUDA驱动安装成功:

开始在虚拟情况中安装pytorch。
进入虚拟情况:

选择pytorch版本。因为要固定CUDA版本,所以,我们选择下面版本的pytorch。

在固定CUDA版本的同时pytorch不要太新,这里选择2.0的。复制到下令行中,开始安装:

等待安装完成。
在安装完成以后,使用“pip list” 查看已经安装的包,出现以下效果就表现安装完成。

这里显示的pytorch的版本和对应的CUDA的版本。如果你安装的是GPU版的pytorch但是这里没有出现CUDA的版本,那你就要考虑看看是不是在安装时哪里出了标题。可以尝试重新安装。如果你反复重试都无法成功就可以尝试去看一下上面链接中的文章,这个文章讲述了具体安装教程。
我们可以在已经安装了pytorch的虚拟情况中依次输入下面的下令举行验证:
  1. python
  2. import torch
  3. print(torch.cuda.is_available())
复制代码
如果安装成功则会返回“True”

当你安装完pytorch以后,才能举行下一步。
五、FFmpeg安装

        FFmpeg的安装相对简单,所以没有专门的文章教程,大家跟着我操纵即可。
去到FFmpeg的官网下载FFmpeg的安装包,FFmpeg官网:FFmpeg




下载好以后如图所示:

解压以后得到如下文件夹:

文件夹下有一个名为“bin”的文件夹,文件夹中有如下内容:

我们必要将这个“bin”文件夹的路径添加到情况变量。
右键”此电脑“点击属性,得到以下界面:

在这个界面中点击“高级体系设置”:

在高级体系设置中点击“情况变量”:

我们要对“体系变量”举行设置:

选中“Path”后点击“编辑”:

在编辑中点击“欣赏”:

将刚才的路径选中进来。

这里要注意路径中不能有中文和一些不明字符。
当路径选入以后,点击确定,然后将打开的所有窗口一路确定下去。
在配置完以上以后,就可以打开cmd下令行窗口输入下面的下令检查是否安装成功了。
  1. ffmpeg -version
复制代码
输入以后回车,应该会有雷同于一下图中的输出。

如果你在输入下令以后,没有得到上面图中如许的输出,或者提示未知下令,找不到下令,这些提示都表现安装没有完成,可以考虑重试上面的步骤或者查阅相干资料
至此,我们的FFmpeg已经安装完成。
六、拉取项目

        我们必要将整个so-vits-svc项目克隆下来,大家可以自行安装git使用下面的下令进项克隆,或者是直接下载项目压缩包再解压。
  1. git clone https://github.com/svc-develop-team/so-vits-svc.git
复制代码
项目文件夹如图所示:

七、别的依靠项的安装

        我们在项目文件夹中找到“requirements_win.txt”并且使用记事本打开。

这里面就是我们项目所依靠的所有库了。我们必要单独安装“fairseq”这个库。这个库安装大概会出现很多错误,请你在安装这个库之前已经安装了Visual Studio 2022并且在此中安装的C++的开发情况。
在虚拟情况中使用下面的下令安装“fairseq”库:
  1. pip install fairseq==0.12.2
复制代码

第一次安装出现了非常多的告诫,并且还伴随着错误,在你完全看不懂这些告诫和错误的情况下,将它们复制给AI是一个不错的办理方案:


AI给出了如下办理方案,我们可以逐一尝试:

使用AI的办理方案,如果再有报错就再将错误提交给AI,直到所有的错误办理为止,这个过程可以提高你办理标题的能力。如图,我们的“fairseq”库已经安装完成了。

既然已经安装完成,我们就可以到“requirements_win.txt”中将这个库删除,然后我们可以在终端中执行下面的下令,安装“requirements_win.txt”中的所有依靠:
  1. pip install -r requirements_win.txt
复制代码
如果你在安装时出现报错,可以尝试重新执行上面的下令举行安装,如果你反复出现错误,可以尝试将“requirements_win.txt”的库一个一个举行安装。
如果你在安装时出现网络标题,可以使用下面的下令将你的pip换源:
  1. # 设置清华大学下载镜像
  2. pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
  3. pip config set global.trusted-host pypi.tuna.tsinghua.edu.cn
复制代码
如图所示,就已经安装完成了,可以看到安装了非常多的库:

在保证上面的库安装没有标题以后,使用下面的下令将指定的库固定到指定版本:
  1. pip install --upgrade fastapi==0.84.0
  2. pip install --upgrade pydantic==1.10.12
  3. pip install --upgrade gradio==3.41.2
复制代码
在确认上面的库安装没有标题以后,使用下面的下令来打开webui。记得在项目根路径下执行下令,否则会找不到这个文件:
  1. python .\webUI.py
复制代码
如果在启动时报错,可以重新查看是否是库的缺失或者是不是库的版本冲突。可以使用上面的办法将错误直接复制给AI举行分析。在输入上面的下令后,如果没有出现错误,过一会儿就可以看到以下输出,并且会自动打开欣赏器并且打开webui。

它这里给出了一个提示,我们可以升级这个库,大家根据自己的情况选择升级。
如下图所示,我们的so-vits-svc webui已经成功启动了:

webui可以大概正常启动阐明我们的情况并没有标题。至此,我们“so-vits-svc webui”的所有依靠项已经安装完成。
八、载入底模与相干配置文件

        我们这里,不管是推理照旧练习,都必要有底模的参与,so-vits-svc的开源库中提供了非常多的底模,不同参数的底模练习和推理出的声音不一样。下面我会举行一个底模以及配置文件的导入和推理测试。
在此处的配置可以参考文章:so-vits-svc-Deployment-Documents/README_zh_CN.md at 4.1 · SUC-DriverOld/so-vits-svc-Deployment-Documents · GitHub
如果你在情况配置还有标题也可以参考上面的文档。下面会用到一些文件资源,资源来自下面这些UP主:
底模提供以及部署教程:【视频已过时仅作参考】最具体的AI音色转换So-vits-SVC4.1本地配置/练习/推理/使用教程/非整合包/从零开始配置!_哔哩哔哩_bilibili
芙宁娜模型提供:分享一个so-vits-svc4.0芙宁娜的AI语音模型【第二期】_原神 (bilibili.com)
上面视频的教程大家也可以看,我的流程和视频中是一样的。我会整理背面会用到的文件,大家自行下载以后,就可以跟着我继承操纵了。
相干文件下载:https://pan.baidu.com/s/107AQh5uxaMnxwtK4U7SNZQ?pwd=clxm 
提取码:clxm
在下载好相干文件以后,我们就可以继承下一步了。
将压缩文件解压以后得到以下文件夹:

下面的配置会使用到这些文件。
我们起首打开“Sovits4.x”文件夹。

我们将“Sovits4.x”文件夹的“checkpoint_best_legacy_500.pt”文件复制到项目文件夹的“pretrain”下:

将“Sovits4.x”文件夹下的“D_0.pth”和“G_0.pth”文件复制到项目文件夹目次下的“logs/44k”目次下。

将“Sovits4.x”文件夹下的“model_0.pt”复制到项目文件夹下的“logs\44k\diffusion”目次下。

在以上文件都复制完成以后,请多确认几次准确无误。
至此我们相干的配置就已经完成了。
九、使用练习好的模型举行推理测试

        当你举行到这一步时,相信你已经完成了上面的步骤。如果你没有完成上面的步骤,可以多尝试几次,之条件到过,我们整个部署过程有非常强的逻辑性,只有完成了前面的步骤,我们这一步才算成功才算真的部署好了这个项目。当你碰到标题时,可以参考上面我提到的文章也可以去看我给出的视频链接。
在你确定上面的步骤没有标题以后,那就开始我们本次部署的末了一步,使用练习好的模型举行推理测试吧。
我们起首启动webui。

我们点击图中所示的地方将“芙宁娜so-vits4.0”文件夹中的“G_46400.pth”文件选中进来。

出现模型巨细就表现导入成功了。
我们点击图中所示的地方将“芙宁娜so-vits4.0”文件夹中的“config.json”文件选中进来。

在完成以上步骤以后,我们就可以点击“加载模型”:

点击了“加载模型”以后,会出现出现语言人,如果一个模型在练习的时候练习了多个语言人,这里就能选择,当然,我们目前这个模型只有一个语言人。

在选择了语言人以后,我们可以选择我们的推理装备,auto表现自动选择,如果你安装了CUDA版的pytorch但是这里却没有你的显卡,阐明你的pytorch没有安装成功,请归去检查以下,或者使用cpu举行推理。

在设置好以上以后,我们将这个页面滑到最下面,我们这里选择“笔墨转音频”:

我们这里在笔墨框中输入想要转换的笔墨,然后选择语言人的性别,这里语言人的性别很紧张,如果语言人的性别和这里没对应转换出来的声音就会很怪,这里芙宁娜的模型我们要选择女声。随后点击“音频转换”:

开始转换以后,会有一个预估时间:

出现音频以后,就表现转换成功了,大家可以试听一下,大家也可以去下载别的模型举行体验,模型最紧张的是一个模型文件一个配置文件,只必要导入这两个文件,模型就能最基本运行。

至此,我们的so-vits-svc webui部署与推理已经完成,如果你在导入模型或者推理时出现错误可以参考上面我给出的文章,或者使用我最开始给出的碰到错误办理办法。
十、结语

        我们部署了so-vits-svc,大家可以使用这个开源项目推理自己喜欢的脚色的声音,大家可以自行去下载已经练习好的模型,背面风趣的玩法留给大家自行探索吧!


免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

悠扬随风

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表