官方链接内容整理的 Spark-TTS Windows 安装完整流程

打印 上一主题 下一主题

主题 1944|帖子 1944|积分 5832

官方链接内容整理的 Spark-TTS Windows 语音克隆 安装完整流程

官方链接内容整理的 Spark-TTS Windows 安装完整流程
Spark TTS:基于大型语言模子的文本转语音模子
Spark-TTS 是一个先进的文本转语音系统,使用大型语言模子(LLM)的强大功能,实现高度正确和自然的声音合成。它被设计为高效、灵活且强大,适用于研究和生产用途。
Inference Overview of Voice Cloning
spark tts infer voice cloning
Inference Overview of Controlled Generation
spark tts infer control
楼主整合好的资源包,免加快,已缓存好的项目,提供不限速链接:
—链接: https://caiyun.139.com/m/i?2mD8SUatQ1y60
/*594n8cMmVZh1:/
复制本段信息,打开「中国移动云盘APP」获取。大家不限速,移动用户免流量!
Spark-TTS Windows 安装指南

1. 安装 Conda

• 下载并安装 Miniconda 或 Anaconda。
告急:安装时勾选 Add Conda to PATH(将 Conda 添加到系统环境变量)。
我的这一步没有环境变量配置,请手动装配

2. 下载 Spark-TTS

选择以下任一方式
保举(手动下载)

  • 访问 GitHub 仓库:SparkAudio/Spark-TTS
  • 点击 Code > Download ZIP,解压到本地文件夹。
    可选(使用 Git)
  1. git clone https://github.com/SparkAudio/Spark-TTS.git
复制代码
3. 创建 Conda 环境

打开 命令提示符(cmd),依次执行:
  1. conda create -n sparktts python=3.11 -y
  2. conda activate sparktts
复制代码
为什么更换为3.11
安装过程遇到错误:
pip 无法从指定的 PyTorch 旧版本索引中找到适合你当前环境的 torch 包。这通常是由于 ​​Python 版本不兼容​​ 或 ​​CUDA 环境标题​​ 导致的。以下是解决方案:
查抄 Python 版本​​
PyTorch 对 Python 版本有严格限制:
​​PyTorch 2.0+​​ 须要 Python 3.8-3.11(​​不支持 Python 3.12​​)。

4. 安装依靠

进入 Spark-TTS 文件夹(解压或克隆的目录),运行:
  1. pip install -r requirements.txt
复制代码
5. 安装 PyTorch

自动检测 CUDA版本(保举):
  1. pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
复制代码
6. 下载模子

选择以下任一方式
保举(Python 脚本下载)

  • 在 Spark-TTS 文件夹中创建 download_model.py 文件,粘贴以下代码:
    1. from huggingface_hub import snapshot_download
    2. import os
    3. model_dir = "pretrained_models/Spark-TTS-0.5B"
    4. if os.path.exists(model_dir) and len(os.listdir(model_dir)) > 0:
    5.     print("Model files already exist. Skipping download.")
    6. else:
    7.     print("Downloading model files...")
    8.     snapshot_download(
    9.         repo_id="SparkAudio/Spark-TTS-0.5B",
    10.         local_dir=model_dir,
    11.         resume_download=True  # 支持断点续传
    12.     )
    13.     print("Download complete!")
    复制代码
  • 运行脚本:
    1. python download_model.py
    2. ```![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/cb101a9282c34a888542fc1717237865.png)
    复制代码
可选(Git 下载)
  1. mkdir pretrained_models
  2. git clone https://huggingface.co/SparkAudio/Spark-TTS-0.5B pretrained_models/Spark-TTS-0.5B
复制代码
7. 运行 Web UI

启动交互式网页界面:
  1. python webui.py
复制代码
• 浏览器访问天生的本地地址(通常是 http://127.0.0.1:7860)即可使用 TTS 功能。
此处楼主遇到了numpy 版本标题可供参考
—1. ​​降级 numpy 到兼容版本​​
powershell
pip install “numpy<2.0” --force-reinstall
这会安装最新的 1.x 版本(如 1.26.4),兼容大多数科学计算库。
2. ​​重新安装辩论的包​​
降级 numpy 后,重新安装依靠辩论的包:
powershell
pip install --force-reinstall contourpy gensim numba
3. ​​验证安装​​
查抄 numpy 版本是否已降级:
powershell
python -c “import numpy; print(numpy.version)”
应输出 1.x.x(如 1.26.4)。


免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

自由的羽毛

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表