在 Hugging Face 上部署语音转语音模子

嚴華  论坛元老 | 2025-3-12 11:58:40 | 显示全部楼层 | 阅读模式
打印 上一主题 下一主题

主题 1013|帖子 1013|积分 3039

介绍

S2S (语音到语音) 是 Hugging Face 社区内存在的一个令人高兴的新项目,它联合了多种先进的模子,创造出险些天衣无缝的体验: 你输入语音,系统会用合成的声音进行回复。
该项目使用 Hugging Face 社区中的 Transformers 库提供的模子实现了流水话处置惩罚。该流程处置惩罚由以下组件组成:

  • 声音活动检测 (VAD)
  • 语音识别 (STT)
  • 语言模子 (LLM)
  • 文本转语音 (TTS)
除此之外,S2S 项目支持多语言!目前支持英语、法语、西班牙语、中文、日语和韩语。您可以使用单语言模式运行此流程或通过 auto 标记进行语言主动检测。请检察 这里 的仓库获取更多详情。
[code]>
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复

使用道具 举报

0 个回复

正序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

嚴華

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表