LatentSync数字人,一键批量,口型同步,MPS加快(WIN/MAC)

打印 上一主题 下一主题

主题 1617|帖子 1617|积分 4851

分享一个迩来还不错的数字人项目——LatentSync。该项目由字节开源,上传一段音频和视频,即可生成数字人视频。

我对该项目做了些更改,增长了批量和MAC版本的支持,用MAC的小伙伴再也不用遗憾了…

看下我生成的效果。
https://live.csdn.net/v/460345
简朴介绍下如何使用
上传一段人物视频和你要生成人物说话的音频。

点击处理视频等待视频生成

https://live.csdn.net/v/460346
批量模式的使用也雷同,支持上传多个文件。

批量模式下音频数目一定要和视频数目保持同等,如果缺少是会报错的。

配置需求

WIN

WindowsN卡需8G显存
如果整合包运行报错,必要安装cuda12.4
https://developer.nvidia.com/cuda-12-4-0-download-archive
MAC

MAC Apple Silicon M1/M2/M3/M4 芯片
8G内存
这里MAC用户需注意

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

小秦哥

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表