IT评测·应用市场-qidao123.com技术社区

标题: LatentSync数字人,一键批量,口型同步,MPS加快(WIN/MAC) [打印本页]

作者: 小秦哥    时间: 2025-1-24 16:44
标题: LatentSync数字人,一键批量,口型同步,MPS加快(WIN/MAC)
分享一个迩来还不错的数字人项目——LatentSync。该项目由字节开源,上传一段音频和视频,即可生成数字人视频。

我对该项目做了些更改,增长了批量和MAC版本的支持,用MAC的小伙伴再也不用遗憾了…

看下我生成的效果。
https://live.csdn.net/v/460345
简朴介绍下如何使用
上传一段人物视频和你要生成人物说话的音频。

点击处理视频等待视频生成

https://live.csdn.net/v/460346
批量模式的使用也雷同,支持上传多个文件。

批量模式下音频数目一定要和视频数目保持同等,如果缺少是会报错的。

配置需求

WIN

WindowsN卡需8G显存
如果整合包运行报错,必要安装cuda12.4
https://developer.nvidia.com/cuda-12-4-0-download-archive
MAC

MAC Apple Silicon M1/M2/M3/M4 芯片
8G内存
这里MAC用户需注意




欢迎光临 IT评测·应用市场-qidao123.com技术社区 (https://dis.qidao123.com/) Powered by Discuz! X3.4