LatentSync数字人,一键批量,口型同步,MPS加快(WIN/MAC)

小秦哥 · 2025-1-24 16:44:30

分享一个迩来还不错的数字人项目——LatentSync。该项目由字节开源，上传一段音频和视频，即可生成数字人视频。

我对该项目做了些更改，增长了批量和MAC版本的支持，用MAC的小伙伴再也不用遗憾了…

看下我生成的效果。
https://live.csdn.net/v/460345
简朴介绍下如何使用
上传一段人物视频和你要生成人物说话的音频。

点击处理视频等待视频生成

https://live.csdn.net/v/460346
批量模式的使用也雷同，支持上传多个文件。

批量模式下音频数目一定要和视频数目保持同等，如果缺少是会报错的。

配置需求

WIN

WindowsN卡需8G显存
如果整合包运行报错，必要安装cuda12.4
https://developer.nvidia.com/cuda-12-4-0-download-archive
MAC

MAC Apple Silicon M1/M2/M3/M4 芯片
8G内存
这里MAC用户需注意

		自动登录	找回密码
密码			立即注册

LatentSync数字人,一键批量,口型同步,MPS加快(WIN/MAC)

本帖子中包含更多资源

0 个回复

快速回复

楼主热帖

标签云

浏览过的版块