IT评测·应用市场-qidao123.com技术社区
标题:
LatentSync数字人,一键批量,口型同步,MPS加快(WIN/MAC)
[打印本页]
作者:
小秦哥
时间:
2025-1-24 16:44
标题:
LatentSync数字人,一键批量,口型同步,MPS加快(WIN/MAC)
分享一个迩来还不错的数字人项目——LatentSync。该项目由字节开源,上传一段音频和视频,即可生成数字人视频。
我对该项目做了些更改,增长了批量和MAC版本的支持,用MAC的小伙伴再也不用遗憾了…
看下我生成的效果。
https://live.csdn.net/v/460345
简朴介绍下如何使用
上传一段人物视频和你要生成人物说话的音频。
点击处理视频等待视频生成
https://live.csdn.net/v/460346
批量模式的使用也雷同,支持上传多个文件。
批量模式下音频数目一定要和视频数目保持同等,如果缺少是会报错的。
配置需求
WIN
WindowsN卡需8G显存
如果整合包运行报错,必要安装cuda12.4
https://developer.nvidia.com/cuda-12-4-0-download-archive
MAC
MAC Apple Silicon M1/M2/M3/M4 芯片
8G内存
这里MAC用户需注意
欢迎光临 IT评测·应用市场-qidao123.com技术社区 (https://dis.qidao123.com/)
Powered by Discuz! X3.4