ToB企服应用市场:ToB评测及商务社交产业平台

标题: Pyramidal Flow利用指南:快手、北大、北邮,开源可免费商用视频生成模子, [打印本页]

作者: 十念    时间: 2024-11-22 13:02
标题: Pyramidal Flow利用指南:快手、北大、北邮,开源可免费商用视频生成模子,
什么是 Pyramidal Flow?

Pyramidal Flow 是由快手科技、北京大学和北京邮电大学联合推出的开源视频生成模子,它是完全开源的,发布在 MIT 允许证下,允许贸易利用、修改和再分发。该模子可以或许通过文本描述生成最高10秒、分辨率为1280x768、帧率24帧的视频。其核心技能是金字塔流匹配算法,将视频生成过程分解为多个不同分辨率的阶段,从而提高生成效率和质量。

功能特色

Pyramidal Flow 与其他视频生成模子的不同之处

定价信息

Pyramidal Flow 是完全开源的,发布在 MIT 允许证下,允许贸易利用、修改和再分发。
怎样利用

Pyramidal Flow 已在 Hugging Face 平台上线,用户可以通过以下方式利用:

利用 Pyramidal Flow 模子的具体步调

在本地情况中利用 Pyramidal Flow 模子来生成视频。这涉及到在本地呆板上安装必要的软件、下载模子、运行模子生成视频等操作。这种方法适用于那些希望在本地呆板上直接运行模子、进行实验或者开发应用的用户。
安装

起首,你需要克隆 Pyramidal Flow 的官方 GitHub 仓库,并按照阐明创建一个新的 conda 情况,并安装必要的依赖项
  1. # 克隆 Pyramidal Flow 的 GitHub 仓库
  2. git clone https://github.com/jy0205/Pyramid-Flow
  3. cd Pyramid-Flow
  4. # 创建一个新的 conda 环境,并安装 Python 3.8.10
  5. conda create -n pyramid python==3.8.10
  6. # 激活新创建的环境
  7. conda activate pyramid
  8. # 安装所需的 Python 库
  9. pip install -r requirements.txt
复制代码
下载模子

从 Huggingface 模子库下载预练习模子:
  1. # 从 Huggingface 模型库下载预训练模型
  2. from huggingface_hub import snapshot_download
  3. model_path = 'PATH'   # 本地保存下载的检查点路径
  4. snapshot_download("rain1011/pyramid-flow-sd3", local_dir=model_path, local_dir_use_symlinks=False, repo_type='model')
复制代码
利用模子生成视频

加载下载的模子,并利用提供的文本提示生成视频:
  1. import torch
  2. from PIL import Image
  3. from pyramid_dit import PyramidDiTForVideoGeneration
  4. from diffusers.utils import load_image, export_to_video
  5. # 设置 CUDA 设备
  6. torch.cuda.set_device(0)
  7. # 初始化模型
  8. 更多代码内容访问教程地址:https://www.meoai.net/pyramidal-flow.html
  9. # 定义文本提示
  10. prompt = "A movie trailer featuring the adventures of the 30 year old space man wearing a red wool knitted motorcycle helmet, blue sky, salt desert, cinematic style, shot on 35mm film, vivid colors"
  11. # 使用模型生成视频
  12. 更多代码内容访问教程地址
  13. # 将生成的帧导出为视频文件
  14. 更多代码内容访问教程地址
复制代码
利用技巧


Pyramidal Flow 模子的练习数据

Pyramidal Flow 模子的练习数据来源重要是开源数据集。具体来说,模子在练习过程中利用了以下数据集:
Pyramidal Flow 模子在练习时仅利用了开源数据集,总计利用了 20,700 小时的 A100 GPU 盘算资源。这种开源的练习数据计谋使得模子可以供广大开发者和研究者免费利用,并便于进行进一步的研究和开发。
适用场景

Pyramidal Flow 提供了高效、机动的视频生成解决方案,适合开发者、艺术家和创作者利用

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。




欢迎光临 ToB企服应用市场:ToB评测及商务社交产业平台 (https://dis.qidao123.com/) Powered by Discuz! X3.4