stable-diffusion | v1-5-pruned.ckpt和v1-5-pruned-emaonly.ckpt的区别 ...

打印 上一主题 下一主题

主题 677|帖子 677|积分 2031


   https://github.com/runwayml/stable-diffusion?tab=readme-ov-file#reference-sampling-script
  

对于 1.5 模型,其中可能包括四部门:标准模型、文本编码器、VAE模型、EMA模型。
标准模型:天生图片的核心模块,潜空间中的前向扩散和反向扩散就是通过它做的,对应到图中左侧的 U-Net。
文本编码器:将文本提示词转换为数学向量,然后用作天生图片的引导条件。全称是 Text Encoder,对应到图中的TE。
VAE模型:用于图像在像素空间和潜在空间的映射,天生图片时将图像从潜在空间转换为像素图片,如今大部门模型都自带VAE。
EMA模型:EMA是一种算法,用来稳定模型效果的。对于日常天生,我们只要相识如许一个究竟就行了:如果只是天生,EMA模型和标准模型的效果是一样的。如果你要做二次练习,并且显卡够好,选择带EMA的模型可能更好,因为全部数据都在;当然选择去EMA的模型也能做二次练习。
   https://mp.weixin.qq.com/s/Ka5lnzcyFv2zdifo-Q81HQ

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

盛世宏图

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表