IT评测·应用市场-qidao123.com

标题: 深入了解Stable Diffusion模子架构和核心组件(CLIP/Unet/VAE) [打印本页]

作者: 金歌    时间: 2025-3-11 21:12
标题: 深入了解Stable Diffusion模子架构和核心组件(CLIP/Unet/VAE)
前言

Stable Diffusion 是一种基于扩散技术的深度学习文本转图像模子,利用埋伏扩散模子(Latent Diffusion Model,LDM)来天生高质量的图像。它重要用于天生以笔墨描述为条件的详细图像,但也可应用于其他任务,如 inpainting(图像修复)、outpainting(图像扩展)以及根据笔墨提示词天生图像到图像(image-to-image)的转换。

从上图可以看出,只需提供一个文本提示,例如“一只戴着帽子的狗”,Stable Diffusion模子就可以天生一张代表文本的图像,这太神奇了!
扩散模子可以天生高质量的图像,Stable Diffusion模子是一种特别的扩散模子,称为埋伏扩散模子(LDM)。原始扩散模子往往会消耗更多的内存,因此创建了埋伏扩散模子,它可以在称为埋伏空间的低维空间中进行扩散过程。从高层次上讲,扩散模子是机器学习模子,它被denoise逐步练习成随机高斯噪声,以得到效果,即image。
Stable Diffusion 模子架构


所有的AI计划工具,安装包、模子和插件,都已经整理好了,




欢迎光临 IT评测·应用市场-qidao123.com (https://dis.qidao123.com/) Powered by Discuz! X3.4