qidao123.com技术社区-IT企服评测·应用市场

标题: AIGC学习条记 [打印本页]

作者: 汕尾海湾    时间: 2024-9-22 13:43
标题: AIGC学习条记
提示:文章写完后,目次可以主动天生,怎样天生可参考右边的帮助文档
  
媒介

提示:这里可以添加本文要记载的大概内容:
记载一下学习AIGC,参考链接: 爆火的AIGC到底是什么

提示:以下是本篇文章正文内容,下面案例可供参考
一、stable diffusion

1.1 diffusion model

正向扩散:
                                                            x                                  t                                          =                                                        α                                     ˉ                                                                  x                                  0                                          +                                                        1                                     −                                                                  α                                           ˉ                                                      t                                                                   ε                                      x_t=\sqrt{\bar{\alpha}}x_0+\sqrt{1-\bar{\alpha}_t}\varepsilon                        xt​=αˉ              ​x0​+1−αˉt​              ​ε
  逆向扩散:计算太复杂,练习网络来模仿
练习过程:为每个图像随机选择时间步长 t ,将高斯噪声应用于图像,将时间步长转换为嵌入向量。
练习步骤:随机选择一个时间步长编码,通过扩散公式向图像中添加噪声,将添加噪声后的图片输入,练习U-Net,比较预测的噪声和实际的差距,重复步骤。
采样

采样就是把噪声图像还原。
步骤:

                                                            x                                               t                                     −                                     1                                                      =                                           1                                                             α                                        t                                                                               (                                               x                                     t                                              −                                                             1                                        −                                                       α                                           t                                                                                             1                                           −                                                                            α                                                 ˉ                                                              t                                                                                                     ε                                     θ                                                           (                                                   x                                        t                                                  ,                                     t                                     )                                              )                                          +                                                        β                                     t                                                      ε                                      x_{t-1}=\frac{1}{\sqrt{\alpha _t}}\left( x_t-\frac{1-\alpha _t}{\sqrt{1-\bar{\alpha}_t}}\varepsilon _{\theta}\left( x_t,t \right) \right) +\sqrt{\beta _t}\varepsilon                        xt−1​=αt​                     ​1​(xt​−1−αˉt​                      ​1−αt​​εθ​(xt​,t))+βt​              ​ε
  
这样一步一步太慢,以是有了stable diffusion。
1.2 stable diffusion


stable diffusion可以根据文本天生图像。

练习

和上面的练习过程差不多,不一样的地方:

总结

Stable Diffusion 要比 Diffusion Model 快很多。
二、Generative AI

2.1 单模态

只能接受单一类型的输入,产生对应类型的输出。

2.2多模态

2.2.1 视觉语言Encoder:concatenated encoder(级联编码器)、cross-aligned encoder(交织对齐编码器)


文本音频天生

文本代码天生

三、回首一下Transformer

3.1 Attention


3.2 self-Attention

和上面一样,                                   Q                         u                         e                         r                         y                         =                         K                         e                         y                              Query=Key                  Query=Key。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。




欢迎光临 qidao123.com技术社区-IT企服评测·应用市场 (https://dis.qidao123.com/) Powered by Discuz! X3.4