f 人工智能-Datawhale X 魔塔AI夏令营 ——从零入门AI生图原理&实践_task 1 - Powered by qidao123.com技术社区

Datawhale X 魔塔AI夏令营 ——从零入门AI生图原理&实践_task 1 ...

王柳  论坛元老 | 2024-11-6 12:10:03 | 显示全部楼层 | 阅读模式
打印 上一主题 下一主题

主题 2152|帖子 2152|积分 6456

 一. 基础知识

1.1 文生图发展历史



1.2 文生图基础知识

文生图紧张以SD系列基础模型为主,以及在其基础上微调的lora模型和人物基础模型等。
1.2.1 文生图流程图

1. 输入提示词                                                 用户提供描述图像内容和风格的文本提示词。
2. (可选)提供参考图像                                                            用户可以选择提供一张或多张参考图像,为模型提供视觉参考。
3. 利用Lora进行模型训练                                                             通过LoRA技术对预训练模型进行微调,使其适应新的使命需求。
4. 图像天生                                                                                          利用经过微调的模型,根据提示词(和参考图像)天生最终的图像。

1.2.2 提示词

提示词可以包罗的内容有主题或主体、背景或情况、细节描述、风格或艺术结果、色彩、情感或氛围。
1.2.3 Lora

1.2.3.1 介绍

是一种用于微调大型预训练模型的技术,特殊在处置惩罚天生使命和迁徙学习时具有显著上风。其核心思想是通过引入低秩矩阵(Low-Rank Matrices)来高效地调整模型参数,从而使模型能够适应新的使命或数据集,而不需要重新训练整个模型。这种方法减少了计算和存储开销,同时保持了模型的强大性能。
1.2.3.2 根本原理

在LoRA中,模型的某些权重矩阵(如自注意力模块中的投影矩阵)会被分解为两个低秩矩阵的乘积。这意味着原本高维的矩阵可以被拆解为两个低维矩阵。这种低秩分解减少了训练参数的数量,使得微调过程更为轻量级。
详细来说,假设一个权重矩阵W被分解为两个低秩矩阵A和 B:  
,其中
,这里的 A 和 B 都是低秩矩阵。
1.2.4 ComfyUI

1.2.4.1介绍

ComfyUI 是一种用于图像天生和编辑的用户界面,设计目的是让用户能够更直观、简单地利用复杂的深度学习模型进行图像处置惩罚和天生使命。它通常与天生式模型(如扩散模型或GANs)共同利用,提供了一个友爱且功能强大的交互界面,允许用户无需深入编程知识即可完成高质量的图像天生。
1.2.4.2 紧张特性

模块化设计
可视化调试
机动的配置
兼容性
简化部署
1.2.4.2 应用场景

快速原型设计
教育与培训
研究与开发
工业部署
1.2.5 参考图控制

参考图控制是一种用于引导图像天生过程的技术,它允许用户提供一张或多张参考图像,以影响天生的最终图像。通过这种技术,用户可以更正确地控制天生图像的细节,如图像的布局、颜色、风格等。特殊是在天生模型(如扩散模型)中,参考图控制通过提供额外的输入信号,使得天生结果更符适用户的预期。
ControlNet 是一种基于参考图控制的技术组件,它附加在预训练的扩散模型(如 Stable Diffusion 模型)上,资助模型更正确地执行特定使命。ControlNet 可以通过姿势关键点、分割图、深度图等控制信号引导天生过程,使得用户可以在天生图像的过程中施加更多的控制和引导。
参考图控制类型
简介
OpenPose姿势控制

输入是一张姿势图片(或者利用真人图片提取姿势)作为AI绘画的参考图,输入prompt后,之后AI就可以依据此天生一副相同姿势的图片;
Canny精准绘制
输入是一张线稿图作为AI绘画的参考图,输入prompt后,之后AI就可以根据此天生一幅根据线稿的精准绘制。
Hed绘制

Hed是一种可以获取渐变线条的线稿图控制方式,相比canny更加的机动。
深度图Midas
输入是一张深度图,输入prompt后,之后AI就可以根据此天生一幅根据深度图的绘制。
颜色color控制
通过参考图控制和颜色控制,实现更加精准和个性化的图像天生结果。

1.3 实战训练

Step0:开通阿里云PAI-DSW试用



  • 开通免费利用
            链接:阿里云免费试用 - 阿里云



  • 魔搭社区进行授权
  •        链接:https://www.modelscope.cn/my/mynotebook/authorization
如果这一步授权失败,可跳过此步调,继续往下进行。
​ 
Step1: 报名赛事

 报名赛事!(点击即可跳转)
赛事链接:https://tianchi.aliyun.com/competition/entrance/532254
Step2:在魔搭社区创建PAI实例!

在魔搭社区创建PAI实例!(点击即可跳转)
 Step3:30 分钟体验一站式 baseline!


 

 

 

 Step4: 微调结果上传魔搭

链接:https://www.modelscope.cn/models/create



Step5:关闭PAI实例!!!!!

链接:https://www.modelscope.cn/my/mynotebook/authorization



免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
继续阅读请点击广告

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

王柳

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表