Datawhale X 魔搭 AI夏令营第四期 | AIGC文生图——进阶上分 实战优化 Task ...

宁睿  论坛元老 | 2024-9-9 13:16:53 | 来自手机 | 显示全部楼层 | 阅读模式
打印 上一主题 下一主题

主题 2065|帖子 2065|积分 6205

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?立即注册

x
Hi,各人好,我是半亩花海。在上一个任务中,我们逐行精读baseline,掌握了使用AI工具提升学习服从,并制作了话剧连环画,初步了解Secpter WebUI。今天,我们将深入探究微调的基本原理及其参数,旨在优化效果。同时,介绍文生图工作流平台ComfyUI,帮助实现更高度定制的文生图天生,进一步提升我们的创作和应用能力。
  
一、初探ComfyUI工具

1.了解ComfyUI

1.1 ComfyUI概念

GUI是 "Graphical User Interface"(图形用户界面)的缩写。简朴来说,GUI就是你在电脑屏幕上看到的那种有图标、按钮和菜单的交互方式。
ComfyUI是GUI的一种,是基于节点工作的用户界面,主要用于使用图像的天生技术,ComfyUI的特别之处在于它接纳了一种模块化的设计,把图像天生的过程分解成了很多小的步调,每个步调都是一个节点。这些节点可以连接起来形成一个工作流程,如许用户就可以根据需要定制本身的图像天生过程。
ComfyUI工具的具体介绍详情看下面的视频:1 万字系统分析ComfyUI | Stable Diffusion:GUI全盘点 | ComfyUI系统性教程原理篇04 | Ai+修建_哔哩哔哩_bilibili
1.2 ComfyUI焦点模块

焦点模块由模型加载器提示词管理器采样器解码器构成。
(1)模型加载器:Load Checkpoint用于加载底子的模型文件,包罗Model、CLIP、VAE三部门。
   

  (2)提示词管理器:CLIP模块将文本类型的输入变为模型可以理解的latent space embedding作为模型的输入。
   

  (3)采样器:用于控制模型天生图像,差别的采样取值会影响终极输出图像的质量和多样性。采样器可以调治天生过程的速率和质量之间的平衡。
   

  这里重点讲讲采样器,主要是介绍Stable Diffusion部门
Stable Diffusion的基本原理是通过降噪的方式(如完全的噪声图像),将一个原本的噪声信号变为无噪声的信号(如人可以理解的图像)。此中的降噪过程涉及到多次的采样。采样的系数在KSampler中设置:


  • seed:控制噪声产生的随机种子
  • control_after_generate:控制seed在每次天生后的变化
  • steps:降噪的迭代步数,越多则信号越精准,相对的天生时间也越长
  • cfg:classifier free guidance决定了prompt对于终极天生图像的影响有多大。更高的值代表更多地展现prompt中的形貌。
  • denoise: 多少内容会被噪声覆盖 sampler_name、scheduler:降噪参数。
(4)解码器:VAE模块的作用是将Latent space中的embedding解码为像素级别的图像。
   

  1.3 ComfyUI图片天生流程

   

    ComfyUI图片天生流程:
  

  • 第一步:选择模型

    • 从可用的AI模型列表中选择符合的模型,比方Stable Diffusion或其他文本到图像模型。

  • 第二步:构建工作流

    • 在ComfyUl的图形界面上拖拽节点,并将它们连接起来以形成一个完备的图像天生或编辑流程。
    • 输入须要的参数,如文本提示、图像文件等。

  • 第三步:实行天生

    • 运行构建好的工作流,观察天生的效果。

  • 第四步:调解与优化

    • 假如需要,可以根据天生的效果调解参数或修改工作流,直至获得满意的效果。

  1.4 ComfyUI的上风



  • 模块化和灵活性:ComfyUI 提供了一个模块化的系统,用户可以通过拖放差别的模块来构建复杂的工作流程。这种灵活性允许用户根据本身的需求自由组合和调解模型、输入、输出、和其他处理步调。
  • 可视化界面:ComfyUI 提供了直观的图形界面,使得用户能够更清晰地理解和使用复杂的 AI 模型和数据流。这对没有编程配景的用户特别有帮助,使他们能够轻松构建和管理工作流程。
  • 多模型支持:ComfyUI 支持多个差别的天生模型,用户可以在同一平台上集成和切换使用差别的模型,从而实现更广泛的应用场景。
  • 调试和优化:通过其可视化界面,ComfyUI 使得调试天生过程变得更简朴。用户可以轻松地追踪数据流,识别并解决题目,从而优化天生效果。
  • 开放和可扩展:ComfyUI 是一个开源项目,具有高度的可扩展性。开发者可以根据需要编写新的模块或插件,扩展系统功能,并根据项目需求举行定制。
  • 用户友爱性:尽管其功能强大,但 ComfyUI 仍然保持了用户友爱性,即使对于复杂任务,也能以相对简朴的方式完成,使其成为天生式 AI 工作流程管理的有力工具。
2. 20分钟速通安装ComfyUI

在这里,我们依旧选择使用魔搭社区提供的Notebook(链接:我的Notebook · 魔搭社区 (modelscope.cn))和免费的GPU算力体验来体验ComfyUI。

2.1 下载脚本代码文件

下载安装ComfyUI的实行文件task1中微调完成Lora文件
  
  1. git lfs install
  2. git clone https://www.modelscope.cn/datasets/maochase/kolors_test_comfyui.git
  3. mv kolors_test_comfyui/* ./
  4. rm -rf kolors_test_comfyui/
  5. mkdir -p /mnt/workspace/models/lightning_logs/version_0/checkpoints/
  6. mv epoch=0-step=500.ckpt /mnt/workspace/models/lightning_logs/version_0/checkpoints/   
复制代码
 (1)在file中创建一个terminal(左侧)             (2)粘贴代码,下载文件(右侧)

2.2 进入ComfyUI的安装文件

我们双击进入ComfyUI的安装文件:

2.3 一键实行安装程序(约莫10min)


2.4 进入预览界面

当实行到末了一个节点的内容输出了一个访问的链接的时候(即 This is the URL to access ComfyUI: 背面的链接 https://pension-democrats-designated-campbell.trycloudflare.com),复制链接到浏览器中访问。
   PS:假如链接访问白屏,或者报错,就等一会再访问重试,程序可能没有正常启动完毕。
  

   留意:到这里还不能天生图片哦,要完成接下来的使用才可以。
  3. 浅尝ComfyUI工作流

3.1 不带LoRA的工作流样例

Step1:下载工作流脚本
   
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

宁睿

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表