论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
应用中心
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
qidao123.com技术社区-IT企服评测·应用市场
»
论坛
›
人工智能
›
人工智能
›
Datawhale X 魔搭 AI夏令营第四期 | AIGC文生图——进阶 ...
Datawhale X 魔搭 AI夏令营第四期 | AIGC文生图——进阶上分 实战优化 Task ...
宁睿
论坛元老
|
2024-9-9 13:16:53
|
来自手机
|
显示全部楼层
|
阅读模式
楼主
主题
2064
|
帖子
2064
|
积分
6202
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
Hi,各人好,我是半亩花海。
在上一个任务中,我们逐行精读baseline,掌握了使用AI工具提升学习服从,并制作了话剧连环画,初步了解Secpter WebUI。今天,我们将深入探究
微调的基本原理及其参数
,旨在
优化效果
。同时,介绍文生图工作流平台
ComfyUI
,帮助实现更高度定制的文生图天生,进一步提升我们的创作和应用能力。
一、初探ComfyUI工具
1.了解ComfyUI
1.1 ComfyUI概念
GUI是 "Graphical User Interface"(图形用户界面)的缩写。简朴来说,GUI就是你在电脑屏幕上看到的那种有图标、按钮和菜单的交互方式。
ComfyUI
是GUI的一种,是
基于节点工作的用户界面
,主要用于使用图像的天生技术,ComfyUI的特别之处在于它接纳了一种模块化的设计,把图像天生的过程分解成了很多小的步调,每个步调都是一个节点。这些节点可以连接起来形成一个工作流程,如许用户就可以根据需要定制本身的图像天生过程。
ComfyUI工具的具体介绍详情看下面的视频:
1 万字系统分析ComfyUI | Stable Diffusion:GUI全盘点 | ComfyUI系统性教程原理篇04 | Ai+修建_哔哩哔哩_bilibili
1.2 ComfyUI焦点模块
焦点模块由
模型加载器
、
提示词管理器
、
采样器
、
解码器
构成。
(1)模型加载器:
Load Checkpoint用于加载底子的模型文件,包罗Model、CLIP、VAE三部门。
(2)提示词管理器:
CLIP模块将文本类型的输入变为模型可以理解的latent space embedding作为模型的输入。
(3)采样器:
用于控制模型天生图像,差别的采样取值会影响终极输出图像的质量和多样性。采样器可以调治天生过程的速率和质量之间的平衡。
这里重点讲讲采样器,主要是介绍
Stable Diffusion部门
。
Stable Diffusion的基本原理是通过降噪的方式(如完全的噪声图像),将一个原本的噪声信号变为无噪声的信号(如人可以理解的图像)。此中的降噪过程涉及到多次的采样。采样的系数在KSampler中设置:
seed:控制噪声产生的随机种子
control_after_generate:控制seed在每次天生后的变化
steps:降噪的迭代步数,越多则信号越精准,相对的天生时间也越长
cfg:classifier free guidance决定了prompt对于终极天生图像的影响有多大。更高的值代表更多地展现prompt中的形貌。
denoise: 多少内容会被噪声覆盖 sampler_name、scheduler:降噪参数。
(4)解码器:
VAE模块的作用是将Latent space中的embedding解码为像素级别的图像。
1.3 ComfyUI图片天生流程
ComfyUI图片天生流程:
第一步:选择模型
从可用的AI模型列表中选择符合的模型,比方Stable Diffusion或其他文本到图像模型。
第二步:构建工作流
在ComfyUl的图形界面上拖拽节点,并将它们连接起来以形成一个完备的图像天生或编辑流程。
输入须要的参数,如文本提示、图像文件等。
第三步:实行天生
运行构建好的工作流,观察天生的效果。
第四步:调解与优化
假如需要,可以根据天生的效果调解参数或修改工作流,直至获得满意的效果。
1.4 ComfyUI的上风
模块化和灵活性
:ComfyUI 提供了一个模块化的系统,用户可以通过拖放差别的模块来构建复杂的工作流程。这种灵活性允许用户根据本身的需求自由组合和调解模型、输入、输出、和其他处理步调。
可视化界面
:ComfyUI 提供了直观的图形界面,使得用户能够更清晰地理解和使用复杂的 AI 模型和数据流。这对没有编程配景的用户特别有帮助,使他们能够轻松构建和管理工作流程。
多模型支持
:ComfyUI 支持多个差别的天生模型,用户可以在同一平台上集成和切换使用差别的模型,从而实现更广泛的应用场景。
调试和优化
:通过其可视化界面,ComfyUI 使得调试天生过程变得更简朴。用户可以轻松地追踪数据流,识别并解决题目,从而优化天生效果。
开放和可扩展
:ComfyUI 是一个开源项目,具有高度的可扩展性。开发者可以根据需要编写新的模块或插件,扩展系统功能,并根据项目需求举行定制。
用户友爱性
:尽管其功能强大,但 ComfyUI 仍然保持了用户友爱性,即使对于复杂任务,也能以相对简朴的方式完成,使其成为天生式 AI 工作流程管理的有力工具。
2. 20分钟速通安装ComfyUI
在这里,我们依旧选择使用
魔搭社区
提供的Notebook
(链接:我的Notebook · 魔搭社区 (modelscope.cn))
和免费的GPU算力体验来体验ComfyUI。
2.1 下载脚本代码文件
下载安装
ComfyUI的实行文件
和
task1中微调完成Lora文件
。
git lfs install
git clone https://www.modelscope.cn/datasets/maochase/kolors_test_comfyui.git
mv kolors_test_comfyui/* ./
rm -rf kolors_test_comfyui/
mkdir -p /mnt/workspace/models/lightning_logs/version_0/checkpoints/
mv epoch=0-step=500.ckpt /mnt/workspace/models/lightning_logs/version_0/checkpoints/
复制代码
(1)
在file中创建一个terminal
(左侧) (2)
粘贴代码,下载文件
(右侧)
2.2 进入ComfyUI的安装文件
我们双击进入ComfyUI的安装文件:
2.3 一键实行安装程序
(约莫10min)
2.4 进入预览界面
当实行到末了一个节点的内容输出了一个访问的链接的时候(即 This is the URL to access ComfyUI: 背面的链接 https://pension-democrats-designated-campbell.trycloudflare.com),复制链接到浏览器中访问。
PS:假如链接访问白屏,或者报错,就等一会再访问重试,程序可能没有正常启动完毕。
留意:到这里还不能天生图片哦,要完成接下来的使用才可以。
3. 浅尝ComfyUI工作流
3.1 不带LoRA的工作流样例
Step1:下载工作流脚本
回复
使用道具
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
宁睿
论坛元老
这个人很懒什么都没写!
楼主热帖
java前置学习
【RocketMQ】消息的存储
iOS Widget
简单的用Python对手机号进行加密 ...
【PostgreSQL】PostgreSQL重建与主库不 ...
k8s v-1.20版本部署详细过程[实测可用 ...
基于单片机的压力测控仿真设计(#0024) ...
离线数仓建设,企业大数据的业务驱动与 ...
❤️肝下25万字的《决战Linux到精通》 ...
Unity 将是驱动 C# 增长的引擎吗 ? ...
标签云
渠道
国产数据库
集成商
AI
运维
CIO
存储
服务器
浏览过的版块
虚拟化与私有云
Java
快速回复
返回顶部
返回列表