论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
应用中心
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
qidao123.com技术社区-IT企服评测·应用市场
»
论坛
›
人工智能
›
人工智能
›
【AI绘画】零底子入门ComfyUI(二)快手可图Kolors大模 ...
【AI绘画】零底子入门ComfyUI(二)快手可图Kolors大模型 ...
三尺非寒
论坛元老
|
2024-10-12 19:04:02
|
显示全部楼层
|
阅读模式
楼主
主题
2121
|
帖子
2121
|
积分
6363
大家好,我是写编程的木木。
7月6日,快手在世界人工智能大会(WAIC)上宣布,快手旗下的文生图大模型可图(Kolors)将全面开源。可图(Kolors)支持中英文双语,生成效果比肩 Midjourney-v6水平,支持长达256字符的文本输入,具备英文和中文写字本领。在中文特色内容理解方面更具竞争力。
1、可图(Kolors)文生图大模型先容
可图大模型是由
快手
可图团队开发的基于潜伏扩散的大规模文本到图像生成模型。Kolors 在数
十亿图文
对下举行练习,在视觉质量、复杂语义理解、文字生成(中英文字符)等方面,相比于开源/闭源模型,都展示出了巨大的优势。Kolors 支持中英双语,在中文特色内容理解方面更具竞争力。可图在
人工评测
和
机器评测
中,整体满足度方面处于
第一梯队水平
,其中画面质量显著领先其他模型。
现实体验有如下优势:
中文
文字
生成
本领(能用,但看具体文字场景)
支持
中英双语
输入
视觉质量与复杂语义准确性
项目
开源
,将来
可期
2、ComfyUI使用可图(Kolors)
停止到 7 月 9 日,
Comfyui 已支持 Kolors
,感谢开源社区老哥们的支持;
2.1. ComfyUI-Manager插件安装
ComfyUI 丰富的
插件
是他的一大亮点,能让这个插件体系玩转的第一步是安装 ComfyUI-Manager 的插件,以后你就能轻松搞定其他插件。
安装 ComfyUI-Manager 有如下方式
1. 进入
ComfyUI/custom_nodes
目录
2. 通过 git 下载插件内容
3. 重启 ComfyUI
若网络欠好,也直接将 ComfyUI-Manager 的压缩包
解压
至 ComfyUI/custom_nodes 目录,以上两种方式都可以,你说,我的 chrome 可以连上 github,但终端连不上,那可以去上一期的内容,里面有解决方法。
2.2. ComfyUI-Manager安装插件
点击
Manager
按钮
点击
Custom Nodes Manager
在搜索框里搜索kolors,选择
ComfyUI-Kolors-MZ
,点击下载,下载完成后,记得重启comfyui,有些同砚可能发现
重启
后并发现没有对应的节点,记得还要再
刷新下页面
,才气生效。
3、模型文件准备
(无法下载的可以文末领取,无偿分享)
3.1. UNET 模型下载
作用:U-Net的卷积神经网络架构,kolors是基于sdxl实现
存放路径:
models/unet/
文件夹下
下载地点:
https://huggingface.co/Kwai-Kolors/Kolors/resolve/main/unet/diffusion_pytorch_model.fp16.safetensors
3.2. ChatGLM3模型下载
作用:大语言模型复杂文本理解本领
存放路径:
models/LLM/
文件夹下(LLM 默认是没有这个文件夹的,必要本身创建)
下载地点:
https://huggingface.co/Kijai/ChatGLM3-safetensors/resolve/main/chatglm3-fp16.safetensors
3.3. 官方 IP-Adapter-Plus
作用:可看下图查看具体变化
存放路径:
models/ipadapter/
文件夹下
下载地点:
https://huggingface.co/Kwai-Kolors/Kolors-IP-Adapter-Plus/resolve/main/ip_adapter_plus_general.bin
3.4. Clip_vision模型
作用:视觉模型,图像编码器
存放路径:
models/clip_vision/
文件夹下
下载地点:
https://huggingface.co/Kwai-Kolors/Kolors-IP-Adapter-Plus/resolve/main/image_encoder/pytorch_model.bin
3.4. vae 模型下载
作用:种别认识的滤镜,让生成的图片调解饱和度
存放路径:
models/vae/
文件夹下
下载地点:
https://civitai.com/models/296576/sdxl-vae
网络欠好,别担心,关注公众号,回复 kolors,即可获取百度网盘下载链接
4、一张试一试
在 glm 大语言模型的加持下,可图(Kolors)显现出强大的复杂文本理解本领。下面是一些示例:
提示词:一个机器人, 可爱,末日废土风格,瓦力,丰富细节,两个履带,手里端着一个花盆,花盘里有一个小花苗
分辨率:1024 * 1024
采样器:euler_ancestral
vae:使用 sdxl vae。
写在末了
感兴趣的小伙伴,赠予全套AIGC学习资料,包含AI绘画、AI人工智能等前沿科技教程和软件工具,具体看这里。
AIGC技术的将来发展远景广阔,随着人工智能技术的不断发展,AIGC技术也将不断进步。将来,AIGC技术将在游戏和盘算范畴得到更广泛的应用,使游戏和盘算系统具有更高效、更智能、更机动的特性。同时,AIGC技术也将与人工智能技术紧密结合,在更多的范畴得到广泛应用,对步伐员来说影响至关紧张。将来,AIGC技术将继承得到进步,同时也将与人工智能技术紧密结合,在更多的范畴得到广泛应用。
一、AIGC所有方向的学习门路
AIGC所有方向的技术点做的整理,形成各个范畴的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证本身学得较为全面。
二、AIGC必备工具
工具都帮大家整理好了,安装就可直接上手!
三、最新AIGC学习条记
当我学到一定底子,有本身的理解本领的时候,会去阅读一些先辈整理的书籍或者手写的条记资料,这些条记具体纪录了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
四、AIGC视频教程合集
观看全面零底子学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从底子到深入,照旧很轻易入门的。
五、实战案例
纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才气将本身的所学运用到现实当中去,这时候可以搞点实战案例来学习。
若有侵权,请联系删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
三尺非寒
论坛元老
这个人很懒什么都没写!
楼主热帖
Centos7安装Mysql5.7(超详细版) ...
微信小程序--点餐系统(本地服务器+源 ...
可观测性之两大误区
小白也可以轻松破解被加密的ZIP口令啦 ...
Java多线程超级详解(只看这篇就够了) ...
如何获取Class对象呢?
GPRS与4G网络:技术差异与应用选择 ...
快速入门python看过的一些资料 ...
Docker 基础 - 1
Spark简单介绍,Windows下安装Scala+Ha ...
标签云
渠道
国产数据库
集成商
AI
运维
CIO
存储
服务器
浏览过的版块
Mysql
Java
前端开发
快速回复
返回顶部
返回列表