【AI绘画】零底子入门ComfyUI(二)快手可图Kolors大模型
大家好,我是写编程的木木。7月6日,快手在世界人工智能大会(WAIC)上宣布,快手旗下的文生图大模型可图(Kolors)将全面开源。可图(Kolors)支持中英文双语,生成效果比肩 Midjourney-v6水平,支持长达256字符的文本输入,具备英文和中文写字本领。在中文特色内容理解方面更具竞争力。
1、可图(Kolors)文生图大模型先容
可图大模型是由快手可图团队开发的基于潜伏扩散的大规模文本到图像生成模型。Kolors 在数十亿图文对下举行练习,在视觉质量、复杂语义理解、文字生成(中英文字符)等方面,相比于开源/闭源模型,都展示出了巨大的优势。Kolors 支持中英双语,在中文特色内容理解方面更具竞争力。可图在人工评测和机器评测中,整体满足度方面处于第一梯队水平,其中画面质量显著领先其他模型。
现实体验有如下优势:
[*] 中文文字生成本领(能用,但看具体文字场景)
[*] 支持中英双语输入
[*] 视觉质量与复杂语义准确性
[*] 项目开源,将来可期
https://i-blog.csdnimg.cn/direct/df140ba1a7504f9895911c007079ee45.png
2、ComfyUI使用可图(Kolors)
停止到 7 月 9 日,Comfyui 已支持 Kolors,感谢开源社区老哥们的支持;
2.1. ComfyUI-Manager插件安装
ComfyUI 丰富的插件是他的一大亮点,能让这个插件体系玩转的第一步是安装 ComfyUI-Manager 的插件,以后你就能轻松搞定其他插件。
安装 ComfyUI-Manager 有如下方式
1. 进入 ComfyUI/custom_nodes 目录
2. 通过 git 下载插件内容
3. 重启 ComfyUI
若网络欠好,也直接将 ComfyUI-Manager 的压缩包解压至 ComfyUI/custom_nodes 目录,以上两种方式都可以,你说,我的 chrome 可以连上 github,但终端连不上,那可以去上一期的内容,里面有解决方法。
2.2. ComfyUI-Manager安装插件
点击Manager按钮
https://img-blog.csdnimg.cn/img_convert/ee0598381ff206c89369f336e044d7c0.jpeg
点击Custom Nodes Manager
https://img-blog.csdnimg.cn/img_convert/0f1b652143d299d69b24ed9cd19b2846.jpeg
在搜索框里搜索kolors,选择ComfyUI-Kolors-MZ,点击下载,下载完成后,记得重启comfyui,有些同砚可能发现重启后并发现没有对应的节点,记得还要再刷新下页面,才气生效。
https://img-blog.csdnimg.cn/img_convert/f7cc6f7580aa851d489373ce13a68be1.jpeg
3、模型文件准备
(无法下载的可以文末领取,无偿分享)
3.1. UNET 模型下载
作用:U-Net的卷积神经网络架构,kolors是基于sdxl实现
存放路径:models/unet/ 文件夹下
下载地点:
https://huggingface.co/Kwai-Kolors/Kolors/resolve/main/unet/diffusion_pytorch_model.fp16.safetensors
3.2. ChatGLM3模型下载
作用:大语言模型复杂文本理解本领
存放路径:models/LLM/ 文件夹下(LLM 默认是没有这个文件夹的,必要本身创建)
下载地点:
https://huggingface.co/Kijai/ChatGLM3-safetensors/resolve/main/chatglm3-fp16.safetensors
3.3. 官方 IP-Adapter-Plus
作用:可看下图查看具体变化
存放路径:models/ipadapter/ 文件夹下
下载地点:
https://huggingface.co/Kwai-Kolors/Kolors-IP-Adapter-Plus/resolve/main/ip_adapter_plus_general.bin
https://img-blog.csdnimg.cn/img_convert/4612874c64ffab4b63070056df1ef57e.png
3.4. Clip_vision模型
作用:视觉模型,图像编码器
存放路径:models/clip_vision/ 文件夹下
下载地点:
https://huggingface.co/Kwai-Kolors/Kolors-IP-Adapter-Plus/resolve/main/image_encoder/pytorch_model.bin
3.4. vae 模型下载
作用:种别认识的滤镜,让生成的图片调解饱和度
存放路径:models/vae/ 文件夹下
下载地点:
https://civitai.com/models/296576/sdxl-vae
网络欠好,别担心,关注公众号,回复 kolors,即可获取百度网盘下载链接
4、一张试一试
在 glm 大语言模型的加持下,可图(Kolors)显现出强大的复杂文本理解本领。下面是一些示例:
提示词:一个机器人, 可爱,末日废土风格,瓦力,丰富细节,两个履带,手里端着一个花盆,花盘里有一个小花苗
分辨率:1024 * 1024
采样器:euler_ancestral
vae:使用 sdxl vae。
https://i-blog.csdnimg.cn/direct/44c91f5115774d23b27f0119e630bc30.png
https://img-blog.csdnimg.cn/img_convert/b0c1eb18ef012878daefef51833f0640.png
写在末了
感兴趣的小伙伴,赠予全套AIGC学习资料,包含AI绘画、AI人工智能等前沿科技教程和软件工具,具体看这里。
https://i-blog.csdnimg.cn/direct/4c4931bd31634629a0c5d16f6112ca89.jpeg
AIGC技术的将来发展远景广阔,随着人工智能技术的不断发展,AIGC技术也将不断进步。将来,AIGC技术将在游戏和盘算范畴得到更广泛的应用,使游戏和盘算系统具有更高效、更智能、更机动的特性。同时,AIGC技术也将与人工智能技术紧密结合,在更多的范畴得到广泛应用,对步伐员来说影响至关紧张。将来,AIGC技术将继承得到进步,同时也将与人工智能技术紧密结合,在更多的范畴得到广泛应用。
https://img-blog.csdnimg.cn/direct/e6a8b48b8024497daecb9d6652c72bb7.png#pic_center
一、AIGC所有方向的学习门路
AIGC所有方向的技术点做的整理,形成各个范畴的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证本身学得较为全面。
https://img-blog.csdnimg.cn/direct/af6e2f485a4f485d9b76a93afa81a02f.png
https://img-blog.csdnimg.cn/direct/7d91365d8b3a45aba258f4603c71dc5c.png#pic_center
二、AIGC必备工具
工具都帮大家整理好了,安装就可直接上手!
https://img-blog.csdnimg.cn/direct/01a2ea000b474fef83abfd18888b2e38.png
三、最新AIGC学习条记
当我学到一定底子,有本身的理解本领的时候,会去阅读一些先辈整理的书籍或者手写的条记资料,这些条记具体纪录了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
https://img-blog.csdnimg.cn/direct/9e597a6fae9344cea8f4a9caf30ecc55.png
https://img-blog.csdnimg.cn/direct/f2619de95125425d8a19b85ce2ff1894.png
四、AIGC视频教程合集
观看全面零底子学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从底子到深入,照旧很轻易入门的。
https://img-blog.csdnimg.cn/direct/ce803d0289b84736b059293d696429b6.png
五、实战案例
纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才气将本身的所学运用到现实当中去,这时候可以搞点实战案例来学习。
https://img-blog.csdnimg.cn/direct/373dd1f17ed14db1a2fa4dfec03c0559.png
https://i-blog.csdnimg.cn/direct/e2e14cc58a99431baa25a6d6bd0815e1.jpeg
若有侵权,请联系删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页:
[1]