要枚举 AI 绘画开源界的几个关键贡献,肯定少不了 Stable Diffusion。
还记否前不久刚推出的 Stable Diffusion 3?
其背后的团队 Stability AI,真的是一波三折,其焦点成员出走,创建了一个新公司:Black Forest Labs - 暗中丛林。
这不,刚刚开源了一款 AI 绘画模子,直接踢馆老东家,其天生结果,完全可以媲美闭源的 Midjourney。
本日分享,就带各人来体验一番,并在本地摆设起来。
之前我的 AI 绘画,都是来自本地摆设的 sd-webui。终于,我的 Stable Diffusion 2 该下线 - 光荣退休了?
No!No!No!
只管 Flux.1 的体现可圈可点,不外要说能完全更换 sd,至少现阶段,还不至于。
我们先来实测体验一番~
1. Flux.1 简介
FLUX.1 AI 号称的上风有:
• 杰出的视觉质量: 天生具有精彩细节和清晰度的图像。
• 正确的提示词遵照: 正确地将文本提示转化为图片,一次天生,无需抽卡。
• 多样化的风格: 支持广泛的艺术风格。
• 复杂场景天生: 创建精致细致的场景。
真的有吹的那么神么?我们来实测体验一番👇
2. 在线体验
- 官网:https://flux1ai.com/dev
- modelscope: https://www.modelscope.cn/studios/muse/flux_dev
我们以官网的所在为例,一起来体验一下。
使用非常简朴,文本框输入你想要天生的内容,右侧一键 Run:
右侧提示框出现分配到GPU后,天生一张图像大概 30-50S 左右。
我用下面这个提示词实测了一下,第一次实行在图片中天生中文,居然失败了!
以是最好使用英文提示词。
- A Monkey holding up a sign with a rainbow in it,
- reading "猴哥 AI"
复制代码 不外有一说一,这个 mokey 的毛发天生的还挺精致的~
固然,下方还可以举行一番简朴的设置,比如最根本的渴望天生图像的宽和高:
然后,我们把提示词修改一下,让它天生一只卡通猴子~
- A catoon monkey with smile holding up a sign with a rainbow in it, reading "AI".
复制代码 哈哈,只管并没完全按照指令天生。不外,个人感觉还是挺可爱的,用来做logo、做封面怎么样?
再来测试一个封面图,我让它写上 Houge AI:
- A round chocolate cake decorated with chocolate shavings, topped with the words Houge AI in white icing and garnished with red cherries. The cake is positioned on a white plate on a wooden table, with a coffee cup and saucer in the background.
复制代码
接着,我们再从 AI 绘画社区中找一些垂类模子的提示词来实测一下:
- 1girl,sweater,white background,
复制代码 简朴的提示词,默认是天生卡通范例的图像:
再给加点料:
- masterpiece,best quality,1girl,moyou,seductive smile,(Turtleneck_sweater_dress:1.5),(Thigh-high_boots:1.4),(Wide-brim_hat:1.3),(Autumn_foliage_background:1.3)
复制代码
天生一张写实类的吧:
- official art,Best quality,masterpiece,ultra high res,((photorealistic:1.4)),((deep Focus)),raw photo,extremely delicate,intricate details,best shadow,1girl,upper body,beautiful,cool,smallface,detailed face,((detailed very long hair)),(pale skin),((brown eyes)),deep shadow,look away,film grain,low key,soft lighting,poised poise,dramatic angles,geometric shapes,contrasts of light and shadow,high-tech backdrop,crisp lines
复制代码
别的不说,细节绝对拉满。Asian girl 亚洲脸,能不能行?
有一说一,Flux 在细节处理惩罚上已经富足传神,不外写实类的还得是垂类大模子~
官方体验所在,由于 GPU 资源有限,高峰期容易列队失败~
但这是一个开源模子,我们完全可以本地跑起来,接着就带着各人实操一番~
3. 本地摆设
Flux.1 根据模子巨细,分为三个版本:
- Schnell:最快的模子。
- Dev:在速率和质量之间提供平衡,并支持更多定制选项。
- Flux.1 Pro:最强模子,模子不开源,只提供 API。
实测来看,开源最强,当之无愧!
唯一的缺点,就是模子参数量太大了,开源的两个版本都有 23.8G,就这一点,就拦住了不少玩家。
不外话说返来,模子参数量小,且还能打的,至少现阶段是不现实的。
3.1 模子下载所在
项目所在:https://github.com/black-forest-labs/flux
模子首发在 Huggingface 上,不外已经有同砚迁徙到了阿里的 modelscope 上。思量到国内的小同伴访问 Huggingface 比力困难,我们这次直接从 modelscope 下载。
两个初始模子有 23.8G:
社区有小同伴提供了量化版,体积小了一半,不外体现略差,不知道是不是我参数设置的缘故因由,欢迎小同伴们品评区互换。
附下载所在:
- schnell:https://modelscope.cn/models/AI-ModelScope/FLUX.1-schnell/files
- dev:https://modelscope.cn/models/AI-ModelScope/FLUX.1-dev/files
- 量化版:https://modelscope.cn/models/AI-ModelScope/flux-fp8/files
!注意:即便是量化后的 11.9G 模子,跑起来也至少必要 16G 显存的消耗级显卡。
假如你的显存不敷,可以接着往下看👇
3.2 ModelScope 实战
本地摆设,我们这次采取阿里云的 GPU 服务器举行演示,假如你有本地 GPU 主机,固然下面是实操也是通用的。
起首,前去 modelscope 首页注册一个账号,新用户是有 GPU 免费使用额度的,选择下方的 GPU 环境,点击启动,你就可以拥有一台 24G 显存的云主机。
Step1:下载 ComfyUI
实例启动后,打开一个终端,然后 git clone 下载 ComfyUI:
- git clone https://github.com/comfyanonymous/ComfyUI
- cd ComfyUI
- pip install -r requirements.txt
复制代码 Step2:下载模子
实例镜像中默认安装好了 modelscope 下载下令,运行下方指令,下载我们所需的模子:
- # FLUX1-DEV
- modelscope download --model=AI-ModelScope/FLUX.1-dev --local_dir ./models/unet/ flux1-dev.sft
- modelscope download --model=AI-ModelScope/flux-fp8 --local_dir ./models/unet/ flux1-dev-fp8.safetensors
- # text encoder model
- modelscope download --model=AI-ModelScope/flux_text_encoders --local_dir ./models/clip/ t5xxl_fp16.safetensors
- modelscope download --model=AI-ModelScope/flux_text_encoders --local_dir ./models/clip/ clip_l.safetensors
- modelscope download --model=AI-ModelScope/flux_text_encoders --local_dir ./models/clip/ t5xxl_fp8_e4m3fn.safetensors
- # vae
- modelscope download --model=AI-ModelScope/FLUX.1-dev --local_dir ./models/vae/ ae.sft
复制代码 给各人看下下载速率,300-400M/s,超快~
- Downloading: 82%|███████████████████████████████████████████████████████████████████████████████████████████████▍ | 18.1G/22.2G [00:54<00:11, 374MB/s]
复制代码 假如你是在其他云主机 or 本地服务器上,必要起首安装 modelscope download 工具:
Step3:启动 ComfyUI
ComfyUI 提供了一键启动脚本,运行下方指令,即可打开一个 web 客户端:
默认端标语是:http://127.0.0.1:8188。
不外,modelscope 上的云主机是没有公网 IP 的,你在本地欣赏器固然是打不开的,怎么搞?
你必要一个内网穿透工具~
有没有最便捷的方式,实现内网穿透?
固然,强推 cloudflared 👇
Step4:cloudflared 安装和使用
堆栈:https://github.com/cloudflare/cloudflared
cloudflared 是啥?
外洋云厂商 Cloudflare 提供的一个下令行工具,用于创建安全的隧道,以便将本地服务袒露到互联网。
起首下载最新版的 cloudflared Debian 软件包(.deb 文件),并使用 dpkg 工具直接安装,无需编译。
- wget https://mirror.ghproxy.com/https://github.com/cloudflare/cloudflared/releases/latest/download/cloudflared-linux-amd64.deb
- dpkg -i cloudflared-linux-amd64.deb
复制代码 看到如下输出,则阐明安装乐成:
- (正在读取数据库 ... 系统当前共安装有 83567 个文件和目录。)
- 准备解压 cloudflared-linux-amd64.deb ...
- 正在解压 cloudflared (2024.6.1) 并覆盖 (2024.6.1) ...
- 正在设置 cloudflared (2024.6.1) ...
复制代码 别的,还可以查察下cloudflared版本:
- cloudflared -v
- # 输出
- cloudflared version 2024.6.1
复制代码 由于 ComfyUI 的服务在 8188 端口上,以是我们用 cloudflared 开启一个监听隧道:
- cloudflared tunnel --url http://127.0.0.1:8188
复制代码 监听乐成后,找到下面这个临时的 url:
打开欣赏器看看吧:
大功告成,开始 ComfyUI 之旅吧~
Step5:愉快玩耍
起首,把 flux1-dev 模子的设置文件下载到本地:https://modelscope.oss-cn-beijing.aliyuncs.com/resource/flux1-dev-test.json
然后,点击 Load 加载设置文件:
末了,输入你想要天生的提示词,以及图片巨细设置。点击 Queue Prompt 开始天生,流程中的高亮模块,阐明正在加载模子:
我这边实测,1360 x 768 巨细的图像,量化版本的模子约莫占用 14G 显存,以是一张消耗级显卡完全够用。
有一说一:ModelScope 的云端 GPU 环境跑模子还是很爽的,尤其是下载 ModelScope 上的模子,速坦白接拉满;唯一的缺陷是,模子权重文件等无法恒久生存,一旦断掉后,还得重头再来一样平常。
写在末了
本文实测了地表最强开源 AI 绘画模子,手把手教你从在线体验到本地摆设。就算你没有土豪级显卡,也可以用云端 GPU 来玩耍。
不得不说,这波 AI 绘画的更新迭代,看得人眼花缭乱、热血沸腾!
不知道下一个惊喜又会是谁呢?让我们拭目以待~
关于开源 AI 大模子的文章,我计划做成一个专栏,现在已经收录了:
- CogVideo 实测,智谱「清影」AI视频天生,全民免费,连 API 都开放了!
- 全网刷屏的 LLaMa3.1,2分钟带你尝个鲜
- SenseVoice 实测,阿里开源语音大模子,辨认结果和服从优于 Whisper
- EasyAnimate-v3 实测,阿里开源视频天生模子,5 分钟带你摆设体验,支持高分辨率超长视频
- 开源的语音合成项目-EdgeTTS,无需摆设无需Key
- 一文梳理ChatTTS的进阶用法,手把手带你实现个性化配音
反面会定期更新,感爱好的小同伴欢迎关注。
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!qidao123.com:ToB企服之家,中国第一个企服评测及软件市场,开放入驻,技术点评得现金 |