哦吼,新模子?文生图范畴的新模子FLUX.1(附模子下载网盘所在和详细利用方法)

[复制链接]
发表于 2026-2-7 12:50:23 | 显示全部楼层 |阅读模式
🎡配景

Black Forest Labs 是由 Stable Diffusion 原班人马创建的公司,致力于研发优质的多模态模子并开源。该公司由多位前 Stability AI 研究员构成,包罗 Robin Rombach 在内的团队成员,他们在图像和视频天生范畴有着良好的贡献,包罗 VQGAN、Latent Diffusion 以及 Stable Diffusion 模子等 。
2024年8月1号,也就是前天,Black Forest Labs 推出了名为 FLUX.1 的开源 AI 图像天生模子系列,包罗三个变体:FLUX.1 [pro]、FLUX.1 [dev] 和 FLUX.1 [schnell]。这些模子在视觉质量、提示词遵照本事、尺寸/宽高比可变性、排版和输出多样性等方面,都逾越了当前市场上的多个盛行模子,如 Midjourney v6.0、DALL·E 3 (HD) 和 Stable Diffusion 3-Ultra 3。
(固然,号称逾越Midjourney各个版本的模子有很多,实际结果各人懂的都懂,这次实际结果会怎样呢?待会儿我们测试看看)
FLUX.1 模子采取了多模态架构和并行扩散 Transformer 布局,通过流匹配方法改进了传统的扩散模子,引入了旋转位置嵌入技能和并行注意力层,以加强模子对图像中差别位置特性的辨认本事和捕获长隔断依靠关系的本事 。
别的,Black Forest Labs 已经完成了 3100 万美元(约合人民币 2.25 亿元)的种子轮融资,并预告将发布 SOTA 视频模子,该公司在视频天生范畴的潜力巨大,大概会成为该范畴的一匹黑马。
如果FLUX.1质量简直不错的话,那么SOTA视频模子也就非常值得等待了。
🎠看跑分

大模子各人都喜好跑个分,我们简单看下官方给出的跑分和结果图:

从跑分上乍一看,FLUX.1比前一段时间Stability发布的SD3-Midium强了小一半的样子,实际上细致一看,这个跑分左侧的值是从900开始到1060,以是如果sd3-midium是990分的话,Flux.1的三个版本大概是1020~1055左右,以是强了30分~65分,貌似...还好。
不得不说,这些评测机构是懂生理暗示的。
让我想起来SD3发布的时间发布的谁人奇葩的评测角度:

那么,啥是ELO Score呢?轻微查了下资料:
ELO评分体系是由物理学家阿帕德·埃洛(Arpad Elo)创建的,最初用于评估国际象棋选手的相对气力。ELO体系基于数学模子,通过选手之间的角逐结果来调解各自的评分,从而反映出他们的气力程度。ELO评分体系厥后也被广泛应用于其他各种竞技范畴,如围棋、足球、电子竞技、大模子评估等。
盘算 Elo Score 的过程涉及到每个对局的结果和加入对局的模子的当前评分。胜利会导致评分进步,失败则会导致评分降落。评分的变革量取决于对手的相对程度,即对手评分越高,胜利带来的评分增长越多,反之亦然。这种评估方法不但思量到了使命的结果,还思量到了对手的气力,使得模子之间的相对性能更具可表明性和比力性。
简单明白的话:这是个相对评分,以是简单看看就好
看下官方的样图:

 一黑板的笔墨这张图是有点锋利了,别的模子还没见过...不外待会儿我们测试看看。
🥽模子下载与利用方法

起首是网盘下载所在:点击下载
打开你会看到这么几个文件:

下载到当地后,模子放置位置如下:
1、将t5xxl_fp8_e4m3fn.safetensors、t5xxl_fp16.safetensors和clip_l.safetensors放在models\clip文件夹下:

2、将flux1-dev.sft和flux1-schnell.sft两个FLUX1模子本体放在models\unet文件夹下,可以新建二级目次,我这里放在了unet下FLUX1目次下,如许unet目次下模子多了比力好区分, (直接放在unet文件夹下也可以);

3、将ae.sft放在models/vae目次下;

完成设置之后,下载文件中的这两个图片是两个工作流,分别用于测试flux.dev和flux.schnell的,原图拖拽到comfyui中即可查察,各人自行测试就好。

注:
1、在利用的过程中,如果你的内存(注意是内存,不是显存)不到32G的话,t5xxl模子可以利用t5xxl_fp8_e4m3fn.safetensors,但是如果你的内存高出32G,那么发起利用t5xxl_fp16.safetensors,结果会更好;
2、如果提示内存不敷,可以在“Load Diffusion Model”中的weight_dtype中选择fp8,可以淘汰一半内存利用量,但是相应的,天生质量会降落一丢丢;

对应的comfyui作者原文:
   If you don’t have t5xxl_fp16.safetensors or clip_l.safetensors already in your ComfyUI/models/clip/ directory you can find them on: this link. You can use t5xxl_fp8_e4m3fn.safetensors instead for lower memory usage but the fp16 one is recommended if you have more than 32GB ram.
  The VAE can be found here and should go in your ComfyUI/models/vae/ folder.
  
  Tips if you are running out of memory:
  You can set the weight_dtype in the “Load Diffusion Model” node to fp8 which will lower the memory usage by half but might reduce quality a tiny bit.
  🧸天生速率参考

起首是天生速率方面,flux_dev模子,默认的20步参数天生,在4090显卡,64G内存的呆板上,大概须要30~40秒天生一张1024x1024的图像;

而蒸馏模子flux_schnell模子,默认只须要4步,大概须要15秒天生一张1024x1024的图像;

🍩天生质量参考

下一篇,我们对比下开源版本中结果最好的一个搭配:flux1_dev模子+t5xxl_fp16+clip_l+20步,对比midjourney V6,选几个典范场景,看下天见结果到底怎样;
记得关注我哦,暂定来日诰日更新~


✨写在末了

如果对comfyui还不认识的话,近来面向ComfyUI的新手,开了一门图文课程,如今已经更新完成了,如果各人在学习过程中碰到什么题目,也可以直接文章下留言,会一连更新相干答疑内容哈。欢迎订阅哦~
https://blog.csdn.net/jumengxiaoketang/category_12683612.html
​​
感谢各人的支持~

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!qidao123.com:ToB企服之家,中国第一个企服评测及软件市场,开放入驻,技术点评得现金

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

登录后关闭弹窗

登录参与点评抽奖  加入IT实名职场社区
去登录
快速回复 返回顶部 返回列表