篮之新喜 发表于 2024-9-1 04:18:46

重磅!Stable Diffusion创始团队推出FLUX.1:一夜颠覆MJ v6,DALL·E 3,SD

前言

https://img-blog.csdnimg.cn/img_convert/c27ed03cc0929cf22e95ec3e331857ee.png
Stable Diffusion 大家已经很熟悉了,是由 CompVis 团队开辟的,这是一个隶属于德国慕尼黑大学的盘算机视觉研究小组。该团队由多个研究人员和开辟者组成,包括 Patrick Esser、Robin Rombach 和 Björn Ommer 等人
现在团队核心开辟人员Robin Rombach 宣布成立黑森林实验室,推出一种先辈的开源文生图模型FLUX.1
https://img-blog.csdnimg.cn/img_convert/77808a499b51389ce0fcfcef5c89a07e.png
开门见山,以下图像全部出自FLUX.1
https://img-blog.csdnimg.cn/img_convert/e26ad7df073fae75854d9fcbf7a29305.jpeg
https://img-blog.csdnimg.cn/img_convert/8f5ec2222f727bc842cf777a3dcdf321.jpeg
https://img-blog.csdnimg.cn/img_convert/83ad88e794e8b0880e72dfefc9b74559.jpeg
https://img-blog.csdnimg.cn/img_convert/4325ae000413cd937996db00ad3038fd.jpeg
https://img-blog.csdnimg.cn/img_convert/5f49c7422881c81a99d8d8711e37616c.jpeg
https://img-blog.csdnimg.cn/img_convert/8bf69c439475e7a24281cdf42e38c0c9.jpeg
https://img-blog.csdnimg.cn/img_convert/2549a651dff41178fd450095cc479897.jpeg
https://img-blog.csdnimg.cn/img_convert/662aa2d309ea52f460b8f580f3522f65.jpeg
https://img-blog.csdnimg.cn/img_convert/edf38ed97682ae38b22afe4942cd8916.jpeg
https://img-blog.csdnimg.cn/img_convert/d27e3c6d1b1e064155b56add1799005e.jpeg
https://img-blog.csdnimg.cn/img_convert/ce48dec2aa5ea043c00436955ce3e881.jpeg
https://img-blog.csdnimg.cn/img_convert/b18f36abd9889c8f22a2721e19721427.jpeg
https://img-blog.csdnimg.cn/img_convert/8ab2eca8c19d76a93f7cea568fe0efec.jpeg
https://img-blog.csdnimg.cn/img_convert/d6981f06198defd8a9aee07126430a5c.jpeg
https://img-blog.csdnimg.cn/img_convert/c1307a9c34080294df8c5cb49be6fb4e.jpeg
https://img-blog.csdnimg.cn/img_convert/5cb927e88a17f19fda7271b916b5526e.jpeg
https://img-blog.csdnimg.cn/img_convert/7b8cf034607614b41faa897fab416cf2.jpeg
https://img-blog.csdnimg.cn/img_convert/21dc52ba233c538a18559f8179f59fe2.jpeg
以下是FLUX.1官宣详细信息,
黑森林实验室成立公告

今天,我们很高兴宣布成立黑森林实验室。我们深深扎根于生成式AI研究社区,使命是开辟和推进用于图像和视频等媒体的最先辈的生成式深度学习模型,拓展创造力、服从和多样性的界限。我们信赖,生成式AI将成为未来全部技术的基础构建模块。通过向广泛的受众提供我们的模型,我们希望将其利益带给每个人,教育公众并增强对这些模型安全性的信任。我们刻意建立生成媒体的行业标准。今天,作为实现这一目的的第一步,我们发布了FLUX.1模型套件,引领文本到图像合成的前沿发展
https://img-blog.csdnimg.cn/img_convert/1870d88ec2d3b3f22a3a06c8f0d6adc2.png
黑森林团队

我们是一支由杰出的AI研究人员和工程师组成的团队,在学术、工业和开源环境中开辟基础生成式AI模型方面有着杰出的记录。我们的创新成果包括创建了VQGAN和Latent Diffusion,用于图像和视频生成的Stable Diffusion模型(Stable Diffusion XL、Stable Video Diffusion、Rectified Flow Transformers),以及用于超快实时图像合成的Adversarial Diffusion Distillation
我们的核心信念是,广泛可及的模型不但促进了研究社区和学术界的创新和合作,还增加了透明度,这是建立信任和广泛采用的关键。我们的团队致力于开辟最高质量的技术,并使其尽可能广泛地可用
资金

我们很高兴宣布乐成完成了3100万美元的种子轮融资。本轮融资由我们的主要投资者Andreessen Horowitz领投,天使投资者Brendan Iribe、Michael Ovitz、Garry Tan、Timo Aila和Vladlen Koltun以及其他知名的AI研究和公司建设专家参与。我们还获得了General Catalyst和MätchVC的后续投资,以支持我们将最先辈的AI技术从欧洲带给全球的使命
此外,我们很高兴宣布我们的顾问委员会成员,包括带来丰富的内容创作范畴履历的Michael Ovitz,以及神经风格迁移的先锋和欧洲开放AI研究的领先专家Matthias Bethge教授
FLUX.1模型系列

https://img-blog.csdnimg.cn/img_convert/8f47b21be06a18c1e57603743b392182.png
我们发布了FLUX.1文本到图像模型套件,这些模型在图像细节、提示词遵循、风格多样性和场景复杂性方面定义了新的最先辈水平
为了在可访问性和模型本领之间取得平衡,FLUX.1有三种变体:FLUX.1 、FLUX.1 和FLUX.1 :


[*] • FLUX.1 :FLUX.1的顶级性能,提供最先辈的图像生成,具有一流的提示词遵循、视觉质量、图像细节和输出多样性。通过我们的API注册FLUX.1 访问权限。FLUX.1 也可以通过Replicate和fal.ai获取。此外,我们提供专用和定制的企业办理方案——请通过接洽我们
[*]
[*] • FLUX.1 :FLUX.1 是一个开放权重的、引导蒸馏的模型,实用于非商业应用。直接从FLUX.1 蒸馏而来,FLUX.1 获得了类似的质量和提示词遵循本领,同时比同尺寸的标准模型更高效。FLUX.1 的权重可在HuggingFace上获取,并可以在Replicate或Fal.ai上直接试用。对于商业环境中的应用,请通过接洽
[*]
[*] • FLUX.1 :我们的最快模型,适合当地开辟和个人使用。FLUX.1 在Apache2.0许可下公开提供。类似于FLUX.1 ,权重可在Hugging Face上获取,推理代码可以在GitHub和HuggingFace’s Diffusers上找到。此外,我们很高兴在ComfyUI上实现了第一天就集成
https://img-blog.csdnimg.cn/img_convert/044e60d7b69ffe9b2bbd392c228cd177.png
Transformer驱动的流模型

全部公共的FLUX.1模型都是基于多模态和并行扩散Transformer块的混合架构,并扩展到12B参数。我们通过建立在流匹配上的方法改进了以前的最先辈扩散模型,这是一种训练生成模型的一样平常和概念简单的方法,包括扩散作为特例。此外,我们通过引入旋转位置嵌入和并行注意力层提高了模型性能和硬件服从。我们将在不久的将来发布更详细的技术报告
图像合成的新基准

FLUX.1定义了图像合成的新最先辈水平。我们的模型在各自的模型种别中设定了新的标准。FLUX.1 和在以下各个方面超越了盛行的模型,如Midjourney v6.0、DALL·E 3(HD)和SD3-Ultra:视觉质量、提示词遵循、巨细/纵横比可变性、字体和输出多样性。FLUX.1 是迄今为止最先辈的少步骤模型,不但优于其同类竞争对手,还超越了强大的非蒸馏模型,如Midjourney v6.0和DALL·E 3(HD)。我们的模型颠末特别微调,以保留预训练中的全部输出多样性。与当前的最先辈水平相比,它们提供了显著改进的可能性,如下所示。
https://img-blog.csdnimg.cn/img_convert/ed3ded38c27041aa837d3d5122b37f71.png
全部FLUX.1模型变体支持多种纵横比和0.1到2.0百万像素的分辨率,如以下示例所示。
https://img-blog.csdnimg.cn/img_convert/a4b6650a1f5f4ba006c5ea4f9332b611.png
接下来:面向全部人的最先辈文本到视频

今天,我们发布了FLUX.1文本到图像模型套件。凭借其强大的创造力,这些模型为我们即将推出的竞争性生成文本到视频系统奠基了坚实的基础。我们的视频模型将解锁高分辨率和前所未有速率的精确创作和编辑。我们致力于继续引领生成媒体的未来
GitHub - black-forest-labs/flux: FLUX.1 模型的官方推理堆栈

FLUX

由 Black Forest Labs 提供:https://blackforestlabs.ai
这个堆栈包含运行文本到图像和图像到图像的 FLUX 潜在修正流 Transformer 的最简推理代码
当地安装

模型

提供三种模型:


[*] • FLUX.1 基础模型,通过 API 提供
[*] • FLUX.1 引导蒸馏变体
[*] • FLUX.1 引导及步长蒸馏变体
[*]
名称HuggingFace 堆栈许可证md5sumFLUX.1 https://huggingface.co/black-forest-labs/FLUX.1-schnellapache-2.0a9e1e277b9b16add186f38e3f5a34044FLUX.1 https://huggingface.co/black-forest-labs/FLUX.1-devFLUX.1-dev 非商业许可a6bd8c16dfc23db6aee2f63a2eba78c0FLUX.1 仅通过 API 提供 自动编码器的权重也根据 apache-2.0 发布,可以在上述任一 HuggingFace 堆栈中找到。这些权重对于两种模型是相同的
使用

启动此中一个演示时,权重将自动从 HuggingFace 下载。要下载 FLUX.1 ,你必要登录,详见此处(https://huggingface.co/docs/huggingface_hub/guides/cli#huggingface-cli-login)。如果你已手动下载模型权重,可以通过环境变量指定下载路径:
export FLUX_SCHNELL=<path_to_flux_schnell_sft_file>   export FLUX_DEV=<path_to_flux_dev_sft_file>   export AE=<path_to_ae_sft_file>
要进行交互采样,请运行
python -m flux --name <name> --loop
或生成单个样本,请运行
python -m flux --name <name> \\   --height <height> --width <width> \\   --prompt "<prompt>"
还提供了一个 Streamlit 演示,支持文本到图像和图像到图像。可以通过以下下令运行演示
streamlit run demo_st.py
API 使用

API 提供对 pro 模型的访问。文档在此:docs.bfl.ml
在这个堆栈中,还提供了一个简单的 Python 接口。要使用此接口,你首先必要在 api.bfl.ml 注册,并创建一个新的 API 密钥
要使用 API 密钥,可以运行 export BFL_API_KEY=<your_key_here> 或通过 api_key=<your_key_here> 参数提供。还必要按上述方式安装软件包
从 Python 使用:
from flux.api import ImageRequest      # 这将直接创建一个 API 请求,但不会阻塞直到生成完成   request = ImageRequest("A beautiful beach")   # 或:request = ImageRequest("A beautiful beach", api_key="your_key_here")      # 以下任何一个将阻塞直到生成完成   request.url   # -> https:<...>/sample.jpg   request.bytes   # -> b"..." 生成的图像字节   request.save("outputs/api.jpg")   # 将样本保存到本地存储   request.image   # -> 一个 PIL 图像
从下令行使用:
$ python -m flux.api --prompt="A beautiful beach" url   https:<...>/sample.jpg      # 生成并保存结果   $ python -m flux.api --prompt="A beautiful beach" save outputs/api      # 直接打开图像   $ python -m flux.api --prompt="A beautiful beach" image show
但由于AIGC刚刚爆火,网上相干内容的文章博客五花八门、良莠不齐。要么杂乱、零散、碎片化,看着看着就衔接不上了,要么内容质量太浅,学不到干货。
这里分享给大家一份Adobe大神整理的《AIGC全家桶学习笔记》,信赖大家会对AIGC有着更深入、更系统的明确。
   有必要的朋友,可以点击下方免费领取!
https://i-blog.csdnimg.cn/direct/f9556ef3567e45feaa6d098711b1c4a4.png#pic_center
AIGC全部方向的学习门路思维导图

这里为大家提供了总的门路图。它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证本身学得较为全面。如果下面这个学习门路能帮助大家将AI利用到自身工作上去,那么我的使命也就完成了:
https://img-blog.csdnimg.cn/9a0b0ec5d03d4b15887a73aafb1df595.png
AIGC工具库

AIGC工具库是一个利用人工智能技术来生成应用程序的代码和内容的工具聚集,通过使用AIGC工具库,能更加快速,准确的辅助我们学习AIGC
https://img-blog.csdnimg.cn/5d865b64bad84eb4bef3a76e41df5f73.png
   有必要的朋友,可以点击下方卡片免费领取!
https://i-blog.csdnimg.cn/direct/f00523db4afb4d64a530c0c932704ad3.png#pic_center
精品AIGC学习册本手册

册本阅读永不外时,阅读AIGC经典册本可以帮助读者提高技术水平,开拓视野,掌握核心技术,提高办理标题的本领,同时也可以鉴戒他人的履历,结合自身案例领悟贯通。
https://img-blog.csdnimg.cn/b4a1e8708e99489ca74d029d610133b9.png
AI绘画视频合集

我们在学习的时候,每每册本源码难以明确,阅读困难,这时候视频教程教程是就很适合了,生动形象加上案例实战,科学有趣才能更方便的学习下去。
https://img-blog.csdnimg.cn/5111b7615a994761bf8beebed63fab9b.png

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页: [1]
查看完整版本: 重磅!Stable Diffusion创始团队推出FLUX.1:一夜颠覆MJ v6,DALL·E 3,SD