FLUX.2 [klein]来了,一秒一图,又快又好!
黑森林和 ComfyUI 又上新了!
看起来还不错啊!


这两个例子来自 ComfyUI 的官方文章,实力已经可见一斑。既然 ComfyUI 发了,就证明已经开源了,大家都可以玩了。这个我们先不展开。
先来看看官方对于这个模型的介绍。

官方首屏介绍的核心是“很快生成高品质的图片”。而且这里也说了,可以调用 API,也可以进行本地微调运行。
右边的图片展示了它强调的背景切换能力,可以一句话让这瓶饮料出现在不同的场景中。
同时它还专门演示了到底有多快,到底有多好。
到底有多快?
亚秒级推理,比任何竞争模型快 30% 以上。

这就是我们常说的“秒出”,字刚打完,刚按完回车,图片就已经生成好了。(当然和设备有关!)
不同设备上的速度如下:

GB200 上最快 0.3 秒一张图。5090 上面 1.2 秒一张图。非常快,非常好~~~这些显卡我都没有! 不过不用担心,我已经提前看过了,本地小显存也能跑。
到底有多美?
官网也专门展示了一些生成样例图片。

单从这些图片来看,质量确实不错。
它还让我眼见为实,下面给了一个网址:

随便选了一条提示词,极速生成,然后提示词里面可以点击修改图片的特征。比如修改演示、风格、真实感等。刷一下,一批图片就出来了!
上面演示的是官网的例子。
下面看看 ComfyUI 在博客中给我们介绍的开源版。
FLUX.2 [klein] 4B 和 9B是 Flux 系列中最快的图像模型,将图像生成和图像编辑二合一。FLUX.2 [klein] 专为交互式工作流程、即时预览和对延迟要求严格的应用程序而设计,可在约 1 秒内完成高质量的图片,吊打一切的生图模型。
两种型号两种类型
FLUX.2 [klein] 以两种模型类型发布,每种模型类型均提供4B 和 9B 参数:
Base(未蒸馏)
- 完整的训练信号和模型容量
- 针对微调、LoRA 训练和训练后工作流程进行了优化
- 研究和定制方面的最大灵活性和控制权
Distilled(四步)
- 4 步蒸馏法,实现最快推理
- 专为生产部署、交互式应用程序和实时预览而构建
- 速度优化,质量损失最小。
显存和速度
comfyui还贴心提供了测试数据。
9B 精炼 — 4 步 · 约 2 秒(5090) · 19.6 GB 显存
9B 基准 — 50 步 · 约 35 秒(5090) · 21.7 GB 显存
4B 精炼 — 4 步 · 约 1.2 秒(5090) · 8.4 GB 显存
4B 基础 — 50 步 · 约 17 秒(5090) · 9.2 GB 显存
可以根据自己的设备和需求选择不同模型, 可惜没有5090,只有5060,掉了个头,应该不会差太多吧😄!
图片编辑能力
FLUX.2 [klein] 4B 两种尺寸均支持文本转图像和图像编辑,包括单参考和多参考工作流程。文生图我们已经看很多了。来看看它的多图编辑特性。
包括:
- 风格转变
- 语义变化
- 物体替换和移除
- 多参考合成
- 多次迭代修改
支持单参考和多参考输入,从而可以在保持视觉一致性的同时实现可控变换。这个演示图,就开头的图片。
这里才补充一张:

反复调整颜色和材质纹理,以实现精确控制
开始使用
- 更新至最新版本的 ComfyUI
- 浏览模板,在“图像”下查找 Flux.2 Klein 4B 和 9B,或下载工作流程。
- 出现提示时下载模型
- 上传图片并调整编辑提示,然后点击运行!
ComfyUI 官方教程:
https://docs.comfy.org/tutorials/flux/flux-2-klein
可以通过教程,自己完成配置。
当然也可以稍等一下,移步托尼不是塔克,我会制作一键包!