FLUX.2 [klein]来了,一秒一图,又快又好!

黑森林和 ComfyUI 又上新了!

看起来还不错啊!

这两个例子来自 ComfyUI 的官方文章,实力已经可见一斑。既然 ComfyUI 发了,就证明已经开源了,大家都可以玩了。这个我们先不展开。

先来看看官方对于这个模型的介绍。

官方首屏介绍的核心是“很快生成高品质的图片”。而且这里也说了,可以调用 API,也可以进行本地微调运行。

右边的图片展示了它强调的背景切换能力,可以一句话让这瓶饮料出现在不同的场景中。

同时它还专门演示了到底有多快,到底有多好。

到底有多快?

亚秒级推理,比任何竞争模型快 30% 以上。

这就是我们常说的“秒出”,字刚打完,刚按完回车,图片就已经生成好了。(当然和设备有关!)

不同设备上的速度如下:

GB200 上最快 0.3 秒一张图。5090 上面 1.2 秒一张图。非常快,非常好~~~这些显卡我都没有! 不过不用担心,我已经提前看过了,本地小显存也能跑。

到底有多美?

官网也专门展示了一些生成样例图片。

单从这些图片来看,质量确实不错。

它还让我眼见为实,下面给了一个网址:

https://bfl.ai/models/flux-2-klein

随便选了一条提示词,极速生成,然后提示词里面可以点击修改图片的特征。比如修改演示、风格、真实感等。刷一下,一批图片就出来了!

上面演示的是官网的例子。

下面看看 ComfyUI 在博客中给我们介绍的开源版。

FLUX.2 [klein] 4B 和 9B是 Flux 系列中最快的图像模型,将图像生成和图像编辑二合一。FLUX.2 [klein] 专为交互式工作流程、即时预览和对延迟要求严格的应用程序而设计,可在约 1 秒内完成高质量的图片,吊打一切的生图模型。

两种型号两种类型

FLUX.2 [klein] 以两种模型类型发布,每种模型类型均提供4B 和 9B 参数

Base(未蒸馏)

  • 完整的训练信号和模型容量
  • 针对微调、LoRA 训练和训练后工作流程进行了优化
  • 研究和定制方面的最大灵活性和控制权

Distilled(四步)

  • 4 步蒸馏法,实现最快推理
  • 专为生产部署、交互式应用程序和实时预览而构建
  • 速度优化,质量损失最小。

显存和速度

comfyui还贴心提供了测试数据。

9B 精炼 — 4 步 · 约 2 秒(5090) · 19.6 GB 显存

9B 基准 — 50 步 · 约 35 秒(5090) · 21.7 GB 显存

4B 精炼 — 4 步 · 约 1.2 秒(5090) · 8.4 GB 显存

4B 基础 — 50 步 · 约 17 秒(5090) · 9.2 GB 显存

可以根据自己的设备和需求选择不同模型, 可惜没有5090,只有5060,掉了个头,应该不会差太多吧😄!

图片编辑能力

FLUX.2 [klein] 4B 两种尺寸均支持文本转图像和图像编辑,包括单参考和多参考工作流程。文生图我们已经看很多了。来看看它的多图编辑特性。

包括:

  • 风格转变
  • 语义变化
  • 物体替换和移除
  • 多参考合成
  • 多次迭代修改

支持单参考和多参考输入,从而可以在保持视觉一致性的同时实现可控变换。这个演示图,就开头的图片。

这里才补充一张:

反复调整颜色和材质纹理,以实现精确控制

开始使用

  1. 更新至最新版本的 ComfyUI
  2. 浏览模板,在“图像”下查找 Flux.2 Klein 4B 和 9B,或下载工作流程。
  3. 出现提示时下载模型
  4. 上传图片并调整编辑提示,然后点击运行!

ComfyUI 官方教程:

https://docs.comfy.org/tutorials/flux/flux-2-klein

可以通过教程,自己完成配置。

当然也可以稍等一下,移步托尼不是塔克,我会制作一键包!

 

小尾巴==========================
公众号:托尼不是塔克
交流群
知识星球
==============================

 



发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注