Z-Image 老少皆宜新知识,AIO模型和工作流!
Z-Image 持续火爆中,小巧又能打的模型,人人都能跑的模型,谁会不喜欢呢?

此图献给少年们,下面叔叔和爷爷们要开始深入交流了,你们可以散了 !
Z-Image 发布之后,社区已经持续发力。
国内的魔搭社区上 Z-Image 相关的项目已经有 60 个了。

国外的 Hugging Face 更加恐怖,已经有 329 个项目。

Civitai 上更是尺度全开,各种 NSFW 如雨后春笋般冒出来了。
今天给大家分享一个 AIO 模型。
AIO 的意思是 All in One。用在我们的场景里,就是一个模型搞定一切。
正常情况下,我们需要一个 UNet 模型、一个 CLIP 模型、一个 VAE 模型;而 AIO 只有一个 Checkpoint 模型。
这样的好处是:节省存储空间、节省内存空间、提升加载效率。
另外,AIO 一般对原模型进行了增强,加入了少儿不宜(NSFW)功能。
1. AIO 模型
今天介绍的 AIO 模型全称叫 Z-Image-Turbo-AIO。
Z-Image-Turbo-AIO 是阿里巴巴通义实验室的 6B 参数逼真图像生成器的一体式重新打包版本,优化了快速的 8 步生成。这个版本包括集成的 VAE 和文本编码器,以提供最大的便利性——只需下载即可生成!
之所以给大家分享这个项目,是因为这个项目的文档非常友好:特点、配置、工作流都写得清清楚楚,非常适合拿来学习研究。
我就摘录一下信息,介绍一下这个模型。
🎯 主要特点
- ⚡ 8 步生成 —— 每张图片 10–40 秒,取决于您的 GPU
- 📦 一体式 —— 不需要单独下载 VAE/文本编码器
- 📸 逼真 —— 专业级输出质量
- 📖 双语 —— 英文和中文文本渲染
- 🎯 8 GB 显存 —— 支持 8 GB 显存的 GPU
- 🌐 Apache 2.0 —— 开放许可,适用于任何用途
🔄 版本选择
🟡 FP8-AIO(推荐给大多数用户)
- ✅ 文件大小减半
- ✅ 下载更快
- ✅ 优秀质量
- ✅ 完美适用于 8 GB 显存
- ✅ 适合测试和日常使用
🌟 BF16-AIO(最高精度)
- ✅ BFloat16 全精度
- ✅ 无损质量
- ✅ 适合测试和日常使用
- ✅ 仍然支持 8 GB 显存
这个项目的模型如下:

首先,我们根据自己的硬件条件下载模型。显存小的下载 10 GB 那个,显存大的下载 20 GB 那个。
模型下载完成之后,放到指定的文件夹里面。

注意:AIO 模型的放置路径和其他模型不一样,必须放在 checkpoint 下面。
2. 安装插件
模型下载完成之后,我们就可以启动 ComfyUI,然后把工作流 JSON 文件拖入浏览器中的 ComfyUI 页面。

这两步还不会的话,请参考之前的文章。工作流在上方的截图中可以获取,就是名为 z-image-turbo-aio-workflow.json 的文件。当然,软件、工作流、模型,我会在文末分享。
加载工作流之后,可能出现一个错误提醒。这是因为这个工作流用到了一个第三方节点。

我们本地还没有这个节点,所以需要安装一下。
我们缺少的节点插件叫 rgthree。
缺少的两个节点,一个是图像比较节点,一个是开关节点。这两个节点都非常有用。
这两个节点都来自于 rgthree 这个节点插件。
图像比较节点可以对比不同工作流和不同参数生成图片的差异。
开关节点可以动态控制运行哪些部分,不运行哪些部分。
要安装这个节点也非常简单。只需要点击右上角的“Manager”。

然后在弹出的菜单中点击 安装缺失插件(Install Missing Custom Nodes)。
软件会自动列出需要安装的插件,只要点击 安装(Install) 即可。

安装完成之后点击 重启(Restart)。

这样节点插件就安装完了,整个工作流就不会报错了。
从工作流中可以看到,其中一个开关节点,用来控制是否加载 LoRA。

如果启动,就会加载 LoRA;如果不启动就会跳过 LoRA。
LoRA 可以锦上添花,也可以雪中送炭,可以用,也可以不用。LoRA 这个知识点会在后续分享,现在已经有很多 LoRA 模型了。
3. 运行生成
上面的全部介绍完了,运行这个工作流非常简单。
只要输入提示词,点击右上角的“运行”就可以了。

我简单对比了一下。
默认的工作流在 1024×1024 的情况下大概消耗 21 秒,而且很容易卡在最后的 VAE 环节。
AIO 工作流在同样分辨率下只要 15 秒左右。如果将 step 改成 4 步,约 7 秒钟一张图!
另外我也比较了 BF16 和 FP8 两个模型,它们相差了约 10 GB,其实两个效果都不错:前者更加精致一些,后者更加自然一些。
这个工作流非常简单实用。
这篇文章介绍了几个知识点,在 ComfyUI 中都非常实用,是组成各种工作流的基础。
最后,学习之余,也可以放松一下:

看懂的请点赞!(杀手锏放最后)
差点忘了,我的 Web 版又做了一些升级。现在已经内置热门提示词了。

网址:https://tools.tonyhub.xyz/zimage
另外,把这个 Web 版部署在本地的教程也写完了,还有一个是 Windows 电脑端配置。最近也写了一个 macOS 版本。

苹果上的 UI 要比 Python 的好很多。点击图片放大后支持缩放、拖动等功能!

大概就是这些了。
今天在升级 Web 软件时,被 GPT 坑了——一个大写字母 A 浪费了一天时间,有点疲惫了。
收工了!
大家可以活动一下手指,表达一下自己的想法!
软件、模型、工作流,可以给公众号发送“zimage”获取!