2025年11月10日

Qwen-Edit 俯拍仰视角度，很强！

By tony 默认分类评论 0

上次分享了 Qwen-Image 的多角度 LoRA，这个LoRA很强，可以轻松修改照片的视角。

这篇文章在某号和某乎发布之后获取了大量的转发和收藏（到私密文件夹）。评论区有人在说“有个大胆的想法”，哈哈。

既然有想法，我们就要赶快实现 😄！

我先帮你们趟趟水。

试了一下才知道，开源的 Qwen-Image 就是无敌的存在。

这张图片就是用 Qwen-Image-Edit 一次生成的。

你们可以尝试让其他主流修图工具做一张类似的图片，就会发现 Qwen-Image 的指令遵循能力有多强了。

反正 GPT 肯定是做不到的，它会义正词严地拒绝你。

即便你花 200 美元一个月，也无法改变它纯洁的心灵。

另外两位修图高手，谷歌（nano-banana）和即梦（SeeDream4），表现也不尽如人意。

下面我用自己生成的图片，来做一个实测对比。

首先看 Qwen-Image 的效果：

这条提示词包含了四部分内容：

Qwen-Image 很明显都做到了。

下面来看下谷歌 nano-Banana 的表现：

我大概试了两次，其中一次不错，另外一次如上图。

这张图片主要是镜头有问题，显然不是俯拍，而是平视。

另外有一点值得表扬：谷歌目前尺度限制比较宽松，名人限制也比较少。

接下来看下即梦的表现：

这个表现不能说很差：跪也跪了，头也抬了，也算俯拍。但是眼神比较飘，直视镜头这个指令做的并不是太好。

另外，它也是一个很有原则的 AI。

用词不当会拒绝生成，如果有名人也会拒绝生成。

在我们的常规理解中，一般来说闭源模型的效果会比较出众，开源模型大部分只能做个平替。

但是在这个场景下，闭源平台的效果并不理想，还有诸多限制。

而 Qwen-Image 的指令遵循能力非常强，强到无法无天，不知羞耻 🫣！

Qwen 啊，我劝你，AI 模型也不能做法外之徒……！

本文之所以用美女，单纯是为了吸引大家的注意力。但是不得不说，Qwen这个多角度编辑能力是真的强！

小尾巴==========================
公众号：托尼不是塔克
 交流群
 知识星球
==============================

某人