Qwen-Edit 俯拍仰视角度,很强!
上次分享了 Qwen-Image 的多角度 LoRA,这个LoRA很强,可以轻松修改照片的视角。

这篇文章在某号和某乎发布之后获取了大量的转发和收藏(到私密文件夹)。评论区有人在说“有个大胆的想法”,哈哈。
既然有想法,我们就要赶快实现 😄!
我先帮你们趟趟水。
试了一下才知道,开源的 Qwen-Image 就是无敌的存在。

这张图片就是用 Qwen-Image-Edit 一次生成的。
你们可以尝试让其他主流修图工具做一张类似的图片,就会发现 Qwen-Image 的指令遵循能力有多强了。
反正 GPT 肯定是做不到的,它会义正词严地拒绝你。
即便你花 200 美元一个月,也无法改变它纯洁的心灵。
另外两位修图高手,谷歌(nano-banana)和即梦(SeeDream4),表现也不尽如人意。
下面我用自己生成的图片,来做一个实测对比。
首先看 Qwen-Image 的效果:

这条提示词包含了四部分内容:
- 两个动作:跪着并抬头;
- 镜头:俯拍;
- 眼神:直视镜头。
Qwen-Image 很明显都做到了。
下面来看下谷歌 nano-Banana 的表现:

我大概试了两次,其中一次不错,另外一次如上图。
这张图片主要是镜头有问题,显然不是俯拍,而是平视。
另外有一点值得表扬:谷歌目前尺度限制比较宽松,名人限制也比较少。
接下来看下即梦的表现:

这个表现不能说很差:跪也跪了,头也抬了,也算俯拍。但是眼神比较飘,直视镜头这个指令做的并不是太好。
另外,它也是一个很有原则的 AI。

用词不当会拒绝生成,如果有名人也会拒绝生成。
在我们的常规理解中,一般来说闭源模型的效果会比较出众,开源模型大部分只能做个平替。
但是在这个场景下,闭源平台的效果并不理想,还有诸多限制。
而 Qwen-Image 的指令遵循能力非常强,强到无法无天,不知羞耻 🫣!

Qwen 啊,我劝你,AI 模型也不能做法外之徒……!
本文之所以用美女,单纯是为了吸引大家的注意力。但是不得不说,Qwen这个多角度编辑能力是真的强!