Qwen-Image 2511 有梦就大胆一点!

我们刚写完 Qwen-Image 的那篇《Qwen-Image 一键穿衣从良,一键“下海经商”!》文章没多久,它的新版本 2511 就来了。根本不给喘息的时间啊,当然,我们也很享受这种屏住呼吸追赶的感觉。

我虽然没有第一时间发文章,但是相信我,我肯定第一时间跟进了。我看了很多对比效果图,也尝试了本地部署。

今天重点来讲讲关于效果的部分。

我基本可以得出结论,2511 的提升主要是在多图角色一致性以及可控性上面

另外还重点优化几个重点使用场景。

这一点从官方的更新用例也可以看出来!

一致性的提升

官方项目主页前面 6 张图都在强调提高角色一致性(Improve Character Consistency)。 角色一致性一旦提高了,就有无限可能了。

比如你可以可以给自己穿上各种衣服,制作各种造型,也可以进行风格化,制作卡通版 Q 版。

当然,也可以和各种人互动咯。比如你的偶像,比如某些老师。这个想象空间,不用我来强调了。在线平台对这方面的限制可是很强很强的哦。

所以我开头说了,有梦就大胆一点,努力去实现吧,技术已经不是障碍!

重新照明的能力

可以对照片光线进行重构,比如这个室内光线重构,打光之后,图片立体了很多。另外也可以做那种把白天改成黑夜,把早晨改成傍晚的玩法。

视角和角度的切换

这是一个很酷的功能,我之前还专门介绍过相关的 LoRA,可以多角度来查看美女,汽车,建筑。

工业设计

可以一句话,给大米汽车换个颜色,这个功能雷老板看了都叫好。可以去掉砝码的提手,可以修改家具的颜色,可以改变椅子的材质贴图。

几何推理

学生党最爱?这个功能如果做得好,应用场景多到不行。我以前一直觉得那些批改作业的 APP 好厉害,后来发现他们居然是人工录入题目……现在好了,AI 可以帮上大忙了。

我觉得上面几项,只要有任意一项做好了,都是不得了。Qwen-Image 应该很清楚它的发展方向,非常好。

新旧对比

最后,我还是用开头那个素材和老版本 2509 对比一下,让大家有一个直观感受,看完应该能明白这次升级核心在哪里了。

首先,单图修改的话,整体来说变化不大。

单图修改相对来说比较简单,所以两个版本表现都不错。

我尝试让人物拿着牌子上面写着 5122。

从结果来看主角的服装,脸部特征都保持的不错,而且手指皮肤都高度逼真,且没有畸变。

因为我用的 AIO 模型,在肤色上好像发生了变化,或者叫做饱和度发生了变化。这个问题后面再聊!

然后,重点来了。多人编辑的时候,差距就出来了!

我用一样的素材,一样的工作流,一样的 seed 来进行测试。

出来的结果,完全不一样。

可以看到,老版本,完全变成了外国人。虽然当时官方也有拍合照的例子,但是我实测很多次,都非常地拉跨。

而新版本,基本保持了角色的脸部特征,不是 100% 的相似度,但是已经比老版本好太多了,而且基本也能用了。

我的例子已经可以表达我要表达的内容。我根本不敢改提示词啊,改完的图片我也完全发不出来啊!

我一直希望打造一个完美的数字分身,然后给他配上完美的人生,包括完美的女朋友,在数字世界里为所欲为。

看来这个想法,很快就要实现了。

我开头也说了,我除了在对比效果之外,也在研究本地运行的方法。这个过程中遇到了一些困难,但是最终还是跑起来了,上面的图片大家也看到了。

老版本可以给公众号发送“Qwen-Image-Edit”获取,有兴趣的可以预习一下。

新版本,我还在整理教程,模型,工作流这些。

有需要的可以留言,或者移步托尼不是塔克

 

小尾巴==========================
公众号:托尼不是塔克
交流群
知识星球
==============================

 



发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注