IT之家 前天
阿里 Qwen-Image-Edit-2509 模型更新发布,支持多图编辑
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

IT 之家 9 月 29 日消息,阿里通义千问今日宣布更新 Qwen-Image-Edit 的迭代版本 —— Qwen-Image-Edit-2509,现已在 HuggingFace 和魔搭社区开源,用户也可以通过 Qwen Chat 选择 " 图像编辑 " 功能免费体验最新模型。

相较于 8 月版本,Qwen-Image-Edit-2509 新增了如下特性:

多图编辑支持:对于多图输入,Qwen-Image-Edit-2509 基于 Qwen-Image-Edit 结构,通过拼接方式进一步训练,从而进行了支持。提供 " 人物 + 人物 "," 人物 + 商品 "," 人物 + 场景 " 等多种玩法。

单图一致性增强:对于单图输入,Qwen-Image-Edit-2509 显著提高了一致性,主要体现在以下方面:

人物编辑一致性增强:增强人脸 ID 保持,支持各种形象照片、姿势变换;

商品编辑一致性增强:增强商品 ID 保持,支持商品海报编辑;

文字编辑一致性增强:除了支持文字内容修改外,还支持多种文字的字体、色彩、材质编辑;

原生支持 ControlNet:包括深度图、边缘图、关键点图等。

Qwen-Image-Edit-2509 的首要更新是支持了多图输入。IT 之家附官方示例如下:

我们先看一个 " 人物 + 人物 " 的例子:

我们再看一个 " 人物 + 场景 " 的例子:

下面是一个 " 人物 + 物体 " 的例子:

实际上,多图输入也支持 ControlNet 常用的关键点图,比如改变人物姿势:

类似的,下面几个例子展示了 3 张图片的效果:

Qwen-Image-Edit-2509 的另一个重要更新是提升了一致性

第一,在人物一致性上,Qwen-Image-Edit-2509 比 Qwen-Image-Edit 有了显著提升,下面展示了各种形象照片生成的例子:

再比如,更改人物的姿势,也可以很好的保持角一致:

基于这一点,加上 Qwen-Image 本身特色的文字生成能力,我们发现 Qwen-Image-Edit-2509 很擅长制作表情包:

人物的一致性也体现在老照片修复上,下面是两个例子:

当然,除了真实人物,生成卡通玩偶、文创也是可以的:

第二,Qwen-Image-Edit-2509 专门增强了商品的一致性。我们发现,模型可以通过白底商品图很自然的制作商品海报:

或者是简单的 logo:

第三,Qwen-Image-Edit-2509 专门增强了文字一致性,并且支持了包括字体类型编辑、字体颜色编辑和字体材质编辑。

此外,定点文字编辑的能力获得了大幅增强:

值得一提的是,文字的编辑常常也可以和图像的编辑交融在一起,比如下面这个海报编辑的例子:

Qwen-Image-Edit-2509 的最后一个更新是原生支持了 ControlNet 的常用的图像条件,比如关键点控制、草图等。

Qwen-Image-Edit-2509 开源地址:

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

阿里 it之家 效果 文创 通义千问
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论