IT 之家 12 月 31 日消息,阿里通义大模型今日开源发布 Qwen-Image-2512,聚焦于三大核心能力的飞跃式提升:更真实的人物质感、更细腻的自然纹理、更复杂的文字渲染,让生成的图像无限接近真实世界。

更真实的人物质感:告别塑料脸、模糊五官。2512 能精准刻画皮肤纹理、发丝走向、表情神态,还能理解 " 微微前倾 " 这类语义细节。
更细腻的自然纹理:水流、苔藓、金毛犬的绒毛、盘羊的粗硬皮毛…… 2512 对自然与生物细节的刻画更细腻。
更复杂的文字渲染:2512 再进化,不仅能排版时间轴、呈现技术图表、还能生成带多格漫画 + 对话框的健康科普海报。
不止于能力增强,模型整体表现也实现突破:在 AI Arena 超过 1 万局的用户盲测中,数据显示 Qwen-Image-2512 在开源模型中表现最优,并在与多款闭源模型的对比中依然展现出显著竞争力。

Qwen-Image-2512 官方生成示例如下:

Qwen-Image-2512 已全面开源,IT 之家附开源地址如下:


登录后才可以发布评论哦
打开小程序可以发布评论哦