智东西 前天
腾讯混元图像2.0模型来了,AI生图毫秒级响应,新添实时绘画板功能
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

智东西

作者 | ZeR0

编辑 | 漠影

智东西 5 月 16 日报道,今日,腾讯发布最新混元图像 2.0 模型(Hunyuan Image2.0),基于模型架构创新,在行业内率先实现实时生图,并具有画面质感超写实的特点。该模型于即日起在腾讯混元官方网站上线,并对外开放注册体验。

体验地址:

https://hunyuan.tencent.com/

相比前代模型,腾讯混元图像 2.0 模型参数量提升了一个数量级,得益于超高压缩倍率的图像编解码器以及全新扩散架构,其生图速度显著快于行业领先模型。

在同类商业产品每张图推理速度需要 5 到 10 秒的情况下,腾讯混元可实现毫秒级响应,支持用户可以一边打字或者一边说话一边出图,改变了传统 " 抽卡—等待—抽卡 " 的方式。

其图像生成质量也提升明显,通过强化学习等算法以及引入大量人类美学知识对齐,生成的图像可有效避免 AIGC 图像中的 "AI 味 " ,真实感强、细节丰富、可用性高。

在图像生成领域专门测试模型复杂文本指令理解与生成能力的评估基准 GenEval(Geneval Bench)上,腾讯混元图像 2.0 模型准确率超过 95%,远超其他同类模型。

在发布直播中,腾讯混元演示了多个不同风格的图片生成效果,除了速度快以外,生成的图片在人物特写、动物特写、复古摄影等领域都有不错表现,体现出电影级别质感画面水准。

人像摄影风格

动物特写

复古摄影

动漫风格

真实人物风格

腾讯混元图像 2.0 模型还发布了实时绘画板功能,基于模型的实时生图能力,用户在绘制线稿或调整参数时,预览区同步生成上色效果,突破了传统 " 绘制 - 等待 - 修改 " 的线性流程,可助力专业设计师的创作。

实时绘画板支持多图融合。用户上传多图后,可将多个草图叠加至同一画布自由创作,经过 AI 自动协调透视与光影,按照提示词内容生成融合图像,进一步丰富了 AI 生图的交互体验。

图源自创作者一只小娜娜

混元图像生成 2.0 模型的发布,是腾讯混元在多模态领域的又一里程碑事件。

腾讯混元在图像、视频等模态上持续投入,在 2014 年率先推出并开源了业内首个中文原生的 DiT 架构文生图开源模型以及参数量达 130 亿的腾讯混元视频生成大模型。

会上,腾讯混元还剧透了即将发布的原生多模态图像生成大模型。新模型在多轮图像生成、实时交互体验等方面有突出表现。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

腾讯 ai 效果 开源
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论