IT之家 昨天
阿里发布万相2.6系列模型,上线国内首个角色扮演功能
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

IT 之家 12 月 16 日消息,阿里发布新一代万相 2.6 系列模型,该系列模型面向专业影视制作和图像创作场景进行了全面升级,全新的万相 2.6 是国内首个支持角色扮演功能的视频模型。该模型同时支持音画同步、多镜头生成及声音驱动等功能,是全球功能最全的视频生成模型。万相 2.6 已同步上线阿里云百炼、万相官网。

IT 之家附官方介绍如下:

万相 2.6 视频生成升级亮点

角色扮演

万物皆可入戏,万相 2.6 能参考输入视频中的角色外观和音色、实现角色扮演,按照提示词生成单人、多人、人与物合拍的视频。

多镜头叙事

万相 2.6 可将用户简单的提示词转换为多分镜脚本,生成包含多个镜头的连贯叙事视频,并且保持多镜头间的主体、场景等关键信息的一致性。

自然音画同步

多人对话场景稳定生成,真实自然的人声表达,声音质感提升,更好听的音乐和歌曲生成。

15s 长视频生成

生成视频最长 15s(参考生视频 10s),提升画面时空内容容量,支持更完整叙事。

音频驱动生成

万相 2.6 可根据用户输入的文本和音频,驱动生成视频,并实现多镜头演绎。

万相 2.6 文生图升级亮点

艺术风格的高度美学与可控性

精准捕捉艺术灵魂:对各类风格关键词理解深入,还原度更高,画面整体风格统一且完整。

风格融合自然流畅:支持多种艺术风格有机融合,过渡平滑,创作出独具一格的视觉作品。

细节刻画生动丰富:对「肌理、色彩、笔触」等细节的呈现更为到位,赋予图像故事感与表现力。

真实人像质感,光影细节到位

在写实人像生成中,人物神态自然、肤质真实,有效削弱 "AI 感 "。模型综合优化构图与光影,呈现更具表现力的人像视角。

文字生成,图表、插画与海报设计

可依据中英文长文本内容,结合美学设计与图文协调性,精准生成海报、图文说明、信息图表等,实现内容与视觉的高度统一。

万相 2.6 图像生成升级亮点

图文混排输出

多张图片和文字一体化生成,具备逻辑推理能力,实现有层次、有逻辑的视觉化叙事。

多图融合生成

多张图片的任意参考、组合或替换,融合多重视觉灵感,生成全新创意图像。

商用级一致性保持

保持角色、风格或元素的高度一致,拓展商业级使用场景。

美学要素迁移

提取参考图的颜色、风格、构图等创意灵感,实现美学参考生成。

镜头和光影精准控制

可指定镜头视角、近远景及光影细节,实现对画面空间与氛围的精确调控。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

阿里 it之家 阿里云 远景 考生
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论