驱动之家 昨天
阿里发布电影级视频模型万相2.6 首次支持角色扮演功能
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

快科技 12 月 16 日消息,阿里式推出新一代通义万相 2.6 系列模型,针对专业影视制作与图像创作场景实现突破性升级。

作为国内首个支持角色扮演功能的视频生成模型,其创新性地融合音画同步、多镜头生成、声音驱动等核心技术,构建了当前全球功能最完整的视频生成解决方案。

通义万相在模型结构上集成了多项创新技术,可对输入参考视频进行多模态联合建模与学习,参考具有时序信息的主体情绪、姿态和多角度全面视觉特征。

同时提取音色、语速等声学特征,在生成阶段作为参考条件控制,实现从画面到声音的全感官全维度一致性保持与迁移,目前万相可支持单人和多人的表演。

此次发布的万相 2.6 进一步提升了画质、音效、指令遵循等能力,单次视频时长实现国内最高的 15s。 

万相 2.6 还新增了角色扮演和分镜控制功能,不仅能一键完成单人、多人、人与物合拍的视频,还能自动实现多镜头切换等专业任务,满足专业影视级场景需求。

万相官网:

https://tongyi.aliyun.com/wan/

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

阿里 核心技术
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论