阿里发布万相2.6首度支持角色扮演，千问已接入该模型并上线「AI小剧场」

" 万相模型家族支持 10 多种视觉创作能力，已广泛应用于 AI 漫剧、广告设计和短视频创作等领域。"

作者：苏打

编辑：tuya

出品：财经涂鸦（ID：caijingtuya）

公司情报专家《财经涂鸦》获悉，12 月 16 日，阿里发布国内首个支持角色扮演功能的视频模型——新一代万相 2.6 系列模型，面向专业影视制作和图像创作场景进行全面升级。

该模型同时支持音画同步、多镜头生成及声音驱动等功能，目前已同步上线阿里云百炼、万相官网。

当天，千问 APP 亦迅速上线 "AI 小剧场 " 功能，提供 Sora2 同款玩法，并宣布接入万相 Wan2.6 模型。原创方向，该功能可支持定制个人 AI 分身，生成原创视频，并邀请好友合拍；二创方面，用户可基于分享的视频模版，上传图片替换人物和自己，增加创意。

今年 9 月，阿里曾在国内发布音画同步的视频生成模型万相 2.5，极大提升了视频创作效率。在权威大模型评测集 LMArena 上，万相图生视频位居国内第一。

截至目前，万相模型家族已支持文生图、图像编辑、文生视频、图生视频、人声生视频、动作生成、角色扮演及通用视频编辑等 10 多种视觉创作能力，已广泛应用于 AI 漫剧、广告设计和短视频创作等领域。

此次发布的万相 2.6 在画质、音效、指令遵循等方面有进一步提升，单次视频时长实现国内最高的 15s，并新增了角色扮演和分镜控制功能，不仅能一键完成单人、多人、人与物合拍的视频，还能自动实现多镜头切换等专业任务，满足专业影视级场景需求。

据介绍，通义万相在模型结构上集成了多项创新技术，可对输入参考视频进行多模态联合建模与学习，参考具有时序信息的主体情绪、姿态和多角度全面视觉特征，同时提取音色、语速等声学特征，在生成阶段作为参考条件控制，实现从画面到声音的全感官全维度一致性保持与迁移，目前可支持单人和多人的表演。

在分镜控制上，通义万相能通过高层语义理解，将原始输入构建为具备完整故事线与叙事张力的专业级多镜头段落，在多镜头丝滑切换的过程中保持核心主体、场景布局和环境氛围统一建模，确保全片在内容、节奏和氛围上的高一致性。

同时，角色扮演功能可令普通用户也能在影视级画面里表现精湛的演技。例如，用户上传一段个人视频，并输入一段科幻悬疑风格的提示词，万相 2.6 即可快速完成分镜设计、角色演绎、画面配音等环节工作，生成一段镜头叙事完整、电影级运镜的短片。

面向广告设计、短剧制作等专业场景，通过输入连续提示词，万相还能生成一段完整叙事的短片，让人人都能当导演。例如，输入一段广告创意的提示词，万相 2.6 能生成一段包含人物角色和商品的广告视频，并且在多镜头切换的情况下保持主体、场景等关键信息的一致性。

自发布当日，公众可直接在万相官网体验万相 2.6。企业用户可能通过阿里云百炼调用模型 API。

本文由公众号财经涂鸦（ID：caijingtuya）原创撰写，如需转载请联系涂鸦君。

添加涂鸦君个人微信（ID：tuyaclub）

加入【公司情报社群】

参与资本市场讨论

获取一手情报

宙世代