【太平洋科技快讯】2 月 12 日消息,字节跳动今日正式发布新一代视频创作模型 Seedance 2.0,采用统一多模态音视频联合生成架构,支持文字、图片、音频、视频四种模态输入,集成业界最全面的多模态参考与编辑能力。相比 1.5 版本,生成质量大幅提升,物理准确度、逼真度、可控性显著增强,更贴合工业级创作需求。目前模型已上线即梦 AI、豆包平台。



亮点方面,Seedance 2.0 在复杂场景生成可用率达业界 SOTA 水平,多主体交互与运动稳定性出色 ; 支持最多 9 张图片、3 段视频、3 段音频及自然语言混合输入,可参考构图、运镜、声音等元素 ; 指令遵循与一致性全面提升,支持稳定可控视频延长与编辑 ; 支持 15 秒多镜头音视频输出及双声道音频,可大幅降低影视、广告、电商等内容制作成本。
字节表示,Seedance 2.0 还远不完美,生成结果仍存诸多瑕疵,将持续探索大模型与人类反馈的深度对齐,让更高效、更稳定、更具想象力的音视频生产工具,服务更多创作者。



登录后才可以发布评论哦
打开小程序可以发布评论哦