9 月 25 日,生数科技正式发布新一代图生视频大模型 Vidu Q2。新模型以 "Vidu Q2 看 AI 演戏 " 为主题," 细微表情生成 " 为核心提升场景,在极致表情变化、推拉运镜、生成速度及语义理解方面取得的突破性进展,实现从 " 生成视频 " 到 " 生成演技 ",从 " 动态流畅 " 到 " 情感表达 " 的革命性跨越,标志着 AI 视频生成技术正式从追求 " 形似 " 进入追求 " 神似 " 的新阶段,将为内容创作、影视产业、广告营销等领域带来全新升级。
本次更新的 Vidu Q2 主要包括图生视频、首尾帧视频、时长可选(2-8s)、电影大片及闪电出片两种模式,在复杂表情变化的文戏,常见的多人打斗场景的武戏,及影视剧情中令人震撼的炫酷特效中表现出彩,能够通过媲美人类的 AI 真实表演,将 AI 演技强力渗透影视、短视频剧情创作、广告创意等生产力场景,推动 AI 视频生成主角从原本僵硬、机械、无感情的 "AI 木头 " 提升为灵动、有情感、会演戏 "AI 人 "。
突破技术壁垒,AI 视频从 " 能动 " 到 " 会演 "
当前,AI 视频生成已能实现基本的动作连贯,但生成的角色往往表情僵硬、眼神空洞,缺乏细节和打动人心的情感表达,AI 生成视频中的角色也常被诟病为 " 面瘫 " 或表情僵化,这成为制约 AI 行业规模化发展的关键瓶颈。
Vidu Q2 的诞生,正是为了突破这一 " 最后一道壁垒 "。它能够理解并生成极其细腻的面部微表情,例如嘴角不经意的抽动、眼神中一闪而过的犹豫、眉头微蹙表达的疑虑等。这些细微、短暂且不受意识控制的表情,是人类传递复杂、真实情感的关键。Vidu Q2 在细微表情生成中的成功技术攻克,使数字角色能够展现出生动且充满感染力的演技。
Vidu Q2 宣传海报
生数科技首席执行官骆怡航表示,"Vidu Q2 的突破在于我们首次让 AI 角色拥有了‘有趣的灵魂’。我们教会了 AI ‘演戏’,这不仅是技术的里程碑,更是通向更高级别人工智能不可或缺的一步。"
这一突破得益于 Vidu Q2 在多模态理解与生成技术上的深度融合。模型通过深度理解情感文本、图文解析,并结合对人体面部动作单元的精细解构与物理模拟,从而在视频中驱动角色面部肌肉、肢体肌肉产生符合情感逻辑的细微运动。除了微表情,Vidu Q2 在生成可控及一致性等方面也有了多方位超越。
构建高效能产品矩阵,多场景应用效能跃升
在突破性的 " 演技 " 能力之下,Vidu Q2 将 AI 化身演技派 ,构建了一套面向实际应用的高效能产品矩阵。本次发布的首尾帧、双出片模式及 2-8 秒筛选等兼顾出片质量与效率的产品设计模式,网页版、App 版及 API 同步上线的多渠道化,使得 Vidu Q2 能够灵活适配从高端影视制作到快速社交媒体内容生产的不同需求,并让用户与客户都能快速体验。
以 " 更大的幅度 × 更牛的运镜 × 更快的速度 = Vidu Q2" 的创作效率革命公式,在实际应用中,Vidu Q2 展现出强大的场景适应性。在需要细腻情感表达的 " 感情 " 中,它能精准刻画角色的内心冲突;在复杂的 " 动作 " 多人打斗场景中,它能确保每个角色的动作流畅且表情到位;而在需要视觉冲击力的特效场景中,它更能生成与角色表演完美融合的炫酷效果。这种全方位的表现,使其成为一个真正意义上的 " 全能型 " 创作伙伴。
引领人机协作,赋能每一个故事讲述者
Vidu Q2 的发布,标志着内容创作范式的一次根本性转移。它并非简单的工具迭代,而是作为 " 表演主体 " 重新定义了 AI 在创作链中的角色。这意味着,创意生产的核心模式将从 " 人执行 " 转向 " 人指导 ",创作者得以从繁琐的实现过程中解放,将精力专注于最核心的创意与审美。
随着技术的持续演进,生数科技 Vidu Q2 正在开启一个 " 人机共创 " 的新纪元:AI 负责精准、高效地完成 " 表演 ",人类则扮演 " 总导演 " 的角色,把控故事的灵魂与情感表达。这种深度协作将极大释放生产力,催生此前难以想象的创意形式,推动 AI 逐步深入电影预演、虚拟人交互等更复杂的工业流程,由 AI 承担表演、人类主导创意的协作模式,必将释放出更大的想象空间与商业价值。


登录后才可以发布评论哦
打开小程序可以发布评论哦