AI终于会“演”了！我们还原了一段“丝瓜汤”修罗场，微表情绝了

AI 应用方向标（公众号：ZhidxcomAI）

作者｜江宇

编辑｜漠影

智东西 9 月 25 日报道，生数科技今日正式发布新一代图生视频大模型 Vidu Q2。

新模型以 " 看 AI 演戏 " 为主题，强调 " 细微表情生成 " 的突破，支持 2 至 8 秒时长的生成视频与首尾帧模式，并在语义理解、推拉运镜、出片速度等方面全面优化，将 AI 生成视频能力从 " 生成动态 " 进化为 " 生成情绪 "。

Vidu Q2 在复杂文戏（如情绪表达）、武戏（多人打斗）、特效戏（视觉冲击）三类常见影视场景中均表现稳定，目前支持网页版、App 及 API 多端使用。

一、体验：AI 也能 " 唠叨演戏 "，角色情绪一镜到底

为了验证 Vidu Q2 在微表情与 " 演技生成 " 方面的真实提升，智东西体验了网络上爆火的 " 丝瓜汤 " 场景。

整个生成流程依托 Vidu AI 手机端完成。APP 首页共提供了三种功能模式：图生视频、参考生视频与参考生图。

其中，参考生视频和参考生图模式支持用户上传自定义图片，也可从内置的 " 主体库 " 中直接选择已有角色形象。该主体库不仅包含用户过往创作中的素材，还整合了社区内容，方便快速复用。

而图生视频功能下，Vidu Q2 模型支持 " 首尾帧生成 " 与 " 电影大片 "" 闪电出片 " 双模式，视频时长可灵活设定为 2 至 8 秒。

本次体验选择 " 图生视频 " 功能，并手动添加了收尾帧：开头帧为母亲角色，结尾帧为儿子角色。

参数设置中，智东西选用的是免费档位下画质最优配置：时长 5 秒、清晰度 1080P、生成模式为 " 电影大片 "。调用的模型版本为最新的 Vidu Q2。

实际指令设定如下：

" 妈妈问儿子喝不喝丝瓜汤，儿子表示不想喝，妈妈便开启‘洗脑’模式反复唠叨丝瓜汤的好处，如‘丝瓜汤去肝火的呀’‘丝瓜汤营养好得不得了’等。当儿子最终被说烦，大声拒绝时，妈妈反问‘你以前脾气没这么差，是不是肝火太旺？喝点丝瓜汤补补吧。’ "

生成视频约在 3 分钟内完成。从结果来看，AI 角色的表现已具备较高的形象一致性和情绪逻辑。儿子在不耐烦阶段的表情也处理得较为连贯，明显可见情绪的变化。

虽然当前版本尚未支持音画同步，但视频画面本身已具备较强的表演力，若后续叠加语音合成或角色音轨，将更贴近真实剧情片段。

从这轮体验来看，Vidu Q2 确实补上了以往 AI 视频生成中 " 表情控制 " 和 " 角色一致性 " 的关键短板，使生成内容具备初步的情绪逻辑与表现力。

二、从 " 会动 " 到 " 能演 "，AI 首次具备情绪表达能力

从 " 丝瓜汤 " 体验中 AI 对角色情绪的 " 演绎 " 出发，Vidu Q2 有多项底层技术的突破。

当前主流 AI 视频模型多以生成连贯动态为主要目标，但常陷于 " 面瘫 "" 眼神空洞 " 等问题，难以支撑复杂剧情。Vidu Q2 则将 " 情绪表达 " 作为系统性优化方向，通过对微表情生成的升级，补足了 AI 视频的情感表现力短板。

它支持呈现嘴角轻抽、眼神游移、眉头紧锁等细微肌肉动作，并通过多模态融合方式，将文本语义、图像内容、面部动作单元等信息共同驱动生成。这让角色的面部和肢体表演均具备 " 情绪逻辑 "。

功能上，Vidu Q2 新增 " 首尾帧生成 " 模式，并提供 " 电影大片 "" 闪电出片 " 两种风格选择，适配短视频创作与剧情片段表达需求：

1、在影视文戏中，Vidu Q2 可模拟人物情绪起伏；

2、在打斗动作戏中，角色面部表情与肢体动作连贯统一；

3、在广告特效中，可实现角色表演与视觉冲击效果的融合。

结语：AI 角色 " 演技上线 "，从 " 幕后 " 走向 " 台前 "

Vidu Q2 的发布，让 AI 具备了 " 可表演 " 的能力，使其在内容生成链条中不再只是 " 工具 "，而尝试从事 " 演员 " 的身份。

未来，随着音画同步、剧本驱动、角色持久记忆等能力逐步补齐，AI 将在更多文艺与商业创作场景中承担起更复杂的任务。而这，也为短视频内容生产、虚拟数字人、广告生成等赛道提供了全新可能。

宙世代