AI 视频生成也有 Skills了，@ 一下就能调用整个好莱坞剧组

Claude Skills 最近在社交媒体上刷屏。它让 AI 从会聊天变成会干活。把专业能力打包成模块，用户只用斜杠 / 一下就能选择对应的 Skills。

想做数据分析？/DataAnalyst。想写代码？/Coding Expert。AI 不再是猜我们想要什么的黑盒，变成了一个按需加载的工具箱。这个模块化的思路，现在也来到了 AI 视频生成领域。

Vidu 新上线的主体社区，把运镜、特效、氛围、表演、构图、叙事、风格、场景、招式等等，这八大类型打包成「主体库」，我们只需要在输入框里 @ 一下，就能调用。

▲在参考生视频中，输入 @，会自动弹出选择框，我们可以直接找到需要的主体

想要推镜头？@镜头库。想要赛博朋克氛围？@氛围库。想要粒子特效？@特效库。

我们甚至可以像 Claude Skills 那样叠加使用：@镜头 + @氛围 + @特效 + 角色图，一次性搞定导演、摄影师、特效师、美术指导的活儿。

以前都说 AI 要抢走好莱坞演员的饭碗，现在 Vidu 直接给每个创作者配了一个 AI 好莱坞制片厂。演员、导演、摄像全部都是 AI，只要我们 @ 一下。

这也是全球第一个 AI 视频主体社区，一个可分享、可交易、可互动的主体社区。

体验地址：https://www.vidu.cn ｜Vidu API：http://platform.vidu.cn/

APPSO 第一时间拿到了 Vidu 主体社区的测试资格，把里面的 8 大主体类型都体验了一遍，我们一起来看看它的实际表现如何。

还有给大家也准备了福利，登录 vidu.cn，输入邀请码：APPSON，注册即送 500 积分，快一起来体验吧

AI 终于学会了「演戏」

在传统 AI 视频中，最难描述的就是画面感。稍微多写几个形容词，AI 就容易产生幻觉。尤其是人物表情的僵硬，简直就是 AI 视频的硬伤。

Vidu 主体社区的表演和表情库，把这些复杂的情绪描述和动作设计，都做到了标准化。现在包括癫狂大笑、惊恐、悲伤、欢快等表演和表情主体，能够直接生成对应角色的表情和情绪状态；还有双人对打、群像对峙、浪漫依恋等招式主体，更是把角色的具体动作都安排好了。

一键 @表情，我们甚至不需要用多余的提示词，就能完美复刻主体社区里面各种表情。同时，还能兼顾到视频的完整统一性。

我们输入一张小丑的图片，使用癫狂大笑这一主体，既让小丑有更丰富的表情和动作，同时小丑的模样也没有被改变，整体画面的气氛也保持在恐怖惊悚中。

▲组合公式：@雷暴不止的@城市废墟，@图 1站在街道上，正对着镜头作出@癫狂大笑，结合剧烈的@急摇镜头，营造出强烈的@恐怖惊悚氛围

能笑，当然也能哭，使用@夸张大眼哭哭这个主体，就可以直接让画面里的角色，哭得撕心裂肺。这些表情和表演主体，能真的让 AI 视频里的角色「活」过来。

▲ 组合公式：@图 1站在镜子前，镜子里显示着她展现出@夸张大眼哭哭的表情，结合强烈的@悲伤氛围，她的哭泣越来越悲痛，同时使用@侧逆光，显示她的轮廓和镜子中清晰的哭泣表情。

不只表情控制准确，动作上，有了主体库的预设，我们可以轻轻松松地就让角色放大招。不只是角色的动作，就连视频特效，我们也是直接 @主体社区里面的对应主体，就自动添加上。

我们先在招式里面，选了一个@百花缭乱的分身。

▲组合公式：@角色 3使用@百花缭乱分身

效果还是很不错的，即使是比较复杂的@冰雨术、锁链等招式，Vidu 也基本上都能驾驭得很好。

▲组合公式：@剑圣使用@冰雨术攻击@苍玄，冰雨快要掉到@苍玄身上时，@苍玄快速使用@金钟罩来抵抗攻击

这些招式和特效，对于短剧漫剧创作者来说，简直是最佳利器。

不同的主体也能多个叠加组合，Vidu 就能给我一个精彩的玄幻武打大片。

▲组合公式：@星野仙尊面向@鬼怪打出@降龙十八掌，场景是@战场，@智能运镜

近距离的双人对打，行云流水的动作也能复刻黑客帝国了。

@ 几下就能出片，我也能做百万运镜了

解决了人物的表情和动作，接着就是画面的设计。

能控制视角，掌握观众的眼睛的镜头，是视频内容呈现当之无愧的重要部分。其中的运镜和构图，运镜能决定摄影机的运动方式，向来就是电影镜头语言的基础；而构图更是决定了画面的景别和视角。

在 Vidu 主体社区，景别包括特写、全景、鸟瞰、360 度展示等，构图也有群像对峙、三分构图、荷兰角构图等，镜头则更加丰富，包含推镜头、摇镜头、环绕镜头、探针镜头等多种运镜方式。

我们先是从主体库里，按照人物 + 风格 + 场景 + 氛围 + 运镜的方式，随机选择了一组提示词，中间甚至没有太多的连接词，用来把这些主体连起来。最后一次性呈现出来的效果，也很有好莱坞大片的风格。

▲组合公式：@紧张压抑氛围，@小李子站在@停车场，镜头先@360 度展示，再拉远到@全景展示空荡荡的停车场

其中小李子就是我们自己创建的主体，上传 1-3 张图片，选择对应的声音，然后确定风格和提示词，就能得到一个可以重复使用的人物主体。

配合 @360 度展示的环绕，进一步凸显紧张压抑的氛围，到镜头拉远，使用@全景展示，把这种视觉冲击力做到更强；短短五秒，充满了戏剧张力。

除了在这种封闭空间的运镜，Vidu 主体社区的镜头配置方案，在露天的无限空间里，表现同样优秀。

▲组合公式：@背后视角 @活力少女坐在摩天大楼边缘，@无人机拉远，@全景展现 @南京城市天际线和@敬畏崇高氛围

此外，Vidu 主体社区还提供了像@探针镜头这样的特殊镜头轨迹，很难用自然语言描述清楚摄像机的运动路径，现在直接直接调用主体就能帮我们快速实现微距穿梭。

▲组合公式：@郑开开 @科幻风格 @太空舱场景 @科技感氛围 @探针镜头

很多 AI 视频往往画质很美，动起来很假。Vidu 主体社区新增的丰富运镜，确实比以往我们输入提示词，告诉 AI 摄像机如何运动，角色如何运动，要可控和容易得多。它对那些专业镜头语言的理解，还是比较准确。

继续测试它对运镜和景别的理解能力。推镜头是最基础的电影镜头之一，从远景缓慢推进到近景，制造情绪递进感。我们先用传统方式写提示词，「Elean 在医院对面，天在下雨，镜头推进到她的脸部，然后镜头拉远，从空中鸟瞰」。

先不说这个用提示词实现的运镜如何，没有参考主体的纯文生视频有诸多不可控，例如画面的风格是否过于超现实，主体的展示是否符合情境等，我们生成了好几次，单纯用提示词的效果，几乎都把握不好这个推进到鸟瞰的速度和效果。

▲提示词版本，鸟瞰运镜下，人物都消失了，不能保持在画面中心

使用 Vidu 主体库，我们还可以直接选择主体社区中，已经有的人物形象，来生成视频。同时@镜头库选择「镜头推进」，加上简单的场景描述。第一次生成就出片了，从推进到拉远，再到鸟瞰镜头，自然过渡。

▲组合公式：@Elean在@医院对面，天在下雨，@镜头推进到她的脸部，然后再@镜头拉远的@鸟瞰运镜

这个对比很能说明问题，传统 AI 视频生成的「理解力」是飘忽的，同一个提示词每次生成都像开盲盒。而主体库相当于把这些专业概念做了标准化封装，模型不用再去猜我们想要什么效果。

不只是好看，让故事更有「代入感」

除此之外，在主体库中里面的氛围、风格和场景，决定了整个视频的味道。

具体来说，场景能决定视频的空间环境，风格决定视频的整体美术风格，氛围则是给画面的情感色彩带来了新的故事。Vidu 主体社区也提供了包括太空舱、医院、森林、咖啡店、豪华宴会厅等场景，科幻、悬疑、赛博朋克、古风等风格，以及紧张压抑、欢快、悲伤、浪漫依恋、科技感等氛围。

我们直接把一个豪华的高级宴会厅，变成一出阴森恐怖的惊悚片，配合左右摇晃的运镜，营造出从人物视角观察环境的效果，增强身临其境感。

▲组合公式：@豪华宴会厅变成@恐怖惊悚的氛围，采用@左右摇晃的运镜，整体是@悬疑电影风格

能通过环境的灯光来展现氛围变化，Vidu 主体社区的其他氛围，还能结合人物表情来呈现。

还能让 @小李子 和 @梦露，加一个@浪漫依恋氛围。Vidu 最后生成的视频光影效果很好，当全景的时候，是用比较暗的下雨天氛围，而自动推进到两个人脸部时，画面又自动提亮了。

▲测试公式：@群像对峙 @小李子和@梦露 @浪漫依恋氛围，背景是@咖啡店

通过对这些不同分类的主体进行测试，让我确认了一件事，多主体组合不是简单的「功能堆叠」，Vidu 在底层做了某种协调机制，让不同主体之间能互相配合。

这种协同感，是传统 AI 视频生成最缺少的。我们在提示词里写再多细节，模型也很难同时从里面理解到，镜头、氛围、特效的平衡。

更惊喜的是，我们不仅能直接引用主体库，来生成视频；Vidu 这次还把这些主体，做成了一个可以分享、互动和交易的社区。

▲用户可以上传自己设计的主体

我们每个人都可以设计和上传自己的主体，同时使用其他的主体，在创作和使用的过程中，Vidu 设置了资产变现模式，每一个主体都是可交易的。

配合前两天刚刚更新的 Vidu Agent 1.0 和 Vidu Q2 参考生 Pro 模型，一方面有更自动化的工作流，开箱即用，实现一键成片，灵活性与便捷性完美平衡的 Agent；全新升级后的功能，支持上传背景音乐、删减旁白、Storyboard 编辑，内置多语言，多音色，多模特，多场景的海量素材库等。

另一方面则是更强大的基座模型，能直接复刻不同视频效果的 Q2 参考生 Pro。

AI 视频生成这条路，Vidu 算是越走越明白了。

从「抽卡」到「搭乐高」

这一圈实测下来，我对 Vidu 主体社区也有了一个更清晰的判断，它除了是一个更好的工具，能帮助我们更好地生成 AI 视频，它更想要改变整个生成的工作模式。

传统 AI 视频生成是「抽卡模式」，我们写一堆提示词，祈祷模型能理解，然后赌概率。运气好抽到 SSR，运气不好全是垃圾。这种模式的问题是，创作过程不可控，专业门槛以另一种形式（说的就是提示词工程）依然存在。

而 Vidu 主体社区是「乐高模式」，把专业元素拆解成标准化的模块，我们只需要选择、组合，然后生成。这种模式的核心优势是可控性，在选择主体时，我们就大体上知道会有什么效果，而不是单纯碰运气。

这个转变对谁最有价值 ? 自媒体、短剧漫剧创作者、电商营销团队、中小企业主，他们需要批量产出有质感的视频内容，但没有专业团队和高昂预算。主体库对他们来说，相当于花小钱雇了一个「虚拟剧组」。

▲复杂的视频制作流程

那些独立创作者、设计师、广告从业者也会受益。主体库可以补齐他们的短板，不用从零学 AE 就能搞定酷炫的镜头和特效。

放到更大的行业背景下看，Vidu 主体社区让 AI 视频生成进入了「工业化阶段」的一个标志。

过去一年，AI 视频生成的主战场是谁的模型更强——可灵、Runway、Sora、Veo 都在比拼画面质量、时长、一致性。但技术到了一定阶段，竞争维度会转向「怎么生成」，也就是工作流、可控性、复用性。

这种转变，其实和 Claude Skills 的逻辑是如出一辙的。Skills 的价值不在于让 Claude 变得更聪明，而在于让它的能力变得可预期、可调用、可组合。用户不再需要猜测「这次它会不会理解我的意思」，而是明确知道「我调用了这个 Skill，它就会按这个方式工作」。

▲ Claude 提供的 Skills 选择，不同的 Skill 能直接解决对应的问题

Vidu 主体库做的也是同样的事情。它把视频生成从「抽卡游戏」变成了「精准指令」。这种确定性，才是真正降低门槛的关键。

对于真正有想法、有审美、有叙事能力的创作者来说，这其实是好事。他们终于不用被技术门槛卡住，可以把精力集中在真正重要的部分。

换句话说，Vidu 全新的主体社区，它能帮我们实现一个完美的推镜头，但不能帮我们决定这个推镜头，应该出现在故事的哪个节点、推进速度应该配合什么样的情绪节奏、这个镜头和前后镜头如何形成叙事张力。

▲主体社区包含的部分主体

这些决策，依然需要我们人类创作者的判断力和审美。

当然，它现在还有一些可以进步的空间，8 秒限制、主体库覆盖度，但这些都是可以迭代优化的。更重要的是，Vidu 主体社区开了一个头，证明了「标准化 + 可组合」这条路是走得通的。

宙世代

一起剪

相关标签