
Claude Skills 最近在社交媒体上刷屏。它让 AI 从会聊天变成会干活。把专业能力打包成模块,用户只用斜杠 / 一下就能选择对应的 Skills。
想做数据分析?/DataAnalyst。想写代码?/Coding Expert。AI 不再是猜我们想要什么的黑盒,变成了一个按需加载的工具箱。这个模块化的思路,现在也来到了 AI 视频生成领域。
Vidu 新上线的主体社区,把运镜、特效、氛围、表演、构图、叙事、风格、场景、招式等等,这八大类型打包成「主体库」,我们只需要在输入框里 @ 一下,就能调用。

▲在参考生视频中,输入 @,会自动弹出选择框,我们可以直接找到需要的主体
想要推镜头?@镜头库。想要赛博朋克氛围?@氛围库。想要粒子特效?@特效库。
我们甚至可以像 Claude Skills 那样叠加使用:@镜头 + @氛围 + @特效 + 角色图,一次性搞定导演、摄影师、特效师、美术指导的活儿。

以前都说 AI 要抢走好莱坞演员的饭碗,现在 Vidu 直接给每个创作者配了一个 AI 好莱坞制片厂。演员、导演、摄像全部都是 AI,只要我们 @ 一下。
这也是全球第一个 AI 视频主体社区,一个可分享、可交易、可互动的主体社区。

体验地址:https://www.vidu.cn |Vidu API:http://platform.vidu.cn/
APPSO 第一时间拿到了 Vidu 主体社区的测试资格,把里面的 8 大主体类型都体验了一遍,我们一起来看看它的实际表现如何。
还有给大家也准备了福利,登录 vidu.cn,输入邀请码:APPSON,注册即送 500 积分,快一起来体验吧
AI 终于学会了「演戏」
在传统 AI 视频中,最难描述的就是画面感。稍微多写几个形容词,AI 就容易产生幻觉。尤其是人物表情的僵硬,简直就是 AI 视频的硬伤。
Vidu 主体社区的表演和表情库,把这些复杂的情绪描述和动作设计,都做到了标准化。现在包括癫狂大笑、惊恐、悲伤、欢快等表演和表情主体,能够直接生成对应角色的表情和情绪状态;还有双人对打、群像对峙、浪漫依恋等招式主体,更是把角色的具体动作都安排好了。
一键 @表情,我们甚至不需要用多余的提示词,就能完美复刻主体社区里面各种表情。同时,还能兼顾到视频的完整统一性。
我们输入一张小丑的图片,使用癫狂大笑这一主体,既让小丑有更丰富的表情和动作,同时小丑的模样也没有被改变,整体画面的气氛也保持在恐怖惊悚中。

▲组合公式:@雷暴不止的@城市废墟,@图 1站在街道上,正对着镜头作出@癫狂大笑,结合剧烈的@急摇镜头,营造出强烈的@恐怖惊悚氛围
能笑,当然也能哭,使用@夸张大眼哭哭这个主体,就可以直接让画面里的角色,哭得撕心裂肺。这些表情和表演主体,能真的让 AI 视频里的角色「活」过来。

▲ 组合公式:@图 1站在镜子前,镜子里显示着她展现出@夸张大眼哭哭的表情,结合强烈的@悲伤氛围,她的哭泣越来越悲痛,同时使用@侧逆光,显示她的轮廓和镜子中清晰的哭泣表情。
不只表情控制准确,动作上,有了主体库的预设,我们可以轻轻松松地就让角色放大招。不只是角色的动作,就连视频特效,我们也是直接 @主体社区 里面的对应主体,就自动添加上。
我们先在招式里面,选了一个@百花缭乱的分身。

▲组合公式:@角色 3使用@百花缭乱分身
效果还是很不错的,即使是比较复杂的@冰雨术、锁链等招式,Vidu 也基本上都能驾驭得很好。

▲组合公式:@剑圣使用@冰雨术攻击@苍玄,冰雨快要掉到@苍玄身上时,@苍玄快速使用@金钟罩来抵抗攻击
这些招式和特效,对于短剧漫剧创作者来说,简直是最佳利器。
不同的主体也能多个叠加组合,Vidu 就能给我一个精彩的玄幻武打大片。

▲组合公式:@星野仙尊面向@鬼怪打出@降龙十八掌,场景是@战场,@智能运镜
近距离的双人对打,行云流水的动作也能复刻黑客帝国了。


@ 几下就能出片,我也能做百万运镜了
解决了人物的表情和动作,接着就是画面的设计。
能控制视角,掌握观众的眼睛的镜头,是视频内容呈现当之无愧的重要部分。其中的运镜和构图,运镜能决定摄影机的运动方式,向来就是电影镜头语言的基础;而构图更是决定了画面的景别和视角。
在 Vidu 主体社区,景别包括特写、全景、鸟瞰、360 度展示等,构图也有群像对峙、三分构图、荷兰角构图等,镜头则更加丰富,包含推镜头、摇镜头、环绕镜头、探针镜头等多种运镜方式。
我们先是从主体库里,按照人物 + 风格 + 场景 + 氛围 + 运镜的方式,随机选择了一组提示词,中间甚至没有太多的连接词,用来把这些主体连起来。最后一次性呈现出来的效果,也很有好莱坞大片的风格。

▲组合公式:@紧张压抑氛围,@小李子站在@停车场,镜头先@360 度展示,再拉远到@全景展示空荡荡的停车场
其中小李子就是我们自己创建的主体,上传 1-3 张图片,选择对应的声音,然后确定风格和提示词,就能得到一个可以重复使用的人物主体。

配合 @360 度展示的环绕,进一步凸显紧张压抑的氛围,到镜头拉远,使用@全景展示,把这种视觉冲击力做到更强;短短五秒,充满了戏剧张力。
除了在这种封闭空间的运镜,Vidu 主体社区的镜头配置方案,在露天的无限空间里,表现同样优秀。

▲组合公式:@背后视角 @活力少女坐在摩天大楼边缘,@无人机拉远,@全景展现 @南京城市天际线和@敬畏崇高氛围
此外,Vidu 主体社区还提供了像@探针镜头这样的特殊镜头轨迹,很难用自然语言描述清楚摄像机的运动路径,现在直接直接调用主体就能帮我们快速实现微距穿梭。

▲组合公式:@郑开开 @科幻风格 @太空舱场景 @科技感氛围 @探针镜头
很多 AI 视频往往画质很美,动起来很假。Vidu 主体社区新增的丰富运镜,确实比以往我们输入提示词,告诉 AI 摄像机如何运动,角色如何运动,要可控和容易得多。它对那些专业镜头语言的理解,还是比较准确。
继续测试它对运镜和景别的理解能力。推镜头是最基础的电影镜头之一,从远景缓慢推进到近景,制造情绪递进感。我们先用传统方式写提示词,「Elean 在医院对面,天在下雨,镜头推进到她的脸部,然后镜头拉远,从空中鸟瞰」。
先不说这个用提示词实现的运镜如何,没有参考主体的纯文生视频有诸多不可控,例如画面的风格是否过于超现实,主体的展示是否符合情境等,我们生成了好几次,单纯用提示词的效果,几乎都把握不好这个推进到鸟瞰的速度和效果。

▲提示词版本,鸟瞰运镜下,人物都消失了,不能保持在画面中心
使用 Vidu 主体库,我们还可以直接选择主体社区中,已经有的人物形象,来生成视频。同时@镜头库选择「镜头推进」,加上简单的场景描述。第一次生成就出片了,从推进到拉远,再到鸟瞰镜头,自然过渡。

▲组合公式:@Elean在@医院对面,天在下雨,@镜头推进到她的脸部,然后再@镜头拉远的@鸟瞰运镜
这个对比很能说明问题,传统 AI 视频生成的「理解力」是飘忽的,同一个提示词每次生成都像开盲盒。而主体库相当于把这些专业概念做了标准化封装,模型不用再去猜我们想要什么效果。
不只是好看,让故事更有「代入感」
除此之外,在主体库中里面的氛围、风格和场景,决定了整个视频的味道。
具体来说,场景能决定视频的空间环境,风格决定视频的整体美术风格,氛围则是给画面的情感色彩带来了新的故事。Vidu 主体社区也提供了包括太空舱、医院、森林、咖啡店、豪华宴会厅等场景,科幻、悬疑、赛博朋克、古风等风格,以及紧张压抑、欢快、悲伤、浪漫依恋、科技感等氛围。
我们直接把一个豪华的高级宴会厅,变成一出阴森恐怖的惊悚片,配合左右摇晃的运镜,营造出从人物视角观察环境的效果,增强身临其境感。

▲组合公式:@豪华宴会厅变成@恐怖惊悚的氛围,采用@左右摇晃的运镜,整体是@悬疑电影风格
能通过环境的灯光来展现氛围变化,Vidu 主体社区的其他氛围,还能结合人物表情来呈现。
还能让 @小李子 和 @梦露,加一个@浪漫依恋氛围。Vidu 最后生成的视频光影效果很好,当全景的时候,是用比较暗的下雨天氛围,而自动推进到两个人脸部时,画面又自动提亮了。

▲测试公式:@群像对峙 @小李子和@梦露 @浪漫依恋氛围,背景是@咖啡店
通过对这些不同分类的主体进行测试,让我确认了一件事,多主体组合不是简单的「功能堆叠」,Vidu 在底层做了某种协调机制,让不同主体之间能互相配合。
这种协同感,是传统 AI 视频生成最缺少的。我们在提示词里写再多细节,模型也很难同时从里面理解到,镜头、氛围、特效的平衡。
更惊喜的是,我们不仅能直接引用主体库,来生成视频;Vidu 这次还把这些主体,做成了一个可以分享、互动和交易的社区。

▲用户可以上传自己设计的主体
我们每个人都可以设计和上传自己的主体,同时使用其他的主体,在创作和使用的过程中,Vidu 设置了资产变现模式,每一个主体都是可交易的。
配合前两天刚刚更新的 Vidu Agent 1.0 和 Vidu Q2 参考生 Pro 模型,一方面有更自动化的工作流,开箱即用,实现一键成片,灵活性与便捷性完美平衡的 Agent;全新升级后的功能,支持上传背景音乐、删减旁白、Storyboard 编辑,内置多语言,多音色,多模特,多场景的海量素材库等。
另一方面则是更强大的基座模型,能直接复刻不同视频效果的 Q2 参考生 Pro。
AI 视频生成这条路,Vidu 算是越走越明白了。
从「抽卡」到「搭乐高」
这一圈实测下来,我对 Vidu 主体社区也有了一个更清晰的判断,它除了是一个更好的工具,能帮助我们更好地生成 AI 视频,它更想要改变整个生成的工作模式。
传统 AI 视频生成是「抽卡模式」,我们写一堆提示词,祈祷模型能理解,然后赌概率。运气好抽到 SSR,运气不好全是垃圾。这种模式的问题是,创作过程不可控,专业门槛以另一种形式(说的就是提示词工程)依然存在。
而 Vidu 主体社区是「乐高模式」,把专业元素拆解成标准化的模块,我们只需要选择、组合,然后生成。这种模式的核心优势是可控性,在选择主体时,我们就大体上知道会有什么效果,而不是单纯碰运气。
这个转变对谁最有价值 ? 自媒体、短剧漫剧创作者、电商营销团队、中小企业主,他们需要批量产出有质感的视频内容,但没有专业团队和高昂预算。主体库对他们来说,相当于花小钱雇了一个「虚拟剧组」。

▲复杂的视频制作流程
那些独立创作者、设计师、广告从业者也会受益。主体库可以补齐他们的短板,不用从零学 AE 就能搞定酷炫的镜头和特效。
放到更大的行业背景下看,Vidu 主体社区让 AI 视频生成进入了「工业化阶段」的一个标志。
过去一年,AI 视频生成的主战场是谁的模型更强——可灵、Runway、Sora、Veo 都在比拼画面质量、时长、一致性。但技术到了一定阶段,竞争维度会转向「怎么生成」,也就是工作流、可控性、复用性。
这种转变,其实和 Claude Skills 的逻辑是如出一辙的。Skills 的价值不在于让 Claude 变得更聪明,而在于让它的能力变得可预期、可调用、可组合。用户不再需要猜测「这次它会不会理解我的意思」,而是明确知道「我调用了这个 Skill,它就会按这个方式工作」。

▲ Claude 提供的 Skills 选择,不同的 Skill 能直接解决对应的问题
Vidu 主体库做的也是同样的事情。它把视频生成从「抽卡游戏」变成了「精准指令」。这种确定性,才是真正降低门槛的关键。
对于真正有想法、有审美、有叙事能力的创作者来说,这其实是好事。他们终于不用被技术门槛卡住,可以把精力集中在真正重要的部分。
换句话说,Vidu 全新的主体社区,它能帮我们实现一个完美的推镜头,但不能帮我们决定这个推镜头,应该出现在故事的哪个节点、推进速度应该配合什么样的情绪节奏、这个镜头和前后镜头如何形成叙事张力。

▲主体社区包含的部分主体
这些决策,依然需要我们人类创作者的判断力和审美。
当然,它现在还有一些可以进步的空间,8 秒限制、主体库覆盖度,但这些都是可以迭代优化的。更重要的是,Vidu 主体社区开了一个头,证明了「标准化 + 可组合」这条路是走得通的。


登录后才可以发布评论哦
打开小程序可以发布评论哦