
" 一定要有梗才能留住人 "。
10 月下旬,一条名为《把远古沧龙做成六道菜(上)》的视频在 B 站爆火,上线三天播放量冲上 700 万。关键这是一段完全由 AI 生成的视频,时长 6 分 23 秒,按以往规律,这两个 buff 叠在一起,是很难被流量眷顾的。
毕竟不少人对 AI 做的内容是 " 排斥的 ",但这条视频下的近 5000 评论中,多是对 AI 快速精进的画面质量与作者对 AI 掌控力的双重震惊。
这条片子确实也跟以往的多数 AI 视频不一样,它不切石头也不是小猫做饭,而是几个国家的厨师进行一场烹饪比赛,食材则为一条沧龙。是的,沧龙——一种 6500 万年前就已经灭绝的远古生物——把它做成菜,没见过吧。
开头是一群老外拿着锯锯肉和剁比人还高的排骨的宏大画面,镜头拉近、旋转、快速转换,人物出场冲突爆发,情节紧凑而有张力,一下便抓住了观众的注意力。

●《把远古沧龙做成六道菜(上)》视频开头
而要让人在这 6 分 23 秒中不流失,才是最难且重要的。为此,B 站 UP 主 " 黄浦江三文鱼 "(以下简称 " 三文鱼 ")上了很多 " 手段 " ——
比如贯穿视频的各种热梗。首先登场的印度厨师做的 " 九转大肠 ";中国厨师是来自上海的 " 辛西娅 ",出场时自配背景音乐和解说,比如这句耳熟能详的 " 最高端的食材,往往只需要最简单的烹饪方式 " ……因为 " 三文鱼 " 深信" 一定要有梗才能留住人 "。
在此之上最基础的,是能够以假乱真的 AI 画面," 不能说是一模一样,争取 90% 真 "。以至于曾有网友开杠 " 你明明就是实拍的,硬要说自己是 AI"。" 三文鱼 " 也不辩驳,说是的," 龙是我前几天刚去南海钓的 "。
要呈现如此高质量的画面,并保持多个人物前后的一致性并非易事,据说其中一个带有特效的画面在生成时," 三文鱼 " 写满了一整页文档。而提示词给到大模型,也不是一次就能生成完美可用的视频片段,往往是需要多次生成,然后选取其中一段更符合创作者需要的,而这个过程就像抽盲盒,在 AI 生成领域也被称为 " 抽卡 "。

● " 黄浦江三文鱼 " 写的提示词
在目前视频模型普遍只能生成 5 秒、最多 10 秒片段的情况下,理论上这段 6 分 23 秒的视频至少需要 75 个 5 秒镜头拼接,但实际上这条视频他生成了 1000 多条素材,有些镜头抽卡次数过百。
在这条播放量已达 740 万的视频下,有人评论说," 这是 AI 诞生以来,我看到的最牛逼的一个 AI 视频。"
实际上,28 岁的 " 三文鱼 " 的本职是一名会计。三年前 AI 刚刚在大众应用层面冒头时,他就迅速跟上形势开始学习,从图片到建模再到跑动画,一个月才能做出一小段,而现在他 " 一天能做出好几个小段 "。
尤其是在今年春节后,他发现真的能百分百用 AI 完成一个小的广告宣传片了,虽然糙了点儿,但确实能交付了。他看到了大模型的飞速进步,于是 " 铁了心要往这行业去靠近了。" 毕竟,他从小的梦想是当导演。
所以这次《把远古沧龙做成六道菜(上)》的爆发并非偶然,除去大模型在短时间内翻天覆地的进步外,还是 " 三文鱼 " 对流量蓄谋已久的一场猎获。
在这条视频之前的一个月,他以每周一更的频率上线了三条以烹饪恐龙为主题的视频,像是一场打前战的 A/B testing ——
第一期《把霸王龙做成三道菜》单纯做菜,把想法落实,无主线人物;
第二期《上海主理人把翼龙做成三菜一汤》加入主线人物上海厨师辛西娅,有梗。受众反响激烈的;
第三期《广州人把三角龙做成一日三餐》去掉主线人物,但加入《中华小当家》等元素,效果回落。
三期视频过后," 三文鱼 " 已经基本掌握了打造 AI 视频爆款的逻辑。他会故意在视频中落下一些穿帮镜头,比如辛西娅经常把手放在滾烫到锅上面,为的就是让大家讨论起来,而热烈的讨论会将视频推向更广阔的流量池。
当然,还有不可忽视的外部环境的变化——各大内容平台及受众对 AI 生成内容接受度的大幅提升。B 站的热门视频中多数都带有 AI 元素,甚至还出现了 AI 生成的 NPC 歌唱大赛;快手也宣称 " 希望用可灵更多赋能平台内创作者,期待平台内产生更多高质量的 AI 长内容。"
而一个月前,AI 视频生成模型 sora2 和 veo3.1 又开始神仙打架,模型能力飞升,敏锐的 " 三文鱼 " 显然已经下了判断——时机已然成熟。
11 月 9 日," 三文鱼 " 更新了《把远古沧龙做成六道菜(下)》,截止到 13 日中午播放量也已近 234 万,而他的 B 站粉丝也已涨到 7.1 万,后台的合作邀约更是纷至沓来。目前看来,他向全职 AI 设计师的转型已经步入正轨了。
11 月初," 未来人类实验室 " 跟 " 黄浦江三文鱼 " 进行了一场对话,聊了聊这条爆款视频背后的巧思、制作与未来规划。以下为对话内容,经整理发布——

" 想到会好,没想到这么好 "
未来人类实验室:前三个视频基本都是每周一更,《把远古沧龙做成六道菜(上)》这期中间隔了 16 天,时间主要花在哪儿了?
黄浦江三文鱼:制作上面不会花太久,主要是在前期的脚本和提示词的梳理。这个剧本在脑海里面默默想了有一个礼拜。谁赢、谁输、每个人的性格怎么样、做的是什么菜、最后决赛会是怎么样……我是把整个故事大概的框架构思完之后,再去做了第一期里面(印度厨师和辛西娅)这两个人。开始自己动手之后,一个多礼拜就赶出来了,当然每天也要熬点夜。
未来人类实验室:你想过这条视频会这么火吗?
黄浦江三文鱼:我想过它会好,但是没想到它会这么好。我预估最多 100 万(播放量)。我是晚上 10:30 发的,发完我就去睡觉了也没管,第二天就已经破 100 万了。私信炸了,有一些合作,更多是在探讨这个怎么做的,让分享一下,他们说跟我玩的 AI 好像不是一个产品。
未来人类实验室:我之前跟一个专门做 AI 产品测评的博主聊过,我们会觉得这条视频爆的原因更多在于整个故事的编排、密集的梗和画面的快速切换上,我看你基本 1-2 秒就会切换一个镜头。AI 的呈现反而是次要的。
黄浦江三文鱼:对。我理解中有人愿意看的视频是比较抽象比较好笑,娱乐大众的。另一块是制作精良,画面毕竟是 AI 做的,但不能犯太多错误,我争取把 AI 做到更真实,不能说是一模一样,争取 90% 真。第三个就是迎合一些网络上的热梗,相当于蹭流量。这三个加起来,我觉得是这条视频成功的原因。
一定要有梗才能留住人,就单纯的去烧菜,我感觉最多也就十几万三十几万播放。
未来人类实验室:你很懂流量啊。视频里还有哪些设计是能够获取流量的吗?
黄浦江三文鱼:我会在 AI 做的真实画面里故意加一些让大家觉得是破绽的东西。比如辛西娅经常喜欢把手放在滚烫的锅上面,这个时候大家就说穿帮了,因为如果你这个地方评论多了,它可能会被推到下一个流量层级,所以我会故意做一些会比较容易引发评论和探讨的东西在里面。

●辛西娅把手放在锅上
未来人类实验室:你好狡猾。
黄浦江三文鱼:这个画面其实挺好玩,大家都觉得叫铁砂掌还是什么无情铁手这种东西。其实做的好的素材我是有的,她不扶着滚烫的锅,但是我思考了一下,还是把废片保留了。
未来人类实验室:所以你是刻意留了一些这种口子让大家去讨论。
黄浦江三文鱼:对。包括煎黑松露,很多人讨论这段,他们说黑松露一煎就不好吃了,也有人说黑松露是可以煎的,还有人说鸡油菌怎么能配黑松露呢?很多专业的大厨过来说确实可以这么做,还有人说要复刻一下。其实是我想黑松露煎一下的话会不会好吃,还随便加了几个云南比较有特色的菌菇,这种无厘头的东西丢进去让网友去讨论。
未来人类实验室:你是怎么发现这些规律的?
黄浦江三文鱼:也是根据前几次的作品来的,这些厨师炒菜的时候,我有一些没注意到,他手就会在明火上面穿来穿去。但当时给我的感觉,这个画面一来,大家就开始弹幕刷起来说穿帮、无情铁手什么的,我就想之后在这种方面适当加一些 AI 的穿帮,也会让大家觉得不是实拍。
因为有些人会过来私信我说 " 你明明就是实拍的,硬要说自己是 AI",或者 " 你明明就是实拍穿插了小部分的 AI,你硬要说是 AI 做的来骗大家 "。我就两个目的,一个是给大家博一笑,另外就是说确实全是 AI 做的。
未来人类实验室:当有人说你这个是实拍的时候,你会觉得开心吗?
黄浦江三文鱼:也算对我实力的一种认可,开心是有一点的。我也会回他说 " 没错,我是实拍的,龙是我前几天刚去南海钓的,或者在广州刚抓回来的 "。

以假乱真
未来人类实验室:怎么想到用恐龙做菜的?
黄浦江三文鱼:当时我看了一些国内的 AI 作品,大家做的都是一样的东西,用刀把石头切下来、小猫做饭,就是做一种 ASMR,火了一个之后,另外的就开始抄。
我更想去用 AI 讲一个故事,我再去看,发现他们确实是把故事讲了,但整个画面第一眼就感觉是 AI,我想能不能再在画面上精进一下,突出大家愿意看的东西,就是跟所有人的故事都不一样。
我当时在吃饭,就想 AI 如果去做牛羊肉的话,大家就觉得不新奇,既然是 AI 了,我能不能尝试一下,大家都想看,但是永远都看不到的东西,比如说吃恐龙。这个想法一下子就在我心中,我觉得这个事情肯定会爆,然后就立马去把这个东西做出来了。
我平时喜欢看《地狱厨房》和动漫,结合这些看看能不能做一些好玩的东西出来。大家都很喜欢做一些《山海经》里面的怪物,或者一些神话里的人物,一看就是 AI 或者虚构的。我更喜欢落到现实里面,现在 AI 你想到什么就能帮你实现什么,所以我看看能不能以假乱真,把我的创意给试一下最大程度的表现出来。
未来人类实验室:如何把 AI 做到 90% 真?有哪些画面是比较难做的吗?
黄浦江三文鱼:人物有一些复杂的动作,比如说摔碗或者骂人,这种动作怎样让它表现得更真实更自然,其实是一个比较复杂的点。比如戈登摔碗那段,到最后也不是很连贯,那段画面我做了 100 多个视频素材,他怎么都不愿意摔,不知道,他可能想吃这个东西。摔了以后这个碗会非常抽象,反正很难保证它的稳定性。
还有涉及到一些特效的部分,比如辛西娅半蹲下来挥出一掌,打出了一条龙,这个动作会比较复杂,毕竟是这么连贯的动作,加上还有特效,还要保证人物的一致性,这应该写了一页纸的 word 文档或者更多(提示词),还有龙拿着一个辣椒和一个松露在厨师面前喷火,这种特效画面的提示词会特别多。

●辛西娅挥掌打龙
未来人类实验室:制作《把远古沧龙做成六道菜(上)》这条视频主要用了哪些模型或 AI 工具?如何适配?
黄浦江三文鱼:先用 Gemini、ChatGPT 梳理镜头脚本、优化提示词 2.0;再用即梦或 Nano banana P 图;视频生成 80% 都是 Veo 3,真实程度比较高,但不熟悉中国题材;所以偶尔还会用到可灵,多数东方人物或者爆炒这些中餐画面会用到;还有一个本地的模型就是 wan2.2,动作生成方面比较好。还有一些配音的,比如说 Heygen,还有 minimax,基本上市面上有的,比较主流的我都用。
未来人类实验室:你每段素材都是 5 秒 5 秒的出吗?
黄浦江三文鱼:都有,5 秒 10 秒 8 秒,如果这个镜头特别难跑,我就三个模型一起开始跑,平台也好,本地跑也好。
未来人类实验室:这条视频的制作成本有多高?
黄浦江三文鱼:其实一个月包会员下来已经上千块钱,但 token 肯定不够用了,还要再额外去付一些 token,再加上本地跑的这些算力,四五千好像有的。关键还是时间成本比较多,人会比较累,每天晚上做到凌晨 3 点,第二天 8 点多起来。晚上越做越兴奋,白天就累得像鬼一样,要喝两杯加浓的一升咖啡。买咖啡的钱都已经上百上千了。
未来人类实验室:评论里好多人问你怎么在这么长的视频当中保持人物的一致性的?
黄浦江三文鱼:一个是大家最熟悉的图生视频,你每个镜头的第一帧保证都是这个人,他动起来的画面里面大概率也是这个人。
另外就是你的提示词很准确,甚至描述到她眉毛和脸上的一些轮廓,比如韩国厨师笑起来是有苹果肌的,你能把她的苹果肌这种描述的那么细,一致性也会保持的比较好。练模型的时候人物就这么几个,你把图片和提示词匹配下来,这个人物就在这里了,一致性肯定是做得非常好。
提示词是有规范的,我第一段是人物的形象,第二段是风格,第三段场景,接下来是动作,视觉上要给观众什么样的,再说 audio,back ground music,然后再是一些别的东西,一段一段分好,冒号一定要打好。告诉 AI,我这一段一定是写这个东西,你不要把这一段融入到别的里面去。调教 AI 提示词非常关键。
未来人类实验室:我觉得还有一个以假乱真的点,就是你对一些细节的处理上是很考究的,至少看上去是这样,比如苍龙肉的质感,做菜的流程这些方面。
黄浦江三文鱼:我对吃菜有研究,我父亲是专业厨师,他平时烧菜也会教我一些步骤。
肉质这个事情是因为我之前发视频后打的 tag 跟恐龙有关,吸引来一些非常资深的喜欢恐龙的人群,他会觉得我恐龙还原得不标准,这个龙肉明明是偏向蜥蜴和或者蛇肉的质感,你做出来更偏牛肉。
他觉得我不严谨,推了好几个恐龙复原的片子或者科普让我去学习,我说好的。确实时间也不够,然后在 AI 上面微调肉的质感也比较困难,别说 AI 了,所有人也没见过恐龙肉到底什么样子,只有你跟他口述说这个要像蜥蜴或者什么,但它也做不出来非常完美的。
我只能至少看上去不像牛羊肉或者猪肉,毕竟这个沧龙是深海的生物,我想它是不是会跟鲸鱼的肉有些相似,因为水的压强会导致它的肉的颜色变得深红,质地比较紧实,吃上去比较老。看一下鲸鱼的肉可能比较像。感觉做到这个程度差不多。

●视频中沧龙的肉质

" 孤独的人工智障抽奖人 "
未来人类实验室:以后还会沿用这种我们没见过的生物来做菜的路线吗?
黄浦江三文鱼:我以后争取沿用大家都没有见过的完全虚构出来的一些东西,比如说麒麟或者说独角兽这种,就避免这些人过来找我聊天。
未来人类实验室:你这种作品还挺吃创意的,如何保持高质量创意的延续性?
黄浦江三文鱼:大家看把恐龙做成菜,总有一天都会看腻的,创意我也是无时无刻不在精进,但越逼自己越没创意。到最后可能我这一段灵感就消失了,我会去做一些别的东西。我举个例子,如果中国人不反感,可能我把中国人信奉的龙做成菜,像红烧黄鳝一样切成段那种,另外就可能做一些更猎奇的东西,或者说不做菜了,如果没有版权问题的话,我可能会复刻一下张国荣和梅艳芳在 2026 年办演唱会,但这个事情我深思熟虑之后,可能它会涉及到肖像权,所以我还在思考这个问题。
未来人类实验室:评论区有人说你开门就已经天花板不知道后面的质量该怎么提高,你会有这个焦虑吗?
黄浦江三文鱼:我就相当于中奖一次了,也不奢望说以后条条都中奖。我也不想把自己框死,流量好我就一直做这一系列。先筛选一下大家到底喜欢什么,我可能下一期就会把做菜的内容稍微简短,做一些好笑无厘头的剧情进去,看观众的反响怎么样。如果反响比之前更激烈或者一样,这两个东西可能结合再做下一期,如果反响不好,我再打回去稍微减少一些剧情量,专注做菜。
故事是一个双刃剑。其实故事比做菜要难,整个人物的动作表情还有台词演戏,这种花的时间会比做菜要久很多,如果反响不好的话,就删掉一点。毕竟一个人,想怎么调就怎么调。
未来人类实验室:你做这些视频的最终目标是什么?你想实现什么?
黄浦江三文鱼:我想做成一个类似于影视级别的 AI 媒体账号,大家可以在频道上追番追剧看综艺。现在是 6 分钟的视频,之后我更想挑战 30 分钟左右或者一个小时的作品,看看这种长视频怎么去留住人会比较好。
未来人类实验室:你如何看待它的商业前景?
黄浦江三文鱼:现在 AI 制作视频基本上替代掉 90% 实景拍摄,现在很多人都不拍了,包括很多大牌,比如说一些大牌美妆也在找做 AI 的一些机构合作,愿意付很大的价钱去替代传统拍摄过程。我觉得是一个非常好的前景,当然不排除有些人是排斥 AI 的,他们还是会坚持用传统的方法去维持他们高品质的一些内容。
未来人类实验室:你的 B 站简介是 " 孤独的人工智障抽奖人 ",是单纯对自己在夜里抽卡的状态的一个描述吗?还是什么?
黄浦江三文鱼:算是吧,还有对 AI 的控诉。它们一直折磨我,然后智障。当时学习 AI 也是一个人在学,并没有任何同学或老师,整个过程也是非常孤独的,没人诉说,有想法有创意也比较天马行空,比如说你有没有吃过恐龙,或者你想不想吃恐龙,就像小孩子跟大人经常会说一些无厘头的话,并没有什么人能听得进去,只能跟 AI 讲,也算是一人一机之间的孤独的聊天。当然就有了 AI 之后,这些创意就可以说给更多人听了,以不同的形式而已。
撰文 | 巴芮 杜雪莹
封面图源 | 《把远古沧龙做成六道菜(上)》
你会想看什么内容的 AI 视频?

本文来自微信公众号" 未来人类实验室 ",作者:巴芮 杜雪莹,36 氪经授权发布。


登录后才可以发布评论哦
打开小程序可以发布评论哦