
昨天,两个爆炸性事件。
一个是张雪峰去世了,刷屏国内。
一个是 OnlyFans 创始人去世了,刷屏海外。
张雪峰,41 岁,心源性猝死。中午在公司跑步机上跑步,突然倒下,送医抢救三个多小时,没救回来。
OnlyFans 老板 Leonid Radvinsky,43 岁,癌症。秘密抗癌许久,身家 47 亿美元,走的时候公司刚在谈 55 亿美元的出售计划。
恰好黄仁勋坐在 Lex Fridman 的播客里,被问到一个问题:" 你害怕死亡吗?"
他的回答是:
第一层:我真的不想死。我有很美好的家庭,有非常重要的工作。
第二层:但如果一定要死,我希望是在工作中突然死去,当场毙命,没有长时间的痛苦。
第三层:我不相信继任者计划。我每天做的事就是把自己脑子里的东西全部倒给团队,一秒都不在我脑子里多停留。如果我哪天突然倒下,公司不会有任何知识断层。
这个回答冷静、理性,优雅,老黄希望的完美结局是——在工作中瞬间死去。

张雪峰 2018 年发过一条微博,现在看起来像一道谶语。

他们都把在工作中死去视为某种理想状态。但黄仁勋这 145 分钟的播客,聊的确实不是 " 过劳 "。他聊的是一个在人类科技史的关键节点上,一个 62 岁的创始人怎么看待自己的角色、英伟达的未来、以及 AI 到底会把人类带向哪里。
这期播客信息量巨大,我挑几个最值得展开的点聊聊。
不要接班人背后,是一套完全不同的管理哲学
就先接着生命的话题吧。黄仁勋说,他不相信继任者计划。
他的逻辑是这样的:" 如果你真的关心公司在你走后的未来,那今天最该做的事,不是物色一个接班人培养三年,而是每时每刻都在把你脑子里的东西倒给身边所有人。"
他说,自己学到的任何新信息," 在我桌上停留绝不会超过一秒 "。每一次内部会议,他就把整个推理过程在 60 多个直接汇报人面前现场演一遍。对,60 多个直接汇报人,而且不做一对一谈话。
这在传统管理学里简直是离经叛道。

但黄仁勋说原因很实在:" 因为英伟达今天做的事情,已经不是传统意义上的产品开发,而是一种极端复杂、极端高密度的协同设计。"
他举的例子是下一代机架系统。像 Vera Rubin 这样的系统里,塞进了多种芯片、不同类型的专用机架、接近两万颗英伟达芯片,以及数量惊人的晶体管。黄仁勋直接说:" 这是世界上有史以来最复杂的计算机。" 而且,这样的系统还在按年迭代。
这种复杂度下,找一个 " 接班人 " 提前培养,然后某天办个交接仪式?不行。。
黄仁勋认为,知识传递得靠每天、每小时、每次会议的持续灌注。这样,等他真走了,这些东西已经长在 4.3 万名英伟达员工的脑子里了。换句话说,接班计划的本质是 " 找一个人替你 ",而黄仁勋的方案是 " 让更多人都长出你的一部分 "。
这也意味着,黄仁勋本人在英伟达内部,某种程度上已经不仅仅是 CEO,他更像一个巨大的知识路由器:董事会的信息、供应链的变化、客户的需求、内部研究的进展、市场的信号,全部涌向他,再由他快速整合、校准、分发。
对他来说,一旦路由器断了,才是真正的风险。但这个路由器里流动的信息,到底是什么?为什么复杂到必须黄仁勋亲自转发?这就得说到他在播客里最大胆的那个判断了。
AGI 已经实现了
播客里第二个炸点:黄仁勋直接说 " 我认为我们已经实现了 AGI",他紧跟着补了一句:取决于你对 AGI 的定义。

从他在播客里的上下文来看,他更接近于把 AGI 理解为:如果一个 AI 系统已经能自己理解任务、拆解任务、调用工具、解决问题,最后把事情真正做完,那它在很多现实场景里,已经足够像 AGI 了。
这个定义和学术界的定义差距非常大。但按这个标准,AGI 确实差不多到了。
但如果只盯着 "AGI 已经实现 " 这句话,很容易忽略更重要的一层:黄仁勋提出这个判断,其实是在回答另一个问题——既然 AI 已经这么强了,为什么我们还需要更大、更贵、更多的算力?
他的回答是:因为 " 思考 " 远比 " 记忆 " 贵。
黄仁勋做了一个类比:预训练更像 " 阅读 ",而推理更像 " 思考 "。思考,比阅读难得多。
预训练当然贵,但它的本质,是让模型把海量知识 " 读进去 ",完成参数化的记忆和泛化。而推理发生在每一个用户请求到来的瞬间,是实时的、一次性的、无法提前缓存的消耗。
当一个人提问时,模型要现场拆解问题、调用工具、规划路径、验证答案、纠错、必要时再分解出多个子任务;尤其当 Agent 开始工作时,情况会更夸张。每个复杂任务背后,都是一组 Agent 在协作,每一步都在额外消耗算力。
这些消耗,和过去那种 " 训练一次、服务很多次 " 的互联网逻辑很不一样。它更像是在每一次交互中都重新启动一座工厂。
所以,黄仁勋并不认同那种 " 推理会越来越轻、推理芯片会越来越小 " 的判断。在他看来,这个方向从逻辑上就站不住。因为只要 AI 真正开始承担任务,推理就不可能变成一个边缘需求,它会变成最核心、最昂贵、也最持续的需求。
今天无论是代码 Agent,还是更复杂的工具型 AI,本质上都在验证这一点:训练塑造能力,推理兑现能力。而真正被用户付费的,往往是后者。
3 万亿美元营收完全可能
顺着这个逻辑,黄仁勋在播客里进一步给出了一套更宏大的框架。
他把 AI 的算力需求拆成四层:预训练 → 后训练 → 测试时推理 → Agent scaling。
很多人现在讨论的,还主要停留在前两层,或者刚刚意识到第三层的重要性。但在黄仁勋看来,第四层 **Agent scaling ** 才是未来真正可怕的地方。
因为一旦 Agent 开始像 " 团队 " 一样分工协作,算力需求就会出现明显的放大效应。一个 Agent 再分裂出多个子 Agent,多个子 Agent 再继续调用工具、生成中间结果、彼此校验,这背后消耗的是一整套动态的计算网络。
更重要的是,这四层会形成一个自我强化的闭环:
Agent 在真实世界执行任务,产生新数据;
新数据反哺预训练和后训练;
更强的模型带来更强的推理能力;
更强的推理能力又催生更复杂的 Agent 系统;
更复杂的 Agent 系统,再生成更多高质量数据。
这个循环一旦跑起来,需求就不会轻易停下。也正因为这样,黄仁勋才敢讲出一句听上去非常夸张的话:英伟达未来做到 3 万亿美元营收,并非完全不可能。

这句话当然会让很多人皱眉。因为以当下体量看,这个数字实在太大了。2025 年,英伟达全年营收大约 1300 亿美元,3 万亿意味着再翻 23 倍。。
但黄仁勋的推理链条其实也清晰:过去的计算机,更像仓库:存储信息、调用信息、检索信息;未来的 AI 计算机,更像工厂:它持续生产 token、持续完成任务,直接对应收入。一旦 "token" 像商品一样被分层定价,那么高智能系统的商业空间,的确会被重新打开。
在黄仁勋眼里,未来卖的是智能生产力的基础设施。
中国为什么重要?
播客里还有一段很有意思,是黄仁勋谈中国。
他提到一个判断:全球相当大比例的 AI 研究者是中国人。而他进一步强调,中国创新速度快,不只是因为工程师多、市场大、竞争激烈,更因为它有一种独特的知识流动结构。
在中国社会里,很多人的关系链不是孤立的职业关系,而是叠加了同学、朋友、家人、同乡等多重联系。工程师之间不是完全割裂的个体,他们彼此有深厚的社会连接。这意味着知识传播会更自然,技术扩散会更快。
很多 " 我知道但你不知道 " 的信息壁垒,在高密度的人际网络里其实很难长期维持。大家在同一个行业、同一座城市、同一个赛道里高强度竞争,最后逼出来的,往往就是极快的学习速度和极强的迭代能力。

他的潜台词就是:中国天然拥有一种高频知识交换的生态结构,它某种程度上和他管理英伟达的方法,居然是相通的——无论是一个国家,还是一家公司,真正决定上限的,可能都不是个别天才,而是知识能不能快速流动,能不能高密度协同,能不能在复杂系统中形成集体智能。
智能会被商品化,人性不会
整期播客听下来,最打动我的,反而不是 3 万亿美元营收,也不是 AGI 定义,而是黄仁勋最后落回到 " 人 " 这件事上。
他说,自己身边到处都是比他聪明的人。每个领域,都坐着真正的专家。而他自己,不过是一个从底层一路走上来的普通人,坐在一群 " 超人 " 中间。
然后他说了一句很重的话:" 智能是一种商品。"今天所有人都在焦虑:如果 AI 比我更聪明,我还有什么价值?
但黄仁勋的回答是,真正决定一个人不可替代性的,未必是聪明本身。
品格、韧性、判断力、同理心、责任感、慷慨、领导力——这些东西,不会因为智能被大规模生产,就自动失去价值。相反,当 " 聪明 " 越来越便宜,这些不容易被商品化的品质,反而会变得更稀缺。
未来,AI 让越来越多的人有能力进入过去进不去的工作领域。一个木匠也许会用 AI 写程序,一个程序员也许会借助 AI 设计产品 ...... 工具抬高了下限,也放大了上限。
当然,前提还是那句老话——先照顾好自己。活着,才看得到未来。


登录后才可以发布评论哦
打开小程序可以发布评论哦