文 | 最话 FunTalk,作者 | 何伊然,编辑 | 刘宇翔
全世界都眼馋英伟达的生意。
根据英伟达公布的 2026 财年第四季度(截至 2026 年 1 月底)财报,其 GAAP 毛利率高达 75.2%,简直印钞机,而这般印钞能力主要源于它在 AI 芯片市场的统治级地位所带来的强大定价权。
几乎所有大模型都奔跑在英伟达的算力芯片上,支撑起它那近 5 万亿美元的市值。
但正因为如此,也几乎所有 AI 大厂都明里暗里试图摆脱英伟达的围笼,不想把命运交给它。刚刚发布的 DeepSeek V4,在技术报告上看,训练部分大概率还是用英伟达芯片,但在与华为的昇腾算力芯片做推理适配,并且表示下半年昇腾 950 上市后 Pro 版的 token 价格将大幅下调。此外,除了华为昇腾,天数智芯、寒武纪等国产芯片厂商也表示已支持 DeepSeekV4 新模型。
在英伟达的大本营美国,谷歌自研了 TPU(张量处理单元)算力芯片,截至 2026 年 4 月,TPU 已发展到第八代,形成了完整的训练与推理芯片产品线。Meta 在今年 3 月也披露了自研 AI 芯片路线图,计划 2027 年底前部署四款 MTIA 系列新品,适配内部 AI 业务算力需求,同时维持与英伟达、AMD 的大规模采购合作,构建 " 自研 + 外采 " 双轨算力供给体系。
是的,一时半会,还是没有哪家 AI 公司能绕开英伟达,但黄仁勋还是感受到了危机。在最近的一次播客采访里,黄仁勋认为摩尔定律正在走向终结,即芯片性能每年翻倍的时代已经过去了,今天最先进的芯片的性能优势不会是永恒的护城河,而是有时间窗口的相对优势。一旦制程逼近物理极限,后来者的追赶难度反而会降低。
黄仁勋表示限制对华出口算力芯片,短期确实会延缓中国 AI 的发展速度,但长期来看,这只会逼迫中国形成自己的生态链。他还没深入谈论下去的是,目前只有中国 AI 公司在致力于开源,并被众多公司、创业公司所采用,如果越来越多的开源模型跑在中国产的算力芯片上,那英伟达纵使依旧占据市场第一,但也将不再是唯一。
事实上,即使没有中国开源大模型、算力芯片的威胁,市场竞争也想促使算力芯片形成双寡头结构,而不是让英伟达一家独大。
有意思的是,这其中,极度依赖英伟达的 Open AI 反而是最积极 " 背刺 " 它的那家。
01
当地时间 4 月 17 日,美国 AI 芯片制造商 Cerebras 正式向美国 SEC 提交 IPO 申请,目标融资 30 亿美元,估值达 350 亿美元。
在 2025 年 10 月撤回上一轮 IPO 申请后,这家以 " 晶圆级芯片 " 为核心卖点的英伟达挑战者用半年时间就再次向 IPO 发起冲刺,并成功将公司估值从 81 亿美元推高至 350 亿美元。
轮估值暴涨的核心支点,是一份与 OpenAI 签订的总额超 200 亿美元的合作协议。
根据协议,OpenAI 承诺在未来三年内使用 Cerebras 芯片驱动的服务器集群,Cerebras 则将为后者部署 750 兆瓦算力,预计 2028 年完成全部部署。此外,OpenAI 还将向 Cerebras 提供约 10 亿美元资金帮助其开发数据中心,并获得约 10% 的认股权证。
显然,OpenAI 已经不算是单纯的客户了,而是债权人,也可能是未来的大股东。选择此时重新冲击 IPO,大概率也是两家公司的一致决定。
在 Cerebras 递交 IPO 文件的同一天,包括 Sora 负责人 Bill Peebles 在内的 OpenAI 三位核心高管宣布离职。同时,曾被视为美国 AI 基础设施里程碑的 5000 亿美元 " 星际之门 " 计划也正处于一团乱麻状态,内部协调与融资问题进展缓慢。
据媒体披露,2025 年 OpenAI 营收 131 亿美元,亏损高达 80 亿美元,预计今年亏损将飙升至 250 亿美元。在巨额亏损的压力下,OpenAI 甚至不得不自断手臂,砍掉了备受欢迎的视频生成产品 Sora。
有分析称,Sora 的日均算力成本约为 1500 万美元,10 秒高精度视频的成本约 33 美元。而在 Sora 运营期间,用户付费总收入仅有 210 万美元。
在这样动荡的时期,奥尔特曼自然清楚对英伟达的过度依赖会成为 OpenAI 最大的软肋。
此前,OpenAI 相继宣布与博通合作开发定制芯片,采用 AMD 新款 MI450 芯片,频频向外界传递明确信号——不想再给英伟达打工了。正是在这样的背景下,Cerebras 成了 OpenAI" 去英伟达化 " 战略中关键的押注对象。
Cerebras 的知名度尽管不显,却在芯片制造企业中有着独特性。
芯片设计巨头们几乎都遵循 " 切晶圆、做小芯片 " 的路线,Cerebras 则关注到了数据在芯片之间搬来搬去时撞上的 " 内存墙 ",因而它采用了一条更激进的单芯片技术路线。
Cerebras 的核心产品是以整块 300mm 晶圆打造的单芯片晶圆级引擎 WSE-3。由于计算、存储、互联全在单芯片内,数据传输延迟较 GPU 集群降低 90%,尤其适配大模型低延迟推理。
在推理场景下,晶圆级架构有望让单位 token 成本降低 80%。
OpenAI 计算基础设施部门负责人表示,Cerebras 为平台新增了专属低延迟推理解决方案,不仅能让用户获得更快响应速度,也将为实时 AI 技术拓展至更广泛用户群体奠定基础。
更重要的是,Cerebras 开辟的非 HBM 依赖路线,可能会打破英伟达近乎垄断的芯片行业格局,让算力供应变得更多元。
这些都恰到好处地击中了 OpenAI 最痛的部位,两者的合作自然水到渠成。
除了 OpenAI,Cerebras 在 3 月还跟 AWS 达成了合作,CS-3 会部署在亚马逊的数据中心,进入主流超大规模云平台的基础设施体系。
02
" 这个快速迭代的行业最令人兴奋之处就在于:算法将不断变得更快速、精准和高效——正因如此我才不愿投身那些九年如一日的传统行业。"
Cerebras 能够走到现在的位置,与创始人 AndrewFeldman 密不可分。
与典型的芯片公司创始人是工程师出身不同,Feldman 毕业于斯坦福大学,拥有经济学、政治学学士学位和 MBA。从职业生涯伊始,他就持续在产品和营销领域积累,这种职业路径让他对什么样的商业模式能跑通有着天然嗅觉。
随着经验积累,Feldman 也逐渐从打工人转变为连续创业者。
而所有连续创业者都有一个极其明显的特性——想赢,不顾一切地要赢。这种人不是普通的 " 好胜 ",而是把 " 赢 " 当作呼吸一样不可或缺。他们通常选择在行业共识的 " 无人区 " 下注,在大多数人觉得 " 没必要 " 或 " 不可能 " 的方向上孤注一掷。换句话说," 赌性 " 比较大。
2007 年,Feldman 创办了服务器公司 SeaMicro。
" 如今大型处理器在使用中就如同我们开着航天飞机去杂货店买东西一样。实际上,我只需要开着普锐斯去就行了。"
SeaMicro 摒弃了传统服务器 " 堆料 " 的思路,把 CPU、内存和一颗自研 ASIC 之外的所有组件全部移除,为需要 " 横向扩展 " 负载的专业互联网公司提供 " 更多的核心 ",该公司在 2012 年被 AMD 以 3.55 亿美元收购。
虽然微服务器业务并入 AMD 后渐渐没了声响,但这段经历让 Feldman 完成了财富积累,也让他进一步坚定了自己的创业方法论:在代际变革的节点上,用 " 反主流 " 的硬件设计切入巨头尚未覆盖的细分市场。
按照行业常规,芯片良率随面积增大而下降。当芯片企业都沿着英伟达的路往前走的时候,Feldmam 用很 " 外行 " 的思考方式决定直接做盘子大小的整颗芯片。
2015 年,Feldman 和技术搭档 Gary Lauterbach 共同成立了 Cerebras,并拉来了多位曾在 SeaMicro 工作过的老部下。Cerebras 沉寂了整整四年时间,直到 2019 年 8 月发布了第一代 WSE-1。
在这段默默无闻的研发期,Feldman 赌的是两个东西:一个是台积电的晶圆级封装技术会逐渐成熟,另一个是 AI 模型规模会大到让 GPU 的内存墙成为致命瓶颈。
从当前的发展看,他赌对了。
2019 年到 2024 年,Cerebras 每两年推出一代新品,制程从 16nm 跳到 7nm 再跳到 5nm,晶体管数从 1.2 万亿滚到 4 万亿。与此同时,Feldman 开始主动出击寻找大客户。2023 年,他飞到阿布扎比拿下了 G42。
Cerebras 和 G42 合作训练了阿拉伯语领域最领先的语言模型,共同创建了由九台互连超级计算机组成的网络 CondorGalaxy。和这家中东企业的密切合作也引发了美国外国投资委员会对 Cerebras 的国家安全审查,但 Feldman 不在乎——审查说明自身的实力。
" 如果你每周只工作 38 个小时,还想挑战像英伟达这样的 800 磅大猩猩?门都没有。你需要清醒时的每一分钟。"
Feldman 曾在访谈里被问过 " 工作与生活平衡 " 的看法,他做出了颇为激进的否定回答。他毫不掩饰想要向英伟达发起挑战的雄心壮志。
参照英伟达十年百倍增长,Feldman 对 Cerebras 的前景抱有颇为乐观的预期:要在未来 3 到 5 年开发出针对百万级患者的治疗方案;为尚未问世的应用提供推理算力;让民众无感知地使用公司技术。
03
Cerebras 冲刺 IPO 面临着此起彼伏的争议,乐观者期待着见证第二个英伟达的诞生,唱衰者则质疑在其业绩的稳定性。
从官方披露的财务信息来看,2022 年至 2025 年 Cerebras 营收从 2460 万美元增长至 5.1 亿美元,四年复合增速达 175%。尤其突出的是,2025 年 GAAP 净利润为 2.38 亿美元,成功扭转了 2024 年净亏损 4.82 亿美元的颓势。
但仔细分析会知道,GAAP 盈利得益于一笔 3.63 亿美元的非现金账面收益,这个收益实际是因美国安全审查而将 G42 相关负债从资产负债表中移除的会计操作。剔除这项非经常性项目后,公司非 GAAP 净亏损实际为 7570 万美元。
换句话说,Cerebras 的 " 扭亏为盈 " 是会计游戏。
2023 年和 2024 年,G42 分别贡献了 Cerebras 总营收的 83% 和 87%。在地缘政治冲突越发严重的情况下,依赖来自中东的单一客户的风险性可想而知。毕竟,Cerebras 首次 IPO 被撤回就有来自国家安全审查的缘故。
根据招股书,公司高达 246 亿美元的剩余履约义务绝大部分依赖于跟 OpenAI 签订的 200 亿美元协议。换言之,Cerebras 的预期收入几乎完全建立在 OpenAI 的远期承诺之上,而非分散化的大规模客户基础。
这份 " 强心剂 " 式的订单能否兑现取决于 OpenAI 自身的命运走向。当最大客户的稳定性本身都在被市场反复打量时,这张 " 空头支票 " 能落实多少,恐怕 Feldman 自己也无法打包票。
与英伟达对比则更能看出 Cerebras 的劣势。
在 AI 行业大爆发之前,英伟达就已经建立了游戏、专业可视化、数据中心等多个领域的多元化客户基础,没有任何单一客户能占据其超过 10% 的收入。英伟达在二十余年的演进过程中与数百万开发者深度绑定,每一次产品迭代都源于内在生态扩张的需求,产品规划路径很清晰。Cerebras 生态处于非常早期阶段,仍然是推理场景下的单点突破,距离真正的平台型企业还有很长的路要走。
哪怕没有 ChatGPT 的横空出世,英伟达也是一家营收稳定、利润可观的优质企业。可要是离开了 OpenAI 的 200 亿美元大单,Cerebras 恐怕都没有冲刺 IPO 的可能性。
2025 年 12 月,英伟达与 Cerebras 的竞争对手 Groq 达成了一项价值约 200 亿美元现金的特殊合作协议,英伟达获得了 GroqLPU 推理架构、芯片设计全栈技术的永久非独家授权。
黄仁勋下场代表着 Cerebras 低延迟专用推理架构的价值得到了业界巨头的认可,但是也让 Cerebras 面临的竞争压力急剧爬升。
从现实出发,OpenAI 引入 Cerebras 不是为了替换,而是成为 " 鲶鱼 ",增加谈判筹码,分散供应链风险。
有消息称,英伟达基于 Groq 芯片的系统将于 2026 年下半年推出。要是奥尔特曼转过头又和黄仁勋达成了一致,Cerebras 很可能成为牺牲品。
在 AI 芯片这个万亿级赛道中,多元化竞争对行业生态的长期发展无疑是件好事。但资本市场向来不缺造富神话与舆论炒作,Cerebras 能否真正兑现技术与商业价值还要跨过多重考验。
" 英伟达挑战者 " 这个动听的名头,也搞不好会变成昙花一现的泡沫。
但正如 " 杰文斯悖论 " 所揭示的,技术进步会提高资源的利用效率,降低单位产出成本,而人们用得起用得多了,反而会导致资源的总消耗量不降反增。随着 AI 更大幅度渗透到人们生活的方方面面,在可预见的未来,算力需求依然会高速增长。
这个千亿乃至数千亿级美元的超级大市场,不止关乎经济,更涉及到地缘安全,谁都不想把命运的钥匙交给英伟达一家所掌握。
但显然,即便是出于自尊,黄仁勋也不会轻易交出钥匙。


登录后才可以发布评论哦
打开小程序可以发布评论哦