华为、寒武纪带头，国产芯片玩家加速抢夺英伟达的蛋糕

作者 | 谢春生

国产 GPU 的头部牌桌上，正在悄悄 " 加人 "。

近来，据媒体报道，字节跳动正与天数智芯洽谈采购至少 5 万颗 AI 芯片，主要用于推理任务。本次洽谈涉及的芯片，主要为天数智芯智铠系列云端推理 GPU，训练场景则使用天垓系列。

截图来源于媒体报道

消息一出，市场一片惊呼。毕竟，字节跳动可是国内 AI 算力的头号买家—— 2026 年计划将资本开支上调超 2000 亿元。

不过，截至目前，字节跳动以及天数智芯方面暂未有所回应。

如果这笔买卖真能落地，天数智芯将成为继华为和寒武纪之后，字节跳动的第三大国产 GPU 供应商。

对于今年 1 月刚在港交所上市的天数智芯来说，这已不光是巨额订单的问题，更是获得了 " 大厂认证 "。

但比订单更值得关注的，是这件事背后透出的信号——国产 AI 芯片正在从 " 政策采购、行业试点 "，真正进入互联网大厂的应用场景，从备选方案转向刚需算力支撑。

01.

不买不行了

字节跳动不是没有选择。

美国目前已在受控条件下批准部分中国企业购买英伟达 H200，但 H20 的 " 后门事件 "，让中国买家在采购时面临额外的合规和安全审查压力。不把鸡蛋放在一个篮子里，已经是国内大厂的基本操作。

更重要的是，字节跳动的算力需求正在发生结构性变化。

QuestMobile 数据显示，截至 2026 年 3 月，字节跳动旗下 AI 智能助手豆包的月活用户已达 3.45 亿。用户增长带来的压力不仅来自模型训练，更来自上线后的持续推理成本。而推理场景对芯片的诉求，无论在互联带宽、显存还是生态成熟度上，都比训练要宽松一档。国产芯片在推理侧已经达到了可用水平。

图片来源：QuestMobile

截至 2026 年 3 月，豆包大模型日均 Token 调用量突破 120 万亿，较上线初期增长千倍。按火山引擎定价及用户行为测算，每日算力消耗成本已达数千万元——这还不算智算中心与芯片采购等一次性投入。

尽管豆包 2.0 的推理效率提升 43%，万 Token 成本仅为海外头部模型合规链路的 38%，但面对 3.45 亿月活用户的免费使用，亏损缺口依然难填。

压力之下，字节跳动开启 " 豪赌 " 式加码。

据多家媒体援引《南华早报》消息称，2026 年，字节 AI 基础设施资本开支预算上调约 25% 至 2000 亿元。此次上调主要受两大因素驱动：一是公司在人工智能领域投入持续增加，二则是内存芯片成本攀升。

更有消息称，字节跳动正考虑将 2026 年开支上限推至 700 亿美元。而在 2025 年，公司净利润同比缩水超 70%。盈利与开支冰火两重天，张一鸣的算力豪赌，赌的或许是未来五年的身位。

字节跳动的算力供应链策略已经很清晰了：训练用华为昇腾、寒武纪高端训练卡，推理引入天数智芯智铠系列，三路并行。这种 " 训练、推理两条腿走路，国产、进口两手准备 " 的打法，正在成为互联网大厂的 " 标配 "。

02.

壁仞们的 " 朋友圈 "

不过，就在字节跳动准备购买国产芯片的消息刷屏时，另一家国产 GPU 厂商的动作更值得关注。

6 月 16 日晚，智谱正式开源新一代旗舰模型 GLM-5.2。第二天，壁仞科技和摩尔线程就相继宣布完成 "Day-0" 适配。壁仞科技壁砺 166 系列基于 vLLM 推理框架完成适配与调优，率先向开发者提供快速部署方案。消息公布后，壁仞科技当天股价上涨 7.09%。

截图来源于相关公众号推文

"Day-0 适配 "，是理解国产 GPU 竞争格局的关键——它不是能用，而是模型发布当天就能跑。这意味着芯片厂商不仅要硬件做得好，软件栈、工具链、开发者生态都得跟得上。而壁仞科技在这件事上已经具备明显的先发优势。

腾讯混元 Hy3 preview、阿里通义千问 Qwen3.6、DeepSeek 全系模型、MiniMax M3、智谱 GLM 全系列、月之暗面 Kimi 等 20 余款国内头部大模型，均完成壁仞科技芯片 Day-0 级同步适配。其中最值得一提的是 DeepSeek，有消息称壁仞仅用数小时就完成了全系列适配，创下了国产芯片响应速度的纪录。

如果把这份适配名单和字节跳动的供应商名单放在一起看，一个清晰的信号浮现出来：壁仞科技已经可以和华为、寒武纪站到同一队列了。

华为是早就在主位上坐稳的那个，昇腾的生态厚度和万卡集群能力，至今仍是其他国产厂商难以企及的标杆；寒武纪入局商用市场较早，且已稳定向字节跳动供货，是大厂算力供应链的核心玩家；壁仞科技则凭国家级认证、资本青睐及大模型生态布局，拿到同等席位，成为新晋力量。

一切似乎都是顺理成章的事。

2026 年 5 月，国家首次在安全可靠测评中设立 AI 芯片品类，9 款国产芯片获评最高安全可靠等级 I 级，华为海思、阿里平头哥、壁仞科技、海光信息、天数智芯、沐曦股份、摩尔线程榜上有名。在国家级认证的坐标系里，壁仞科技已经可以和华为、阿里平头哥站在同一排。

资本市场的投票更直接：2026 年 1 月 2 日壁仞科技在港交所挂牌上市，开盘即大涨 82%，市值一度突破千亿港元，成为港股 GPU 第一股。

这个 " 朋友圈 " 的价值，在于它形成了一个正循环：模型越多在壁仞科技上跑，其软件栈就越成熟；软件栈越成熟，新模型适配就越快；适配越快，更多模型厂商就愿意选择壁仞。这就是生态的 " 飞轮效应 "。

当然，壁仞科技不是一个人在战斗。整个国产 GPU 赛道，正在上演一场围绕大模型适配的军备竞赛。

前述已提及，华为昇腾的生态厚度同行难以企及。此番，智谱 GLM-5.2 在 Day 0 就完成了与昇腾的推理适配；寒武纪在 DeepSeek-V4 发布当天完成 Day0 适配，作为字节跳动现有的两家 GPU 供应商之一，其 NeuWare 软件栈的影响力持续扩大。

摩尔线程 6 月以来连续完成 MiniMax M3 和智谱 GLM-5.2 的当日适配，MTT S5000 的响应速度已经不输任何对手。

燧原科技则在集群方向发力，联合腾讯云发布 " 燎原 " 智算集群 3.0 商用版，已适配 DeepSeek、腾讯混元、智谱 AI 等主流大模型，完成数千卡万卡集群部署。

另外，值得一提的是，燧原科技 6 月 15 日刚刚过会，若顺利上市，" 国产 GPU 四小龙 " ——摩尔线程、沐曦股份、壁仞科技、燧原科技，将首次在资本市场聚齐。

03.

终局拼什么？

如果只看单一新闻报道，容易觉得就是几家国家芯片厂商在抢订单、抢头条。但把线索串起来看，逻辑就完全不同了。

国产 GPU 的黄金窗口期已经打开，但窗口期不会永远敞开。英伟达下一代 Rubin 架构已在路上，一旦美国放松对华出口限制，国产芯片的 " 时间差 " 优势可能很快会消失。

大厂的行动已经说明了一切。字节跳动 2026 年 AI 基础设施投入超 2000 亿元，阿里单季度资本开支超 380 亿元，腾讯 2026 年下半年大规模导入国产算力，这些，让国产芯片从 " 备胎 " 变成 " 主力 "。但这种系统性替代的前提是生态成熟，谁在 "Day-0 适配 " 上不掉队，谁才能拿到大厂采购的入场券。

如今，壁仞科技拿下 20 余款头部模型的当日适配，寒武纪稳居字节跳动供应商名单，生态的差距正在拉开，而后来者追赶的时间窗口正在收窄。

更要命的是算力成本。字节跳动净利润下滑超 70% 还在硬扛 2000 亿算力投入，说明整个行业已经到了必须压降成本的临界点。国产芯片在推理侧的优势不仅是安全自主，更是能够为大厂们省下大把大把的钞票。

譬如，天数智芯智铠系列定价只有英伟达同级别产品的六到七成，随着产能爬坡和良率提升，价格还有进一步下探的空间。

然而，成本优势之外，产能才是真正的命门。国产 GPU 普遍受制于先进制程产能瓶颈，中芯国际 N+2 工艺的排期，早已挤满了各家芯片厂商的订单。

政策红利算是打开了需求侧的空间，但供给侧的天花板决定了谁能真正吃到蛋糕。2026 年 5 月，9 款国产芯片获评国家最高安全可靠等级，信创需求井喷，但交付能力决定谁能兑现红利。

国产 GPU 的窗口期不会永远存在。生态、成本、产能，三道关卡已经横在所有玩家面前。时间有限，待到年底大厂万卡集群点亮，谁是填坑者、铺路者、陪跑者，出货量自会给出答案。

注：文中部分图片来源于 Ai 生成 / 网络，如有侵权请告知删除。

宙世代

一起剪

相关标签