ASIC商业化，拐点已至

文 | 半导体产业纵横

2026 年第二季度，ASIC 芯片领域的消息密度达到了前所未有的水平。仅 6 月 18 日亚马逊确认洽谈将 Trainium 芯片向外部数据中心出售，到 6 月 24 日 OpenAI 与博通联合发布首款自研推理芯片 Jalape ñ o，一周之内两大重磅事件接踵落地。再往前回溯，谷歌 5 月携手黑石集团成立 50 亿美元合资公司将 TPU 商业化，微软的 Maia 200 正在与 Anthropic 洽谈算力租赁，Meta 则因收购 Rivos 后的内部整合失败而陷入被动。

这些事件指向同一个结论：ASIC 正在从 AI 算力体系的边缘走向中心。超级云计算厂商和前沿 AI 实验室同时发力，背后不仅是成本控制的商业本能，更是对下一代 AI 基础设施控制权的争夺。高盛预测，AI 驱动的 ASIC 需求将在 2027 年与 GPU 需求平分秋色；而 2026 年四大云厂商的 AI 资本支出合计预计将达到 7000 亿至 7750 亿美元，同比增长近 78% ——如此庞大的资金体量，任何单一芯片供应商都无法独占。

云厂商：从内部自用到走向台前

长久以来，定制化 AI 芯片多被视为云计算巨头的 " 内部玩具 "，用于消化庞大的自用算力需求。然而，2026 年的多项战略异动表明，这层边界正在被打破。背后的核心驱动力是 AI 工作负载的结构性转变——从 " 训练主导 " 全面转向 " 推理主导 "。SemiAnalysis 和 Bernstein 的研究估计，在大规模推理部署中，ASIC 相比通用 GPU 的总拥有成本（TCO）优势达 40% 至 65% ；AI 图像生成平台 Midjourney 在迁移至谷歌第七代 TPU 后，月度计算成本从 210 万美元降至 70 万美元。这种经济性优势直接反映在云服务定价上：根据 Artificial Analysis 的数据，基于 TPU 的谷歌 Gemini 3.1 Pro 每百万 Token 混合价格约 1.74 美元，比同级别的 Opus 4.7（4.10 美元）和 GPT-5.5（4.35 美元）便宜近 60%。

亚马逊的动作尤为引人注目。 2026 年 6 月 18 日，亚马逊 AI 业务负责人 Peter DeSantis 在接受采访时证实，AWS 正在洽谈向其他公司的数据中心出售其定制的 Trainium 芯片。早在今年 4 月的致股东信中，亚马逊 CEO Andy Jassy 就已暗示，如果芯片业务作为独立实体，将今年生产的芯片卖给 AWS 和外部公司，其年收入将达到约 500 亿美元。目前，亚马逊内部芯片部门的年收入运行率已突破 200 亿美元，其最新的 Trainium3 芯片在发布后迅速处于 " 基本售罄 " 状态，并获得了超过 2250 亿美元的收入承诺。其核心客户包括 OpenAI、Anthropic 和 Uber，其中 Anthropic 已承诺部署超过 100 万颗 Trainium 芯片，签约高达 5GW 的芯片容量。

谷歌的布局则更为激进。2026 年 5 月，谷歌宣布与黑石集团成立合资公司 "TPU Cloud"，黑石初始承诺出资 50 亿美元（含杠杆最高可达 250 亿美元）。该项目目标在 2027 年上线约 500MW 容量的 AI 数据中心，完全基于谷歌提供的 TPU 硬件、软件和服务构建。这是 TPU 诞生十年来，首次在 Google Cloud 体系外进行大规模商业化销售。谷歌还为纽约州西部的 "Lake Mariner"AI 数据中心项目提供了高达 32 亿美元的财务担保，该项目将为 Anthropic 提供数千个基于 TPU 的计算节点。供应链层面，谷歌已向英特尔下单生产超过 300 万颗 TPU，联发科也正在切入下一代 TPU v10 的设计供应链，打破了博通长期独占的格局。

三大云厂商的自研芯片已各自形成明确的产品定位和客户网络：亚马逊的 Trainium/Inferentia 系列服务于 Anthropic、OpenAI 和 Uber；谷歌的 TPU v7 Ironwood 和 v8 系列已吸引 Anthropic、Meta 和 Midjourney；微软的 Maia 200 则正在争取 Anthropic 和 OpenAI。

微软同样在推进。其基于台积电 3nm 工艺打造的第二代 AI 加速器 Maia 200 已在数据中心投入运行，搭载 216GB HBM3e 内存，FP4 峰值性能超过 10 petaflops 。今年 5 月，Anthropic 正在与微软洽谈租用基于 Maia 200 的 Azure 服务器，一旦达成将成为微软自研芯片的首个重磅外部客户。

OpenAI 的九个月造芯

值得注意的是，自研芯片的参与者已不限于云计算巨头。2026 年 6 月 24 日，OpenAI 联合博通正式发布首款定制推理芯片 Jalape ñ o（哈拉佩诺），标志着全球最大的 AI 模型公司正式入局芯片赛道。

Jalape ñ o 被定义为 " 智能处理器 "，专为大语言模型推理场景设计。OpenAI 负责底层架构设计，博通负责硅片实现与网络硬件， Celestica 负责板卡与机架系统集成，台积电完成制造。OpenAI 总裁 Greg Brockman 透露，依托公司自研大模型辅助优化，这款芯片从顶层设计到流片仅耗时 9 个月。早期测试显示，Jalape ñ o 在性能 / 瓦特指标上显著优于现有方案。

OpenAI 的造芯逻辑与云厂商有所不同。作为全球最大的 GPU 采购方之一，OpenAI 面临的核心问题是算力供给始终跟不上业务扩张速度。Brockman 在发布会上坦言：" 我们对工作负载有深刻理解，一直在寻找那些被现有硬件低效服务的特定任务，思考如何构建专门加速它们的硬件。" 博通 CEO 陈福阳也表示，其六大核心客户的算力需求近乎无限，" 算力紧缺不止会持续 2026、2027 年，预计 2028 年行业需求还会继续攀升 " 。

Jalape ñ o 的物理样品已于 6 月 24 日交付 OpenAI，计划 2026 年末实现小规模首批部署，2027 年快速爬坡，2028 年上半年全面规模化量产。远期规划总耗电量最高将达到 10GW 。这意味着 OpenAI 正在构建从模型、产品、数据中心到芯片的完整垂直技术栈。正如其官方声明所言："OpenAI 不仅在开发前沿模型或构建产品，它正在设计模型之下的基础设施——芯片架构、内核、内存系统、网络、调度、部署系统和产品体验。"

阵痛与壁垒：Meta 的教训

然而，自研芯片并非坦途。Meta 在这一领域的挫折，为整个行业敲响了警钟。

2025 年 9 月，Meta 斥资超 20 亿美元收购了 RISC-V 芯片初创公司 Rivos，意图加速其自研 AI 芯片（MTIA）项目。然而仅半年后，这场联姻便陷入泥潭。据报道，Rivos 的整合进程受到 Meta 现有员工与 Rivos 团队之间在薪酬和战略路线上严重冲突的阻碍，双方围绕未来芯片应依赖 Meta 现有 IP 还是 Rivos 技术展开政治斗争，直接导致多个项目延期。更有消息人士透露，Rivos 项目在 Meta 内部已被实质性取消。

这暴露了互联网企业跨界半导体的深层矛盾：软件代码可以随时迭代更新，但芯片一旦流片（Tape-out），任何微小的架构失误都意味着数亿美元和几个月时间的损失。微软的 Maia 项目同样经历了从 2025 年推迟到 2026 年的量产延期。这些案例说明，即便拥有数百亿美元的研发预算，从零构建一个成熟的芯片生态仍需要长期持续投入。

与此形成对比的是，OpenAI 选择了一条更务实的路径：不自建芯片团队，而是与博通深度合作，利用后者成熟的硅片实现能力和供应链资源，将自身对模型工作负载的理解转化为芯片架构设计，9 个月内完成从设计到流片的全过程。这种 " 模型公司定义架构 + 半导体公司实现制造 " 的分工模式，或许代表了一种更高效的产业协作范式。

产业链重构与市场展望

云计算巨头和 AI 实验室自研芯片的狂潮，正在重塑半导体产业链的价值分配。博通和 Marvell 控制了全球约 95% 的定制 AI ASIC 共同设计市场。博通 2026 财年第二季度 AI 半导体收入达到 108 亿美元，同比暴增 143%，CEO 陈福阳预计 2027 年 AI 芯片收入将超过 1000 亿美元。高通也凭借低功耗架构积累，成功斩获字节跳动数百万颗 AI 芯片的订单。中国台湾 ASIC 设计公司世芯电子的 CEO 预测，AI ASIC 收入将从 2024 年的约 130 亿美元增长至 2030 年的超过 1500 亿美元，复合年增长率接近 50% 。

根据 TrendForce 的最新预测，2026 年定制 AI 芯片出货量将实现 44.6% 的增长，而同期商用 GPU 出货量增速为 16.1%。这是 AI 时代开启以来，定制芯片出货增速首次显著超过通用 GPU。Bloomberg Intelligence 预计定制芯片需求到 2033 年年均增长 27%。高盛全球研究所估计，2026 年至 2031 年间全球 AI 领域总计需要约 7.6 万亿美元的资本投入。

从半导体产业的演进规律来看，" 通用 " 与 " 专用 " 的分野正在变得清晰。通用 GPU 凭借 CUDA 等软件生态，在模型训练和多用途 AI 开发领域仍将保持统治力。然而，在推理规模呈指数级增长的商业化部署阶段，拥有极致成本优势的定制 ASIC 正在快速切分市场。TrendForce 的数据显示，ASIC AI 服务器出货量预计将在 2026 年达到 AI 服务器总市场的 27.8% 。

对于前沿模型公司而言，" 多芯片策略 " 正在成为标配。Anthropic 目前同时运行在 AWS Trainium、Google TPU、Azure GPU 以及洽谈中的 Microsoft Maia 四大硬件平台上；OpenAI 则在使用亚马逊 Trainium、AMD、Cerebras 芯片的同时，开始部署自研的 Jalape ñ o 。Bessemer Venture Partners 合伙人 Adam Fisher 公开表示：" 一些新兴云公司无法脱离购买某一家全栈硬件，因为他们担心配额被削减 " ——但随着算力短缺加剧，越来越多的公司正在突破这一束缚。

2026 年的非 GPU AI 芯片集中爆发，只是 AI 基础设施重构的序幕。当模型公司开始定义芯片架构，当云厂商开始向外销售硅片，半导体产业的传统分工正在被重新书写。

宙世代

一起剪

相关标签