一块小小的芯片,正在成为推动人工智能从 " 训练 " 走向 " 应用 " 的关键支点,撬动着未来三年超过 3100 亿元的市场规模。
当推理需求超越训练,谁能掌握这场算力竞赛的主动权?
近期,OpenAI 与晶圆级 AI 芯片企业 Cerebras 签署了一份协议,OpenAI 将在 2026~2028 年把 750MW 规模的 Cerebras 芯片集成到其 AI 推理计算资源库中。
这一大规模部署并非用于模型训练,而是专门为 AI 推理服务。
推理,这一让训练好的模型真正 " 工作 " 的环节,正在成为 AI 芯片市场的新焦点。
市场研究机构 IDC 中国副总裁周震刚指出,2024 年,中国数据中心加速卡有 57.6% 是推理卡,33% 是训练卡。而在 DeepSeek 出现后,一些小型公司的算力从训练转到推理。腾讯、百度这类平台接入 DeepSeek 也大大推动了推理芯片的增长,因此预计 2025 年推理芯片占比还会进一步大幅增加。
推理需求超越训练,产业迎来爆发点
过去两年,大模型训练是 AI 芯片市场的绝对焦点。
如今,这一格局正在悄然改变。
《2025-2030 年人工智能芯片行业市场调研及投资前景预测报告》显示,中国 AI 推理芯片相关产品及服务行业市场规模正以惊人的 94.9% 复合年增长率扩张,从 2020 年的 113 亿元增至 2024 年的 1626 亿元。预计到 2025 年,这一市场规模将达到 3106 亿元。
这一爆发性增长的主要推动力来自 AI 大模型的快速落地应用。
生成式 AI 的普及 彻底改变了需求结构。开源且性能出众的大模型如 DeepSeek-R1 面世后,更多人开始真正将大模型用起来,促使推理需求大幅增长。
腾讯管理层在近期业绩交流会上明确指出,公司看到对 GPU 更大的需求是在推理侧,用户推理需求逐渐增长,AI 需求已超过现有 GPU 资源所能提供的算力。
这种转变同样体现在智算中心的建设规划上。
2024 年 12 月,香港规模最大的数码港人工智能超算中心投入服务,香港为申请使用者提供资助。数码港行政总裁郑松岩表示,该超算中心第二阶段规划算力是 1700PFLOPS,2025 年 10 月该超算中心算力将提升到 3000PFLOPS。
中国 AI 推理芯片市场的快速扩张也与政策环境密切相关。国家政策正在加快智慧城市发展与数字政府芯片相关的产品及服务。
这些大型项目需要大量运算基础设施,使得运营成本控制成为关键考量,而具备卓越能效比的 AI 推理芯片相关产品及服务正能满足这一需求。
国产芯片站上竞技台,性价比成制胜关键
随着推理需求成为市场主流,AI 芯片的竞争格局正在发生深刻变化。
一个最明显的趋势是:国产芯片正迎来前所未有的发展机遇。
周震刚提供的数据显示,2024 年中国数据中心加速卡市场中,国产算力占比已达到 34.6%。相比 2022 年和 2023 年英伟达占据 85%-90% 市场份额的格局,这一变化意义重大。
推理任务的特点为国产芯片提供了切入市场的机会。与训练任务不同,推理环节对 AI 芯片的兼容性要求更为灵活,可以将不同应用的推理负载分配到不同的芯片上。
图片来源:英伟达官网截图
这意味着国产芯片能够在不与英伟达直接竞争的情况下,找到自己的应用场景。
市场对国产芯片的接受度正在快速提升。
一些观察人士指出,过去客户会询问国产芯片与英伟达 H100 相比的优势、性价比和生态兼容性," 现在这些问题已经没有太大影响了 "。
云厂商或 AI 厂商现在需要英伟达之外的更多国产芯片方案作为补充和备份。
在这个市场中,极致性价比成为国产芯片的制胜法宝。
有业界人士直言:" 国产芯片通过极致的性能优化,可以在特定领域实现超越英伟达 4090 的极致性价比。"
这些特定领域包括信创、交通、能源、通信等。
随着边缘设备上运行的大模型越来越智能,从智能手表到工业机器人,推理芯片的市场边界正不断扩展。
这块曾经被训练芯片光芒掩盖的市场,正在迎来属于它的黄金时代。
这块小小的推理芯片,不再只是技术的附属品,而是决定 AI 能否真正融入千行百业的关键变量。


登录后才可以发布评论哦
打开小程序可以发布评论哦