盖世汽车 01-22
告别训练“军备竞赛”,AI决胜关键已转向推理芯片
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

一块小小的芯片,正在成为推动人工智能从 " 训练 " 走向 " 应用 " 的关键支点,撬动着未来三年超过 3100 亿元的市场规模。

当推理需求超越训练,谁能掌握这场算力竞赛的主动权?

近期,OpenAI 与晶圆级 AI 芯片企业 Cerebras 签署了一份协议,OpenAI 将在 2026~2028 年把 750MW 规模的 Cerebras 芯片集成到其 AI 推理计算资源库中。

这一大规模部署并非用于模型训练,而是专门为 AI 推理服务。

推理,这一让训练好的模型真正 " 工作 " 的环节,正在成为 AI 芯片市场的新焦点。

市场研究机构 IDC 中国副总裁周震刚指出,2024 年,中国数据中心加速卡有 57.6% 是推理卡,33% 是训练卡。而在 DeepSeek 出现后,一些小型公司的算力从训练转到推理。腾讯、百度这类平台接入 DeepSeek 也大大推动了推理芯片的增长,因此预计 2025 年推理芯片占比还会进一步大幅增加。

推理需求超越训练,产业迎来爆发点

过去两年,大模型训练是 AI 芯片市场的绝对焦点。

如今,这一格局正在悄然改变。

《2025-2030 年人工智能芯片行业市场调研及投资前景预测报告》显示,中国 AI 推理芯片相关产品及服务行业市场规模正以惊人的 94.9% 复合年增长率扩张,从 2020 年的 113 亿元增至 2024 年的 1626 亿元。预计到 2025 年,这一市场规模将达到 3106 亿元。

这一爆发性增长的主要推动力来自 AI 大模型的快速落地应用。

生成式 AI 的普及 彻底改变了需求结构。开源且性能出众的大模型如 DeepSeek-R1 面世后,更多人开始真正将大模型用起来,促使推理需求大幅增长。

腾讯管理层在近期业绩交流会上明确指出,公司看到对 GPU 更大的需求是在推理侧,用户推理需求逐渐增长,AI 需求已超过现有 GPU 资源所能提供的算力。

这种转变同样体现在智算中心的建设规划上。

2024 年 12 月,香港规模最大的数码港人工智能超算中心投入服务,香港为申请使用者提供资助。数码港行政总裁郑松岩表示,该超算中心第二阶段规划算力是 1700PFLOPS,2025 年 10 月该超算中心算力将提升到 3000PFLOPS。

中国 AI 推理芯片市场的快速扩张也与政策环境密切相关。国家政策正在加快智慧城市发展与数字政府芯片相关的产品及服务。

这些大型项目需要大量运算基础设施,使得运营成本控制成为关键考量,而具备卓越能效比的 AI 推理芯片相关产品及服务正能满足这一需求。

国产芯片站上竞技台,性价比成制胜关键

随着推理需求成为市场主流,AI 芯片的竞争格局正在发生深刻变化。

一个最明显的趋势是:国产芯片正迎来前所未有的发展机遇。

周震刚提供的数据显示,2024 年中国数据中心加速卡市场中,国产算力占比已达到 34.6%。相比 2022 年和 2023 年英伟达占据 85%-90% 市场份额的格局,这一变化意义重大。

推理任务的特点为国产芯片提供了切入市场的机会。与训练任务不同,推理环节对 AI 芯片的兼容性要求更为灵活,可以将不同应用的推理负载分配到不同的芯片上。

图片来源:英伟达官网截图

这意味着国产芯片能够在不与英伟达直接竞争的情况下,找到自己的应用场景。

市场对国产芯片的接受度正在快速提升。

一些观察人士指出,过去客户会询问国产芯片与英伟达 H100 相比的优势、性价比和生态兼容性," 现在这些问题已经没有太大影响了 "。

云厂商或 AI 厂商现在需要英伟达之外的更多国产芯片方案作为补充和备份。

在这个市场中,极致性价比成为国产芯片的制胜法宝。

有业界人士直言:" 国产芯片通过极致的性能优化,可以在特定领域实现超越英伟达 4090 的极致性价比。"

这些特定领域包括信创、交通、能源、通信等。

随着边缘设备上运行的大模型越来越智能,从智能手表到工业机器人,推理芯片的市场边界正不断扩展。

这块曾经被训练芯片光芒掩盖的市场,正在迎来属于它的黄金时代。

这块小小的推理芯片,不再只是技术的附属品,而是决定 AI 能否真正融入千行百业的关键变量。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

芯片 ai ai芯片 腾讯 香港
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论