芯东西 前天
GPU汹涌,非GPU洗牌
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_caijing1.html

 

非 GPU 芯片势力崛起已势不可挡。

作者 |  程茜

编辑 |  漠影

芯东西 12 日 17 日报道,今天,上海 GPU 龙头沐曦股份在上交所科创板敲钟,开盘价为 700.00 元 / 股,截至午间休市股价大涨 687.79%,总市值达到 3298.82 亿元,将全球算力产业的竞争推向全新高度。

近一段时间以来,全球算力产业都处于重磅事件密集爆发期。

海外,非 GPU 赛道的谷歌 TPU 狂揽千亿级订单,在 GPU 垄断的算力市场撕开缺口,上周博通 CEO 爆料 Anthropic 向博通下总计 210 亿美元(折合人民币约 1486 亿元)订单,还叠加 Meta 等科技巨头的采购意向;GPU 层面,因害怕失去中国市场,美国批准英伟达 H200 AI 芯片对华出售。

反观国内,算力产业热度同样持续攀升,北京 AI 芯片明星企业清微智能拿下超 20 亿元大额融资,背后是业界少见的投资阵容。此外还有国内 AI 芯片创企密集披露并购、上市计划,本土算力生态加速成型。

上述海内外算力产业的密集动向,共同指向一个不可逆的行业变革:全球算力市场长期由英伟达 GPU 垄断的市场格局正在松动。

在大模型发展初期,市场对通用算力的强需求让英伟达 GPU 迅速占据绝对主导地位,几乎形成 " 无 GPU 不训练 " 的行业局面。

如今,一方面谷歌 TPU、亚马逊 Trainium3 等非 GPU 芯片在一些场景对 GPU 实现规模化替代,国内市场 2025 年上半年非 GPU 算力卡占比已达 30%,寒武纪 MLU、昆仑芯 ASIC、清微智能可重构芯片(RPU)等产品已形成差异化优势。

另一方面在投资市场,英特尔被传计划以 16 亿美元(约合人民币 112.9 亿元)(含债务)收购非 GPU 路线 AI 芯片独角兽 SambaNova,挽救自己在 AI 时代落下的竞争力,还有非 GPU 路线独角兽 Groq 两年间拿下超 30 亿美元(折合人民币约 213 亿元)融资。

▲海外非 GPU 路线企业最新动向汇总

可以看到,非 GPU 芯片势力崛起已势不可挡。

在此背景下,全球算力产业下一步将往哪走?非 GPU 路线能有多大市场空间?未来会百花齐放还是一支独大?非 GPU 赛道哪条路线有望最先冲出重围?我们试图通过拆解全球算力格局及国内几家头部企业的技术路线,找到这些问题的答案。

01.

全球算力产业的下一程

将面临路径分化

从需求端、底层技术、全球算力生态构建的三个核心维度来看,全球算力产业格局变革具有一定的必要性及急迫性。

首先在需求端,今年被称作大模型落地元年,推理场景算力需求增加,单纯堆砌 GPU 的粗放模式已经难以适配当前大模型规模化落地需求,这正倒逼企业寻找更高效的算力解决方案。

同时,AI 深入千行百业使得行业多元、细分需求接连出现,如 AI 视频生成、AI 医疗诊断、工业数字孪生等场景对算力能效比、适配性的要求各不相同。叠加企业主动分散供应链风险、规避单一厂商依赖,非 GPU 算力产品迎来关键的市场切入契机。

其次是技术端,传统冯 · 诺依曼架构的存算分离矛盾凸显,其设计逻辑已难以突破硬件性能的物理边界,需要架构革新突破瓶颈。

非 GPU 路线实现多点突破,如谷歌 TPU 专用架构、国产可重构芯片的动态适配能力等,已经在特定场景下形成性能与成本优势。

最后是生态层面,打破单一架构生态垄断已经成为行业共识,国产开源框架正通过兼容适配、自主优化,快速构建本土生态协同体系。

因此全球算力产业正在朝着打破单一架构,不同路径百花齐放的局面发展。

就在近日新华社发布的一则报道提到:" 在 AI 芯片领域,北京已经形成了自主可控的 " 芯片矩阵 ",昆仑芯、寒武纪、摩尔线程、清微智能……一系列国产明星产品性能领先。"

这之中既有 GPU 路线的摩尔线程,还有非 GPU 中 ASIC 路线的昆仑芯、寒武纪,以及非 GPU 中可重构计算的清微智能。四家企业分属不同技术路线的发展态势,恰恰印证了北京在 AI 芯片赛道多元布局、保障供应链安全的远见。

在这些明显的行业趋势背后,我们还能捕捉到驱动行业发展的几大核心趋势:

第一是 GPU 与非 GPU 两大技术路线正并行发展。GPU 路线凭借成熟的生态兼容性和通用计算能力,在需要兼顾图形渲染、科学计算与 AI 训练的场景中将持续发挥优势;非 GPU 路线,则随着大模型的快速演进,在 AI 推理领域率先展现出强劲增长潜力。

其中可重构架构凭借通用计算能力,已经在 AI 主流场景中占据重要地位。

第二,全球算力产业的重心不再唯硬件性能论,而是朝着软件、模型、场景适配等的全栈布局发展,通过协同创新让算力资源被充分释放出来,避免算力资源限制,并针对不同硬件架构对模型进行压缩、量化、适配。

这一趋势本质上是要实现算力效能最大化。

第三是中国厂商的话语权正在提升。在算力领域长期由欧美厂商主导的市场格局下,中国企业在非 GPU 赛道展现出不容小觑的竞争力。

综上,全球算力产业的下一程必然会走向路径分化。

02.

非 GPU 路线市场稳步上升

国内渗透率高于全球

全球知名市研机构 Gartner 预计,到 2027 年,针对 AI 推理应用的算力需求将导致 AI 加速器(通常指非 GPU 的 AI 专用芯片)的出货量超越 GPU。

与此同时,在全球算力产业中,非 GPU 路线正在快速成长为与 GPU 分庭抗礼的核心力量,算力市场双轨并行的格局有了雏形。

全球知名市研机构 IDC 发布的报告显示,今年上半年,中国非 GPU 芯片市场在加速计算领域增长显著。2025 年上半年,中国非 GPU 服务器市场占比约为 30%,预计到 2028 年市场占有率将接近 50%。

AI 在千行百业的加速渗透对这一趋势有着极大的推动作用。

英伟达创始人、CEO 黄仁勋曾经在采访中透露,中国的 AI 应用发展速度极快,其社会接纳新技术的节奏非常快。这是一个让他深感担忧的领域,因为归根结底,这场工业革命的胜负将取决于 AI 应用层面的发展,取决于谁能成为技术普及的引领者。

相比于 GPU,非 GPU 技术路线在成本、能效比、场景适配性上更为契合当下 AI 主流应用场景。

其硬件采购与运维成本更低,更适配中小企业及大规模分布式部署需求;能通过定制化架构实现低功耗与高精度的平衡,实现更优能效比;适配自动驾驶、工业物联网等边缘端场景的算力需求;同时具备更强的实时性、稳定性与灵活性,适配差异化 AI 任务。

尤其在智算中心、大模型部署、云计算、泛机器人、智能驾驶等主流 AI 应用场景中,非 GPU 路线有适配特定负载的高能效比、更低的全生命周期成本、更强的国产供应链自主可控性,且能通过从 0 到 1 的定制化架构实现大模型推理高吞吐与低延迟,兼容多业务负载。

对于规模达千亿乃至万亿级的 AI 市场而言,非 GPU 方案必然会占据一席之地。

不过,客观来讲,非 GPU 发展尚没有 GPU 成熟,大部分非 GPU 芯片生态成熟度不足,缺乏完善的软件工具链、丰富的开源框架支持。再加上其发展处于早期,对企业的早期研发投入能力也是不小的考验。

这也从侧面印证,GPU 与非 GPU 两条技术路径各有优劣,并非简单的替代关系。

03.

拆解国内头部芯片企业布局

可重构赛道势头正猛

想要探究当前国内非 GPU 赛道的发展格局,可以聚焦几家核心企业作为切入点。

北京 AI 产业具有代表性,2024 年其 AI 核心产业规模已经达到近 3500 亿元,占全国近一半,助攻这一产业发展的底层芯片玩家更为关键。

因此新华社报道提到的昆仑芯、寒武纪、摩尔线程、清微智能,这四家北京芯片代表企业,正是国内 AI 产业蓬勃发展的生动缩影,透过它们的发展轨迹,更能清晰窥见国内 AI 芯片产业格局的深刻变革。

▲北京四家芯片代表企业 2025 年上半年出货量位居国内前列

这四家企业中,摩尔线程为 GPU 阵营,其余三家均为非 GPU 阵营,其中寒武纪、昆仑芯主攻 ASIC 路线,清微智能以可重构架构实现通用计算为核心发力方向。

值得注意的是,这并不是当下非 GPU 赛道的全部路线,不过这几家受到北京市认可的企业极具代表性,既展现出国产非 GPU 的布局脉络,也凸显了政府层面的有力支持。

因为 GPU 的技术优势已经在业界有广泛认知,因此我们主要拆解了另外两条非 GPU 路线。

ASIC 架构是一种为特定用途定制设计的集成电路,谷歌 TPU 就是 ASIC 芯片。ASIC 最核心的优势就是性能、功耗,再加上支持深度定制的特性使得其在 AI 应用浪潮中得以大展拳脚。

寒武纪的 ASIC 芯片采用自研架构,构建了覆盖云端、边缘端和终端的完整产品线。以其首款采用 Chiplet 技术的芯片思元 370 为例,该芯片最大算力高达 256TOPS(INT8),是寒武纪第二代产品思元 270 算力的 2 倍。

昆仑芯基于其自研 XPU 架构,昆仑芯 R200 可提供高达 256 TOPS(INT8)和 128 TFLOPS FP16 的算力,性能可达主流 GPU 的 1.5 倍。在实际部署中,其单机 4 卡 R200 方案可实现 4800 tokens/s 的推理吞吐量,满足千亿参数大模型的实时交互需求。

这些实例足以印证,AI 领域中非 GPU 架构对 GPU 的规模化替代进程已全面开启。

不过 ASIC 的不足之处在于,因为需要定制化所以其从需求定义到量产交付的每个环节都需投入大量时间与资源,不仅如此,ASIC 架构一旦固化便难以调整,面对算法快速迭代的场景,往往需要重新流片,进一步拉高研发风险与周期成本。

相比之下,兼容 GPU、ASIC 路线优势的可重构计算路线发展势头更猛,核心在于它踩中了 AI 产业从算力集中到场景细分转型的行业趋势,可以解决 GPU 通用但低效、ASIC 高效但硬件固化的痛点,且通过底层架构创新实现了性能与性价比的平衡。相比行业同类型产品实现成本整体降低 50%、能效比提升 3 倍。截至今年 12 月,清微智能的可重构芯片累计出货量已超 3000 万颗,2025 年其算力卡订单累计超 3 万张,在全国十余座千卡规模智算中心实现规模化落地。

▲清微智能 AI 算力芯片 TX81

此外,可重构数据流技术路线还与 AI 计算需求天然适配。在实现芯片高效互联这一核心环节上,可重构数据流派自研的 TSM-LINK 算力网格技术,支持多芯片点对点直连,可实现数据的高效传输,从根源上规避传统交换机架构存在的带宽瓶颈与通信延迟问题。而 GPU 架构在适配晶圆级芯片集成时,只能依赖外部交换机完成互联,性能损耗与延迟问题难以避免。

在芯片设计层面,可重构数据流架构从底层架构设计阶段就具备三维扩展的天然优势,能够与晶圆级芯片技术、3.5D 堆叠等先进立体封装技术深度结合,形成清晰且可持续的升级迭代路径。据悉,清微明年推出的下一代芯片会带来大幅度性能跃升,有望实现对国际主流前沿 AI 芯片的弯道超车。

▲ GPU 与非 GPU 技术路线基本性能对比

因此从本质上来看,可重构计算路线不是对 GPU、ASIC 的替代,而是通过找到其中的平衡,取两家之所长,契合了 AI 规模化落地的核心需求。

04.

结语:算力产业进入多元共生新时代

总的来看,当下 AI 算力领域格局已较为清晰:GPU 凭借成熟生态与极致并行计算能力,在通用大模型训练、图形渲染等核心场景仍占据不可撼动的统治地位,但正面临功耗攀升、成本高的结构性挑战;而非 GPU 路线则凭借更高能效比、更低全生命周期成本及自主可控优势,在 AI 推理、专用算力需求等主流 AI 应用领域快速崛起,共同推动算力体系向多元化、异构融合方向演进。

以大模型、生成式 AI 为代表的新一轮 AI 浪潮催生出前所未有的 AI 算力需求,同时国产大模型企业强势突围,带动了国内 AI 算力需求的持续增长,中国 AI 算力产业迎来新的机遇和挑战。

当下,国产非 GPU 企业异军突起,正与国内大模型厂商形成合力,为国内 AI 算力产业注入新的活力。目前来看,非 GPU 技术路线尽管相比 GPU 并不成熟,但因其天然优势与 AI 应用落地相契合,正迸发出强大生命力。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai芯片 英伟达 gpu 博通 美国
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论