字母榜 12小时前
财富盛宴之后,英伟达国产平替们能否有足够的储备撑到黎明?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_caijing1.html

 

摩尔线程上市不到两周,又一家国产芯片企业沐曦登陆 A 股。

和摩尔线程一样,沐曦也创造了令人炫目的财富神话:首日高开 568.83%,报 700 元 / 股,总市值达 2800 亿元,本次 IPO 募资 41.97 亿元,发行价 104.66 元 / 股,网上中签率仅 0.03348913%。

中一签盈利近 30 万元,直接刷新了 A 股年内打新收益纪录。

与之相对,被称为国产英伟达的摩尔线程,截止至发稿,股价报 715.06 元 / 股,较昨日收盘微涨 0.51%,当前总市值约 3361 亿元,位列 A 股第三高价股,仅次于寒武纪和贵州茅台。

股价与市值的火爆表现,让沐曦与摩尔线程这两家国产 GPU 头部玩家成功站上聚光灯下。但资本市场的热度背后,是两家企业截然不同的基因底色、技术路线博弈,以及对国产算力替代赛道的差异化布局。

两家国产 GPU 芯片在资本市场上接连缔造财富神话,无疑会令 " 英伟达国产平替 " 们的上市之路更加急迫,问题是,第三个幸运儿会是谁?这场财富盛宴又能持续多久?

A

如果摩尔线程被称作是国产英伟达,那么沐曦就是国产 AMD。

沐曦成立于 2020 年 9 月,创始人陈维良曾在 AMD 工作 17 年,担任过 AMD 全球 GPGPU 设计总负责人,负责全球通用计算 GPU 产品线的整体设计与管理,主导并完成 15 款高性能 GPU 产品的流片与量产。联合创始人彭莉和杨建,两人都是 AMD 企业院士。

彭莉是 AMD 全球首位华人女性企业院士,在 AMD 任职多年历任图形架构师、系统架构师、首席芯片架构师等职务。杨建在 AMD 工作了 14 年,同样拥有深厚的 GPU 技术积累。

沐曦的产品线很清晰,分成三大系列。曦思 N 系列专注 AI 推理,首款智算推理芯片曦思 N100 于 2022 年 1 月交付流片,2023 年 4 月正式量产。曦云 C 系列做训推一体和通用计算,这是公司目前的主力产品,曦云 C500 于 2024 年 2 月正式量产,采用 7nm 工艺,专注 AI 训练、推理及科学计算。还有曦彩 G 系列负责图形渲染,不过这个系列目前还在研发阶段,尚未量产。

从产品路线看,沐曦走的是典型的," 先做推理,再做训练,最后补齐图形 " 的路径。

2022 年,沐曦先拿推理芯片打开市场,2024 年训推一体芯片量产后迅速成为营收支柱,图形渲染则留到后面慢慢打磨。

业绩数据能看出这家公司的爆发力。2022 年营收只有 42.64 万元,2023 年跃升到 5302.12 万元,2024 年达到 7.43 亿元,三年复合增长率高达 4074.52%。2025 年前三季度营收已经达到 12.36 亿元,同比增长 453.52%,全年营收预计在 15 亿到 19.8 亿元之间。

但高增长的背后是持续的亏损。2022 年到 2024 年,归母净利润分别为 -7.77 亿元、-8.71 亿元、-14.09 亿元,三年累计亏损超过 30 亿元。2025 年前三季度亏损 3.46 亿元,虽然亏损幅度在收窄,但距离盈利还有距离。公司给出的预测是,最早将于 2026 年达到盈亏平衡。

这种财务状况在国产 GPU 行业其实是常态。GPU 芯片属于资本和技术双密集型行业,前期研发投入巨大,需要持续烧钱打磨产品和生态,只有当出货量上来、规模效应显现之后,才有可能扭亏为盈。摩尔线程也一样,预计最早 2027 年才能实现盈利。

沐曦的客户主要集中在国家算力平台、智算中心、行业头部企业这些 To B 场景。产品已经部署在 10 余个智算集群,覆盖北京、上海、杭州、长沙、香港等多地,服务对象包括教科研、金融、交通、能源等行业。2024 年营收中,曦云 C500 系列贡献了 98% 的收入,单一产品依赖度极高。

这既是优势也是风险。优势是资源集中、目标明确,能够把有限的资金和人力投入到最核心的产品上。风险是一旦 C500 被竞品超越或者遭遇技术瓶颈,公司的营收会立刻受到冲击。

从累计销量看,截至 2025 年第一季度,沐曦 GPU 累计销量超过 2.5 万片,2025 年预计总出货量在 3 万到 5 万片之间。这个数字和英伟达一年 550 万张的出货量比起来,差距极其巨大。但在国产 GPU 领域,这个销量已经算是头部玩家的水平。

B

反观摩尔线程,其创始人张建中,在英伟达工作了 14 年,曾任英伟达全球副总裁、大中华区总经理。他亲历了 GPU 从图形芯片演变为 AI 基础设施的全过程,对英伟达的 CUDA 生态体系有着深刻理解。

摩尔线程的核心高管中,也有多位都来自英伟达。

这种基因差异直接决定了两家公司的技术路线选择。

摩尔线程的 MUSA 架构,走的是转译兼容路线。核心工具 MUSIFY 能够将 CUDA C++ 源代码自动转换为 MUSA C++ 源代码,再通过 MUSA 编译器生成基于 MUSA 指令集的二进制代码。

这种策略的杀手锏在于零门槛迁移,开发者用 CUDA 写的代码,可以在 MUSA 平台上无需修改直接运行,甚至常见的 CUDA 算子能即插即用。

MUSA 已经开源了 Torch-MUSA、OpenCV-MUSA、vLLM-MUSA 等工具链,全面适配 PyTorch、TensorFlow、百度飞桨等主流 AI 框架。截至 2024 年 11 月,Torch-MUSA 专属支持的算子总数已超过 1050 个。

这种策略的优势很明显 : 开发者学习成本低,现有的 CUDA 生态可以快速迁移过来,对于急需国产替代方案的客户来说,这是最现实的选择。

但软肋也同样明显。本质上,这是在 CUDA 生态上加了一层转译层,英伟达的专利武器库随时可能引爆,而且转译过程必然会带来性能损耗,无论优化得多好,都难以完全避免。更关键的是,这条路走到极致,也只是,更好的兼容版,很难说是真正的技术自主可控。

沐曦的 MACA 软件栈,走的是自主指令集路线。GPU IP 包含指令集、微架构在内全部自研,拥有独立知识产权,从底层与 CUDA 彻底切割。

MACA 提供类 C 编程语言,兼容主流 C/C++ 异构计算语法,但需要开发者重新学习和适配。

这种策略的优势是长期安全,不受英伟达 EULA 条款约束,技术演进完全自主可控,专利风险可以规避。但代价是生态重建成本巨大。

MACA 直到 2025 年 2 月才开源工具链,比 MUSA 晚了近两年。开发者社区的活跃度远不如摩尔线程,迁移工具的易用性也有明显差距。除非客户被完全禁止使用任何英伟达产品,包括 CUDA,否则主动迁移的意愿一般都很低。

相较之下,MUSA 软件栈 2022 年首发,已经形成完整开发生态。

产品线战略上,摩尔线程走的是 To C 加 To B 双线布局。

To C 端。摩尔线程的春晓芯片,220 亿晶体管规模,集成 4096 个 MUSA 流处理核心加 128 个专用张量计算核心,主频 1.9GHz,FP32 算力 15.2TFLOPS。

核心优势是全功能架构,单芯片同时支持现代图形渲染引擎、智能多媒体引擎、AI 计算加速引擎、物理仿真四大引擎,覆盖 DirectX、OpenGL、Vulkan、OpenCL 等主流接口。MTT S3000 是业内首款支持 PCIe 5.0 标准的 GPU 产品,256bit 显存位宽配 32GB GDDR6 显存。

这种设计使其可以横跨 AI 智算、云游戏、云渲染、视频云等多场景。To C 端的 MTT S80 消费级显卡,搭载完整的春晓芯片,能够流畅运行《暗黑破坏神 3》《英雄联盟》等主流游戏。

这是国内唯一支持 Windows DirectX 12 的游戏显卡,也是国内唯一能批量出货桌面级显卡的厂商。

To B 端,摩尔线程的产品线更加丰富。MTT S3000,面向云渲染、云游戏等企业场景。更高端的 MTT S4000 是训推一体智算卡,MTT S5000 则支持 FP8 精度,专门针对大模型训练和推理优化。同时摩尔线程还有面向数据中心的万卡互联方案 KUAE。

沐曦走的是纯 To B 路线,产品线高度聚焦。

沐曦的曦云 C500,采用 7nm 工艺,通用 GPU 架构,专注 AI 训练、推理及科学计算,对标的是英伟达 A100。

虽然其自研指令集和可重构 GPU 架构,并宣称通过独创硬件加速单元优化算力能耗比,突破了传统 GPU 能效瓶颈。

但曦彩 G 系列图形渲染 GPU 仍在研发阶段,无法提供成熟的图形能力。下一代旗舰曦云 C700 号称接近英伟达 H100,但在 H100 的 4000TFLOPS 面前,15TFLOPS 的 C500 更像是在追赶上一代产品。

曦思 N100 专注推理,曦云 C500 做训练推理兼顾,曦彩 G 系列图形渲染还在 PPT 阶段。

本质上这是两种不同的豪赌。摩尔线程赌的是,CUDA 生态护城河会逐渐松动,通过转译工具抢夺英伟达的开发者。沐曦赌的是,自主可控的战略价值会倒逼客户接受生态重建成本。

前者像当年 Android 兼容 Java 应用的策略,后者则是自研内核。

C

然而历史已经给出了残酷的答案。

AMD 在全球 GPU 市场苦战 20 年,市占率始终徘徊在 10% 左右,面对英伟达的 CUDA 生态壁垒几乎无解。这场国产 AMD 与国产英伟达的路线分歧,怎样才能避免重复的结局?

同时沐曦和摩尔线程也面临相同的问题,他们的产品性能远低于英伟达最新的旗舰产品。

根据摩根大通的数据,2025 年英伟达出货 550 万张 GPU。

相较之下,摩尔线程 AI 计算芯片 1.5 万到 2 万片,消费级显卡及 SoC 15 万片,但后者多为面向信创 PC 和轻薄本市场的低算力产品。沐曦截至 2025 年第一季度累计销量 2.5 万片,2025 年预计总出货量 3 万到 5 万片。

不是因为价格,而是因为性能代差至少 2 到 3 代。

光是 H100 单卡性能相当于国产旗舰 GPU 的 3 到 5 倍,而且英伟达的迭代速度比国产厂商更快。等沐曦、摩尔线程的下一代产品出来,英伟达的 B 系列已经开始收割市场。

更要命的是,大部分所谓,国产化订单,本质上是被动替代,而非是客户主动选择,买不到英伟达才退而求其次。12 月 8 日,特朗普宣布放宽英伟达 H200 出口政策后,字节内部迅速成立 "H200 自采项目组 ",腾讯则是参与紧急会议,提交 H200 需求预测报告。

从现状来看,目前国产 GPU 的真实应用场景大多是这些推理场景,算力要求低,国产勉强够用。教育科研,不追求极致性能。以及一些采购项目,强制国产化要求。

但在真金白银的商业 AI 训练市场,主动选国产方案的客户数量并不多。

从已有的订单看,沐曦和摩尔线程大概率会继续获得融资和政策支持,营收也会随着强制国产化订单增长。

但要真正成为客户的首选,而非备胎,需要解决三大核心问题:性能、软件生态成熟、供应链稳定性达到英伟达水平。

国产 GPU 的故事,注定是一场漫长的马拉松,IPO 首日涨 5 倍的狂欢,并不能代表未来。

就在摩尔线程、沐曦双雄逐鹿科创板之际,另一个玩家——百度旗下的昆仑芯也传出赴港 IPO 的消息。2025 年 12 月,路 · 透社援引知情人士称,昆仑芯计划最早于 2026 年一季度向港交所递交上市申请,目标 2027 年初完成 IPO,最新投后估值约 210 亿元。

更引人注目的数据是:昆仑芯 2024 年营收约 20 亿元,超过已上市的摩尔线程的 4.38 亿元和沐曦的 7.43 亿元,更是超过了寒武纪的 11.74 亿元。摩根大通预测,其 2026 年营收或暴涨至 83 亿元,是 2025 年预期的 6 倍。

更关键的是,昆仑芯是大厂自用模式的典型。百度持股 59.45%,文心大模型的万卡训练集群就用的是昆仑芯,这种左手研发,右手采购的闭环是摩尔线程、沐曦这些市场化公司无法复制的天然优势。

昆仑芯选择港股而非科创板,可能也透露出其直至 2026 年才有望实现盈亏平衡,A 股对盈利的硬性要求显然不太友好。其外部客户占比约 40%,包括 vivo、吉利汽车、招商银行、南方电网等,虽然看似多元化,但核心还是靠百度内部订单撑起规模。

大厂自用,能保证订单稳定,但若找不到其他出路,那就等于天花板锁死。

但对于一直对百度市值不满的李彦宏来说,昆仑芯上市是一次难得的享受市场 " 高估 " 的机会。盛宴不常,盛筵难再,英伟达国产平替们唯有努力成为财富神话,或许才有足够的储备撑到黎明。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

英伟达 amd 摩尔 芯片 gpu
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论