锌产业 2小时前
巨变2025:国产GPU集体冲线
index.html
../../../zaker_core/zaker_tpl_static/wap/tpl_caijing1.html

 

由于国产大模型热情依旧、生成式 AI 已成确定性趋势,以及众所周知的原因,2025 年的国产 AI 芯片迎来了高光时刻。

就在本月,摩尔线程沐曦股份先后在科创板 IPO 上市,在上市后,市值迅速暴涨 6-7 倍,甚至一度将 A 股的投资热情带到了一个新高度。

与此同时,同为 " 国产 GPU 四小龙 " 的燧原科技早在 2004 年就启动了科创板上市进程,另一位玩家壁仞科技也在近日向港交所提交了 IPO 申请、拟于 2026 年 1 月 2 日在港股上市。

与此同时,诸如天数智芯、昆仑芯等更多国产 AI 芯片企业,也已经开启 IPO 征程 ……

这让巴克莱银行亚太区执行主管 Matt Toms 也不禁感慨:" 如果到 2026 年或 2027 年,中国生产出低成本、有竞争力的芯片,就像当年的 DeepSeek 那样,我一点也不会感到惊讶,而这将对英伟达及其供应链造成颠覆性影响。"

这就不得不让我们,在这新年旧日更替之际,重新审视以国产 GPU 四小龙为代表的,中国 AI 芯片的关键时刻。

01 学习大厂,颠覆大厂

来自咨询公司 Challenger, Gray&Christmas 的数据显示,2025 年美国因人工智能导致的裁员人数已接近 5.5 万人

时至今日,生成式 AI 成为时代趋势,已经不容置疑。

中国市场是生成式 AI、大模型的前沿阵地,也是大模型最活跃、竞争最激烈的市场,这里需要大量的万卡集群、十万卡集群,需要大量的 AI 算力,尤其是在当下国际竞争局势下,国产 GPU 的算力需求日趋强烈。

这时," 国产 GPU 四小龙 " 应运而生。

说起来,国产 GPU 四小龙不仅代表着中国 AI 芯片的顶级战力,在全球 AI 芯片领域也有着不小的影响力。

就像 Anthropic 创始成员来自 OpenAI 一样,这四小龙的核心创始成员大都出自两所 GPU" 黄埔军校 " ——英伟达、AMD,不少都曾是这两家全球芯片巨头的关键先生。

首先来看四小龙中关注度最高的,也是在上市后不久就马不停蹄地举办了首届开发者大会的摩尔线程。

摩尔线程创始人张建中出生于江苏南京,大学就读于南京理工大学计算机系,后又在原冶金部自动化研究院获得硕士学位。

相较于四小龙中其他几位创业者,张建中的求学经历并不算出彩,但这并没有影响他进入职场后的一路进阶升级。

1992 年,离开冶金部自动化研究院后,张建中先后在惠普戴尔做过产品总经理客户部总经理,之后在 2005 年加入英伟达,在英伟达,张建中这一待就是十五年。

在这十五年里,张建中任全球副总裁、中国区总经理,直接负责英伟达在中国的业务和生态体系建设,不仅推动中国后来成为了英伟达在全球的一个重要市场,也让张建中在陪跑英伟达过程中,见证了 GPU 从不起眼的游戏领域图形处理器,一路成长为人工智能大潮中一切相关产业的底层基础设施。

于是,在人工智能大潮下、在国产 AI 芯片崛起时,这位打工皇帝结束了自己在全球科技巨头二十多年的打工生涯,创业成立了摩尔线程。

在创立摩尔线程时,张建中将英伟达生态总监周苑GPU 架构师张钰勃等一批前同事一并拉入到了自己的创始团队,这让摩尔线程天生具备了 " 英伟达血统 ",在后来的技术产品研发过程中展现出了超乎寻常的战斗力。

从成立第二年开始,摩尔线程 GPU 研发以一年一代的速度进入到了国内市场,与此同时,对标 CUDA,摩尔线程构建起了自己的 MUSA 生态,摩尔线程由此也有了 " 中国版英伟达 " 的名号。

沐曦股份创始人,是同样出身于国际芯片巨头的陈维良,只不过是另外一家 GPU 巨头,AMD。

陈维良是微电子专业科班出身,先是在电子科技大学微电子专业完成了本科学业,后又考入清华大学微电子系攻读硕士,毕业后回到上海,从工程师做起。

陈维良在创业之前有过多份工作经历,先后在泰鼎多媒体、远弘科技、亚鼎视频科技任职,彼时已经涉足 GPU 研发,并担任过研发设计经理,不过,陈维良这三段工作经历并不长,真正让他深入研究 GPU 并拥有国际眼光的,是他的第四份工作,超微半导体,也就是 AMD。

陈维良是2007 年加入的 AMD,当时的 AMD 还是英特尔的小老弟,尤其随后自己的债务危机和英特尔的酷睿上新,让 AMD 很长时间没缓过劲儿来。

不过,这其中也有一个难说好坏的世纪并购—— 2006 年,AMD 花费 54 亿美元并购 ATI,AMD 由此陷入了长期的债务危机,但也因此获得了梦寐以求的 GPU 技术,并成为当时唯一具备 CPU 和 GPU 芯片制造能力的公司。

陈维良正是在这之后加入的 AMD,并在这家全球半导体行业巨头服役了 13 年之久,在这期间,他的主要工作是负责 GPU 设计和产品研发,陆续完成了 15 款 GPU 产品的流片和量产,他也一路做做到了高级总监。

陈维良离职创业、成立沐曦股份,同样是在 2020 年,一同被他拉入沐曦创始团队的,还有AMD 两位很有分量的科学家,彭莉和杨建

当然,后来加入沐曦的 AMD 前员工,远不止这两位,周俊、王定等一批资深研发人员也都成了沐曦研发团队的核心力量,陈维良由此组建起的 " 中国版 AMD",也走上了一条有别于摩尔线程的路。

燧原科技的创始人,是同样曾在 AMD 任职的清华系创业者,赵立东

赵立东本科就读于清华大学电子工程系,随后又前往美国犹他州立大学攻读了电子与计算机硕士学位。

作为电子工程专业科班出身的他,在 2007 年加入了 AMD,随后参与了 AMD 中国研发中心的组建,在这期间,他历任计算事业部高级总监、产品工程部高级总监,主要工作就是负责 CPU/GPU/APU 的产品规划和相关核心 IP 的研发

这里值得一提的是 AMD 的 APU,AMD 当年收购了 ATI,并不是为了与英伟达抢占 GPU 市场,而是想将 GPU 和 CPU 集成到同一颗芯片上,通过这样的 APU 抢占消费市场,这样的 APU 的产品规划和研发,也正是赵立东后来的工作之一。

不过,赵立东当时更想做的是将 AMD 完整的产品线引入中国,为此他还曾亲自前往 AMD 美国总部推进这一计划,只是后来这一计划的实施并不顺利。

在之后六年里,燧原科技完成了三代四颗芯片的研发,成为国内 GPU 领域又一个举足轻重的团队。

壁仞科技创始人,张文,在四小龙中是一个独特的存在。

张文是四小龙中唯一一位非科班出身的创业者,他本科就读于合肥工业大学电机专业,随后辗转美国,在美国 IT 领域创业并实现了财务自由,这之后,张文选择跨界深造,先是在哥伦比亚大学拿到了工商管理硕士,后又在哈佛大学拿到了法学博士

张文的从业经历也很丰富,在哈佛大学毕业后,由于在纽约拿到了律师执照,他曾在华尔街的律师事务所做过高级律师、也曾在华尔街泛美亚做过市场资深投资人。

2011 年回国后,在中芯国际张汝京离职创业做映瑞光电科技公司时,张文成了张汝京为公司招募的 CEO,张文由此进入到半导体领域。

张文另外一份为众人所知的从业经历是2018 年加入商汤、任职总裁,参与了商汤国内总部、国内诸多大型项目,以及全球研发中心的落地。

有了在半导体领域的从业经验、也有了在人工智能领域的从业经验后,张文选择自己创业,在 2019 年创办了壁仞科技。

彼时的张文,所擅长的并不是技术研发,而是募集资金、人才招募,张文当时从英伟达、AMD、华为、阿里、紫光等国内外知名团队里挖来了不少技术人才,由此组建起了壁仞科技的研发团队。

或许是因为非科班属性,张文带领下的壁仞科技产品迭代速度相较另外三小龙稍显逊色。

壁仞科技第一款 GPU 大成之作是 2022 年 8 月发布的 BR100 系列芯片,当时的壁仞科技已经完成 B 轮融资,累计融资 47 亿元,C 轮融资也已经在路上。

然而,尽管张文擅长资本运作,但壁仞科技和燧原科技有着相似的坎坷上市经历,在 2024 年冲击科创板上市未果后,如今转战港交所、冲击港交所 GPU 第一股。

02 借鉴技术,突破技术

国产 GPU 四小龙的创始人背景有所不同,使得四个团队选择的技术路径也略有差异。

不过,由于这四个团队成立之前,在全球半导体进程中,GPU 就已经有了相对成熟的生态和英伟达、AMD、英特尔这样的 " 带头大哥 ",四小龙的核心技术团队大都也来自这些国际巨头,这就不免要在芯片自研时,学习借鉴带头大哥们的经验。

有着超强英伟达基因的摩尔线程,走的正是英伟达全功能 GPU 的路线,其产品功能定位现代图形渲染、智能多媒体编解码、AI 计算加速科学计算这些领域。

在过往这五年里,摩尔线程发布过桌面级显卡 MTT S50,也发布过数据中心卡 MTT S2000,甚至还搞出了国产 GPU 千卡集群—— KUAE 千卡智算中心。

实际上,对于摩尔线程而言,最重要的是计算架构的迭代,在公司业务步入正轨后,摩尔线程以每年一代计算架构进行着技术迭代——2021 年的苏堤,2022 年的春晓,2023 年的曲院,2024 年的平湖,以及 2025 年的花港

在每一代计算架构发布时,又都会有相应的桌面级 GPU、数据中心 GPU 产品更。

与此同时,摩尔线程也构建起了兼容英伟达 CUDA 的MUSA 生态,通过开源策略和 MUSIFY 工具支持 CUDA 代码迁移。

这一方面是方便基于英伟达 CUDA 生态的产品可以丝滑切换到国产 GPU上,有点国产软件发展过程中,国内数据库厂商兼容 Oracle 的意思,另一方面也是其打造平台型生态必须布局的底层基础设施

沐曦股份是典型的 AMD 系创业团队,走的是通用 GPU(GPGPU)路线,虽然聚焦 AI 计算、通用计算、图形渲染,但目前其产品主要聚焦的还是更为热门的AI 训练推理场景

沐曦已经面世的产品分为两个系列:

一个是面向云端智算推理的曦思系列芯片,沐曦是在 2022 年 1 月完成曦思 N100 芯片设计并交付流片,并在 2023 年正式量产;

另一个是面向训推一体的曦云芯片,沐曦是在 2022 年 12 月完成的曦云 C500 交付流片,并于 2024 年 2 月正式量产,随后陆续在多个国家人工智能公共算力平台、运营商智算平台和商业化智算中心批量应用。

作为 GPU 新势力,沐曦同样高度重视开源生态,并自研了 MXMACA 软件栈。

在近日官方更新的 3.3.0.X 版本中,沐曦官方着重强调了兼容二字,兼容英伟达的 CUDA、兼容 TensorFlow、PyTorch、JAX 等主流开源架构,旨在通过开源力量加强自家产品的认知度和普及率。

壁仞科技的技术路线与沐曦类似,也是通用 GPU(GPGPU),不过,壁仞更强调 " 高端 " 二字。

壁仞是在 2022 年 8 月发布了首款通用 GPU 芯片 BR100 系列(BR100 和 BR104),据官方给出的数据显示:

这颗采用 7nm 制程、chiplet 设计、2.5D CoWoS 封装的 BR100,算力达到了 1000TFLOPS(FP16)、FP8 算力达到 2000TFLOPS,单芯片峰值算力达到 PFLOPS 级别,这样的性能已经超过英伟达 A100 算力水准。

正因如此,壁仞的 GPU 芯片主要面向云数据中心、运营商、智算中心等场景,用以支撑大模型训练、AI 推理、高性能科学计算等通用计算负载。

高性能通用 GPU 成了壁仞的一个标签,壁仞由此也扛起了国产 GPU 云端大算力的大旗。

四小龙中成立最早的,也是另一支 AMD 系创业团队的燧原科技,技术路线又有些不同,燧原科技更强调的是自有生态和云端 AI 加速

说起来,燧原技术路线更为单一、也更为纯粹,核心产品就是 AI 训练加速卡,聚焦大模型训练,自研了GCU-CARA 架构、GCU-LARE 互联技术(类似 NVLink),几乎将所有的本钱都押注在了大模型训练这一肉眼可见、最需要大规模算力的地方。

燧原早在 2019 年底就面向人工智能领域推出了邃思 1.0 这款 AI 训练芯片,以及搭载该芯片的 AI 加速卡云燧 T10。

在这之后,燧原每年都会有新产品发布,2020 年底发布了首款 AI 推理加速卡云燧 i10,2021 年发布了邃思 2.0、云燧 T20/T21/i20、云燧集群。

到今年,燧原又发布了面向高性能场景推理加速应用的燧原 S60,以及训推一体 AI 芯片燧原 L600,这也成为燧原第四代系列产品。

就在中国恶补 GPU 功课之时,由于众所周知的原因,英伟达被迫离开中国市场,国产芯片由此也迎来了一个前所未有的历史窗口期。

03 拥抱资本,成为资本

几乎所有产品,都在被生成式 AI、被大模型重塑,这在 2025 年已经是一个显性趋势。

作为造就大模型的大算力,在 2025 年也经受着被高估和热捧。

从全球范围来看,英伟达在今年 7 月市值突破 4 万亿美元,成为全球首家市值破 4 万亿美元的公司;

从国内来看,即便是尚未盈利的寒武纪,股价也在今年 8 月突破了千元,成为继茅台之后 A 股第二支千元股,寒武纪市值由此也在短短一个月内暴涨了 1500 亿元,突破 4000 亿元。

同样被资本热捧的还有国产 GPU 四小龙,从过往融资经历来看,四小龙已经成为明星标的,每家身后都站着一整个明星投资机构方阵。

与此同时,四小龙也正在成为资本。

目前,四小龙已有两家抢在年底在科创板上市,其中,摩尔线程上市首日股价涨 4 倍、五日股价涨 6 倍沐曦股份更是在上市首日就暴涨 7 倍,甚至将带动了 A 股投资热潮。

继摩尔、沐曦之后,壁仞科技也已经通过港交所聆讯,即将冲刺港交所 GPU 第一股,预计将在港交所节后上市第一天(2026 年 1 月 2 日)上市。

回望 2025 年这一年,人工智能正在悄悄影响着一切,影响着技术的方向、人才的去向、资金的流动,乃至每个人工作和生活的节奏。

在这之中,如果有哪一个产业最能代表人工智能的起落,那么,作为人工智能的底座,GPU 在 2025 年注定是那个最耀眼、也最具有时代象征的符号

评论
大家都在看