
作者丨铅笔道 吴欣晓
编辑丨铅笔道 邹蔚 王方
过去 2 个月,最吸金的赛道,莫过于国产 GPU。
那些 1 天赚 700%、5 年赚 1000 倍的神话,在这一轮全部实现,并且都绕不开一个关键词:GPU 四小龙——摩尔线程、天数智芯、沐曦、壁仞科技。
一位长期跟踪 GPU 产业的投资人对铅笔道表示:夸张点说,过去 5 年,如果没投 GPU,相当于这一轮周期 " 白干 "。这种遗憾,不亚于移动互联网时代错过字节。
这个机会窗口正越来越小。本月,随着通用 GPU 企业——天数智芯在港股上市,募资约 32 亿元,意味着四小龙最后一块拼图被补齐。
值得注意的是:IPO 之前,这家低调到几乎不接受媒体采访的公司,最近持续向市场释放消息。
1 月 26 日,它亮出几张底牌:公布了 2025 到 2027 年的 GPU 架构路线图,特别需要指出,2025 年推出的天数天枢,在 DeepSeek V3 场景,性能已超英伟达 Hopper 架构 20%,这意味着天数的路线图已经在兑现过程中。同时,这次发布天数智芯还推出四款边端产品彤央系列(可理解为 " 本地算力模组 "),尺寸从口袋大小到桌面级;还披露了最新商业进展:覆盖 20 个行业、300 多个客户、1000 个联合开发案例,数千卡集群已稳定运行超 1000 天。
这些动作,不禁引发好奇:它究竟能撑起多大的戏码,能否持续创造千倍的收益神话,又会怎样影响国产 GPU 的格局?
- 01 -
新神话还是新泡沫
这些动作背后,有一个特定背景,那就是目前的国产 GPU,泡沫和机会一样大——天数智芯这些动作,离机会更近,还是离泡沫更近?
国产 GPU 的机会在哪里?多说无益,直接看英伟达。过去 10 年,市值从几百亿美元,涨到万亿美元,一年收入约 1300 亿美金(2025 财年),其中净利润超 700 亿美元。
这些数字背后,有一个几乎共识的结论:AI 的尽头是算力;算力的尽头,是 GPU。AI 要想聪明,必须烧钱、烧算力;而要想算力大,就必须 " 卡 " 多。
这些元素中,钱、算法都不稀缺,稀缺的几乎只有一个:GPU。2020 年之前,全球大部分的 GPU 产能,都卡在一家公司手里:英伟达。
因此,国产 GPU 的起点,并不浪漫,只有三个字:买不到。
尤其到 2022 年底,美国收紧 AI 芯片出口规则,相当于洪水撞上大坝,小路直接被堵死。这些 " 卡脖子 " 局面,逼得本土厂商必须自研。
这支本土队伍中,既包含了寒武纪、海光信息等,也囊括着 GPU 四小龙:摩尔线程、天数智芯、沐曦、壁仞科技。
此外,还包括各类超级独角兽,比如燧原科技、昆仑芯等(见下表)。

统计发现,这些公司的成立时间,可以分为两类:一类成立于 2019-2020 年前后,正值国产 GPU 爆发前夕;
另一类是先遣部队,成立于 2015 年前后,风口还没来就等在那里,比如寒武纪、天数智芯、海光等。
这些先遣部队,成立之初,也不是完全奔着 GPU 而去。只是干着干着,风口来了。
以天数智芯为例,2015 年成立时(总部上海),它锁定的并不是 GPU,而是算力加速软硬件产品,好比打游戏时的 " 外挂工具 ",能让计算速度更快。
但过程中,AI 算力的需求,让它发现 GPU 的供不应求。于是 2018 年,天数智芯转向 GPU 研发,启动首款产品(天垓 100)的流片工作。
这才有了后来的成果:实现国内通用 GPU 从 0 到 1 的首次突破,成为国内第一家自研、量产通用 GPU 的公司。
这些队伍,取得的成绩也不尽相同。
海光、寒武纪起步较早,成了第一批国产 GPU 上市公司,市值在 5000 亿 -7000 亿不等。
剩下的 "GPU 四小龙 ",上市时间接近,差异化也较大。
观察可以发现:错位比较明显的是天数智芯。
它的成立时间最早,自研量产时间最早,芯片交付量靠前(通用 GPU5.2 万枚),年收入排名第二(2024 年)。
基于这种全站自研通用 GPU 的技术优势和实战场景打磨的规模化商业落地优势,不少投资人看好它的稀缺性和增长潜力。

国产 GPU 四小龙市值及收入对比。
- 02 -
伪需求与真痛点
国产 GPU 现在热度爆表,钱也追得凶,但能不能一直火下去,要回到一个根本问题:芯片好不好用,能不能被客户认可。
这个痛点下,国产 GPU 有三大流派。
一类是 " 参数派 "。这是最容易被市场看见的一类:指标好看。核心算力、内存带宽、跑分成绩都挺亮眼,宣传材料数据一列一列地甩出去。
另一类是 " 定制项目派 "。它的风格是:先解决问题,再谈指标,优点是:短期赚得稳、问题能解决,但想做成流水线大厂,天花板明显。
最后一派是 " 系统工程派 " 或者叫 " 解决方案派 ",天数智芯就是这类企业。
它是前面两派的融合,既做芯片又承接定制项目,但不追求一次性表现,而是提供长期可运行的解决方案:不仅做硬件,还要自研软件栈、工具链、编译器和适配层等。
这条路走的人不多,难度大。天数智芯副总裁邹翾对铅笔道说:" 我们在国内首家构建了通用架构下的 GPU 全栈设计能力,目的就是为了在客户实际场景中实现好用、落地。"
这三大路线差异较大,但面临的瓶颈相同,那就是:直到今天," 国产卡 " 的份额依然很小。
多家头部算力中心负责人向铅笔道表示:过去 1-2 年,国产芯片仍是少数选择——就算是 " 老大哥 " 华为,也面临这个瓶颈。
具体的份额,可以用一组数字来形容:100 张通用 GPU 里,大约只有不到 6.5 张是国产卡(2025 年 / 如图)。

天数智芯招股书中,国产 GPU 份额的描述。
" 国产卡 " 为什么份额少,是性能不行吗?不完全是。据外媒报道,国内多款头部芯片,关键性能与英伟达旗舰产品(H100)相比,差距只有 10%-20%。
甚至某些产品,国产 GPU 还实现了反超。比如 1 月 26 日,天数智芯发布的几款边端产品,打通客户应用场景 " 最后一公里 ",把云端大算力能力折叠进方寸之间,将集成大算力的小巧产品,送到客户的 " 手中 ",就像在场景的端侧产品中安装了 " 大脑 + 小脑 ",让边端场景的运行更加流畅。比如具身智能机器人,不但能够走路,而且可以根据算力支撑的实时判断能力,进行 " 劳动 "。此外这个产品还可以应用在工业智能、交通智能、车陆运一体化协同。在这组产品中," 基础款 " 的性能已反超国际卡 3.7 倍。

天数智芯与英伟达相关产品性能对比。
性能的差距,为国产 GPU 争回来不少分,但另一个更值得重视的问题是:芯片好不好用,客户认不认可。
- 03 -
破局思路
国产 GPU 的破局思路是什么?天数智芯副总裁邹翾的建议是:回归 " 好用 "。
" 这么多年,我们一直在思考:什么是好用的 GPU?如何衡量 GPU 价值?用户核心诉求是什么?我们的洞察就是简单两个字:好用——它不单单指的是价格优势,还包括使用体验:比如要花多少人力、多少物力、多少时间。"
这听起来可能有点抽象,他举了两个身边案例。
有家 AI 创业公司,金融大模型每季度至少迭代两个版本,每次硬件适配,需要投入 10 人团队,耗费两周修改 500 至 1000 行代码。
另一家传统企业,需要用开源大模型建知识库,因硬件接口不兼容,落地周期常从一个月,延迟至两到三个月。
这些痛点,不只在 1-2 个案例身上体现。邹翾介绍,截至去年底,天数智芯探索了 20 个行业,服务了 300 客户,联合开发了 1000 个案例,无一不指向这个答案:产品好用!。
在客户眼里,这种 " 好用 ",具体又包括什么?天数智芯副总裁郭为向铅笔道提到:客户买不买你的产品,主要看三点。
1、客户现有使用习惯是否需要改变;
2、是否提供本地化调优服务;
3、是否有价格优势。
郭为表示,就算自己第一次拜访客户,也基本从这三点入手。
这三句话背后,隐含着客户的三大烦恼。
1、别让客户为了 " 新卡 " 去改代码、换框架、重写流程;
2、通过贴身调优,把坑在前期填掉,帮客户把系统真正跑稳;
3、利用国产优势,给客户一个愿意尝试的理由。
比如,天数智芯发布了 4 款边端产品:彤央系列(如下表)。

天数智芯的新品,可用于机器人等新兴场景。
其中,副总裁郭为讲述了一个客户痛点。
国内有家机器人未来独角兽——格蓝若,想选一款芯片,让机器人 " 听得清、想得快、说得明 "。核心诉求之一,就是兼容性。
" 我们模组采用的标准接口,和英伟达的 Orin 完全兼容。目前国内,机器人几乎全行业采用的都是英伟达标准,所以客户的使用习惯等都不用改变,拿过去可以直接用。"
最终,格蓝若选择了天数智芯。
又比如,天数智芯还发布了 3 年架构路线(如图)。这些架构背后,主要的指引思路,也是 " 好用 ":算得快、算得省、省力、可持续等。

比如算得快(高利用率):天枢架构的 "Attention 效率>90% 是个关键指标,意味着芯片干正事的时间更多,浪费的算力更少。
比如算得省。天枢架构追求更精细的 " 省电 " 模式,这就像给不同的任务(科学计算、AI 推理)匹配最合适的 " 燃料 ",在保证结果正确的前提下,最大限度降低功耗和成本。
此外,为了让客户省钱,解决 DDR 存储价格高的问题,天数智芯通过 kv cache 等技术,让模型推理使用的内存量降低 50% 以上。
- 04 -
结语
未来几年,通用 GPU 的国产化趋势不可逆。据行业报告显示,预计 2029 年,国产率有望达到 50%。
摩尔线程、天数智芯、沐曦、壁仞这四小龙,就像中国 GPU 市场的先遣部队,各自抢占阵地,也把初步经验探索了出来:对用户来说,买的不仅仅是卡,而是最终体验。
天数智芯此次向市场释放消息,或许就是朝着这个目标,为下一轮竞争做铺垫。
本文不构成任何投资建议。


登录后才可以发布评论哦
打开小程序可以发布评论哦