文 | 海豚研究
2026 年 1 月 2 日,壁仞科技在港交所敲钟:发行顶格定价 19.60 港元;开盘股价飙升 +82.14%,盘中一度市值突破千亿港元,收盘市值约 825 亿港元;公开认购超额达 2,347 倍,散户热情火爆。
火爆行情离不开其作为首家港股上市 GPU 公司的稀缺性," 国产 NVIDIA" 的标签更让其成为资本追捧的香饽饽。但抛开这些光环,我们关心壁仞究竟是否是一家优质的公司?
1. 历程:在实体清单上长出来的公司
要理解壁仞,必须梳理其发展历程,其历程本身就是国产芯片行业的 " 辛酸史 "。
1)2019-2022 年,一级资本加注芯片国产替代。公司成立于 2019 年,当年美国把华为列入实体清单、海思被迫断供,一级市场将 " 芯片国产替代 " 作为投资主线。当时空缺的国内 GPU 市场迫切需要初创企业既要能肩负起 " 国产 NVIDIA" 的宏大叙事,又不能使投资人的真金白银打水漂。在此背景下,创始人张文带着他跨度极大的履历登场。
交大的工科、海外学的法律与商科,早期职业是律师,后转型投资人,2011 年才真正进入半导体,张文组建了一支由 AMD、高通、华为海思等顶级技术专家组成的 GPU 初创团队。
有叙事、有人才、有愿景且具备稀缺性(彼时摩尔线程、沐曦集成尚未创立),自然不乏资金追捧。在 2019-2021 年间,公司共完成了 7 轮融资,累计金额 47 亿元,B 轮投后估值超过 110 亿元。
2)2022-2024 年,产品惊艳亮相到产线被动 " 升级 "。2022 年 8 月,万众瞩目的壁仞正式发布产品 BR100/104,其中 BR100 是旗舰产品,公司将其对标 "A100 的 3 倍以上算力、性能逼近未发售的 H100",同期自研 BIRENSUPA 软件栈,主讲中国版 H100 叙事。
但是,细看产品参数,TSMC 7nm 制程、CoWoS-S 封装、HBM2e,敏锐的投资者已经能够猜到接下来会发生什么了。两个月后,BIS 发布出口管制新规(「ECCN 3A090」),BR100 产品参数触发管制限制。
在四个月后的 2023 年 1 月,壁仞突然实现了 BR106 的量产,该型号是从哪儿来的?海豚君推测 BR106 是壁仞为绕开新规而 " 降规 " 迭代的 BR104,初期大概率仍由台积电生产,但被实体清单后生产转至国内。
备注:2023 年 10 月壁仞被定向封锁,BIS 把它和另外 12 家中国实体列入出口管制实体清单,并加挂 " 脚注 4",也就是代工厂要给这些客户交付产品,必须先得到许可证。TSMC 代工通道彻底关闭。
从被制裁到转产国内产线量产,速度上来看壁仞还算可以。但两次制裁前后,联合创始人焦国方与徐凌杰先后离职,面对这家高估值但历经旗舰流产、产品降规、产线被迫 " 升级 "、初创团队流失的国产 NVIDIA",资本市场的 " 光环 " 逐渐褪去。
3)2024 年 - 至今,商业化启动
重新恢复节奏已经是 2024 年的事情。其中 BR 166,当下 100 系产品中强算力的双芯配置,也是当下的收入主力,是 2025 年 8 月才开始量产的。
目前 BR100 产品系下有三款产品,单芯 BR106,双芯 BR166(收入主力),以及 IoT 芯片 BR110。整体这三款产品其实都是 2022 年研发的产品。
而包括壁仞在内,国内芯片创业公司的价值重启,是在 2025 年上半年 H20 被禁,即使后续解禁,甚至 H200 放行后,国内云大厂的预算硬性分配到国产芯上,市场已经开始确定性认识到 " 国芯 " 已是国产替代下的" 刚需品 "。
那么,在新叙事强力加持下,摩尔线程、沐曦登陆科创板,壁仞、天数智芯登陆港股,剩下燧原科技同样上市在即。那么在国产芯价值重估当中,壁仞在一众同行中有什么不同,能吃多久的行业红利,未来的核心看点又在哪里?我们接着分析。
2. 中短期:" 出货 " 为王
目前,国产芯业绩其实逻辑很简单:供给为王。谁能芯片规模出货,谁就能拿到云资本开支的预算。因为英伟达在中国 GPU 市场从几乎 100% 的市占率光速接近清空、AI 走到 Agent 时代又进一步引爆了需求,这中间留下的供需错配太大。
按照海豚君的粗略核算,这个供需差距可能要到 2028-2029 年,才有可能逐步弥合上。29 年之后才会进入需求为主的时代。26 年的需求缺口应该是 40-50% 上下。
1)供给:先进产能紧缺
国产 GPU 的单核性能弱是共识,普遍落后 NVIDIA/AMD 一至两代,国内常见的方案是通过各种层级(Die-Die/GPU-GPU)的数量堆叠、互联来弥补差距,但难以从根本上消除与海外晶圆厂之间的工艺差距。目前,国产 AI GPU 的上游仍在诸如光刻、EDA 等方面存在限制:
- EDA:国产 EDA 龙头华大九天国内份额约 15.7%,但全球份额仅为 2-3%,且尚未提供数字 IC 全流程的套件;叠加美国对华出口 EDA 软件中的高端制程(7nm 及以下)实施严格管制。
- 光刻设备:国内仍然依赖 ASML DUV 进口,2025 年中国加速采购以对冲管制升级,而 EUV 出口管制始终是最关键的卡点;
- 代工:因设备限制,国内先进制程(N+2:7nm;N+3:5nm)是稀缺产能。目前国内先进产能的能力主要是在中芯国际,多数国产 GPU 设计厂都是排队等中芯的产能。另外一家是华虹半导体,但只是小规模量产,良率和产能有待验证。
由于产能受限,部分 GPU 厂商只能被迫选择 N+1 产线(初代 7nm),但芯片性能与制程先进性高度相关,这也是产能受限下的无奈之举。
因此代工厂能拿出多少的供货,海豚君按 " 晶圆产能 → AI 产能分配 → 制造良率 → 单片裸晶数 → 封装良率 → Die 总供给 " 来做粗略估算。
2)需求:AI 代理需求爆发
需求端看,由于 AI 逻辑芯片进口实质受限,国产替代成刚需。但由于目前国内产品还很难满足训练需求,因此这里主要只是核算推理端的芯片需求。
a ) 以阿里、字节、腾讯为代表的互联网巨头;
b)以 DeepSeek、MiniMax、智谱等为代表的基础模型研发企业;因为需要一直不停消耗 Token,单一需求量太大,有绕过云厂商直接提需求的权利。
以上厂商主要受益于推理需求的结构性上升,领先厂商的基础模型已将日均 token 消耗推至超十万亿。该部分是需求的主力军。
c ) 电信运营商、国企与地方政府等主权 AI 玩家,需求主要来自国家 AI 基础设施建设、数据主权、算力中心与公共部门应用。
市场需求基于国内 AI 开支规划,沿 " 客户 AI/ 云 Capex → 剔除 CSP 海外支出 → × 服务器占比 × AI 服务器占比 × 加速器组件占比 → AI GPU 金额 TAM → /ASP/ 算力 反推卡数→ GPU Die 个数 → CPU/GPU 个数比→ CPU Die 个数 → Die 总需求 " 逐级推导。
总体估算下来,26 年大约需要 420 万颗的 AI 芯片需求,但 26 年供给只有 260 万的供给,差距肉眼可见。
3. 短期:壁仞产能锁定能力如何?
要判断壁仞短期业绩的释放爆发力,本质是分析它否能够锁定足量产能支撑起规模化出货。根据调研,在代工产能受限的当前阶段,代工产能其实是大锅饭的 " 配额制 ":对具备成长性的厂商给予适度倾斜,避免产能在限额分配中过度向单一头部集中。
而海豚君分析后认为,当下这种计划配额制对壁仞相对二线能力(下文会具体分析为何二线)的芯片商而言,反而是好事。因为配额制分配会更加侧重战略分配,而非完全市场化定价方式。
1)获得配额的基本门槛:通关
在配额分配中,目前的硬性标准非常看重从模型一发布就能适配,考察的是软件能力。我们观察到国产 AI 芯片企业正与国产 AI 模型公司紧密合作,主动实现 Day0/ 深度适配大模型工作。
目前这些新兴的核心芯片商都号称能在模型发布的第一时间,实现 DAY 0 的适配。但实际运行流畅度可能又是另外一回事。下图展示了壁仞对主流大模型的适配情况,基准门槛是通关的。
再看锁定产能的 " 软 " 条件:资金背景。
- 主权资金方面,海光 / 寒武纪都有强势的国资(中央)背景,有望优先受益于中芯国际的先进产能(最高优先级仍是华为);而上海地方同时扶植了壁仞 / 沐曦 / 燧原三家本地厂商,壁仞并非 " 独宠 "。
- 产业方面,燧原 / 寒武纪在 IPO 前分别有腾讯 / 阿里入主,在需求侧相较于壁仞更有保障;而目前壁仞并无强绑定的大厂关系。
虽然没有独特的 " 深厚关系 ",获取肯定还是能拿到的,毕竟:
其一,对于地方而言,各家厂商手心手背都是肉、难以偏废,其介入本就会使二线厂商有望获得优于纯市场化结果的产能份额。
其二,华虹国际(上海市国资委 ( 51.59% ) 、上海国盛 ( 18.36% ) 、上海国际集团 ( 18.36% ) 、上海仪电 ( 11.69% ) )以 " 现有少数股东的紧密联系人 " 身份出现在壁仞的配售名单中(尽管份额仅 0.13%),也就是说晶圆厂就是它的股东。
而调研也证明,壁仞已经开始接触除中芯国际以外的晶圆厂,并准备了两套产品方案。我们认为随着华虹 7nm 逐步投产,壁仞将随着华虹的产能释放逐步获得晶圆供应。
2)为什么良率可能成为制约?
尽管存在上述利好,难改中芯国际(先进产能的大头)的排产优先级并不面向壁仞的事实,我们判断未来产品主要的供应仍将来自华虹,但华虹的先进制程目前仍处于投产初期,产能有待爬坡。
该工艺通过 DUV 多重曝光实现,而非 EUV,这将导致芯片的良率与能效相对偏低,进而拖累出货能力,是短期最关键的风险点。
4. 长期:壁仞长线能跑赢吗?
进入长期,比拼的就是各家厂商的产品力,产品力的维度目前来说分为三个大的维度:
a. 单芯能力:基础参数、迭代速度;
b. 芯片软、硬结合与生态能力;
c. 系统级方案的交付能力。
目前国内玩家中,除了海思有比较强的系统化交付产品和能力,其他都还集中在芯片这个单一问题上。单看壁仞:
1)基于 GPGPU 的硬件系统;
2)软件平台 BIRENSUPA;
1) 基于 GPGPU 的硬件系统
主流的 AI 智算芯片类型上,有 ASIC、FPGA 与 GPGPU 三种路径。公司主营自研 GPGPU 芯片、加速卡、整机服务器,采用 Fabless 模式,将晶圆制造和封装测试外包给第三方代工厂。
目前壁仞已量产 BR106/BR110/BR166 三款 GPGPU 芯片,以 PCIe 板卡与 OAM 模组落地,产品的核心规格信息整理如下:
自 BR100/104 流产后,公司不再公布产品具体的可比参数规格。根据光大证券,其单芯片(BR100/BR104/BR106)性能在国产芯片中表现优异,支撑起芯片总体出货量同比增长 +273%。但以上都是历代产品的数据表现,海豚君更关注的是旗舰产品 BR166 与 BR20X。
a ) BR166 够打吗?
BR166 其实就是 BR106 的双芯版,算力翻倍,架构其实不变,而 BR106 的原本架构就是 2022 年的 BR100。
按招股书所说,「我们利用芯粒技术将两个 BR106 裸晶和四个 DRAM 集成到一个封装中…两颗 BR106 裸晶之间的 D2D ( 裸晶间 ) 双向带宽可高达 896GB/s。」架构(下图为 BR100 架构,BR166 除内存披露为 DRAM 外延续此架构)如下所示:
彼时来看,壁仞为了做 AI 智算场景,设计架构上还是颇具创新的,高算力搭配超大的片上 L2 缓存(H100 仅 50MB,BR100 高达 256MB)。
微架构设计上,我们知道 SM 是 NVIDIA 的基本调度粒度,类似壁仞的 SPC 下还有更小的 EU 单元,支持对 4/8/16 EU 的动态调度粒度组合,可以根据工作负载特性在更细粒度上做资源复用。
算力(矩阵吞吐量)上,每个 EU 配置 1 个 T-Core(1 SPC 有 16 个 T-Core 并行计算);Hopper 架构下单 SM 是 4 个 Tensor-core;这个是更适合国产良率下 Chiplet 的方案。
当下来看,不支持原生 FP8&FP4 数据格式是最大的硬伤,没有低精度数据格式意味着在大模型训练推理场景的效率上存在先天劣势,而这在大模型训练推理任务中已大范围应用。
在国内同行中,由于 BR100 是 2022 年的产品,单芯算力还算可以,主要在片间互连、显存带宽与容量、计算精度等方面已被友商赶超,其中昇腾 910C 基本对标 H100,而沐曦 / 燧原的产品综合性能已经介于 H100-H200 之间,BR166 的产品力已略显不足。
我们观察其下游合作伙伴(黄底意味着交付)进行印证,壁仞的产品主要出货给运营商 / 智算中心等主权 AI 项目,并没有 CSP 的大规模订单。一个很大的原因,是 CSP 们部署的都是推理需求,当下 Agent 推理要的是大内存、强连接。壁仞当下产品线这方面比较薄弱,因此综合实力上 BR166 不是一个非常能打的产品。
除了产品力不足这一潜在因素外,我们在第 1 节中对壁仞曲折的发家史已经进行了梳理,地缘政治因素导致了供应链的不确定性,使得公司无法向互联网客户证明其具备长期、稳定、大批量供货的能力。
不过需求过旺情况下,这些短期是不大问题:从财报来看,订单、预付款、备产三个维度的财务数据侧面印证了壁仞下游需求的确定性是存在的。
- 在手订单:据招股书披露,其框架销售协议及销售合同中未完成的、具约束力订单总价值达 8.22 亿元,为后续收入提供确定性基础。
- 合同负债:2025 年末合同负债达 0.77 亿元,已有客户以预付方式锁定订单。
- 存货:2025 年末存货净额达 9.49 亿元、同比增长超 500%,且结构上以原材料(3.86 亿元)与在制品(4.31 亿元)合计占比约 85%,表明存货扩张源于确定订单。
b ) BR20X 怎么看?
BR166 综合竞争力不突出,但站在 2026 年的节点上,按照 3-4 年产品大迭代一次来看。新一代旗舰产品 BR 20X 系产品推出在即。节奏上:
( 1 ) . BR20X 系列:目前正在进行物理设计及流片验证,计划 2026 年四季度开启商业化。公司将在提升单芯片能力的同时加快推进超节点系统。
( 2 ) . 产品参数:作为供应链完全转向国内而免受管制的下一代旗舰产品,演进方向上符合我们预期:
- FP8&FP4 将在 BR20X 系列配备,加速公司适配大模型训练推理需求;
- 提供更强的算力;
- 配备更大更快的内存、更高速的互联带宽及超节点系统设计。
具体规格上,我们估计 BR20X 将对标 NVIDIA H200,具体参数没有公开信息。海豚君以参考对标的产品以及调研信息,对 BR20X 估计如下:
新产品主要是补了内存容量的短板,但连接上应该还是需要改善。但总体来说,由于补足了之前的缺点,新产品从产品侧是能够拿到大厂的订单的。关键矛盾,还是新产线爬坡的良率。
2)软件平台 BIRENSUPA
如果说硬件方面,各大芯片设计厂商正在尝试各种方案缩小与 NVIDIA 的代差,那在软件方面,CUDA 就是所有厂商都无法绕开的一堵高墙。CUDA 的壁垒不必过多赘述:先发优势积累的护城河、软硬件深度绑定带来极致性能优化与软件兼容、丰富的工具库等。
国内厂商的应对大体分两条路线。一是采取兼容 CUDA 的模式,如摩尔线程的 MUSA/ 沐曦的 MACA,他们都以此作为商业化的卖点。二是以华为 CANN/ 寒武纪 Neuware 为代表的全栈自研,前者通过超 5 年的算子积累深度绑定了主权订单,后者在推荐系统场景垂直深耕,收获字节等头部 CSP 的锁定。壁仞创立之初也计划走自研生态。
BIRENSUPA 的开源程度与软件栈的丰富度上短板明显,生态建设仍处于早期阶段;且在工程落地面临摩擦成本。调研指出,在复杂场景下,BIRENSUPA 可能仍需手动修改底层 IR 代码或出现编译报错率偏高的问题,部分通信库在千卡集群中的同步延迟也需要调优。
为了补短板,壁仞打算把 IPO 募资的 40% 用于优化软件栈生态,且在 PyTorch、vLLM、SGLang 等主流开源框架逐步提供了全面支持,使其能够进入 CUDA 生态构建的庞大存量市场,降低客户迁移成本。
短期来看,壁仞由自研生态转向兼容的取舍是合理的,其规模体量 / 客户结构 / 商业化能力都无法支撑其继续埋头走自研道路。毕竟对于客户而言,最终评判核心是解决方案的性价比,这是一个软硬件结合的体现。
但站在更长期视角,兼容本质上并不能带来竞争壁垒,乐观的推演下是壁仞作为中间层做得比其他厂商更具优势,但如果壁仞不能在软件易用性、稳定性和第三方生态建设上建立差异化,可能很快就会陷入同质化竞争。
3)超节点:有方案吗?
壁仞的产品以 GPU 集群 / 超节点为交付形式,但其在交付方案中的价值量仅在于 GPU 环节,互连、交换、整机集成的价值量让渡予曦智、中兴等上下游伙伴。
行业,国产厂商除华为已实现了全栈自研,多数在互连通信的自研布局上仍处于起步阶段(仅在卡间互连协议实现自研),在交换芯片(对标 NVSwitch)、整机柜系统集成环节多与上下游厂商合作。
而目前各家的研发重心放在了算力芯片、软件栈之上,互连尚未形成差异化竞争。但互连技术在 AI 时代的价值被显著放大,Scale-up/out/across 能力将决定单节点能够承载的模型体量。
我们认为能够率先 " 交钥匙 " 的公司将利于自身长期生态壁垒的构建,壁仞与创业公司同行没有本质差异。
5. 综合来看,壁仞在同行当中,主要差异化是单芯能力。但其实当下推理芯片的核心单芯重要性其实在下降,算力模块上的内存和连接也变得越来越重要;系统化超节点交付方案上没有差异,还都在初级阶段;在关键的软件生态上也是几家当中不太突出的。
但它好的地方在于,在 " 产能配额 " 模式下,它具备种子选手,持续被政策扶持的实力,本身能够港股上市,其实也是一种官方背书的体现。而且短期来看,BR 20X 商业化在即,也能为接下来的业绩释放提供非常好的接力棒。


登录后才可以发布评论哦
打开小程序可以发布评论哦