芯东西(公众号:aichip001)
作者 | 程茜
编辑 | 漠影
芯东西 6 月 12 日报道,上海 AI 芯片龙头燧原科技将于 6 月 15 日上会,这是国产 AI 芯片 IPO 最新动向。
当前,国产 AI 芯片已经站在资本热潮与商业化落地双重聚光灯下:一方面国产 AI 芯片接连 IPO、上市企业盈利转好;另一方面,IDC 数据显示,2025 年国产 AI 芯片、非 GPGPU 市场份额增加,国产 AI 芯片出货量占比首次突破 40% 大关。
在 token 经济重构算力评价体系、大模型推理需求全面爆发的产业背景下,以 DSA(专用领域架构)为核心的非 GPGPU 路线,正走出一条独立自主的突围路径。
燧原科技就是其中一大代表,其深耕 DSA 路线,依托互联网大厂完成芯模同步进化,一条区别于 GPGPU 路线的国产算力成长路径清晰浮现。
结合当下国产 AI 芯片企业的最新动向,我们试图拆解出当下国产算力玩家突围的核心逻辑与现实挑战。
一、Token 经济下,国产非 GPU 赛道正强势突围
AI 算力产业格局,正伴随大模型的发展经历变革,同时也为国产 AI 芯片打开了难得的发展窗口。
去年初至今,AI 推理算力需求占比持续攀升。国家数据局的数据显示,2025 年我国用于人工智能训练和推理的数据总量同比增长 42.86%,其中推理数据量达到 101.34EB ,首次超过训练数据量。不同于训练场景极致追逐峰值算力,推理场景更看重能效、吞吐与单位成本性价比。
与此同时,2026 年初,OpenClaw、Hermes 等智能体热潮直接改写了 token 消耗逻辑,居高不下的成本让企业压力倍增,Uber 称员工大规模使用 AI 编程工具后,4 个月烧掉全年 AI 预算;不具名公司忘记设限,一个月在 Claude 上烧掉 5 亿美元。
成本重压之下,行业对芯片的评判标准发生转变,业界不再单纯追逐芯片峰值算力,单位 token 成本、综合性价比成为关键,芯片还要在吞吐速率、推理时延、功耗管控、软硬件适配协同等多个维度同步迭代,把纸面算力转化为可落地、低成本的真实产出。
在这些行业趋势驱动下,GPU 单一垄断的算力供给格局松动,高性价比的国产 AI 芯片迎来巨大市场机遇。随之而来,国产 AI 芯片及非 GPU 赛道快速崛起,头部厂商密集启动 IPO 进程,盈利拐点将至。
▲不同架构类型 AI 芯片市场规模、参与者等
目前国内 AI 芯片企业中,海光信息、摩尔线程、沐曦股份等 GPU 企业已在上交所科创板上市,壁仞科技、天数智芯等 GPU 企业登陆港交所。燧原科技、华为海思、寒武纪、昆仑芯为采用 DSA 路线的 AI 芯片企业,其中燧原科技即将上会,昆仑芯已同步启动 A 股、港交所两地 IPO 筹备。
整个国产 AI 芯片赛道正处盈利前夜,商业化进程逐渐清晰。寒武纪 2025 年净利润 20.59 亿元,首次扭亏为盈;海光信息去年营收 143.76 亿元,首次突破百亿大关。国产 AI 芯片行业已然迈入技术变现、商业落地的高质量发展周期。
二、构建大模型训推一体算力底座,五款云端 AI 芯片已落地
AI 算力竞争进入新阶段,推理场景对于 GPGPU 生态的依赖在持续减弱,非 GPGPU 赛道崛起,正在给国产 AI 芯片树立一套全新、更高维度的考核标尺,也为不走 GPGPU 路线的国产 AI 芯片厂商撕开了突围窗口。
相较于传统 GPGPU 架构,非 GPGPU 架构的效率优势在当下 AI 发展节点被进一步放大。
在芯片设计阶段,非 GPGPU 架构就针对 AI 核心算法和应用场景加速优化,将核心计算、互联、存储优化特性集成到芯片架构中,后续基于与大模型企业的联合软件优化、适配,能使其在 AI 应用场景下实现优于传统 GPGPU 架构的能效比和效率,具备更高效能、更大数据吞吐量、更低功耗特性。
在一众国产 AI 芯片玩家之中,最新公布 IPO 动向的燧原科技就是非 GPGPU 架构的典型代表。
不同于基于通用架构改良的研发模式,燧原科技坚持的是从底层原始创新,基于自主指令集研发 DSA 架构产品,打造原创自主架构的 GCU-CARE 加速计算单元和 GCU-LARE 片间高速互连技术,兼具编程灵活性与大模型高并行度加速计算。
如今,燧原科技已经在云端 AI 训练和推理芯片两条产品线上迭代了四代 5 款芯片,开发了多款 AI 加速卡及模组、智算系统及集群,其中 AI 加速卡及模组和智算系统及集群业务已构成其主要收入来源。
这样的全栈技术自研与产品布局,得益于其从硬件架构、软件生态到集群落地的全链条自主可控,这也正是燧原科技的核心竞争力。
首先,底层架构自主是硬件性能突破的核心前提,燧原科技通过原始创新、自主结构的高性能芯片与硬件技术,在处理器微架构设计、处理器指令集设计、高性能计算核心、低精度量化技术等关键领域,已经实现 AI 芯片系统级设计、架构级设计等全链条系统化自研。
根据招股书,燧原科技打造的新一代云端 AI 芯片,是国内少有原生支持 FP8 低精度数据的产品。
其次,软件生态是国产算力支持大模型落地适配的关键载体,该公司并没有依附 CUDA 生态的计算编程体系,而是自研了包括驱动程序、编译语言与编译器、算子库、工具链、深度学习框架的全栈 AI 计算及编程软件平台驭算 TopsRider,降低大模型编程开发难度和迁移成本。
此举的核心意义在于,其软件平台与自主硬件芯片深度适配,能够有效降低大模型编程开发门槛、减少大模型适配成本,从而提升其产品的商业化适配能力。
最后是集群层面,这也是国产 AI 芯片规模化落地的关键一环。燧原科技已经打造了高速互联、稳定可靠的 AI 算力集群方案,并在千卡、万卡智算项目中实现收入,形成了技术研发 - 产品落地 - 营收变现的良性发展闭环。
招股书显示,燧原科技已经可以实现千卡算力集群 7 天高性能稳定运行,万卡算力集群 24 小时无故障稳定运行,相应指标在国内处于领先地位。
▲燧原科技智算系统
产品落地的同时,燧原科技在 AI 产业链上的生态圈正在不断扩展。其已经与超过 100 家 AI 产业链上下游企业建立了生态合作,大幅降低 AI 智能体部署门槛,并面向 AI+ 场景的各类垂直应用领域,适配了 DeepSeek、Qwen 等近千个 AI 大模型,支持 AI+ 场景应用的快速落地。
可以看出,燧原科技基于非 GPGPU 架构,已经跑通了国产 AI 芯片技术自研、产品落地、商业盈利、生态扩容的全闭环发展路径。
三、借互联网大厂之力,芯模同步进化
国产算力快速迭代、规模化落地的核心驱动力,还有一个关键角色是头部互联网大厂。它们正与国产芯片厂商深度绑定、协同进化。
一边,头部互联网大厂是大规模算力需求方、场景验证载体、资本投入主力,其手握海量真实 AI 应用场景、规模化算力需求,既能为国产 AI 芯片提供真实场景的落地打磨机会,也能通过持续资本投入加速芯片企业技术迭代、产能扩张。
另一边,国产 AI 芯片厂商则是整个算力生态的硬件底座,为国产大模型训练、AI 场景落地提供底层硬件支撑。单一的芯片技术迭代或场景落地都难以支撑产业规模化发展,芯片硬件与场景应用深度绑定,才能构筑起核心竞争力。
这一趋势也体现在国产 AI 芯片厂商的客户结构中——燧原科技、寒武纪等国产 AI 芯片企业均存在头部大客户营收占比较高的情况。
这是因为,国内能够实现 AI 大模型商业闭环的企业主要集中在字节跳动、腾讯、阿里巴巴等头部互联网平台,而这些拥有成熟的 AI 应用场景与规模化算力需求的厂商正是国产 AI 加速卡的核心大客户。
▲国内头部互联网大厂的 AI 资本支出情况
以燧原科技为例,腾讯是燧原科技 2025 年第一大客户,销售收入占同期总收入的 74.90%。目前燧原科技的现有产品已累计在腾讯深度适配了大量 AI 模型,支持其内部多个硬件场景。
过往行业普遍存在硬件与算法脱节问题,通用芯片架构无法贴合大模型算法特性优化,大模型也难以适配国产自研架构,最终导致芯片性能冗余、算法落地受阻。这使得当下 AI 产业竞争已转向 " 芯片硬件 + 模型算法 + 场景适配 " 的综合生态竞争,芯模协同能力成为衡量国产算力竞争力的核心指标。
燧原科技和腾讯的深度合作就是一大例证。燧原科技与腾讯实现了深度芯模同步迭代,基于真实业务场景反向优化芯片架构、算子适配与算力调度,让硬件性能充分释放,提升模型落地效率,形成了场景验证、技术优化、性能升级、场景扩容正向循环。
不仅如此,与头部大客户合作的经验,也成为燧原开拓新客户的核心优势。其第三代产品燧原 S60 已在互联网客户和各地智算中心大批量出货;支持超 300 个应用场景,服务腾讯、美图、源石云等泛互联网商业伙伴,覆盖 10 亿以上规模终端用户。
如今,燧原科技的商业化增长空间进一步打开。据燧原科技披露,多家潜在互联网客户已基于测试需求下达小批量订单,或进入量产订单商务谈判环节。
当下的 AI 产业中,国产 AI 芯片与头部互联网大厂、头部 AI 创企的协同价值正持续放大。
结语:国产 AI 芯片厂商持续突围,前路任重道远
芯片行业本身技术壁垒高、研发投入巨大、产业链配套复杂,整体发展之路向来充满重重挑战,国产 AI 芯片赛道更是长期面临算力架构打磨、先进制程供给、生态适配等多重压力,眼下一批国产 AI 芯片企业接连冲击资本市场、迎来集中上市潮,无疑是行业释放出的积极向好信号。
不过对各家芯片企业而言,上市远不是发展终极目标,仅仅是企业成长过程中的一个阶段性节点,能否行稳做强,最终取决于算力产品竞争力、客户口碑、成本控制与持续创新能力,上市时间的早与晚,并不会直接决定一家企业长久的发展格局与行业地位。


登录后才可以发布评论哦
打开小程序可以发布评论哦