云天励飞陈宁：国产AI推理芯片迎来历史性机遇

打造基于国产工艺的推理芯片的端边云产业生态，推动中国第四次工业革命早日到来。

编辑 | 全球 AI 芯片峰会

9 月 17 日，由智一科技旗下智猩猩联合芯东西举办的 2025 全球 AI 芯片峰会（GACS 2025）在上海举行，在峰会主论坛上，云天励飞董事长兼 CEO 陈宁博士以《芯智 AI，推理未来》为主题发表演讲。

云天励飞董事长兼 CEO 陈宁谈道，在 " 政策 + 需求 " 双重驱动下，国产 AI 推理芯片正迎来绝佳发展机遇。

根据灼识咨询报告，中国 NPU 市场规模短期预计新增规模 339.3 亿元，长期预计新增规模 1092 亿元。

高效 Token 生成是衡量推理芯片性价比的关键指标。11 年来，云天励飞已研发五代 NPU，打造相关指令集、专用算子、存算一体架构、低比特混合量化等芯片硬件技术。

其 " 算力积木 " 架构是基于国产工艺的 D2D Chiplet & C2C Mesh 大模型推理架构，具有可扩展性强、灵活性强、实时性高等特点。

云天励飞提供 " 深穹 "、" 深界 "、" 深擎 " 三大 AI 推理芯片系列，分别面向大模型推理算力中心 / 超节点 / 一体机 / 加速卡、边缘网关 / 边缘盒子 / 家庭主机、及机器人 / 无人机 / 无人车等 AI 推理等应用。

目前，云天励飞正在研发新一代 NPU Nova500，并基于 Nova500 推出多款性能更强的 AI 推理芯片。

以下为陈宁的演讲实录：

很高兴有机会跟大家分享一下关于人工智能 2025 年的最新变化趋势，以及变化背后对于 AI 芯片尤其是国产芯片带来的一些机遇和挑战，最后分享一下云天励飞在这里的思考和实践。

在讨论这个趋势前，我们把 AI 放到一个更宏大的叙事背景下。

中国在过去几千年依靠四大文明曾经一度引领全球的科技和社会发展，但 300 多年前第一台蒸汽机在英国的出现改变了这个格局。

依靠第一台蒸汽机在欧洲的出现，英国在第一次工业革命打造了日不落帝国。200 年前的第一个灯泡也是出现在英国。

后来，美国依托电力时代，引领了全球的科技和经济的发展。在第三次工业革命，美国依靠计算机，再一次在科技、军事、金融、经济甚至文明、文化，引领定义了世界运行的规则。

当前，我们正站在以人工智能为基础的第四次工业革命的门前。过去几年，人工智能的快速发展令越来越多人相信，在未来五年，我们有可能全面进入第四次工业革命。

但在这个窗口期，（中国科技和海外科技）两条曲线可能再次交叉。

而人工智能的六个关键要素，算力、芯片、应用、人才、数据、系统中，人才是流动的，应用、数据、系统是中国的差异化优势。

今年年初的 DeepSeek，证明了我们在算法领域也有可能把差距压缩到几个月的时间。唯独 AI 芯片成为我们仍需追赶的、还有一定差距的核心关键要素。

这是中国在 2030 年第四次工业革命有没有机会推动两条曲线再次交叉的一个关键要素。这也是为什么大算力 AI 芯片不仅仅成为一个行业、一个领域，更是国家的一个核心战略。

01.

AI 全面进入推理阶段

AI 应用正大规模爆发

为什么芯片这么重要？

2022 年 11 月 30 日，ChatGPT 一夜之间把我们带入到人工智能大模型高速发展的加速阶段。过去两年多，AI 大模型不仅是全球最高频的一个词汇，它把我们人类行行业业的科技突破性发展带入到一个快车道。

在此之前，重大的科学技术变革是以 3-5 年为周期。但是过去两年多，这个周期被压缩到了 3 个月甚至是几个小时的模型迭代和更新，不仅在大语言模型、多模态大模型，还在 AI for Science、生物医药、AlphaFold、脑机接口、SpaceX 甚至推动通信领域的 AI 融合等等各行各业。

越来越多人认为，2030 年可能只有 1% 到 5% 的人需要工作，剩下的人类只需互相娱乐。从秦始皇时代开始的长命百岁愿望也变成了可能。哈佛提出我们可能在 2030 年突破平均 150 岁的寿命。

AI 和大模型不仅给我们的电子产业、AI 产业数字化智能硬件带来一系列变化，甚至对于人类文明的演进历程产生深远和重大的影响。

但是穿透这些快速迭代变化背后，我们看到一些趋势。

从 2012 年 Hinton 的 AlexNet 论文开启了这一轮深度学习小模型到大模型的变革，可以说，过去十多年是 AI 训练的时代。

当然，英伟达的 GPU 和 CUDA 系统，也依靠过去十多年从小模型赋能千行百业、长尾算法到 Transformer 赋能大模型的训练，赢得了它的高光时刻。

但在 2025 年，我们看到一个重大的趋势——AI 正在由过去的学习训练阶段，全面进入到应用推理时代。

未来 5-10 年是 AI 训练和 AI 推理并重的时代，多了一条路线。AI 应用正在大规模爆发。

未来在 6-12 个月，只要有一款 AI 爆品，可能是一个 AI 数字人、一个 AI 情感伴侣，也可能是一个家庭的聊天机器人，或者一款毛绒玩具，让你产生情感联系，那么 AI token 的数量可能是以 1~2 个数量级激增。

如果这款爆品出现，很快 AI 推理芯片的市场需求、市场规模将会快速超过 AI 训练芯片的市场规模。

02.

AI 推理算力网络将像电网般无处不在

打一个比喻，如果跟第二次工业革命的电力时代相比，AI 训练芯片就相当于是发电机。

但我们知道，发电不是目的，落地到每个寻常百姓家的使用，赋能各类电器，才是真正推动产业化革命的关键。所以，AI 推理芯片是怎么把电更好地用起来，使能灯泡等家用电器的电动机。

很少有人知道国家电网的电厂里今天用的是什么牌子的发电机，但是很多人会关心比亚迪电动车里的电动机和发动机能否做到自主可控，可否把它的体积压缩 1%，成本压缩到更小，能够驱动多轴人形机器人，赋能各行各业。

所以，AI 推理芯片将成为 AI 赋能第四次工业革命、赋能千行百业，甚至改变我们每个人生活的关键的核心技术和产品。

在这个过程中，我们看到两大趋势：

一是未来 5-10 年甚至更快，AI 和大模型会重新定义我们人类的所有电子产品，从耳机、眼镜到手持的手机、Pad 到扫地机器人、家用电器、无人驾驶汽车、人形机器人……都会开口讲话，变成我们各类场景的超级个人助手或者情感陪伴助手。AI 推理芯片在端边云会赋能所有这些 AI 软件 agent 和硬件 agent。

另外，未来 5 到 10 年，AI 推理芯片赋能的 AI 推理算力网络，会像今天的电网和无线通信网络一样，作为一个最重要的第四次工业革命的基础设施，无处不在。

国家有大型的 AI 推理算力中心；每个城市有自己一定规模的、赋能城市超低时延响应的 AI 推理算力中心；甚至每个 10 万平以上的产业园区，也有专门提供 coding 的园区里企业边缘 AI 计算中心；甚至每个人的家庭里都会有计算主机，私有化大模型可以部署到家庭里，确保个人和智能隐私的安全；每个人办公室里的 NAS 硬盘也会添加 AI 推理芯片，去赋能日常办公，构成这样一张无处不在的 AI 推理算力网络。

两个月前，我到日内瓦开会，在联合国和 ITO 提出一个建议，由 ITO 牵头去定义未来 AI 推理算力全球网络的国际接入标准和行动方案。未来 AI 推理算力网络就像今年 4G 和 5G 通信网络一样，会有国际标准，会无处不在、智能硬件不仅在中国、美国，走到非洲偏远的乡村，也可以无缝接入这些 token 的服务。

两个重大的变化趋势：所有硬件都会吐出 token，都会被 AI 重新定义；AI 推理算力网络会无处不在，背后都是对于端、边、云的 AI 推理芯片激增的需求。

中国定制 AI 芯片（比如谷歌 TPU、博通 ASIC）包含各类架构的定制的 AI 推理芯片，统称 "NPU"。它对应的是英伟达的 GPGPU 架构。

根据灼识咨询的市场分析报告预测，保守估计到 2030 年，在中国市场，以 NPU 为主导的 AI 推理芯片市场需求会达到 4000 亿元，这个数字会快速地被放大。

国务院近期发布了《关于深入实施 " 人工智能 +" 的行动方案》。上一次这么大力度的行动方案还是 2015 年的 " 互联网 +" 行动方案，推动了中国一批互联网巨头产业的形成。

今年的行动方案里有两个最重要的数字：

到 2027 年，率先实现人工智能与 6 大重点领域广泛深度融合，新一代智能终端、智能体等应用普及率超70%；

到 2030 年，我国人工智能全面赋能高质量发展，新一代智能终端、智能体等应用普及率超90%。

不是力争达到，而是必须超过这两个数字。

所以，中国在未来五年将成为全球人工智能渗透率最高的国家，并且依托这些样板和应用的案例，把大模型和芯片复制到全球。

AI 全球竞争，已经不再仅仅是谁能够训练出来最聪明的大模型，而是谁能够在全球 70 亿人口里，将 AI 的模型、芯片和应用占领更广阔的全球市场，引领第四次工业革命。

03.

云天励飞 11 年芯路：

五代 NPU、算力积木架构、落地三大赛道

最后，简单介绍一下云天励飞和我们在 AI 推理芯片领域的一些探索。

云天励飞是我在 2014 年带领一支美国海归工程师团队回到深圳，创立的一家 AI 推理芯片公司。我们可能是中国最早的一支聚焦在 AI 推理芯片领域的 AI 芯片公司之一。

11 年的时间，我们打造了五代神经网络处理器（NPU）面向端、边、云的 AI 推理芯片，像最早的安防、智慧城市到企业级的服务，到最近消费类服务的各类场景，打造了一系列应用产品和服务行业的样板。

跟英伟达 GPGPU 在训练时代的主架构做一个简单类比，我认为可以分为三类。

AI 的训练，现在无可争议的是，基于GPGPU的硬件架构，基于 CUDA 的软件生态，构建了一个训练的繁荣市场。这是过去十多年不仅对于 AI 训练，对于各类科学计算、天气预报甚至未来量子科研的研究，打造的一个全球繁荣生态。国内也有很多，像华为昇腾、寒武纪等，构建了国产训练生态。

但是随着推理芯片、推理市场的兴起，我们认为未来两个新的领域：

一个是基于GPNPU的云端 AI 算力中心的推理芯片市场会快速兴起，所有头部互联网企业都会在自己原有的智算中心里快速扩建 AI 大算力推理芯片市场。从 AI 的加速卡一体机到 AI 计算集群超节点，这些技术都会快速跟进。

到未来 AI 端边的这些定制化细分场景。这些场景往往是基于NPU架构，可以提供更高性价比、更高能耗比的定制化、高性价比 AI 推理芯片。

比如说，我认为今天的 AI 智能终端芯片，最优秀的一家公司是苹果，它的智能手机里 NPU 占比越来越高。

甚至苹果预测未来它的手机端大模型，可能会有 70% 到 80% 的大模型推理任务将会基于苹果 A 系列手机芯片在本地完成。这需要高性价比的、基于 NPU 的推理芯片架构的设计。

形成这样的三个赛道，解决不同场景、不同需求的灵活性和和性价比之间的最优平衡。

云天励飞 11 年，我们从终端到边缘到云端，打造了 5 代神经网络处理器。

从 Nova 100 第一代面向城市级的海量视频分析，包括人脸识别等应用场景，到第二代和第三代面向多维的各类视觉行为、视觉智能、视觉感知的智能分析，从终端到边缘，到目前正在商用的第四代 Nova 400 的基于 Chiplet 的神经网络处理器。

尤其是我们开发了 " 算力积木 " 的架构创新，来解决国产工艺的大算力问题。

目前在研的第五代 Nova500 中，我们结合了 Chiplet 和 3D memory 的封装来突破内存墙。

算力积木是从 2020 年开始，我们跟国产的工艺和生产厂家联合，基于 Chiplet 的探索架构创新，可以实现算力 scale up 的扩展。基于相对成熟的 12nm、14nm 国产工艺，通过算力堆叠，就像搭积木一样，实现一次性的设计生产，多次封装，可以堆叠出来面向不同场景的不同规格的算力的不同芯片，来解决国产工艺相对落后的、应对不同算力规格的、尤其是（满足）大算力等市场的需求。

经过 11 年的时间，基于我们 NPU 和 GPNPU 的底层算法芯片化的核心芯片设计技术平台，我们打造了面向消费级、企业级、行业级的三大类应用场景的产品和服务。

面向消费级，我们去年可穿戴设备模组的出货量，比如说蓝牙耳机单品的出货量突破了 3200 万颗，服务中国所有头部手机品牌厂商，占到了所有手机品牌厂商蓝牙耳机的 35% 的中国市场份额，成为最大的可穿戴设备的硬件方案供应商。相信这些可穿戴设备，包括大家关注到最近苹果发布会，它的耳机已经可以做同声传译，这些都会被 AI 大模型重新定义和赋能。

我们内部也孵化了 AI 的原生硬件 " 噜咔博士 "，从两岁三岁的孩子开始提供知识类，包括我们下个月即将发布的毛绒玩具，情感陪伴类的，这些都有机会成为人工智能时代的智能硬件，人工智能时代的 iPhone 时刻，在未来 6 到 12 个月就有可能会出现。

对于企业级，我们提供大算力的 SoC 芯片、一体机、计算集群超节点等等，通过 AI 芯片，结合我们上下游的合作伙伴，共同为企业生产力的提升去进行赋能。

对于行业级，更是我们十多年沉淀的，在安防、交通、教育、智慧城市等多个行业，在中国的 100 多座城市打造了城市级的系统性的样板。

尤其是我们三个系列 AI 推理芯片，面向云端大模型的大算力推理芯片，我们的" 深穹 " 系列提供了一体机，今年年初也适配了满血版的 DeepSeek，提供计算集群的产品和服务。

第二个系列是我们沉淀十年的、面向边缘计算的各类碎片化场景，从视频高密到压缩版的大模型的推理的服务——" 深界 " 系列。

面向边缘计算，我们今年也立了项，还继续去打造面向 VLA 具身智能的机器人大脑芯片——" 深擎 " 系列，去赋能各类的机器狗机器人。

04.

结语：正在预研第三代算力积木架构

支持更大规模算力扩张

最后跟大家分享一下我们推理芯片的未来规划。

当前我们正在商用的 Nova 400 是基于算力积木 1.0 架构——我们沉淀了 5 到 6 年时间的「Chiplet+ 国产工艺」的算力积木。

云天励飞可以说是第一家中国的 AI 芯片公司，在 2020 年就全面拥抱纯国产工艺。

在目前在研的算力积木 2.0 中，我们融合了 3D memory 晶圆级的封装，不仅突破算力，还有内存墙。

我们正在预研的包括光电一体化，作为第三代算力积木架构，不仅是 scale up，也能够实现 scale out，在整个大规模推理的超节点和推理集群层面，进行算力内存和互联的扩张，去支撑更多的 AI 落地到各行各业。

最后，希望我们能够携手各位创业者和芯片界的专家和同仁们，一起来打造基于国产工艺的推理芯片的端、边、云产业生态，从 GPNPU 的内核的架构到工具链、编译器、软件栈，到算子库整个生态的建设，推动中国第四次工业革命早日到来，推动我们提到的两条曲线，能够在 2030 年再次交叉。

以上是陈宁演讲内容的完整整理。

宙世代

一起剪

相关标签