每日经济新闻 6小时前
云天励飞董事长陈宁:AI推理时代已至 推理芯片崛起将是中国科技复兴巨大机遇
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

当对话式人工智能工具—— ChatGPT 点燃的全球 AI(人工智能)训练竞赛逐渐开始白热化,一个更深层次的产业变革悄然发生。2025 年,被业界普遍视为 "AI 应用大爆发的元年 ",智能体(Agent)正从概念走向现实。而在应用爆发的背后,是百倍增长的推理算力需求与高昂成本之间的尖锐矛盾。在这场由 " 训练 " 转向 " 推理 " 的算力范式革命中,中国 AI 芯片产业能否抓住历史性机遇?

视觉中国图

在日前举办的雪球嘉年华会议期间,云天励飞董事长兼 CEO(首席执行官)陈宁在接受《每日经济新闻》记者专访时表示,人工智能就像当年的第一台蒸汽机、第一个灯泡、第一台计算机,可以说,人工智能是未来五年科技突破的关键。

陈宁认为,中国在算法上已能够将跟世界先进水平之间的差距缩短至数月,甚至在应用、数据、能源、系统集成方面更有优势。

在陈宁看来,推理芯片赛道是中国实现 " 超车 " 的关键。这场关于重新定义算力的竞赛才刚刚吹响号角,中国第一次与全球站在相近的起跑线。" 我们有机会,也必须抓住这个机会。"

推理芯片展现巨大潜力

在陈宁看来,人工智能产业的发展可以清晰地划分为三个阶段。

第一阶段是 2012 年至 2020 年的 " 智能感知 " 时代,以小模型驱动特定场景的解决方案为主,市场的特点就是碎片化,难以规模化复制。

第二阶段是 2020 年至 2025 年的 AIGC(人工智能生成内容)时代,大模型展现出惊人的内容生成能力,除了英伟达这个 " 卖铲人 ",整个行业都在寻找盈利闭环。

"2025 年,我们进入了第三个阶段—— Agentic AI(代理式人工智能)时代。" 陈宁强调,无论是豆包手机、AI 眼镜,还是人形机器人,其本质都是将大模型、操作系统与硬件载体深度融合的智能体。它们能独立完成复杂任务,替代部分工作岗位,这才是 AI 引发产业革命的真正形态。这个时代的核心特征是应用爆发,而应用背后所需的算力,正从以训练为主转向以推理为主。

" 这是根本性转折。" 陈宁表示,训练追求极致性能和迭代速度,而推理要大规模商业化,必须讲求市场经济,追求极高的性价比。

陈宁以 19 世纪初英国化学家戴维发明了世界上第一个实验性电灯为例,指出直到爱迪生通过商业化改良、降低成本并建设了电网,才真正将电力革命推向千家万户。

陈宁笑称,黄仁勋可能成为 AI 领域的戴维,因为前者定义了训练时代,而推理时代的 " 爱迪生们 " 正在涌现,这也从另一个角度决定了谁才能真正主导一场产业革命。

正是这一转变,打破了英伟达凭借 CUDA(英伟达给自家 GPU 量身打造的专属工具)生态和 GPGPU(通用图形处理器)在训练时代建立的垄断格局。

陈宁表示,此前,黄仁勋长期坚持 " 通用计算 " 理念,认为算法迭代极快,专用推理芯片容易过时,主张通过 GPU(图形处理器)的通用性来覆盖推理需求。但市场规律证明了推理芯片赛道的不可替代性。谷歌在最新的 TPU(张量处理器)战略中明确了 " 训推分离 " 的趋势,加码推理专用的算力权重,博通为 Meta、OpenAI 定制推理芯片,都证明了独立的推理芯片赛道崛起,并展现出巨大潜力。

对于中国而言,这意味着一场难得的 " 超车 " 机遇。陈宁坦言,在训练赛道上,由于先进制程受限、CUDA 生态壁垒高筑,中国企业追赶英伟达差距较大,风险也越来越大。但在推理芯片赛道上,全球都刚刚起步,游戏规则不同。

" 推理更接近应用场景,要为用户提供更高性价比的产品,这正是中国产业所擅长的。" 陈宁判断,推理芯片的崛起,将是中国科技复兴的巨大机遇。

推理需求现爆炸性场景

面对 AI 推理时代的全新需求与挑战,陈宁认为,一味简单模仿英伟达的 GPGPU 架构并非出路。推理任务的计算范式发生了根本变化,尤其是 Prefill(预填充)和 Decode(解码)两个阶段对算力和带宽的需求不同,传统架构面临瓶颈。

为此,云天励飞(云天励飞 U,SH688343,股价 77.10 元,市值 276.66 亿元)提出了新的芯片架构—— GPNPU,旨在融合三大核心能力:首先是顶层结合 GPGPU 的 SIMT 编程范式,具有通用灵活的调度架构,这样可以更便利地兼容 CUDA 生态;其次是结合指令集微架构设计能力,去优化 GPGPU 里面的矩阵类计算的硬件;与此同时,基于国产工艺和全国产产业链融合一系列先进封装技术,打破内存瓶颈,降低成本。

GPNPU 的目标,是在计算算力、存储带宽、存储容量三者间实现更优配比,满足面向未来推理芯片时代多元化异构推理算力的需求。无论是单位硅芯片面积的计算性能上,还是模型迭代的迁移成本上,包括算子优化提升的硬件利用率,尤其是通过高能效、低功耗等一系列的芯片技术降低运营过程中能源成本,能真正实现全方位降低用户的 TCO(总体拥有成本)。

展望未来,陈宁描绘了推理需求的爆炸性场景。他以豆包大模型为例,其日均 Token(文本处理的最小单元)处理量已达 50 万亿且增速惊人。陈宁给出 " 粗算 " 的假设,即便以 50 万亿为基准不再增长,面向大规模在线推理的资本开支与运营开支也会非常可观。

陈宁进一步判断,若 Token 规模短期继续上行,明年上半年可能触及 100 万亿,而在单位能效不发生显著改善的情况下,电力与散热等基础设施压力可能出现 " 千倍级 " 的数量级跃迁。

为支撑 AI 规模化、产业化,陈宁提出在较短周期内把 " 百万 Token" 的推理综合成本降低到 " 一分钱 " 级别。这需要通过架构革命(如存算一体)和工艺创新才能实现,这也正是中国企业的机会所在。

每日经济新闻

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

陈宁 ai 人工智能 芯片 云天励飞
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论