2025 年,可谓是 AI 智能体真正兴起的一年。而 2026 年,或将成为 AI 智能体大爆发的一年。在此背景下," 推理 " 仿佛成了各大芯片厂商关注的焦点。英伟达 200 亿美元 " 收编 "Grop,尽显推理大时代对 " 效率价值 " 的重视。
国内厂商方面,不少厂商推出推理专用算力芯片,甚至有厂商只专注于推理芯片。近日,这个领域的重磅玩家爱芯元智(0600.HK)登陆港交所,成为 " 中国边缘 AI 芯片第一股 "。
推理芯片可分为云端、边缘侧和端侧三大类,边缘侧和端侧为推理芯片重要组成部分。而爱芯元智则是国内边缘侧、端侧推理芯片的佼佼者。
在这场推理大时代,谁能提供性能、功耗和成本最优解,谁就将掌握下一个时代的钥匙。而爱芯元智,则已经在边缘、端侧推理领域占据了领先身位。
推理大时代
双轨驱动构建技术护城河
ChatGPT 的横空出世,开启了人类的大模型时代,也开启了算力芯片的大爆发。而随着 AI 不断发展、迭代,对算力芯片也提出了新的要求。
2025 年,智能体和 AI Skills 成了新的热点。如果说,大模型是人工智能的大脑,那智能体和 AI Skills 则给人工智能装上了手和脚。不仅能够 " 生成 ",还能真正地帮助人类干活,成为生产力工具。
头豹研究院认为,尽管生成式 AI 本身已经极大地提升了内容生成的效率和质量,但 Agentic AI(代理型 AI)作为其更高级的形态,通过引入自主性、目标导向和多步骤执行能力,在生成式 AI 的基础上创造了全新的、更深层次的价值。
而 Agentic AI 的盛行,让 AI 行业的目光从训练转向推理。如何搭建一个好用的智能体,如何让人们使用智能体创造价值成为关键。
在此背景下,业界对 AI 芯片的需求并非一味地堆叠算力,好用、效率、低延时成为关键。另据头豹研究院,依托小型模型能力跃升,执行 GPT-3.5 级别的系统推理成本在 2022 年 11 月至 2024 年 10 月间骤降 280 多倍。硬件层面,年化成本降幅达 30%,能效年提升率达 40%。据悉,常规模型 API 输出价格已经降至 10 元百万 Tokens 以下。甚至,已有厂商喊出百万 Tokens 一分钱的口号。
因此,如何在有限的功耗和预算下释放大模型的能力,成为决定 AI 普惠与否的关键瓶颈。面对边缘终端设备在性能、功耗与成本上的 " 不可能三角 " 难题,爱芯元智通过底层架构创新,构建了坚实的技术护城河。
公司的核心竞争力源于其独特的 " 双轨开发模式 ":一方面纵向迭代升级 IP 核技术,另一方面横向拓展应用领域。这一模式的两大技术支柱是公司自主研发的爱芯通元(AXNeutron)混合精度 NPU(神经网络处理器)和爱芯智眸(AXProton)AI-ISP(人工智能图像信号处理器)。
爱芯通元混合精度 NPU 是破解 " 不可能三角 " 的关键。传统 GPU 方案虽通用,但在功耗和成本上难以适应边缘场景。爱芯元智的 NPU 采用多线程、异构式多核设计,将内存与处理单元紧密集成,并通过两大机制实现效率跃升:一是优化神经网络计算以减少计算负荷,二是通过内存层次设计最小化不必要的数据传输。
边缘推理另一特性在于,不同应用场景下对算力的需求千差万别。而爱芯元智的优势在于,其 NPU 能根据不同的计算需求动态选择 INT4、INT8、INT16 等数值精度,对内存密集型任务采用低精度,对精度敏感计算则保持高精度,在确保精度的同时显著提升计算效率。
这一架构创新带来了惊人的能效比,根据灼识咨询数据,该 NPU 每瓦吞吐量比基于 GPU 架构的传统解决方案提升高达 10 倍。这一设计理念不仅确保稳定的低延时表现,更能在边缘设备的功耗限制下高效运行复杂 AI 模型。
深耕边缘侧、端侧落地
未来空间广阔
目前," 推理芯片未来增长会大幅快于训练芯片 " 已成为各方共识。那么,推理芯片赛道内部又将如何演绎呢?
根据爱芯元智招股书,全球 AI 推理芯片 2024 年至 2030 年的年复合增长率预计为 31.0%。其中,云端推理、边缘推理和端侧推理年复合增长率预计分别为 36.3%、42.2% 和 20.4%。可以看出,未来边缘推理发展空间极为广阔。
至 2030 年,预测边缘推理全球市场规模为 7262 亿元,端侧推理全球市场规模为 8861 亿元。两大市场规模合计超 1.5 万亿元。
边缘 AI 推理芯片部署于靠近数据源的边缘服务器、网关或基站,执行实时本地推理,需要在高性能与功效之间保持谨慎平衡,以确保低延迟、数据安全及运行稳定性。端侧 AI 推理芯片直接应用于终端设备,例如智能手机等消费电子产品、智能汽车及智能家电等。
爱芯元智深耕视觉 AI 端侧推理多年。爱芯元智 2024 年以超 900 万颗的出货量排名前五,市场份额为 6.8%。值得注意的是,其在中高端芯片细分市场以 24.1% 的份额高居榜首。随着市场需求日益向中高端芯片倾斜,爱芯元智认为其有能力在未来巩固当前的领先地位。
在国内边缘 AI 市场,虽然当下仍处于早期阶段,但对数据安全和本地化处理日益增长的需求预计将推动市场快速扩张。据悉,爱芯元智在这一新兴领域出货量位居第三,2024 年出货量达 10 万颗,市场份额为 12.2%。
智能汽车芯片方面,截至 2025 年 9 月 30 日,爱芯元智智能汽车 SoC 累计出货量已超 51 万颗,并获得多家头部车企及 Tier 1 的定点项目。
此外,爱芯元智自研的面向高阶智能驾驶应用的旗舰芯片产品 M97 已于近日回片并顺利点亮。这颗芯片是公司智能汽车业务迈向高端化的核心产品,也是继 M55H、M76H、M57 系列之后的全新一代智能汽车芯片,凝结了公司在芯片设计和研发领域的核心创新成果。
值得注意的是,AI 芯片的使用不仅需要硬件能力,更考验软硬件生态系统。算力上的领先,可能被竞争对手追赶,但生态系统的构建,将成为 AI 芯片厂商牢不可破的护城河。
据悉,通过提供从芯片到软件工具链的完整解决方案,破局云端依赖,深耕边缘侧、端侧应用落地。公司的核心优势在于其提供了一套完整的以芯片为核心的 " 交钥匙 " 方案。其自研的 Pulsar2 工具链,集成了模型转换、量化与编译等功能,能够让开发者高效地将主流 AI 模型部署在爱芯元智的 SoC 上。
展望未来,随着 AI 大模型在边缘侧的应用加速落地,以及智能辅助驾驶对合规与成本的更高要求,爱芯元智凭借其 " 高智价比 " 的平台化能力和 AI 芯片及配套方案,有望在资本市场的助力下,进一步巩固其在 AI 感知与边缘计算领域的护城河,并在重构全球边缘算力格局的进程中释放出巨大的长期产业价值。
(文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。)
编辑|蒙锦涛
每日经济新闻


登录后才可以发布评论哦
打开小程序可以发布评论哦