
智东西
作者|云鹏
编辑|漠影
近期," 龙虾热 " 席卷全球,以 OpenClaw 为代表的各类智能体加速涌向企业和个人,随之而来的不仅是各行业领域生产力范式的变革,也带来了底层芯片算力市场格局的深刻改变。
在 AI 大模型已经全面进入 Agentic AI(AI 智能体)时代的今天,算力瓶颈不再局限于 GPU 等大算力 AI 加速器,由于多并发和海量数据流转的需求,CPU 的重要性愈发凸显,重新回到系统调度的舞台 C 位。
海外 GPU 巨头英伟达也在最近的 GTC 大会上发布了其自研的 Vera 服务器 CPU,以应对 Agentic AI 带来的 CPU 瓶颈问题。

CPU 领域,相比传统 x86 架构和 Arm 架构,RISC-V 作为新兴的指令集架构,其简洁灵活易扩展、兼顾通用与 AI 算力、开源开放等特点几乎都成为当前 AI 时代的 " 刚需 ",成为其突出优势。
在这样的产业大变局下,就在今天上午,阿里达摩院在 2026 玄铁 RISC-V 生态大会上重磅发布了新一代旗舰 CPU IP —— C950,其不仅在 SPECint2006 基准测试中史无前例地突破了 70 分大关,更首次实现了 RISC-V CPU 流畅跑通千亿参数顶尖大模型。

玄铁 C950 的问世,标志着 RISC-V 正式撕下 " 低端 " 标签,在高性能与 AI 计算两大核心战场,与 x86、Arm 形成了实质性的 " 三足鼎立 " 之势,成为 Agentic AI 时代芯片算力赛道的最大变量。
一、冲刺高性能与 AI 市场,彻底撕掉 " 低端 " 标签,AI 智能体给 RISC-V 按下加速键
从第一个 5 年的开源学术探索项目,到第二个 5 年国际标准和商用 IP 开始萌芽,再到如今第三个五年,今天基于 RISC-V 架构的芯片正迎来井喷式涌现。从架构提出到出货 100 亿颗处理器,RISC-V 只用了 12 年,而 x86 架构用了 30 多年。

走过第 15 个年头的 RISC-V,正在 AI 时代技术创新和市场需求的双重驱动下,迸发出更旺盛生命力。
目前,RISC-V 芯片的商业化版图正在快速扩张。在物联网与边缘计算市场,英伟达、英飞凌等海外巨头都在大量出货基于 RISC-V 架构的 MCU(微控制器)。
英伟达每年大约消耗 10 亿个 RISC-V 核心,内置于其 GPU、CPU、SoC 和其他产品中,其在 2025 年曾透露正在推进 CUDA 兼容 RISC-V 架构;英飞凌则宣布今后所有 MCU 都要基于 RISC-V 架构开发。
在 RISC-V 高性能领域,资本动作也从未停止,比如高通此前就收购了 RISC-V 初创企业 Ventana,试图在高端市场寻找切入点。Meta 则基于 RISC-V 架构自研 AI 芯片。
行业数据的预测进一步印证了这一爆发趋势。根据半导体权威分析机构 SHD Group 的最新预测数据,到 2031 年,RISC-V 设备数量将超过 360 亿颗,年复合增长率高达 31.7%;相关市场规模将超 3000 亿美元。部分行业智库甚至预测,到 2030 年,RISC-V 有望占据全球处理器市场 25% 的份额。
尽管 RISC-V 在 MCU、嵌入式、家电、存储、多媒体、汽车、通信、安全、终端等众多领域呈现星火燎原之势,但其长期以来始终无法摆脱 " 低端 " 芯片的固化标签。

RISC-V 要想真正跻身主流芯片架构的牌桌,仅仅在边缘侧 " 打游击 " 是远远不够的。要想与 x86 和 Arm 三足鼎立,RISC-V 必须在服务器(高性能)和 AI 计算两大核心战场上证明自己。
这不仅是技术层面的突破,也是芯片生态话语权的争夺。
二、C950 打破 RISC-V 性能天花板,7 年深耕构建国内顶级 RISC-V 生态
这次大会上阿里达摩院亮出的新一代旗舰 CPU IP —— C950,正是 RISC-V 在突围高性能与 AI 计算、打破固有印象的一次 " 里程碑 " 式突破。
在高性能方面,根据官方数据,在工业界公认的 SPECint2006 基准测试中,C950 直接突破 70 分大关,其单核性能超过了 22/GHz,最高主频达 3.2GHz,成为当之无愧的全球最强 RISC-V CPU,逼近 AMD Zen5、Intel GNR、Arm V2 等行业高端产品。

为了验证其在真实环境下的可用性,达摩院进行了严苛的联合测试。结果显示,面对 MySQL(数据库)、Redis(内存缓存)、Nginx(Web 服务器)、OpenSSL(安全协议)等服务器经典工作负载,经软硬件协同优化,C950 的性能达到行业第一梯队水平,云网络、云存储性能较部分主流产品提升在 30% 以上。

众所周知,AI Agent 并非单纯 AI 推理任务,而是典型的 CPU 密集型任务,大量并发指令需要串行执行,海量数据高频流转。C950 通用计算性能的大幅提升,会显著提升整体的系统效率。
在软件生态兼容性方面,C950 支持了国际最新规范文件 RVA23.1 的全部标配和可选扩展。这一 Profile 标准的落地至关重要,它关系到整体系统的可靠性、安全性和资源利用率,可以极大便利 RISC-V 进入服务器、AI、汽车等高端平台,并能无缝适配 Linux、Android 等主流操作系统环境。

据了解,此次发布的 C950 可以用于云计算、生成式 AI、高端机器人、边缘计算等诸多领域。
实际上,在向高性能迭代的路上,达摩院玄铁一直是 RISC-V 阵营中毋庸置疑的领跑者,回顾其产品演进,几乎每一次迭代都在不断打破行业的 " 天花板 ",C950 的推出不是昙花一现,而是持久深耕之下技术创新力的一次阶段性集中体现。
阿里巴巴从 2018 年起开始布局 RISC-V,是国内最早涉足 RISC-V 的技术团队之一。早在 2019 年 7 月,阿里就发布了当时业界性能最强的 RISC-V CPU IP ——玄铁 C910,其首次突破运行频率 2GHz 的门槛,Specint2k6 评测 7/GHz。
这一成绩在当时给了行业极强的信心:RISC-V 的架构设计在原理上没有性能天花板。
随后 C910 的生态落地更进一步证明了其可用性。2024 年,达摩院联合中科院软件所研发出全球首台稳定运行的 RISC-V 笔记本电脑、欧洲云服务商 Scaleway 发布了全球首个 RISC-V 云实例,它们的计算底座都是 C910。
可以说,C910 吹响了 RISC-V 冲向高性能的冲锋号。
当然,这只是一个开始,服务器芯片才是真正考验 CPU 通用算力极限的终极战场。2025 年发布的玄铁 C930,通用算力达到 SPECint2006 基准测试 15/GHz,首次迈过了服务器芯片的入门门槛。
RISC-V 实现行业里程碑式突破的每一个关键节点,我们都能看到玄铁的身影。而每一代玄铁 CPU 的推出,都会带动产业上下游企业参与进来,进一步加速 RISC-V 向高性能领域迭代的步伐。
7 年多来,阿里陆续推出 C、E、R 系列的 16 款 RISC-V CPU,分别对应高性能、高能效、高可靠场景,这些 CPU 已经广泛应用于服务器、机器人、新能源汽车、工业控制、AI 智能终端、存储控制器等领域。

根据官方数据,目前玄铁 CPU 已应用于 200 多款量产芯片和近千款终端产品,客观来看,玄铁 CPU 已经形成了目前国内规模最大、最成熟的 RISC-V 产业生态。

三、业内首次跑通顶级千亿大模型,剑指 AI Agent 时代新型算力中枢
正如前文所说,高性能和 AI 计算是当前 RISC-V 芯片聚焦突破的核心战场。在 AI 产业全面进入 Agentic AI 时代的今天,在新的计算范式下,CPU 的重要性愈发突出,而玄铁 C950 则是一款真正为 AI Agent 而生的新型 CPU。
在智能体当道的今天,使用电脑和笔记本的可能不再是单一个人,而是无数个自主运行的智能体,系统的 Token 调用量呈现出指数级的暴增。
如何高效地加载和流转 KV-Cache、如何降低首 Token 延迟,成为了系统真正的瓶颈。在这个过程中,CPU 不再是 GPU 的 " 配角 ",而是作为系统任务调度和庞大数据流转的 " 中枢 "。
针对这一行业趋势痛点,达摩院玄铁利用 RISC-V 架构天然的开放性和灵活性,赋予了 CPU 原生 AI 能力。
此次达摩院发布了两款 RISC-V 原生 AI 计算引擎—— 4K 超宽 Vector 引擎和 Matrix 引擎,与玄铁 CPU 统一编址,消除数据拷贝瓶颈,从而将通用高性能算力与 AI 算力进行原生融合。

其中,Matrix 引擎专门为大模型张量计算加速,单核算力可以达到 8TFLOPS。在实测中,搭载了玄铁全自研 Matrix(矩阵)加速引擎的 C950,其 AI 推理表现称得上惊艳,平均执行效率超过 90%,典型算法性能较行业提升 2-3 倍,其顺利运行了当前业界顶级的 Qwen3 开源模型,以及对算力要求极高的 DeepSeek V3" 满血版 "。

具体来看,运行 Qwen3 的输出速度达 34 Tokens/s,首 Token 延迟仅为 3.4s;而运行 DeepSeek V3 的输出速度达 18 Tokens/s,首 Token 延迟 1.7s。
这是 RISC-V CPU 首次原生支持千亿参数规模的大模型。这一突破意味着,在处理复杂的 AI Agent 推理与调度任务时,CPU 可以极大缓解 GPU 的压力,承担更多 AI 计算任务,成为 AI Agent 时代 AI 计算新架构中的核心组成部分。
在加速落地,让行业客户能充分发挥 RISC-V 特性优势方面,此次阿里达摩院发布的 Flex 平台无疑是 RISC-V 可扩展性的最佳证明,其可以很好的解决真实产业中的高度定制化需求。

去年,达摩院玄铁共支持了 35 家客户进行了多达 38 项的 CPU 底层改动,其中超过一半的定制需求集中在 AI 加速、存储优化、可靠性增强等特定垂直场景。

简单来说,Flex 平台将造芯的主导权依然交还给产业,这一平台包括处理器建模、开发环境和软件工具链等完整组件,客户不仅能选择 " 标配 " 的高性能玄铁 CPU 作为基座,还可基于 Flex 进行深度的自定义修改,从而打造出最符合自身垂直场景需求的创新 CPU。
值得一提的是,像 Vector(向量)加速、Matrix(矩阵)加速等高端 AI 能力,客户也可以自行通过 Flex 平台来实现与集成,这无疑会显著降低高端定制芯片的设计门槛。
整体来看,RISC-V 没有历史包袱,不需要兼容过往几十年的软件栈,可以专注于实现最高效的 AI Agent 性能;RISC-V 简洁、灵活,易于扩展的特性则可以让芯片设计企业根据 AI 软件栈变化快速迭代,及时响应最新的算力需求。
此外,AI Agent 任务同时需要高性能的通用算力与 AI 算力,而 RISC-V 开源社区正在编制面向矩阵计算(Matrix)的扩展指令,也就是把 AI 能力写入 RISC-V 的 " 基因 ",有望令 RISC-V 成为高性能通用计算与 AI 计算融合的最佳载体。
最后,RISC-V 开源开放的特点也进一步有助于破除技术壁垒,便于国家和企业层面将技术主动权握在自己手中。
四、中国开源力量 " 会师 "RISC-V,主导全球标准话语权,产学研迈入深水区
芯片行业多年发展证明:芯片架构的竞争从来不是单打独斗,而是生态阵营的较量。
由于美国对高端半导体技术的持续限制,中国产业界正将 RISC-V 视为实现 " 硅主权 "(Silicon Sovereignty)和底层技术自主可控的重要赛道。
当前,中国开源力量正在 RISC-V 高性能生态中完成一次史无前例的 " 大会师 "。
从宏观背景来看,RISC-V 国际基金会(RISC-V International)为了保持技术中立,已将总部迁至瑞士。而在这个主导 RISC-V 技术走向的最高组织中,中国企业展现出了压倒性的存在感。

据最新公开信息,在 RISC-V 国际基金会的 19 家 "Premier(高级)" 会员中,中国企业占据了 8 家,远超其他单一国家。
在具体落地层面,阿里达摩院玄铁正串联起中国本土的产业生态。
一方面,玄铁与北京开源芯片研究院、中国科学院软件研究所达成合作,共同研发下一代开源 RISC-V 高性能 CPU 香山及软件生态,形成科研层面的 " 共振 "。

软件生态层面,达摩院玄铁积极参与 OpenRuyi 社区,目前以 25.27% 的 Patch 贡献率稳居排名第一。

在产业协同层面,达摩院玄铁与中兴通讯在 RV 国际基金会和开源软件社区中强强联手,共同推进服务器领域开源组件的深度优化,使相关的存储和编解码性能得到了显著提升。
2023 年,达摩院牵头发起的 " 无剑联盟 ",围绕玄铁 CPU 构建开放、协同、普惠的 RISC-V 芯片商业服务体系,给企业提供从芯片设计到应用的全链路能力,降低开发成本与风险,加速 RISC-V 产业化进程。

在国际标准指定方面,达摩院玄铁正在积极投入 RISC-V 国际基金会的核心工作,不仅主导了服务器级芯片标准的制定并正式发布,还深度参与了 BRS、RPMI 等服务器关键规范的起草。
特别是在 AI 领域,玄铁正在主导 Matrix 扩展(AME)社区的讨论及标准制定,这意味着未来全球的 RISC-V 芯片在演进 AI 矩阵计算能力时,可能遵循由中国主导制定的技术底层标准。
结语:" 顶峰相见 ",RISC-V 开源生态剑指 AI 智能体时代
达摩院玄铁 C950 的发布,绝不是一次测试跑分的 " 刷榜 ",而是真正从通用计算性能和 AI 计算性能两个关键方面实现突破,彻底打破了 RISC-V" 做不了高性能计算 " 的刻板印象。
在产业层面,基于 Flex 平台的开放性,横向联合中国各领域 RISC-V 开源力量,达摩院玄铁正在牵头构建一套能够与传统封闭生态体系对抗的新业态。
在这场 "AI 时代计算架构之战 " 中,以玄铁为代表的 RISC-V 阵营,已经拿到了 AI Agent 时代的高端算力殿堂 " 入场券 "。


登录后才可以发布评论哦
打开小程序可以发布评论哦