驱动之家 03-25
Arm第一次亲自做芯片!发布全新AGI CPU:136核心、两倍性能秒杀x86
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

快科技 3 月 25 日消息,一直以来,Arm 都是一家对外提供 IP 授权的芯片企业,包括 CPU、GPU、NPU 和各种系统 IP。

后来,Arm 打造了计算子平台 ( CSS ) ,相当于打包各种 IP 的平台级解决方案,客户拿去就可以做出完整芯片 ( 比如小米玄戒 ) 。

如今,Arm 宣布其计算平台进入全新阶段,首次涉足量产芯片领域,首款产品就是 "AGI CPU"。

打个不是太精确的比方,这就类似于 NVIDIA、AMD 不但卖 GPU 芯片,也自己做公版显卡。

这是一款由 Arm 自主设计、面向 AI 数据中心的 CPU 芯片,旨在应对日益增长的代理式 AI ( Agentic AI ) 工作负载,同时帮助生态伙伴快速、规模化部署量产级的 Arm 平台。

合作伙伴可根据需求,灵活选择 Arm IP 授权、Arm CSS 方案,或者直接购买部署 Arm 芯片。

Arm AGI CPU 基于 Armv9.2 指令集、Arm Neoverse V3 架构,支持 bfloat16、INT8 AI 指令集。

这也是当今众多数据中心级 CPU 的核心支撑,包括 NVIDIA Vera、亚马逊 Graviton、谷歌 Axion、微软 Azure Cobalt。

它采用台积电 3nm 工艺制造,提供 136 核心、128 核心、64 核心三种规格,可单路可双路,每个核心配备两个 128-bit SVE 单元、2MB 二级缓存 ( 最大 272MB ) ,还有 128MB 三级缓存,主频 3.2GHz,热设计功耗 300W。

内存支持 12 通道 DDR5,每通道 2 条,最高速率 8800MT/s,每核心内存带宽 6GB/s,时延低于 100ns。

I/O 扩展支持 96 条 PCIe 6.0 通道,支持 CXL3.0 Type 3,还可以提供六条 PCIe 4.0。

Arm 官方的参考设计服务器采用 1OU 双节点设计,基于符合 OCP 规范的 DC-MHS 标准规格设计,每台刀片服务器配备两颗 Arm AGI CPU,以及独立内存与 I/O,共计 272 个核心。

这些刀片服务器可在标准风冷 36 千瓦的机架中满配部署,最多 30 台,总计 8160 个核心。

Arm 还与超微合作推出了 200 千瓦的液冷设计方案,可容纳 336 颗 Arm AGI CPU,总计超过 45000 个核心。

Arm 声称,它在单核、SoC、刀片式服务器、机架各层级上,都实现行业领先的性能表现,尤其是单机架性能可以达到 x86 平台的两倍以上。

其中,更高性能、更高能效的单线程性能,可处理更多任务;叠加更多的可用线程,最终实现单机架性能的大幅提升;领先的内存带宽,则支持每个机架运行更多线程,避免在持续高负载下因核心争抢资源而导致性能下降。

另外,部署 Arm AGI CPU 之后,每吉瓦 AI 数据中心算力的资本支出,可以节省多达 100 亿美元。

客户合作方面,Arm 已与 Cerebras、Cloudflare、F5 Technologies、OpenAI、Positron、Meta、Rebellions、SAP、SK Telecom 等达成进一步的商务合作,都会在各自的方案中部署 Arm AGI CPU,覆盖加速器管理、控制平面处理、云与企业级 API、任务与应用托管等领域。

Arm 还与永擎电子、联想、广达电脑、超微等头部 OEM/ODM 厂商合作,现已推出基于 Arm AGI CPU 的早期系统,更广泛的商用部署预计将于今年下半年落地。

超大规模云服务商、云计算、芯片、内存、网络、软件、系统设计与制造等领域的 50 多家领军企业,都支持 Arm 进军芯片领域,包括 AWS 亚马逊云、博通、谷歌、Marvell、美光、微软、NVIDIA、三星、SK 海力士、台积电等等。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

芯片 arm ai gpu 数据中心
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论