Intel和AMD联手造新指令集!不用独显也能跑AI,计算密度提升16倍

你有没有想过，以后不装独立显卡的笔记本也能流畅运行 AI？这事儿还真快要实现了。6 月 22 日，Intel 与 AMD 共同发布了完整的 ACE CPU 扩展规范，这是一套面向 AI 运算的全新指令集，直接落地在 x86 架构上。

说白了，以前 CPU 跑 AI 任务效率很低，因为传统的 AVX10 向量指令并不是为矩阵运算设计的，执行 AI 核心的矩阵乘法时功耗高、效率差。ACE 就是在 AVX10 基础上做了专门拓展，新增了处理矩阵计算的硬件单元，不需要重新设计底层架构，厂商适配成本也很低。

官方数据很亮眼：同等输入向量规模下，ACE 的计算密度是 AVX10 的 16 倍。这意味着单条指令能完成更多计算，减少了指令调度的开销，内存带宽利用率也同步提升，功耗控制更出色。不过要注意，16 倍计算密度不等于直接 16 倍提速，最终性能取决于两家处理器后续的硬件设计实现。

对开发者来说，这是个大好消息。ACE 指令集跨厂商通用，写一套代码就能适配 Intel 和 AMD 全系支持 ACE 的 CPU，不用针对不同 AVX 版本做多套适配。PyTorch、TensorFlow 等主流 AI 框架都能无缝兼容，数据格式覆盖 INT8、FP8、BF16 等 AI 常用类型，还原生支持 OCP MX 块缩放格式。

未来新一代 x86 处理器将搭载 ACE 扩展，笔记本、台式机、服务器无需依赖独显，就能流畅运行各类本地 AI 任务。部分临时的 NPU 算力需求也可以转移到 CPU 处理，开发者不再需要适配各家规格不一的 NPU 硬件。端侧 AI 的落地场景将进一步拓宽——这对轻量化模型和低延迟任务来说尤其重要。

Intel 和 AMD 这对老对手能坐在一起达成共识，说明 AI 计算的需求已经足够紧迫，谁都不能再单打独斗了。# 热爆趣创赛 #

宙世代

一起剪

相关标签