你有没有想过,以后不装独立显卡的笔记本也能流畅运行 AI?这事儿还真快要实现了。6 月 22 日,Intel 与 AMD 共同发布了完整的 ACE CPU 扩展规范,这是一套面向 AI 运算的全新指令集,直接落地在 x86 架构上。

说白了,以前 CPU 跑 AI 任务效率很低,因为传统的 AVX10 向量指令并不是为矩阵运算设计的,执行 AI 核心的矩阵乘法时功耗高、效率差。ACE 就是在 AVX10 基础上做了专门拓展,新增了处理矩阵计算的硬件单元,不需要重新设计底层架构,厂商适配成本也很低。
官方数据很亮眼:同等输入向量规模下,ACE 的计算密度是 AVX10 的 16 倍。这意味着单条指令能完成更多计算,减少了指令调度的开销,内存带宽利用率也同步提升,功耗控制更出色。不过要注意,16 倍计算密度不等于直接 16 倍提速,最终性能取决于两家处理器后续的硬件设计实现。
对开发者来说,这是个大好消息。ACE 指令集跨厂商通用,写一套代码就能适配 Intel 和 AMD 全系支持 ACE 的 CPU,不用针对不同 AVX 版本做多套适配。PyTorch、TensorFlow 等主流 AI 框架都能无缝兼容,数据格式覆盖 INT8、FP8、BF16 等 AI 常用类型,还原生支持 OCP MX 块缩放格式。
未来新一代 x86 处理器将搭载 ACE 扩展,笔记本、台式机、服务器无需依赖独显,就能流畅运行各类本地 AI 任务。部分临时的 NPU 算力需求也可以转移到 CPU 处理,开发者不再需要适配各家规格不一的 NPU 硬件。端侧 AI 的落地场景将进一步拓宽——这对轻量化模型和低延迟任务来说尤其重要。
Intel 和 AMD 这对老对手能坐在一起达成共识,说明 AI 计算的需求已经足够紧迫,谁都不能再单打独斗了。# 热爆趣创赛 #


登录后才可以发布评论哦
打开小程序可以发布评论哦