Arm宣布,推出新款 Cortex-A320,是过去十年里首次对 Cortex-A3x 级别内核进行更新。
Cortex-A320 采用了 Armv9.2 架构,专门用于满足物联网和边缘 AI 应用的需求。与 Cortex-A520 相比,Cortex-A320 通过几个微架构优化,实现了 50% 以上的效率提高。通过高效的分支预测器、预取器和内存系统改进,与上一代 Cortex-A35 相比,标量性能提高了 30%,ML 性能提升了十倍,也比广泛使用的 Cortex-A53 高出六倍。
Cortex-A320 是一款无序单发内核,具有 32 位指令获取和 8 级流水线,支持 64KB L1 和 512KB L2 缓存,可实现单核心到四核心配置,并具备可扩展性,另外提供了 256 位 AMBA5 AXI 接口连接外部存储器。由于支持 DSU-120T 功能,可实现仅配备 Cortex-A320 内核的集群。
矢量处理单元实现了 NEON 和 SVE2 SIMD(单指令多数据流)技术,既可以在单核复合处理器中单独使用,也可以在双核心或四核心实现中在不同内核之间共享。由于支持 BF16 等新数据类型,以及增强的点乘和矩阵乘法指令,使得 Cortex-A320 成为适用于 ML 应用的最高效 Cortex-A 内核。
此外,Arm 还集成了 Cortex-A320 CPU 和支持 Transformer 算子网络的 Ethos-U85 NPU,打造出全球首个专为物联网优化的 Armv9 边缘 AI 计算平台。相较于去年基于 Cortex-M85 的平台,新的边缘 AI 计算平台在 ML 性能上有八倍的性能提升。
登录后才可以发布评论哦
打开小程序可以发布评论哦