快科技 4 月 18 日消息,Intel 正式发布了代号 "Hala Point" 的新一代大型神经拟态系统,用于类脑 AI 领域的前沿研究,提升 AI 的效率和可持续性。
该系统基于 Intel Loihi 2 神经拟态处理器,在上代大规模神经拟态研究系统 "Pohoiki Springs" 的基础上,进一步改进了架构,将神经元容量提高了 10 倍以上,达到史无前例的 11.5 亿个,大致相当于猫头鹰或卷尾猴的大脑皮层规模,性能也提高了多达 12 倍。
Loihi 2 处理器早在 2021 年就已发布,首发采用 Intel 4 工艺,集成 230 亿个晶体管、六个低功耗 x86 核心、128 个神经形态核心,单颗就有 100 万个神经元、1.2 亿个突触,是上代规模的 8 倍,性能也提升了 10 倍。
Loihi 2 应用了众多类脑计算原理,如异步、基于事件的脉冲神经网络 ( SNN ) 、存算一体不断变化的稀疏连接,而且神经元之间能够直接通信,不需要绕过内存。
尤其是在新兴的小规模边缘工作负载上,它实现了效率、速度和适应性数量级的提升。
比如执行 AI 推理负载和处理优化问题时, Loihi 2 的速度比常规 CPU 和 GPU 架构快多达 50 倍,能耗则只有百分之一。
Hala Point 系统的形态是一个六机架的数据中心机箱,大小相当于一个微波炉,内置 1152 颗 Loihi 2 处理器,共有 140544 个神经形态处理内核、11.5 亿个神经元、1280 亿个突触,最大功耗仅为 2600 瓦。
系统内还有 2300 多颗嵌入式 x86 处理器,用于辅助计算。
内存带宽达 16PB/s ( 16000TB/s ) ,内核间通信带宽达 3.5PB/s ( 3500TB/s ) ,芯片间通信带宽达 5TB/s,可以每秒处理超过 380 万亿次的 8 位突触运算、超过 240 万亿次的神经元运算。
Hala Point 在主流 AI 工作负载上的计算效率非常出色,比如运行传统深度神经网络时,每秒可完成多达 2 万万亿次运算 ( 20PFlops ) ,8 位运算的能效比达到了 15TOPS/W ( 每瓦特 15 万亿次计算 ) ,相当于甚至超过了基于 GPU、CPU 的架构。
在用于仿生脉冲神经网络模型时,Hala Point 能够以比人脑快 20 倍的实时速度,运行其全部 11.5 亿个神经元。
尤其是在运行神经元数量较低的情况下,它的速度甚至可比人脑快 200 倍!
早期研究结果表明,通过利用稀疏性高达 10 比 1 的稀疏连接和事件驱动的活动,Hala Point 运行深度神经网络的能效比可高达 15TOPS/W,同时无需对输入数据进行批处理。
Hala Point 系统有望推动多领域 AI 应用的实时持续学习,比如科学研究、工程、物流、智能城市基础设施管理、大语言模型、AI 助手等等。
登录后才可以发布评论哦
打开小程序可以发布评论哦