科技快讯网 06-16
科研人的‘芯’病,只有它能治!
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

某高校 HPC 选型立项会现场

几位大甲方正在激烈讨论 …

这位副院长所说的分享,其实是

上周某「 科研算力基础设施」闭门会

会上,一位大型科研机构的研究员

讲出了自己单位的 HPC 选型心得

他的开场白,有这么一段

「我不是反对 GPU,但我们所里大部分 HPC 集群,还都是用 CPU 来搭建的」

为啥选 CPU 呢?这位专家继续解释

在我们科研单位,一个 HPC 集群

通常要承载不同科研任务

这些任务,来自不同科研团队

对算力的需求,也是千差万别

有的吃缓存、有的吃 IO、有的吃主频

CPU 可以更灵活应对这些负载,效率奇高

还有,我们跑的软件

都是科研软件,一般人都没听过

大量科研软件,都优先支持 CPU

这些软件的厂家,更愿意在 CPU 上做优化

总之,科研任务「杂而重」

CPU 是全能型选手(性能、灵活性、兼容性)

扛活儿能力更强

基本逻辑搞明白,接下来问题是

市面上 CPU,选哪款比较好?

当然是

第五代 AMD EPYC 处理器

Turin 系列中的【AMD EPYC 9755】

这也是 AMD 最新一代 CPU

话说,这款 "9755" 一问世

就被很多科研大佬疯狂点赞

他们也有过买不到合适算力卡的苦恼

结果 "9755" 把这些高端大活儿都包办了

这颗 " 懂科研的 CPU"

一口气解决困扰科研人员的六大难题

HPC 机房是科研院所的香饽饽

每个课题组都在抢资源

之前大家都是轮流排队共用

动不动就是几十个仿真任务同时跑

而且个个大活儿,负载重、周期长

采用 AMD EPYC 9755

可以有效缓解 HPC 机房的排队状况

因为这家伙的性能确实强悍

采用先进的 4nm 制程

单颗 CPU,高达 128 核,256 个线程

更有同门师兄 "9965" 甚至能提供 192 核

以一台双路 HPC 节点为例

搭载 2 颗 AMD EPYC 9755

单节点算力,就能飙到 22.12TFlops

干起活来嗖嗖快

而且,"9755" 采用了全新 Zen 5 架构

具备了更高 IPC(每时钟指令数)

IPC 越高,CPU 单位时间内处理任务越多

相比上一代 Zen 4 架构

通用任务快 17%,AI 和科研任务快 37%

一个典型科研计算任务

比如迭代计算、量子化学模拟

需要【高强度 + 大规模 + 长时间】稳定计算

极大挑战 CPU 的 " 抗压能力 "

这期间要:不降频,不掉速,全程拉满

而 "9755" 专干这种大场面

高频稳定输出,一口气干到底

它基础频率 2.7GHz,最高可达 4.1GHz

还有能飙到 5GHz 的同门兄弟

好比一场科研马拉松长跑

起跑快、途中快、冲刺快,全程不降速

有些科研任务

可能包含大规模矩阵乘、浮点运算等

比如结构力学、流体力学、电磁场仿真等

要是 CPU 不给力,漫长等待如炼狱

莫慌,"9755" 支持 AVX-512 指令集

具有完整的 512b 数据路径

这可是应对矩阵计算的秘笈

让它可以全程保持较高的全核频率

算得又快又稳,告别漫长等待

大型计算任务,往往伴随海量数据

不是算不动,而是数据 " 堵在半路了 "

内存带宽跟不上,IO 通道也拥堵

数据加载慢一步,CPU 就只能躺平

AMD EPYC 9755 早就修好数据高速路

首先,大缓存拉满

配备高达 512MB 的 L3 缓存

热数据直接放在自己 " 被窝 " 里

先来一波 " 近场访问 ",绝对不卡壳

第二,内存通道拉满

每颗 CPU 支持 12 通道 DDR5 内存

内存容量最高可扩展到 6TB

第三,内存速率拉满

最高支持 6400MT/s

数据加载又快又稳

最后,高速 IO 拉满

支持 PCIe 5.0 + CXL 2.0

高速设备随心扩展,数据流转畅通无阻

科研软件是 " 有脾气 " 的

有的对缓存特别敏感

就要大缓存、高内存带宽

有的盯着频率,主频越高越欢

有的看核数,偏爱高核心数

AMD EPYC 9755 好比超级大厨

能够满足各种软件的不同胃口

高核心数、高频率、大 L3 缓存、高 IPC、

12 通道 DDR5 6400、AVX-512...

还有一点,它是 X86 架构

生态兼容性好,适配度和优化完善

HPC 集群一上量

采购成本、运营成本,都是大开支

电老虎一发威,每年动辄百万级电费

AMD EPYC 9755 堪称性价比王者

前期采购看→相同预算,算力更高

同样规模下,搭载 "9755" 的集群

拥有更多核数、更高主频、更强算力

算效比更高

后期上线看→相同电费,效率更高

"9755" 能效比高,功耗更低

跑同样多任务,电费省下一大笔

长远运营看→便于内部统一统筹

搭载 "9755" 的集群支持高效虚拟化调度

单位可以将 HPC 集群统一建设和管理

避免院系、科室自建,造成浪费

既能提供超大规模算力

又能按需灵活分配资源

怎么样,科研场景六大难点

AMD EPYC 9755 全部攻克

让每个科学计算项目,都丝滑无比

让科研经费的每分钱,都花在刀刃上

内容转载自:特大号

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

第五代 科研 hpc 基础设施 gpu
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论