中关村在线 04-18
联想万全异构智算平台亮相,陈振宽:拥有多项领先技术
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

4 月 18 日,第十届联想创新科技大会 Tech World 在上海举行。联想集团副总裁、中国基础设施业务群总经理陈振宽表示,联想基于最全面的 AI 基础设施产品组合以及最丰富的 AI 行业解决方案,加速了全球客户的智能化转型,同时在这场非赢不可的比赛和角逐中将竭尽所能,为客户提供纵横智能化时代的万全之策。

陈振宽称,联想是扎根于中国的高科技企业,引领了一个又一个的中国 IT 技术发展浪潮。

在通用计算领域,联想的 X86 服务器可靠性连续 9 年第一,实现 463 项性能世界记录;在科学计算领域,联想连续 9 年实现中国 HPC TOP 100 NO.1,助力中国在科学计算、仿真、气象等前沿领域的创新突破;在人工智能 1.0 时代,联想基于中国特色需求设计了完整 AI 基础设施组合,并实现 165 个行业验证落地的 AI 方案。

现如今,大模型的 AI 2.0 时代已经迈着大步走来。随着 AI 模型参数的指数级增加、迈入千亿、万亿级大关,大模型具备了超强的泛化、生成能力,促使人工智能进入更广的应用场景和更深的业务流程当中,发挥更大的价值。

为解决用户面对的挑战,联想 AI 基础设施聚焦三大领域。一是为用户匹配经过验证优化的最佳算力,二是赋能用户充分利用算力,提升计算效率。三是以先进的液冷技术帮助用户节能增效且突破芯片散热的瓶颈。

同时,陈振宽总结了联想过去一年为 AI 应用大潮创新的五大技术,包括智能匹配 AI 算力的智算魔方,针对 GPU,AI 集群提效设计的先进算法,以及跨 AI 和 HPC 集群充分共享算力的超级调度器。

算力匹配魔方:基于海量的硬件评测和 AI 算子算法集成工作, 联想构建了 AI 场景与算法与集群硬件三者匹配关系的算力魔方知识库。立体魔方中的数千个交叉点中的每一个,代表一种场景和与之最匹配的算法和集群配置。应用算力匹配魔方,用户可以跳过选择验证数十种算法和近百种 AI 集群配置的复杂过程,只需输入场景和数据,算力魔方即可自动加载最优算法和调度最佳集群配置。

挖掘 GPU 潜力的 GPU 内核态虚拟化技术:在 AI 推理和中小训练中,AI 子任务多以虚拟 GPU 承载,而在容器和调度层做 GPU 虚拟化和容器间数据隔离是目前业界较普遍的做法,这使得虚拟化和资源隔离的开销造成约 20% 的 GPU 算力损耗。联想研究院与高校研究机构多年合作开发在 GPU 驱动层进行虚拟化和资源管理,新的算法可以将虚拟化造成的 GPU 损耗降至

联想集合通信库:联想在多年集群网络设计中积累了丰富的对大规模集群网络的拓扑优化手段,同时联想研究院与高校研究机构合作建立了基于深层数学原理的集合通信优化算法。在千卡规模训练集群,采用集成了联想集合通信库的联想异构智算平台做管理调度,可提升网络通信效率超过 10%,集群规模越大,效果越显著。

高效 AI 断点续训技术:AI 训练故障频发是常态,因此有必要在训练前设置故障检查点和备份,以备训练因故障中断时能提取备份做到从断点续训。联想异构智算平台在常规以外,深化了对软、硬件的全面监控,优化了多级存储备份架构和策略,更以多年积累的 AI 训练故障预测的 AI 模型来预测断点和提前优化备份,由此能将断点续训恢复时间缩减到分钟级。

联想 AI 与 HPC 异构集群超级调度技术:HPC 集群部分会用到 GPU 节点,AI 集群绝大部分用 GPU 节点。 同时拥有 HPC 集群和 AI 集群的用户希望在不同集群间根据任务优先级和资源状况共享宝贵的 GPU 节点资源。联想异构智算平台在 AI 和 HPC 调度之上架构了超级调度器,全局自动化管理不同类任务和调度异构资源,实现了资源动态共享。

以上这些就是联想在 AI 基础设施积累的三大能力和领先的五大技术创新,是联想整合全球和本地研发智慧,潜心钻研 AI 技术和应用发展趋势,并深耕本地客户特色需求的基础上打造的。

大会上,陈振宽正式发布了 " 联想万全异构智算平台 ",它集合了联想在 AI 2.0 时代的 IT 基础设施技术主张。AI 技术正在高速发展,联想万全异构智算平台也将布局未来,将挑战分钟内的断点续训,持续优化超大规模集群的通信算法,深入研究相变式液冷技术,并布局模块化液冷数据中心。这些技术将为中国用户提供更加强大、稳定、高效、绿色的智能算力。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

智慧云

智慧云

ZAKER旗下新媒体协同创作平台

相关标签

联想 ai gpu 魔方 基础设施
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论