芯智讯 11小时前
高通发布数据中心CPU及AI300芯片,目标2029年拿下150亿美元!
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_font3.html

 

当地时间 6 月 25 日,高通技术公司在其投资者日活动上宣布其数据中心战略,并推出一系列全新的数据中心解决方案,包括高通 Dragonfly(飞龙) C1000 CPU、高通高带宽计算 ( HBC ) 、高通 Dragonfly AI300 推理加速器以及连接产品,同时还提供定制芯片解决方案。所有这些解决方案均旨在最大限度地提高每瓦性能和 Token 吞吐量,并降低总体拥有成本。

这些新平台凸显了高通技术在构建全栈式人工智能(AI)优化数据中心基础设施方面日益重要的地位,涵盖智能体和数据中心级 CPU、人工智能推理加速器、高性能连接以及大规模定制芯片解决方案。而高通 Dragonfly AI300 的加入,也进一步丰富了此前发布的高通 Dragonfly AI200 和 AI250 等产品,并遵循年度 AI 加速器路线图(Roadmap)。

" 智能体人工智能正在显著提升数据中心对人工智能推理的需求。随着这类工作负载逐渐成为主流,基础设施必须以更低的功耗和成本提供更高的性能," 高通公司总裁兼首席执行官克里斯蒂亚诺 · 阿蒙表示。" 这正契合了高通的优势,我们已做好充分准备迎接这一转变。通过高通 Dragonfly,我们将高性能、低功耗的计算能力引入数据中心,并与领先客户签署了多年、多代合作协议。"

高通技术公司凭借数十年来在片上系统 ( SoC ) 、低功耗设计、高性能处理和领先 IP 领域的专业知识,以及超过 400 亿个组件的工程经验,打造出专为超大规模数据中心级、代理密集型 AI 推理工作负载而设计的解耦式机架级 AI 基础设施。这些创新实现了更优的代币经济性、更低的延迟、更简化的集成、可扩展的部署以及更低的总体拥有成本。随着代理型 AI 大幅提升代币需求,高通技术公司的解决方案以每瓦代币数为关键杠杆,旨在降低总体拥有成本 ( TCO ) 。

" 企业现在需要的远不止是单个组件。在分布式、始终在线的基础设施上协调多种类型的计算至关重要," 高通技术公司执行副总裁兼数据中心总经理 Tony Pialis 表示。" 借助高通 Dragonfly,我们将计算、人工智能、内存和连接整合到一个统一的机架级平台中,该平台专为日益复杂、代理驱动的工作负载而设计,同时解决了内存带宽和功耗方面的关键瓶颈。这建立在高通技术公司数十年来一直致力于提供的高性能、低功耗大规模计算之上,如今,我们将其应用于数据中心,其方式鲜有其他公司能够匹敌。"

2029 财年数据中心收入将超 150 亿美元

随着高通全套数据中心解决方案的推出,也标志着其在计算连续体的各个层面进入下一个增长阶段。

" 我们正在开启高通的下一个篇章,加速边缘计算多元化战略的实施,推出面向下一代人工智能数据中心的全面路线图,并转型为一家平台公司," 阿蒙表示。" 我们在整个计算领域拥有广泛的布局,并在低功耗计算、人工智能和连接领域拥有无与伦比的技术能力,这使我们能够更好地把握这些机遇。"

高通预计,还给出了其 QCT 业务 2029 财年最新目标:手机业务营收将占 QCT 收入的三分之一左右;非手机业务收入达到 400 亿美元。

而在非手机业务当中,数据中心收入将超过 150 亿美元;汽车行业收入将达到 100 亿美元;物联网收入将超过 140 亿美元;工业、网络和机器人收入达到 80 亿美元;个人人工智能和计算收入达到 60 亿美元。

高通认为,未来 3-5 年,随着人工智能计算日益分散到各种设备、边缘和云端,多个大型市场正迎来转折点,其中包括支持代理的边缘设备、数据中心基础设施、汽车、工业系统、网络和机器人等。到 2030 年,这些领域合计的潜在市场规模将达到约 1.7 万亿美元。

展望 2029 财年之后,高通预计数据中心、机器人、ADAS 和自动驾驶、工业人工智能、个人人工智能以及 6G 等领域将持续保持长期增长,其中智能体人工智能有望推动智能互联设备的新一轮升级。下一阶段将以加速多元化和成熟的运营杠杆为基础,同时为新的增长机遇提供资金。

面向数据中心的 Dragonfly C1000 CPU:250 核心,能效提升 2 倍

高通推出了专为数据中心打造的 Dragonfly C1000 CPU,旨在为代理(Agentic)、通用计算和 AI 主节点工作负载提供最佳吞吐量、响应速度和基础设施利用率,同时降低资本支出和运营支出,从而在规模化应用中实现一流的总体拥有成本 ( TCO ) 和性能。

具体来说,Dragonfly C1000 基于高通自研 Oryon CPU 内核打造,采用多芯片架构设计,核心数超过 250 个,频率可超过 5GHz,在提供卓越单核性能的同时,实现了出色的吞吐量和扩展性。可为大规模部署的代理工作负载提供卓越的性能。

在能效方面,高通给出了极具竞争力的数据:与现有服务器 CPU 竞品相比,Dragonfly C1000 基于规格参数的每瓦性能预估提升了 2 倍以上。这一优势在 AI 数据中心面临电力供给刚性约束的当下尤为关键。

高通 CEO 克里斯蒂亚诺 · 阿蒙在投资者日上指出,当前云厂商扩建算力集群的核心瓶颈已从芯片成本转向能耗与供电能力,而高通在智能手机领域深耕二十年的低功耗设计经验,恰好可以转化为数据中心市场的差异化竞争力。

在 I/O 与内存子系统等方面,Dragonfly C1000 同样瞄准了下一代数据中心需求:

连接与扩展:支持超过 2 TB/s 的 PCIe Gen 7 连接速度,兼容 CXL 规范,可支持下一代加速器、高速网络、存储及内存解耦。

内存子系统:采用领先的低功耗内存技术(LP DRAM),旨在提供卓越带宽、容量、低延迟和高能效。

散热与部署:同时支持风冷和液冷,兼容 OCP ORv3 标准的机架和服务器,可灵活部署于各类数据中心环境。

RAS 特性:内置先进的可靠性、可用性和可维护性(RAS) 功能,包括 ECC、故障隔离和错误恢复,保障大规模弹性运行。

此外,Dragonfly C1000 可选配高带宽计算(HBC)连接,支持基于 CPU 的推理场景。

预计 Dragonfly C1000 将于 2028 年上市。

高通高带宽计算 ( HBC ) :每瓦带宽提升 6 倍

高通还发布了一种创新的专用近内存计算架构—— HBC(高带宽计算),它将计算能力与高速内存结合在 3D 堆叠硅解决方案中,以解决 AI 计算所面临的数据传输瓶颈,实现 AI 代理的高效扩展,满足持续推理、内存带宽和实时响应的需求。

虽然,目前 HBM 是 AI 计算加速器的首选内存解决方案,但随着算力不断攀升,对于 HBM 容量和带宽需求持续提升,Token 成本也在不断上涨,导致其效率降低,进而造成总拥有成本 ( TCO ) 上升。

高通声称,其凭借 3D 集成、系统级设计、LPDDR 领先技术和能效方面的专业知识,有效应对了 HBC 的复杂性,提高了内存带宽,并降低总体拥有成本 ( TCO ) 。

具体来说,高通 HBC 方案是将 AI 加速器从系统芯片(SoC)中分离出来,并将其置于 LPDDR DRAM 堆栈下方。HBC 加速器通过硅通孔(TSV)与 LPDDR 堆栈连接,从而在不使用昂贵的 HBM 内存和先进封装的情况下,提供最大的带宽和容量。

虽然高通并未公开 HBC 提供的实际带宽,但该公司声称,与 HBM 相比,HBC 旨在实现每瓦带宽提升 6 倍(基于卡级标准化后的竞品规格);与 SRAM 相比,HBC 旨在实现每瓦容量提升 200 倍(基于机架级标准化后的竞品产品规格)。

高通 HBC 还拥有多代发展路线图,旨在以更低的总体拥有成本和更高的能源效率,提供更快、更高效、更具可扩展性的处理能力。其中,采用 HBC Gen 1 技术的 AI250 旨在实现业界领先的单卡 133 TB/s 读写速度,相比采用 LPDDR5X 的 AI200,有效内存带宽提升 18 倍;采用 HBC Gen 2 技术的 AI300 则旨在实现更进一步的性能提升,相比 AI200,性能提升高达 54 倍。

预计搭载 AI250 的 HBC Gen 1 将于 2027 年年中开始商业化样品测试。

全新 AI 加速器:高通 Dragonfly AI300

继去年十月推出 AI200 和 AI250 加速器解决方案之后,高通此次还正式发布了第三代风冷和液冷机架式 AI 推理平台 AI 3000。

据介绍,AI300 集成了突破性的高通 HBC Gen 2 技术,可加速计算,并集成内存和提高有效内存带宽,专为分散式推理部署而设计(AI250 使用 HBC Gen 1)。

AI300 具备业界领先的内存容量和有效带宽,可为大型语言和多模态模型(LLM、LMM)推理和智能体人工智能工作负载提供高吞吐量、低延迟的性能。

高通预计,AI300 每卡每瓦特内存带宽性能将比现有基于 GPU 的架构提升 4-8 倍。

AI300 还利用 UALink(Ultra Accelerator Link,超高速加速链路)和 ESUN(Ethernet for Scale-Up Networking,以太网扩展网络)实现向上扩展;利用铜缆和光纤实现向外扩展。

预计 AI300 将于 2028 年开始商业送样。

高通还推出了面向下一代人工智能和云数据中心基础设施的大规模性能优化的定制芯片业务,专为智能体人工智能和其他特定工作负载定制的芯片。

高通表示,其具备涵盖芯片、系统和软件协同设计能力,从设计到量产的端到端定制芯片解决方案,可以满足客户特定的性能、功耗和集成要求。同时,其先进的封装和模块化架构,可以为定制芯片提高性能、能效和可扩展性。此外,高通成熟的知识产权和精简、设计执行流程、强大的供应链体系,有助于加快产品上市速度并降低执行风险。

高通称,其定制芯片业务有能力为这个 2029 财年总规模达 1150 亿美元的市场提供价值。而高通对于定制芯片客户可以提供多种合作模式。

提供数据中心连接产品

对于超大规模数据中心来说,连接已经成为了其性能提升的新瓶颈。芯片大厂 Marvell CEO 此前就曾指出,现代 AI 需要数万乃至数百万个处理器协同工作,构成一台超大规模计算引擎。" 当计算问题被拆解成无数子任务、分散到整个数据中心执行时,连接就是一切。"

黄仁勋也曾表示:" 当你面对一个计算问题,把任务拆成许多部分,并分布到整个数据中心时,真正不可或缺的正是连接能力。"

目前,高通所提的连接解决方案涵盖了芯片间、铜缆、光纤和园区级互连的广泛连接产品组合,适用于下一代人工智能数据中心。

●支持光纤、AOC 和 AEC 应用中的高带宽 800G 和 1.6T 连接,从数据中心内部链路到最远 20 公里的园区部署。

●结合高通技术公司的 SerDes、PAM4、轻量级相干 DSP、信号完整性和遥测功能,以支持可扩展的高性能 AI 基础设施。

这些解决方案可以解决日益分布式、分散化和带宽密集型基础设施中,对人工智能数据中心性能至关重要的数据传输瓶颈问题。

与 Meta 就数据中心 CPU 达成战略性多代合作协议

高通技术公司和 Meta 公司于 6 月 25 日宣布达成一项战略性的多代合作,高通技术公司将成为 Meta 公司数据中心 CPU 的供应商。高通技术公司的数据中心 CPU ——高通 Dragonfly C1000 ——计划用于 Meta 公司的下一代服务器,这凸显了高性能、高能效计算在大规模横向扩展环境中日益增长的重要性。

高通技术公司的解决方案将于 2028 年下半年开始投入生产,并适用于未来的数据中心容量扩展。高通技术公司的平台方案涵盖先进计算、高性能连接和系统级优化,旨在提供卓越的每瓦性能,并帮助大规模降低总体拥有成本。

高通公司总裁兼首席执行官克里斯蒂亚诺 · 阿蒙表示:" 我们设计的数据中心 CPU 旨在为大规模数据中心部署提供领先的单核性能和突破性的能效,而与 Meta 达成的这项多代合作协议是对我们这一理念的重要验证。我们很高兴能够深化与 Meta 的合作,将业务范围从终端设备扩展到数据中心。而这仅仅是个开始。"

Meta 创始人兼首席执行官马克 · 扎克伯格表示:" 我们很高兴能继续与高通技术公司合作,共同设计 Meta 的下一代 CPU。结合我们在其他计算领域的投资,我们正在快速构建所需的基础设施,以便为全世界每个人提供个人超级智能。"

此外,来自技术和人工智能生态系统的 35 多家全球领先企业也公开支持高通技术公司的数据中心愿景和商业解决方案,其中包括 Advantest、Arista、Astera、Cirrascale、Compal、Confidential Core AI、Core42、台达、Fibercop、富士康、技嘉科技、华联科技、英业达、IONOS、联想、MasterWorks、Microchip Technology、美光科技、南亚科技、NEC、NeuReality、广达、和硕联合科技、三星 SDS、Saptiva AI、SK 海力士美国、Supermicro、Teradyne、TeraHop、联电、VAST Data、Viettel IDC、VNPT 集团和纬创资通。

编辑:芯智讯 - 浪客剑

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论