IT之家 9小时前
消息称Meta自研芯片梦受挫:最先进芯片夭折,靠合作寻求替代方案
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

IT 之家 2 月 28 日消息,当地时间 2 月 27 日,据《The Information》援引知情人士消息称,Meta 在自研 AI 芯片方面遭遇重大挫折,已放弃其最先进的训练芯片项目,并将开发重点转向结构更简单的替代方案。

由于芯片设计难度超出预期,Meta 上周决定取消正在开发的高端 AI 训练芯片,并已向 AI 基础设施部门员工通报这一调整。

Meta 调整芯片战略的同时,也在加强与现有芯片供应商的合作。据报道,Meta 已签署价值数十亿美元的协议,从谷歌租用 AI 芯片。AMD 本周表示,将与 Meta 合作部署最多 6GW 的 Instinct AI 芯片,以支持 Meta 下一代 AI 基础设施。此外,Meta 本月还宣布与英伟达建立跨多代合作关系,将继续在数据中心部署英伟达芯片。

Meta 自研芯片属于 "Meta 训练和推理加速器 "(MTIA)项目,目标是降低对外部供应商的依赖,同时减少数据中心运营成本并增强基础设施控制能力。

Meta 已放弃其第二代训练芯片 Iris 的一个版本,并随后启动更先进芯片 Olympus 的开发,但该项目同样遭到了夭折的命运。一名参与芯片开发的人员表示,公司内部对能否开发出可与英伟达性能匹敌的芯片持怀疑态度,原因包括开发周期长、设计复杂以及功耗控制难度高。如果功耗无法有效控制,将削弱芯片相对于英伟达产品的竞争力。

在技术架构方面,Iris 采用单指令多数据(SIMD)架构,这种架构更易于硬件设计,但软件开发难度较高。Olympus 则采用单指令多线程(SIMT)架构,与英伟达芯片类似。这种架构更适合 AI 训练软件,但硬件实现复杂度更高。

Meta 原计划最早于 2026 年第四季度完成 Olympus 设计,而芯片设计完成后通常仍需至少 9 个月才能实现量产。Olympus 的 GPU 原计划采用 Meta 去年收购的 Rivos 的技术,该技术可兼容英伟达的 Cuda 软件生态,而 Cuda 是当前 AI 训练的行业标准。

Meta 最初计划基于 Olympus 构建大规模 AI 训练服务器集群,但管理层认为,这一方案存在风险,可能影响公司在与 OpenAI 和谷歌竞争过程中训练新模型的进度。此外,软件成熟度可能不及英伟达生态,而复杂设计也可能增加量产难度。

因此,Meta 目前计划继续依赖外部供应商提供的 AI 训练芯片,因为这些芯片的软件生态更加成熟,风险更低。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

英伟达 ai 芯片 基础设施 供应商
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论