星途科讯 15小时前
苹果Siri重构:算力外包谷歌英伟达,年付十亿
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

苹果全球开发者大会(WWDC)定于 6 月 8 日开幕,其人工智能重构计划中最具深远影响的细节,竟涉及苹果并不拥有的硬件。据悉,基于 Gemini 重建的 Siri 将把最复杂的请求发送至谷歌云,由英伟达 Blackwell B200 图形处理器进行处理,而非运行在苹果自有服务器上。对于约 20 亿台苹果设备的庞大装机量而言,这意味着 iPhone 智能的核心部分,很快将在两大竞争对手构建的基础设施上运行。

打破全栈闭环:复杂查询路由至英伟达 B200

预计苹果将继续让设置计时器或控制智能家居等简单请求在 iPhone 本地运行。这一转变主要针对超出设备处理能力的复杂场景:相关查询将回退至谷歌的大型 Gemini 模型,并在谷歌部署的英伟达 Blackwell B200 芯片集群上完成处理,用户数据将在硅片层面进行加密。这一安排使谷歌和英伟达成为苹果多年来最重要产品的核心环节。

此举打破了苹果长期掌控全栈技术的惯例。该公司多年主张安全的软件必须建立在自行设计的硬件之上,并为此构建了 " 私有云计算 "(Private Cloud Compute)。将旗舰助手的推理能力外包给竞争对手的数据中心,直接背离了这一理念。

性能瓶颈迫使转向:私有云难以承载万亿参数

这一变化的主因是性能问题。据报道,苹果曾尝试在私有云计算中运行 Gemini 模型,但测试显示系统速度过慢,无法达到 Siri 所需的大规模可用性标准。这促使苹果转向谷歌现有的基础设施,后者已为万亿参数推理做好了资源准备。

这一细节修正了此前关于新 Siri 工作原理的认知。去年 11 月,外界普遍预期定制版 Gemini 模型将独家运行在苹果自有服务器上。而最新迹象表明计划已变,目前尚不清楚私有云计算在此次发布中究竟扮演何种角色。

隐私新防线:英伟达机密计算技术

隐私机制是此事的工程核心。Blackwell B200 是一款多芯粒数据中心处理器,集成 2080 亿个晶体管,专为服务万亿参数模型设计。苹果所依赖的是英伟达机密计算(Confidential Computing),这是一种从 CPU 扩展至 GPU 的基于硬件的可信执行环境。

当该模式激活时,Blackwell 芯片会对 GPU 内存中的所有数据(包括模型权重、用户输入和推理结果)进行加密,同时在计算过程中保持加密状态。在多 GPU 配置中,芯片间的 NVLink 流量也会被加密。B200 是首款在输入和输出路径上都提供可信执行保护的 GPU。

对读者而言,其实际意义非常具体:苹果押注即使请求在竞争对手机器上处理,片上加密也能确保 Siri 请求的机密性,避免数据以明文形式暴露给谷歌云端。这与苹果最初 " 无状态服务器、不保留任何数据 " 的私有云设计理念截然不同,新方法通过硬件在每一步保持提示词加密,并结合密码学证明验证芯片身份。

资金流向逆转:苹果年付 10 亿美元授权费

在英伟达硬件之上,是苹果与谷歌于 2026 年 1 月 12 日宣布的合作关系。苹果同意每年支付约 10 亿美元,授权一款定制的 1.2 万亿参数 Gemini 模型。该系统大小约为苹果自身 1500 亿参数云模型的八倍,远超设备上运行的约 30 亿参数模型。

这种经济模式颠覆了熟悉的关系格局。谷歌每年已向苹果支付约 200 亿美元以保持 Safari 默认搜索引擎地位,而在 Gemini 协议下,资金流向发生逆转,苹果需为其助手背后的智能层向谷歌付费。

反垄断阴影下的合作

这种日益紧密的关系落入了充满争议的法律环境中。美国司法部于 2026 年 2 月提起反垄断上诉,挑战了维持 200 亿美元搜索默认协议有效的裁决。法律分析人士指出,Gemini-Siri 协议引发了政府在搜索案中识别出的相同结构性担忧,因为它将 20 亿台设备的复杂 AI 查询路由至单一主导提供商。

谷歌方面表示,通过该协议不会接收苹果用户数据,且据报道合同禁止谷歌利用 Siri 查询训练其模型。若上诉成功,该合作关系可能面临两家公司均未公开讨论的限制条件。

发布时间表:9 月正式亮相

任何期待在周一看到成品助手的用户可能需要等待更久。WWDC 将是苹果预览 iOS 27 及其配套操作系统的场合,随后将推出开发者测试版。据报道,具备完整对话功能的 Gemini 驱动 Siri 将与下一代 iPhone 一同在 9 月发布。周一只是正式揭幕和开发者接入的开始,而非消费者发布日期。

常见问题解答

Siri 是否在使用 Google Gemini?

是的。根据 2026 年 1 月宣布的合作协议,重建后的 Siri 基于苹果从谷歌授权的定制 Gemini 模型。苹果自身的较小模型仍负责处理简单的设备端请求。

新版 Siri 何时推出?

据报道,Gemini 驱动的 Siri 将于 2026 年 9 月与下一代 iPhone 一同发布,而非在 6 月 8 日的 WWDC 主题演讲上亮相。预计 WWDC 将率先预览该软件并向开发者开放。

苹果会与谷歌共享 Siri 数据吗?

谷歌表示不会通过该交易接收苹果用户数据,且苹果正依靠英伟达机密计算在处理过程中对请求进行加密。据报道,合同防止谷歌利用 Siri 查询训练其模型。

什么是英伟达 B200?

Blackwell B200 是英伟达的旗舰数据中心 GPU,专为大规模 AI 训练和万亿参数推理而设计。它包含硬件机密计算功能,可在芯片处理数据时对数据进行加密。

【星途科讯 图文丨欧阳布布】

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

英伟达 谷歌 siri gpu 芯片
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论