硅星人 8小时前
Google瞧不上Harness:发更强TPU搞Agent全家桶,还随手替苹果发布了新Siri
index.html
../../../zaker_core/zaker_tpl_static/wap/tpl_font3.html

 

" 试验阶段结束了。" Google Cloud CEO Thomas Kurian 在开场不到三分钟就抛出这句话。

Google Cloud Next 大会于当地时间 4 月 22 日上午在拉斯维加斯召开。这是近年来科技圈最受关注的云计算大会之一,今年的主角只有一个:Agent

从 Keynote 的章节命名就能看出 Google 的野心:Agentic Enterprise Blueprint、Agentic Data Cloud、Agentic Defense、Agentic Taskforce...... 每一个模块都冠上了 "Agentic" 的前缀,Google Cloud 向世界介绍的是一套从算力底座到应用前端的完整 agent 架构。

但如果你把这场 Keynote 从头看到尾,会发现一件非常有意思的事:

Google 是真的瞧不上 Harness,在整场大会里对这个火热名词一字未提。

在热火朝天的 agent 浪潮里,Harness 是最近一段时间最火热的概念。它被用来描述建设 agent 的过程里所需要的一切基础设施。

而在疯狂的讨论里,如我们之前所观察的,Google 的沉默振聋发聩。它完全缺席了。

这次 Google Cloud 的大会上,缺席的原因终于明白:

Google 根本不认同什么 Harness,或者说它拒绝被其他人提出的模棱两可概念牵着鼻子走,它提出的是从 AI Hypercomputer(包括新发布的训练和推理分家的更强 TPU),Agentic Data Cloud、Agentic Defense、Agentic Task Force,到最重要的 Gemini Enterprise Agent Platform 的 Agent 五层架构体系。

它要用这个全家桶抢走所有企业 agent 的生意。在这次大会上,甚至出现了活久见的一幕:苹果的 logo 出现在 Google 的发布会大屏幕上,恍惚以为误入乔布斯剧院。Google 就这样以客户案例展示的形式 " 发布 " 了新的 Siri 的关键信息。

这一切都是 Google 在秀肌肉。

以下是这场长达两小时 Keynote 的核心内容解析。

Sundar Pichai :资本投入创历史

Google CEO Sundar Pichai 公布了一个让人瞠目的数字:Google 在 2022 年的资本支出为 310 亿美元,而 2026 年的预算区间是1750 亿至 1850 亿美元,四年内实现了近 6 倍的增长。其中超过一半的机器学习算力将专门分配给云业务。

他随即用 Google 自己的案例说明 Agent 的实际价值:

Google 内部目前75% 的新代码由 AI 生成,并由工程师审核通过(去年秋天这一比例还是 50%)。在一次复杂的代码迁移任务中,工程师组建了由 " 规划者、协调者、编码者 " 三类角色构成的 Agent 系统,最终将迁移速度提升了 6 倍。

在营销层面,团队借助 Gemini 生成大量创意素材变体,实现精细化个性投放,带来 70% 的制作周期缩短和 20% 的转化率提升。

在安全层面,Google 安全运营中心的 Agent 每月自动处理数以万计的非结构化威胁报告,将威胁缓解时间压缩了超过 90%

Pichai 随后宣布了大会最重磅的产品:Gemini Enterprise Agent Platform,并将其定义为 "Agent 时代的任务控制中枢 "。

Gemini Enterprise Agent Platform:企业 Agent 的操作系统

这是整场 Keynote 着墨最多的部分,也是 Google 今年最核心的产品策略落点。

新模型阵容

Google 发布了一批新模型,均处于 Preview 阶段:

Gemini 3.1 Pro,最新的旗舰推理模型,专为复杂工作流编排设计,可与企业 API 和系统直接交互,减少调优需求。Databricks、JetBrains、Replit 均已选择接入。

Gemini 3.1 Flash Image(内部代号 Nano Banana 2),面向高保真视觉资产生成。Veo 3.1 Lite,Google 最具成本效益的视频模型,定位高并发视频应用场景。Lyria 3 Pro,企业级音频和音乐生成模型。

值得关注的是,Google 同时支持 Anthropic 全线模型,并在大会上宣布新增对 Claude Opus 4.7 的支持。

此外,Google 还宣布成为苹果的首选云合作伙伴,双方正在基于 Gemini 技术共同开发下一代 Apple Foundation Models,这些模型将驱动包括 " 更个性化的 Siri" 在内的苹果未来 AI 功能。

Agent 的完整生命周期管理

平台的核心价值在于覆盖 Agent 从构建到治理的全生命周期:

Low-Code Agent Studio 允许非技术员工用自然语言创建和部署 Agent,将业务规则融入 LLM 推理,实现可预期的自主执行。

Agent Registry 是 Agent 的 " 总台账 ",为组织内每一个内部 Agent 和工具建立索引,确保可发现性与治理合规。Skills & Tools Registry 则提供可复用的模块化指令包,让 Agent 能快速习得特定领域的专项能力。

Agent Marketplace 支持从生态合作伙伴直接搜索和部署专业 Agent,接入方包括 Atlassian、Box、Oracle、ServiceNow、Workday 等主流企业软件厂商。

平台原生支持 Model Context Protocol(MCP),并将全部 GCP 服务暴露为 MCP 接口,使任意 Agent 均可无缝调用任意 GCP 服务。

安全与治理:Agent 身份识别

在安全侧,平台引入了 Agent Identity 机制——每个 Agent 被分配唯一的加密 ID 和明确的授权策略,所有行为均可追踪和审计。Agent Gateway 充当统一管控台,跨组织执行策略,配合 Model Armor 防止敏感数据泄露。

Agent Observability 提供粒度化的执行路径可视化,支持 OTel 标准遥测,开发者可追踪 trace、监控工具调用,诊断推理死循环。

真实客户案例

客户采用数据颇为亮眼:

德国保险公司 Signal Iduna 上线数周后即达到 80% 的使用率,11,000 名员工开始自主构建专属 Agent,其健康险 Agent 将用户答复速度提升了 37%,周活用户增长 400%。KPMG 首月达到 90% 的采用率,上线超过 100 个 Agent。Walmart 向门店管理人员推出 Gemini Enterprise,让管理者能花更多时间在卖场与员工、顾客互动,而非坐在办公室盯屏幕。NASA 使用 Gemini Enterprise Agent 为 Artemis II 载人航天任务提供飞行就绪性支持,确保宇航员安全。

此外,Citi Wealth 与 Google Cloud 及 DeepMind 合作,推出了名为 "Citi Sky" 的 AI 财富团队成员,可全天候多语言为客户提供金融服务。Virgin Voyages 部署了面向船员的 AI 助理 "Project Ruby",将生产时间线缩短约 60%,并拉动单月销售额增长 28%,实现了一个销售纪录季度。

大会还邀请了单板滑雪传奇、三届奥运金牌得主 Shaun White 上台,现场演示 Google Cloud 如何用 AI 分析他在 2017 年的比赛影像——将一个不到三秒的腾空动作逐帧拆解,追踪三维姿态、旋转速度、腾空时长,为新生代运动员的技术训练提供数据支持。

AI Hypercomputer:算力基础设施的两条腿

负责基础设施的高级副总裁 Amin Vadhat 说:" 在 Agent 时代,算力不再由一块芯片定义,算力就是整个数据中心。"

第八代 TPU:训练与推理分家

Google 本次发布了 TPU 第八代,并首次拆分为两个独立平台:

TPU 8t(训练专用):将块缩放乘法运算直接内置于 MXU(矩阵运算单元),消除 VPU 计算开销,单 pod 计算性能是上一代的近 3 倍。芯片间互联带宽是 Ironwood 的两倍,最多可连接 96,000 颗 TPU,形成 3D 环形拓扑,整个 Superpod 提供 121 exaflops FP4 算力。单 Superpod 共享带宽内存达2 petabytes。Google 将其类比为 " 可存放美国国会图书馆全部数字馆藏 100 次 " 的容量。

TPU 8i(推理及强化学习专用):集成专用集合加速引擎,额外降低 5 倍延迟;全部内存缓存直接驻留在硅基上,从根本上打破了制约长上下文解码的 " 内存墙 "。采用全新 Boardfly 拓扑,单 pod 部署 1,152 颗 TPU,可同时运行数百万个并发 Agent,接近零延迟,算力达 11.6 FP8 exaflops,较 256 芯片 Ironwood pod 提升9.8 倍

Virgo 网络与 NVIDIA Vera Rubin

在网络层,Virgo Network 将 134,000 颗芯片以 47 petabits/s 的无阻塞带宽互联,提供 170 万 exaflops 的总算力,支持在单一集群中组织超过百万颗 TPU,可将数月的训练时间压缩到数周。

与此同时,Google 宣布将成为全球首批提供 NVIDIA Vera Rubin NVL72 的云厂商,并在其上开放 Virgo 网络支持,最多可连接 96 万颗 GPU。

在处理器侧,基于 Arm 架构的自研 Google Axion N4A 实例上线,与同类 x86 实例相比,价格性能比提升最高 2 倍,能耗性能比提升 80%。

金融巨头 Citadel Securities 现场分享了实测数据:在 TPU 上运行工作负载的速度是此前的 2 至 4 倍,成本降低 30%;原本需要数周甚至数天的研究任务,现在可以在数小时乃至数分钟内完成。

Agentic Data Cloud:让 Agent 读懂企业数据

" 没有上下文的推理只是猜测。" 负责数据业务的 Karthik Narain 给出了这场演讲里最直白的一句话。

Agentic Data Cloud 由四项核心创新构成:

Knowledge Catalog(知识目录),定位为企业的 " 通用上下文引擎 "。它深度整合 BigQuery,将表结构和元数据映射为统一的业务语义,并通过 Smart Storage 将非结构化数据(PDF、图片等)一落入 Google Cloud Storage 便立即完成标记、富化和 Agent 就绪处理,无需任何人工数据工程。Gemini 会自动提取实体、映射关系、理解业务语义:当 Agent 听到 " 净收入 " 或 " 风险 " 时,它能理解企业特定的语义含义。

Data Agent Kit,一套内嵌于开发者日常工作流(VS Code、Claude Code、Gemini CLI)的数据科学工具库。开发者只需表达意图,例如 " 预测客户流失 ",系统便自动构建数据管道、部署模型,直接在 Agentic Data Cloud 上执行,全程无需手动编排。

Lightning Engine for Apache Spark,Google 重构了 Spark 执行引擎,在 Agent 时代的大规模数据处理场景下,性能是此前市场领导者的2 倍,价格性能比也高出 2 倍。Flipkart、Lowe's、Meesho 等已开始使用。

Cross-Cloud Lakehouse(跨云数据湖仓),这是 Karthik 最着重阐述的一项能力。基于开放的 Apache Iceberg 标准,分析引擎可以直接跨 AWS、Azure 查询数据,数据不移动、零复制、无须承担昂贵的出站流量费,直接实现低延迟访问,彻底打破 " 数据必须在同一朵云 " 的历史枷锁。

Agentic Defense:安全也要以机器速度运转

" 漏洞从发现到被利用的时间已经变成负数。" 安全负责人 Francis deSouza 用这句话揭示了当前网络安全的严峻现实:当前漏洞的平均被利用时间是负 7 天,也就是说,攻击往往发生在补丁尚未开发出来之前。更令人担忧的是,攻击者从初始入侵到移交给下一个威胁团伙的交接时间,已从过去的 8 小时压缩到22 秒

应对这一现实,Google 推出了 Gemini 原生的 Agentic 安全运营中心(SOC):triage Agent 将原本 30 分钟的安全调查压缩至 60 秒完成;威胁狩猎与检测 Agent 以人类团队无法企及的速度和规模主动扫描风险;结合 Mandiant、VirusTotal 和 Chrome 的全球遥测数据,暗网威胁识别准确率达98%

大会上,Wiz 正式并入 Google Cloud(此前已宣布收购意向)。Wiz 联合创始人 Yinon Costica 上台介绍了 Wiz 的 AI Application Protection Platform(AI-APP)

Wiz 通过无代理方式自动构建云和代码环境的动态资产清单,并生成安全图谱,直观呈现 AI 应用架构(包括哪个 Agent 运行哪个模型、能访问哪些数据库和工具)。

Wiz Red Agent(红队 Agent)持续自动验证每个暴露风险,像一个友好的白帽黑客不间断扫描攻击面——它能发现认证绕过漏洞,并证明该漏洞确实可被用来渗透后台敏感数据库。Wiz Green Agent(绿队 Agent)则负责自动化完整的修复流程:识别责任人、定位漏洞代码行、生成修复建议,并可直接提交 PR 或触发编码 Agent 自动修复。

Agentic Taskforce:让 Agent 直接服务客户和员工

面向客户:从购物到服务的全渠道 Agent

Google 推出了预建的购物 Agent 和餐饮点单 Agent,支持从发现到结账的全流程自然语言交互。Omnichannel Gateway 确保 Agent 在网页、移动端、语音多个渠道之间无缝衔接,且完整保留对话上下文。

Papa John's 正在用 Food Ordering Agent 构建记忆用户偏好、加速送达的超个性化点餐系统。Best Buy 用 Agent Assist 引导购物者了解复杂产品规格、解决问题、预约服务。Home Depot 的 "Magic Apron" 助理则覆盖从选购灵感、产品知识到购后支持的全旅程。

演示环节中,YouTube TV 的客服语音 Agent 已在生产环境中服务 100% 的用户,现场接到来电后,Agent 流畅地推荐了体育订阅方案,并在请求下实时切换为西班牙语为来访者父亲讲解,整个体验自然到与真人客服无异。更重要的是,YouTube TV 团队从零到生产上线,只用了六周

面向员工:Workspace Intelligence

Google Workspace 产品 VP Yulie Kwon Kim 发布了 Workspace Intelligence,定义为 " 消除上下文碎片的统一智能层 "。

她用一个场景说明问题:一个普通的工作日里,你为了回答一个问题打开了 15 个标签页,在过期邮件、被人实时编辑的 PPT 和多个表格之间来回跳转。Workspace Intelligence 的目标是让这一切不再发生。

演示中,系统在 Google Chat 的 Ask Gemini 界面里,直接汇总了来自多个来源的最紧急任务,精确定位了 " 上季度那个带区域销售折线图的 doc",并通过调用 " 区域营销技能 ",自动跨邮件、聊天记录、外部 CRM 和企业品牌素材,生成了一份格式精美、符合个人历史风格的 Google Slides 报告。

大会还宣布,从 Microsoft 365 迁移到 Google Workspace 现在可以快5 倍,包括法律和财务等对格式要求严苛的复杂团队迁移也在支持范围内。

一场系统架构层面的宣战

纵观整场 Keynote,如果只提炼一个核心判断,那就是:Google 正在将 Agent 从一个功能,升级为一套完整的企业操作系统。

Thomas Kurian 在最后总结时特别强调了 " 开放 ",并以此与竞争对手的 " 围墙花园 " 策略形成对比:客户可以自由选择最好的芯片和模型、自由在任何地方运行 AI、自由控制自己的数据和 Agent。

但自由不是无序。Google 给出的答案,是用五层架构把这种自由兜住。

AI Hypercomputer,为 Agent 时代重新设计的算力底座,训练与推理首次分开专项优化。Agentic Data Cloud,解决的是 Agent 的 " 原料 " 问题:企业数据如何变成 Agent 可信赖的上下文。Agentic Defense,让安全本身也成为自主运行的 Agent,以机器速度对抗机器速度的威胁。Gemini Enterprise Agent Platform,Agent 的构建、部署、治理、优化一体化平台。Agentic Taskforce,面向客户和员工的现成 Agent 部队,以及将 AI 能力深度融入 Workspace 的智能层。

" 试验阶段结束了 ",这句话听起来像一个简单的宣告,但背后是一个清晰的商业逻辑:当 75% 的 Google Cloud 企业客户已经在使用 AI 产品,当 Walmart 和 Unilever 这样的传统巨头也已将 Agent 部署到门店和采购流程,Google Cloud 需要的不再是说服企业为什么要用 AI,而是向企业提供管理数千个 Agent 的能力。

这正是 Gemini Enterprise Agent Platform 的存在意义。

评论
大家都在看