Siri爆改闪击GPT：国产手机助手如何接招

当 OpenAI 还在为广告变现和 AGI 理想争论不休时，苹果和谷歌已经酝酿起了 " 绕后偷家 "。

1 月 24 日，苹果公司官宣了自 Siri 诞生以来最具颠覆性的动作：砸下 10 亿美元与昔日的宿敌谷歌深度合作，为 Siri 全面换装定制版的 Gemini 大模型心脏。这次换装完成，Siri 的参数量级将从 1500 亿跃升至 1.2 万亿，彻底蜕变为具备多轮深度对话、跨 App 操作能力的真正意义上的 AI 智能体。

全新的联盟将 AI 助手的竞争拉入新维度，Siri 的爆改不是终点、而是移动 AI 终局之战的真正起点，苹果、谷歌与国产阵营之间的正面交锋也由此拉开序幕。而这次，国产玩家不仅与全球科技巨头站在同一起跑线，甚至拥有了更快冲刺、率先撞线的机会。

苹果的 "AI 补课 "：钞能力永不过时

苹果的 AI 布局，用一句话概括就是 " 有钱真好 "。

GPT-4.1 支持高达 100 万个 token 的上下文窗口，相当于 75 万字左右。这意味着它可以进行长时间、有深度且逻辑连贯的对话，精准记住用户的偏好和之前的讨论内容。

与 GPT-4、Claude 等新生代智能体相比，老版 Siri 过去数年最大的尴尬在于其孱弱的自然语言理解和任务执行能力。它无法处理包含多个意图的复杂指令、更无法理解上下文进行多轮对话。

如此巨大的差距如果从零开始追赶，不仅需要耗费天文数字的研发成本，更关键的是会错失宝贵的时间窗口。因此，苹果选择了 " 花钱买时间 " 这个最务实的策略，斥资 10 亿美元后，它将 Gemini 这个世界顶尖的大模型整合进了自己的体系。

不过，靠大模型补齐 " 智商 " 的苹果并没有简单地将 Siri 变成一个 Gemini 的传声筒。而是押注隐私安全这张王牌，再次筑高 " 生态城墙 "，用生态闭环换取技术加速度。

面对用户最为关注的隐私担忧，苹果承诺，会严格限制新 Siri 可保留的用户长期记忆范围，重点强化本地数据处理与权限管控。Gemini 全程运行于苹果私有云，用户请求会进行标识化处理，谷歌仅扮演技术供应商的角色提供模型推理能力，无法接触具体数据及用于训练。

要知道，伴随着生成式 AI 不断迭代进化，从《少数派报告》、《极限审判》等影视作品，到 AI 换脸诈骗、三星员工使用 ChatGPT 导致机密泄露等现实案例，关于隐私的争议和思考从未停息。

对用户隐私保障层层加码的合作，完美维护了苹果建立的 " 隐私守护者 " 形象。在数据安全焦虑日益加剧的背景下，这张牌的价值愈发凸显。

Siri 升级后的另一大优势，是将强大的 AI 能力与苹果无缝衔接的全场景生态深度绑定。根据合作协议，升级后的 Siri 将与 iOS、MacOS、WatchOS 等苹果全家桶系统进行前所未有的深度集成。

通过 " 硬件 + 服务 " 的闭环将用户锁定在其构建出的庞大生态系统中，是苹果常年稳居市场宝座的核心。有了 Gemini 的加持后，无论是手机、电脑还是手表用户都能获得更一致、连贯的智能体验，iOS 生态的 " 粘性 " 将极大增强。

从用户隐私的坚守到生态全面升级，iOS 这个本已是 " 粘性之王 " 的操作系统，在 Gemini 的助力下再次拥有了不被 AI 超车的底气。

值得注意的是，苹果最新发布的财报中全球营收、净利润、iPhone 销售收入等等，一口气创下了多个历史新高。苹果本季度大中华区的营收为 255 亿美元，飙升 38%，以苹果税为代表的服务业务毛利率高达 77%，同样创下历史新高，成为苹果新的现金奶牛。

要效率更要合规，苹果、阿里、腾讯领衔 A2A

然而，苹果看似天衣无缝的战略布局中却隐藏着几乎无法绕开的难题——中国市场。

由于数据安全法规和网络监管政策的差异，谷歌的完整服务在中国大陆地区长期处于缺位状态。这意味着国行版 iPhone、Mac 等设备上搭载的新 Siri，大概率无法直接调用由谷歌提供的完整版 Gemini 模型，而是极有可能采用一种 " 自研模型 + 国内厂商适配 " 的折中方案。

当海外用户已经开始享受新 Siri 带来的跨 App 一键订票、智能规划旅行、自动整理相册等便捷体验时，国内用户面对的很可能是功能被阉割、能力打折扣的 " 残血版 "Siri。

体验上的巨大落差，恰恰为嗅觉敏锐的国产手机厂商们打开了千载难逢的黄金窗口。

移动 AI 时代，评判 AI 助手优劣的核心标准不再是它能写出多优美的诗歌，而是它能在多大程度上 " 解放用户的双手 "，更重要的是在安全、不牺牲隐私的情况下，完成真实世界中的任务。

在这方面，国产阵营中的一些玩家已经展现出远见和执行力。他们所探索的正是与苹果、谷歌不谋而合、被行业普遍认为是未来方向的 Agent to Agent，即 A2A 模式。

A2A 模式的核心思想是让 AI 助手扮演一个 " 总调度员 " 的角色。而各个 App 则将自己的核心功能封装成一个个独立的、标准化的 " 子智能体 "。当用户发出指令时，AI 主智能体负责理解意图、拆解任务，通过统一的、经过授权的 API 接口，向相应的 App 子智能体 " 派发工单 "，协同完成任务。

阿里巴巴旗下的 " 千问 " 已开始了 A2A 模式的深入探索。用户只需在对话框里说出自己的需求，千问便能立即理解需求后包含的多重意图，随后调度 " 飞猪 " 查询并预订车票和酒店、调用 " 高德地图 " 规划行程路线，甚至联动 " 淘宝 " 推荐并购买用户所需物品。

整个过程流畅、精准，还在阿里生态这个安全、可控的框架内完成。

这种模式的优越性在于，它建立了清晰的双重授权机制——用户需要明确授权 AI 助手可以调用哪些 App 的功能；App 开发者也通过 API 接口明确规定了哪些能力可以被外部调用、调用的频次和数据范围。

AI 的每次操作都有据可查、权责分明，还构建了远比应用商店模式更具协同效应的共生生态，为 App 开发者带来新的流量入口和商业模式。

在 2025 年 Q3 的财报电话会上，腾讯总裁刘炽平曾表示微信也会推出智能体 AI。基于腾讯手握的超级生态，微信 Agent 登入市场后大概率能调度海量的微信小程序和滴滴、同程等服务。完成从社交、出行到本地生活的一站式任务闭环。

然而，在通往 AI 手机的道路上并非所有玩家都选择了 A2A 这条虽然稳妥但需要耐心构建的道路，一些厂商也进行了 AI 直接 " 读屏 " 的系统级 GUI 路线探索。

以字节跳动联合中兴推出的豆包手机和魅族等推崇 " 视觉一体化 " 概念的厂商为代表，这种模式的逻辑是通过获取系统底层的极高权限，让 AI 像真人一样 " 读取 " 屏幕上的文字和图像，然后 " 模拟 " 人的手指去点击、滑动、输入，从而操作手机上的任何 App。

这种方式绕过了与 App 开发者漫长的沟通、协调和接口适配过程，理论上能兼容所有现有 App，以最快的速度向用户展示 " 一句话搞定所有事 " 的酷炫效果。

但 " 快 " 却是以牺牲用户的隐私和安全为代价，当 AI 助手需要 " 读屏 " 工作时，就意味着用户的聊天记录、支付密码输入界面、私密照片等一切屏幕上显示的内容，都将毫无保留地暴露在它的 " 视野 " 之下。

尽管厂商会承诺数据不上云或本地处理，但在不透明的技术黑箱面前，这种承诺显得苍白无力。所以才会在豆包手机推出后迅速引发行业争议和抵制，各大银行的金融类 App 更是第一时间通过技术手段屏蔽此类模拟操作行为。

毕竟没有哪个负责任的平台会允许未经授权的第三方 " 黑箱 "，在自己的应用界面上为所欲为。

此次苹果与谷歌的合作模式也向所有手机厂商展现了，引入强大的大模型能力绝不等于可以无视规则、践踏隐私，AI 生态必然是建立在尊重、合作与共赢的基础之上。这既是对用户资产安全和隐私底线的守护，也是大模型厂家和手机厂家话语权的博弈。

现在来看，GPT 的领先优势虽然无法在商业层面上得到映射，但其加持下的手机 AI 助手还是很有机会成为 AI 时代的 " 超级入口 "。

GPT 类产品的核心场景是写代码、做报告、搞创作等深度思考，需要大模型的复杂推理能力，但说到底还是无法嵌入日常生活的 " 冷冰冰工具人 "。相比之下，手机助手和用户心理距离更近，" 即时响应 " 的高效和 " 最懂用户 " 的体贴成为它的核心竞争力。

苹果豪掷 10 亿美元 " 购买神装 " 的故事也告诉我们，未来的 AI 竞争绝不会是某一家模型公司的 " 一家独大 "，而是 " 模型能力 + 生态整合 + 用户信任 " 的综合性较量。

中国的手机厂商与其等待 " 残血版 " 的 Siri 出世，不如主动出击，与阿里、腾讯、美团等掌握着本地生活场景的互联网巨头深度合作，通过安全、标准的 A2A 模式接入国产手机助手，创造出真正 " 懂中国用户 " 的超级 AI 助理。

届时，集合了支付、社交、出行等应用能力的它将形成一站式服务闭环，面对苹果的生态壁垒和 GPT 的通用能力也能具备一战之力。

宙世代

一起剪

相关标签