三易生活 6小时前
找来谷歌Gemini做外援,苹果的Siri有救了
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

AI 加持的个性化 Siri 究竟何时才能全面上线?这或许是相当多 iPhone 用户最想知道的一个问题,毕竟 iOS 的大版本从 18 跨越到 26,个性化 Siri 的上线时间依旧还是 " 未来一年 "。如今,苹果似乎终于准备着手来解决这个问题了。

日前有海外媒体援引知情人士透露的信息称,苹果公司将以 10 亿美元 / 年的价格获取谷歌 Gemini 模型的使用权,为其承诺已久的个性化 Siri 提供技术支持。具体来说,谷歌的 Gemini 将负责处理 Siri 的摘要生成和任务规划等复杂功能,据称苹果所引入的 Gemini 模型参数量达 1.2 万亿,规模是其自研 1500 亿参数模型的 8 倍。

为了让新版 Siri 得以在明年春季如期上线,苹果这次也是无奈选择了 " 造不如买 "。因为按照相关说法,苹果只是希望将 Gemini 作为过渡方案,直至自研模型的能力可以满足要求。除此之外,Gemini 为 Siri 提供的 AI 服务均将通过苹果的私有云完成,用户数据会完全隔离,谷歌无法获取,这一点与此前苹果与 OpenAI 的合作也保持了一致。

其实不是苹果不想用自家产品,而是目前 Apple Intelligence 实在是 " 扶不起的阿斗 "。虽然 Apple Intelligence 上线已经有一年多时间,但真正落地的功能还寥寥无几,并且已经实装的功能表现也一言难尽,诸如文档抓不住重点、不会合理使用标点符号等问题。

其实有问题不可怕,苹果如今真正的难关,是短期内还看不到解决相关问题的希望。当下,苹果 AI 团队的现状只能用 " 风雨飘摇 " 来形容,以苹果基础模型团队(AFM)负责人 Ruoming Pang 的离开为标志,在今年夏季,苹果已经失去了 AKI(Answers, Knowledge and Information)团队负责人 Ke Yang、首席机器人专家 JianZhang,以及 John Peebles 等数位大语言模型(LLM)的研究员。

核心团队几乎被 " 掏空 " 是苹果 AI 部门的现状,但在当下的 AI 市场的竞争中,算力不再是桎梏,人才才是重中之重,因为算法的迭代更依赖天才的灵光一闪,所以离职潮就让苹果可能本就不足的 AI 研发能力雪上加霜。这也是为什么此前在 WWDC25 上,负责 AI 部门的高管 Craig   Federighi 承认,Siri 当前版本(即 V1 架构)还无法满足客户的期望,也达不到苹果的标准。

可是被寄予厚望的 V2 架构版 Siri 迟迟难产,苹果所宣称 Siri 能更好地理解用户在对话中可能出现的错误或自我纠正,通过应用程序意图调用设备上更广泛的操作,以及利用个人知识进行语义索引等功能依然还处于 "PPT" 状态。

即便苹果在核心 AI 研发人员出走后也开始补强,但 Apple Intelligence 想要名副依旧还需要时间。可偏偏苹果在 AI 竞赛中缺的就是时间,所以引入谷歌 Gemini 作为外援就能立竿见影地让 Siri 从智障变智能。

事实上,在敲定引入谷歌 Gemini 前,据称苹果曾测试了 OpenAI 的 ChatGPT 以及 Anthropic 的 Claude。那么为何来自直接竞争对手的 Gemini,最终会成为苹果为 Siri 选择的支撑?当然是因为在一众第三方 AI 大模型里,Gemini 最契合苹果的需求。

在 lmsys 大模型竞技场等榜单里,谷歌最新的 Gemini 2.5 绝非在各个方向中都拔尖的存在。而关于 Claude 3、GPT-5、Gemini 2.5 这三个 SOTA(当前最先进)模型中谁最聪明,如今海外社交平台上被高票赞同的说法是三者各有千秋,其中 Claude 3 的代码能力独树一帜、GPT-5 在搜索上一骑绝尘,Gemini 2.5 则赢在写作能力上。

显而易见,对于普通用户而言,代码生产能力可以被忽视,毕竟绝大多数人不需要一个效率出色的代码草稿生成器,那么剩下的搜索和写作能力里,显然后者对普通用户意义更大。让 AI 帮助你从互联网世界纷繁复杂的数据海洋中找到需要的内容,确实很有意义,但它的问题就是可替代性强,因为传统搜索引擎也能做到这一点。

生成图片、总结文档、写作文字,恰恰是普通用户既缺乏又没办法假于外物的场景。如果没有 AI,想要在网络上指点江山,写出合乎逻辑且通顺的大段文字,就需要有一定的语文能力,诸如 "666"、" 绝绝子 "、" 破防 " 等互联网黑话的出现,就是因为当下网民群体的本科率不足 10%。

当然,得益于全球主要国家中普遍存在的计算机基础教育,打字几乎属于人人都会的技能,但绘画就不一样了。如果没有进行专门的学习,普通人可能都不知道如何动笔,这也是为什么 " 画师 " 能成为互联网上一个热门职业的原因。

换而言之,Gemini 最擅长的写作、生图具有一定稀缺性。不仅如此,谷歌还有一个 OpenAI 和 Anthropic 不具备的优势,那就是他们是一家存在了二十余年的跨国巨头。" 全球视野 " 虽然对于 AI 大模型的高度毫无意义,却能拓宽它的广度。

Gemini 对于多语言的支持应该是如今一众大模型中表现最好的,不仅是英语、汉语、西班牙语、法语等主流语言,就连泰语、马来语、瑞典语这些小语种的适配它也相当出色。这一点,对于业务遍及全球的苹果无疑十分重要。

模型的长处恰好契合消费级市场的特质,又具备全球化能力,同时一年只需要 10 亿美元,这样看来,苹果让 Gemini 成为 Siri 的大脑可以说是一点也不亏。

【本文图片来自网络】

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

siri 谷歌 ai apple 一闪
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论