数智前线 06-11
苹果AI:惊喜不多,但给安卓手机打了个样
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

虽然苹果没有太多技术上的创新,但提供了不少 AI 落地手机等终端的工程实践。‍

文|牛慧‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

编|周路平‍‍

近两个小时的主论坛演讲,苹果将一半时间留给了人工智能。

北京时间 6 月 11 日凌晨一点,苹果 2024 开发者大会在库比蒂诺开幕。如果说去年开发者大会的风头还是 MR 设备 Vision Pro,今年被诟病在人工智能赛道落后于同行的苹果,终于发布了大量与人工智能相关的产品和功能。

比如新的 Siri 可以理解上下文进行多轮对话,可以在多个 App 之间进行信息的流转,而且接入了 ChatGPT 的能力;比如可以自动分类邮件并生成回复内容,语音备忘录可以转录成文字和摘要,支持图片查找和图片消除,支持视频的自动编排……苹果在将这些 AI 能力与手机里的各种 App 和场景进行打通。

尽管没有太多眼前一亮的东西,但苹果等终端厂商有一个很大的优势是不用去创造需求和场景,只需要把手机上原本存在的大量痛点,用 AI 做好就能给用户带来不一样的体验。

而苹果将这些 AI 能力用了一个很鸡贼的词来概括—— Apple Intelligence,试图将用户的心智培养成 Apple Intelligence(苹果智能)等于 Artificial Intelligence(人工智能)。

01 ‍‍

AI 将如何改变 iPhone 的体验?

在发布会进行到一个小时后,苹果终于开始了 Apple Intelligence 的发布,而应用场景被放在了最前面进行介绍。

一是生成表情包和图片。当用户找不到合适的表情符号来表达自己想要表达的意思时,可以通过自然语言自由创建自己的表情符号。而且,还可以在跟朋友发消息时,用朋友的照片生成不同风格的图片,让聊天更加有趣,目前支持素描、插图和动画三种风格的图片生成。

二是通话转录和摘要。iPhone 在此之前出于隐私考虑一直不支持通话录音的功能,而未来将支持这一功能,并且提供智能摘要,但用户在开始录音时,对方会收到通知,这将是一个令人尴尬的画面。

三是信息的提炼和生成。包括 Safari 浏览器的网页信息的提炼,以及邮件分类和摘要,同时可以生成邮件回复内容或者进行文本润色。另外,苹果 AI 也将会总结手机 App 推送的关键信息,进行优先通知。

四是图片消除和生成 vlog。 用户可以只需输入描述,苹果系统就能利用现有的图库创建 " 具有独特叙事弧线的电影 "。或者可以直接告诉手机需要查找什么样特征的图片,然后系统会从海量的图片库中找出相对应的图。而用户也可以消除图片中不需要的元素,达到一键消除的效果。

五是 Siri 变得更智能,支持自然语言的多轮对话,能理解上下文,也将支持文本输入。Siri 作为语音助手推出了十几年时间,但一直不够智能,只能处理一些简单的任务,比如 " 设置计时器 "、" 创建提醒 ",而且很多问题只会给你罗列一堆搜索链接,毫无智能可言。

在大模型加持后,Siri 有了新的 logo,而且用户调用 Siri 时不再像之前那样出现一个圆环,而是整个屏幕出现灯光环绕的效果。

而且,苹果也正式公布了与 Open AI 的合作,Siri 可以直接调用 ChatGPT 的能力,比如你想知道哪种植物适合种在院子里,你可以拍一张照片,Siri 可以使用 ChatGPT 提供答案。但苹果也表示,在使用这项服务之前,用户会被询问是否要使用 ChatGPT。而且苹果用户可以无需创建帐户免费访问 GPT-4o,ChatGPT 的订阅用户可以连接他们的帐户,并直接在苹果系统中访问付费功能。

不过,鉴于国内无法直接调用 ChatGPT 的服务,Siri 在国内的能力或许会有所限制。而在此之前,苹果传出与百度在洽谈合作,将文心一言的服务接入 iPhone 里,但这一消息并没有得到双方确认。

另一个不太好的消息是,因为大模型需要更强的算力,所以很多 iPhone 的机型并不能体验到这些 AI 能力。目前信息来看,只有 iPhone 15 Pro 以及配备 M1 或更新芯片的 iPad 和 Mac 才能使用。

这意味着,在换机周期变得越来越长的当下,苹果或许想借 AI 之手来推动带动新款 iPhone 的销售。

除了 AI 的重头戏,苹果也对手机、电脑、平板和手表等操作系统也进行了常规的更新,比如 iOS 增加了应用锁、卫星通信以及支持手机与电脑之间的跨设备操作。而另一个令人惊喜的功能是,计算器终于被引入了 iPad,支持用手写笔做各种数学笔记,而计算器可以识别各种表达式,直接出现答案,或者创建抛物线图等,甚至可以模仿你的笔迹。

02 ‍

强调跨 App 的系统级使用

从苹果推出的这些 AI 功能来看,并没有哪个是非常令人眼前一亮的东西,包括通话摘要、图片编辑和消除在三星、OPPO 等安卓手机上都已经实现。但相比于其他厂商碎片化的更新,苹果展现出了从系统层面对生成式 AI 的思考。

苹果在此次发布会上清晰地介绍了其 AI 五大核心思考:强大的、符合直觉的、深度整合的、懂得个人的、隐私的。这也意味着苹果的 AI 并不会像很多大模型产品那样,提供很多酷炫的功能,更多是完善产品在系统中的完整体验。

" 它必须理解你,并扎根于你的个人背景,比如你的日常生活、你的人际关系、你的交流等等。它超越了人工智能。它是个人智能," 库克说。

苹果一直在强调跨 App 的协作,而跨 App 的背后是苹果将调用你的个人信息和情境,它不仅能从你的各种检索中分析相关度最高的内容,还会参考你屏幕上的内容,比如你正在查看的邮件或者日程日历。

比如当你询问 Siri 爱人的航班何时降落,它将交叉引用可能通过短信或电子邮件与您共享的航班数据。Siri 还可以整合其他信息,例如即将到来的午餐预订,因此你可以询问它从机场到餐厅需要多长时间,而无需在应用程序之间切换。 

比如有人向你发送包含地址的短信时,可以要求 Siri 将地址添加到对应的联系人。比如通过屏幕感知,你可以要求提供朋友在某个位置的照片,然后让 Siri 将一张特定照片添加到笔记中,这意味着 Siri 同时浏览了照片和备忘录。

比如有一场会议改到了傍晚,你想知道开完这场会还能不能赶上女儿的演出,Apple Intelligence 就会处理相关的个人数据来给你提供协助。首先它知道你的女儿是谁,以及她前几天发来的演出,也知道你的会议的时间、地点,预估你从公司到剧院的交通状况。

目前,新版 Siri 可以执行 100 多项操作。而这些功能贯穿邮件、备忘录、Safari 浏览器、Pages、Keynote 甚至是第三方的 App。

当然,国内用户对苹果 AI 能力的感知可能会非常有限。除了没办法接入 ChatGPT 之外,也与国内用户的使用习惯有很大关系。一是国内很多用户与海外用户的使用习惯并不相同。比如发布会反复提到处理电子邮件的内容,而国内用户的工作习惯里,电子邮件并不是一个刚需。另外像 iMessage 的功能,国内也不流行,大家还是喜欢用微信交流,这也将使得系统对个人信息的获取面临一些困难。

03 ‍

端云部署,考验用户隐私安全

苹果将其 AI 能力定义为个人化智能系统,而要实现智能的前提是需要获取大量个人数据和环境信息,包括图片、备忘录、消息、电子邮件等。

目前,苹果尽可能地将 AI 的运算在端侧本地运行,不用上传数据到服务器,手机、电脑上就能处理。但端侧的计算性能毕竟有限,只有用了 A16Pro 和 M1 及以上的处理器的手机和电脑才能够支持苹果的 AI 功能。而且即便是这些机型,在面对大一点的任务时依然可能要调用到云端的能力。

事实上,目前手机和 PC 厂商都在强调端云协同的能力。不过苹果并没有透露,具体哪些任务需要在云端完成。但至少调用 ChatGPT 的部分肯定需要接入 ChatGPT 的云端服务。

而数据一旦上云,总会给用户带来更多的担忧,没有存在自己手机里来的放心。

为了解决端侧算力有限而云侧存在数据安全的问题,苹果专门推出了 Private Cloud Compute ——私密云计算技术。它将使用 Apple Silicon 的特殊服务器,这个服务器用的是苹果的芯片,如果请求需要发送到云服务器,苹果表示它只会以 " 加密 " 安全的方式发送与任务相关的数据。

苹果声称,数据绝对不会被存储,连苹果也无法访问,数据只会为了用来执行请求。苹果在数据安全和用户隐私上的努力值得国产手机厂商们学习,或许未来手机厂商和 PC 厂商都需要建设专门的数据中心来处理 AI 的请求,而不是依赖于公有云的服务。

当然,这并不能完全打消人们对数据安全的担忧。OpenAI 的死对头马斯克直接在库克的推文下留言," 如果苹果在操作系统层面集成 OpenAI,那么我的公司将禁止使用苹果设备,这是不可接受的安全违规行为。"

© 本文为数智前线(szqx1991)原创内容

未经授权,禁止转载

进群、转载或商务合作联系后台

文章精选

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

逗玩.AI

逗玩.AI

ZAKER旗下AI智能创作平台

相关标签

ai 人工智能 apple 开发者大会 iphone
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论