每日经济新闻 昨天
手机AI竞争转向:苹果、vivo等厂商不再“堆参数”,押注轻量化端侧大模型
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

在生成式 AI(人工智能)席卷全球的浪潮中,智能手机正成为 AI 落地的关键阵地。从苹果推出 Apple Intelligence、三星发布 Gauss(高斯)、荣耀带来 MagicGUI 大模型,再到 vivo 的蓝心大模型,端侧 AI 正成为行业新一轮技术竞赛的焦点。相比云侧 AI,端侧 AI 既能保护用户隐私、降低计算与能耗成本,还能提供类似个人助手的交互体验。

然而,当 AI 从云端迁移到终端,技术与商业的难题也随之而来。过去两年,厂商们热衷于将大模型直接嵌入手机操作系统,并将参数规模当成竞逐的焦点。比如,vivo 曾在 2023 年实现 130 亿参数的 " 蓝心大模型 " 在端侧跑通,并让 70 亿参数模型在端侧落地。

然而在今年 10 月 10 日举办的 vivo 开发者大会上,vivo 副总裁、vivo AI 全球研究院院长周围给出了一个新的发展方向——放弃对 " 通用人工智能 " 的追逐,转而推出体量更轻的 3B 端侧多模态推理大模型,该模型仅占用手机 2GB 内存、功耗约 750 毫安,却能在推理能力上超过此前的 7B 甚至 10B 模型,性能接近云端模型。" 做千亿级模型需要两万卡以上的集群,光设备投入就 20 多亿元,这还不包括每年数亿元的电费。‘卷’通用人工智能不太现实。"

vivo 副总裁周围 企业供图

事实上,端侧模型的小型化正逐渐成为行业共识。苹果的 Apple Intelligence 同样采用 30 亿参数的设计,可以在设备上完成文本摘要、信息提取与跨应用操作等任务。这意味着,厂商们正在从 " 堆参数、拼算力 " 的竞争,转向关注模型在端侧实用性能、功耗控制的理性阶段。

告别模型参数竞赛

端侧大模型落地后,越来越多消费者开始应用大模型,这也有望为手机消费带来新的增长契机。华福证券在研报中称,端侧大模型将成为消费电子品牌厂商提升个性化用户体验,打造产品差异化竞争力的重要方向,具备更强 AI 能力的终端新品推出或将带动消费电子见底复苏。

在 vivo AI 产品总经理关岩冰看来,真正实现个人化智能的核心在于端侧。" 只有端侧模型才能实时分析用户的数据、洞察需求,感知屏幕内容、理解使用意图等。" 这也正是苹果在 "Apple Intelligence" 中强调的方向,即在端侧完成敏感数据处理,保障隐私,同时提供个性化服务。然而,与苹果封闭的体系不同,安卓阵营的厂商在落地端侧大模型时要面临众多挑战。

" 云端模型的 CPU 通常基于 X86 架构,而手机上是 ARM 的内核,此外还要兼容不同芯片厂的 NPU 指令集,如何把原来生态里指令集转成手机上的指令集,这里最大的障碍是算子。" 周围说道。据他介绍,vivo 早在 2017 年便在美国设立 AI 研究院,组建专门的算子团队,目前该团队已扩展至几十人,聚焦把模型转成端侧化的过程。

算子之外,内存占用同样是制约端侧大模型落地的关键瓶颈。周围举例称:" 以往 7B 模型需要占用 3.5G 内存,而 8G 手机是中高端机型的主要配置,一个大模型就占掉 4 个 G 内存,一下让高端机变成了低端机。" 推理能力则是另一个挑战。例如,执行一个查询任务:" 帮我找今天下午 4 点北京到深圳的机票哪一个最便宜 ",实际会涉及几个 App 比价、分析使用习惯等复杂问题。" 去年的 70 亿参数模型只能做简单的任务拆解,不能做复杂的推理。" 周围说道。

过去一年 vivo 针对这些问题进行了优化。vivo 推出的 3B 端侧多模态推理大模型只占 2G 内存,不影响高端机的性能,其次增强了推理能力,可在手机中做意图中控和任务拆解的中台。" 今年 30 亿参数的模型已比去年 100 亿参数的模型更强,甚至在部分任务中与云端模型差距仅在 2%~3% 之间。" 周围说道。这意味着,在文本摘要、多轮对话、意图识别等场景中,端侧模型已具备实用价值。

智能体跨应用调度受限

随着端侧算力提升和操作系统 AI 化,手机中原有的语音助手逐渐向具备执行能力的 " 智能体 " 演进——它不再局限于回答提问,而是被赋予更强的意图理解与任务执行能力。厂商希望其能成为真正意义上的个人助理,完成诸如 " 帮我订一杯拿铁,少冰 " 这类需要调用外部服务、理解上下文并执行多步操作的实际任务。

目前 AI 手机智能助手调用第三方 App,主要有两条技术路线:一是通过意图框架实现。通过 API(应用程序编程接口)调用应用,实现跨应用功能。具体来说,就是手机厂商与 App 开发企业协商、以合法 API 的形式接入;二是 " 纯视觉方案 ",无需第三方 App 同意,直接调用安卓系统的无障碍等系统级权限。具体做法是,安卓手机厂商以多模态大模型技术配合无障碍权限,先读取屏幕内容,再以模拟用户点击的方式代替用户操作,实现手机智能助手代替用户接管手机,以达到调用 App 功能的目的。

" 用户用手机,手机厂商只占了 15% 的时长,还有 85% 的时长是用于开发者提供服务,特别是头部的互联网厂商,又在这 85% 中占了 70%~80%,他们的参与度非常高。" 周围说道。这也导致智能体在跨应用调度服务时处处受限,互联网巨头掌握着绝大多数用户服务接口和数据,而手机厂商掌握着操作系统与硬件能力。双方在安全授权、用户隐私和收益分配上的界限尚未明晰。

周围坦言:" 当手机的智能体要做任务的时候,我们只能做自己的功能和应用,比如是否流畅、调亮度、连 Wi-Fi 等,如果想跨应用操作,还需要和对方(互联网厂商)讨论安全授权的标准。"

在他看来,破局的关键在于推动行业标准的建立。" 我们无法避免地要做用户习惯和服务的分发,接下来的策略是建好能力,其次,愿意跟我们握手、合作的,就坐下来商量。AI 时代到来,是否需要一个新的江湖地位和影响力,就留给时间来回答。"

每日经济新闻

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai vivo apple 人工智能 竞赛
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论