豆包决定还是往回收一收。
12 月 5 日,豆包手机助手团队发布《关于调整 AI 操作手机能力的说明》表示:豆包手机助手将限制 AI 在刷分、刷激励场景的使用;暂时下线 AI 操作银行、互联网支付等金融类 App 的能力,并计划与相关厂商沟通共建安全操作准则;部分涉及竞技排名的游戏场景,AI 操作能力也将暂时下线。
豆包手机助手团队表示,这 " 为在技术发展、行业接受度和用户体验之间做好良性适配 ",算是对这两天的争议做了调整。
不得不说,这款由字节旗下豆包团队与中兴通讯联手推出的 nubia M153 工程样机,是近期机圈热度最高的手机,官方售价 3499 元,二级市场被炒到了上万,其搭载的豆包手机助手技术预览版,嵌入底层操作系统,可实现与系统的深度交互。
这不就是 iPhone 搭载的 Siri 梦想中的自己嘛,Siri 没做成的事,让豆包尝鲜了。
其实最开始,我是有些疑虑的,毕竟之前字节做硬件,都让人有种虎头蛇尾的感觉:坚果手机想做抖音入口,TikTok Lite 手机是为了预装 TikTok,Pico VR 是为押注元宇宙。所有硬件,在字节这里似乎都是 " 手段 ",不是 " 目的 "。一旦战略重心转移(比如元宇宙凉了,AI 热了),那些硬件立马边缘化。
用户能感受到这种 " 工具感 " ——你不是真心想做好一台个硬件,你只是想让我用你的服务。所以现在推出 AI 手机,我一开始觉得又是为了推豆包大模型、抢系统入口。
但当我深入了解了豆包手机助手的技术细节和战略意图后,我意识到,这可能并不是又一次 " 机会主义 " 的尝试,而是字节真的想 " 另起一套规则 "。
如果真的成功,字节就能走向 " 任务执行 " 的深水区,从 " 内容帝国 " 变成智能服务的一个环节,从而真正摆脱对流量曝光的依赖,在实体经济站稳脚跟,成为中国互联网真正的一极。
只是这次尝试注定会引起种种争议,豆包往回收一收是必然的,甚至可以说,豆包本可以不必这么匆匆忙忙。
01一场豪赌:"AI 原生手机 " 野心
从技术层面看,豆包手机助手的核心创新在于让 AI" 住进 " 了手机操作系统的底层,而不是简单地作为一个应用层的工具。这种 " 像人类一样操作手机 " 的能力,意味着它可以真正跨越不同应用之间的壁垒,自动完成从订餐、比价到发消息的各种复杂任务。
值得注意的是,这是首个豆包和手机厂商在操作系统层面合作的手机 AI 助手,其核心在于让 AI 直接控制系统、跨 App 执行任务、与硬件按键深度联动。
豆包手机助手能够在豆包 App 的基础上,和手机厂商在操作系统层面深度整合,具备视觉感知、长期记忆和操作能力,代表了 AI 原生手机的实际形态。
关键的是,豆包这次选择与中兴通讯合作,推出 nubia M153 工程样机,而不是自主开发硬件。官方明确表示,豆包并无自主开发手机的计划,目前正与多家手机厂商推进合作。
在测试视频中,我们可以看到豆包手机助手能够自动比价下单、调用优惠券、完成跨平台支付等操作。然而,这些看似酷炫的功能背后,是对用户操作习惯和敏感信息的深度监测。
豆包手机助手目前很大程度上依赖于 " 读屏 " 技术——也就是让 AI 盯着用户手机屏幕,观察用户在微信聊什么、支付宝余额多少,然后模拟用户点击操作。这种方式确实能实现跨 App 的功能整合,但其中蕴含的隐私风险,却让相当一部分用户心生忐忑。

有用户直接评论道:" 各种敏感信息不光手机厂商知道了、字节也知道了,比如微信的通信录,吓不吓人?"
尽管其他手机厂商,也在推动自动化的手机 Agent 技术,但这里的一个关键在于:由于小米、荣耀、vivo 的核心版图在硬件方向,不像字节那样重度依赖广告和跨平台数据变现,因此没有 " 原罪感 ",让用户觉得自己的行为数据会被用于广告推荐等。
所以当豆包说 " 我要做一个为你服务的 AI",大家第一反应不是相信,而是怀疑:" 这背后是不是又一个更高级的收割机制?"
毕竟从整个字节的商业模式来看,一个能跨 App 自动帮你订机票、买手机、订餐厅的 AI Agent,最有可能的盈利模式,就是在比价和推荐环节嵌入自己的商业利益。比如你让 AI" 找个便宜又靠谱的笔记本 "。
而在用户看来,传统硬件厂商没有这种动机,用户对它们的想象边界,就是 " 做一台好手机 ",不会觉得它要监测自己的数字生活。
在这样热议中,人们对豆包手机 AI 的评价,也呈现了两极分化的态度:一方面认为其是打破了 "APP 孤岛 " 的技术先锋、开启 AI OS 时代的革命者,另一方面则认为,豆包这是 " 以 AI 犯禁 ",表现出了对隐私的强烈担忧。
02生态孤岛:当巨头们不愿开放城门
如果说技术层面的挑战还可以通过产品迭代来解决,那么生态层面的壁垒,则是字节面临的真正难题。
微信、淘宝、美团会乖乖开放接口,让豆包 AI 随便调用吗?
答案大概率是否定的。
就在豆包发布 AI 手机后不久,网上就传出了用豆包操作微信时,微信会强制退出登录的现象。
随后,淘宝、中国农业银行、中国建设银行等 APP 陆续出台针对性风控措施,出现豆包 AI 助手无法登录、无法完成支付等情况,外界普遍认为,这是上述 APP 针对豆包 AI 助手跨应用操作的反制
尽管事后豆包发文声称,豆包手机助手是经过用户授权,才能完成操作手机的任务,支付环节、身份验证等,任务会暂停,并由用户人工接管完成相关授权,然而,豆包 " 以 AI 犯禁 " 的讨论已然开始发酵,腾讯不能忍受微信被管道化,多半会以安全为名来处理。

从技术角度深入分析豆包的这种 " 系统性 ",这个 " 系统级 "AI 的核心,其实就一个词:INJECT_EVENTS 权限。
INJECT_EVENTS 是 Android 系统里最顶级的权限之一,相当于给了 AI 一把 " 万能钥匙 "。 普通 App(比如抖音、微信)根本拿不到这个权限,因为它能模拟真实的手指点击、滑动、输入——就像有个看不见的人在替你操作手机。
这个权限有个硬规矩:必须用手机厂商的系统私钥签名才能启用。
简单说,就是中兴作为手机厂商,在系统底层给豆包开了张 " 路条 ",用自己的 " 官方印章 " 给豆包 APP 盖章认证,让它获得了超越普通 APP 的权限。
事实上,除了努比亚这种市场份额较低的厂商,有可能会与豆包进行这样深度的,让渡系统权限的合作外,大部分手机厂商都有自己 AI 战略,不太可能与豆包做出这种系统级的让步。
例如,华为在 2025 年全面升级了小艺助手,推出端侧大模型 + 云端大模型的双引擎架构。小米的小爱同学升级到了 6.0 版本,能够实现跨应用操作和自动化任务执行。
OPPO 的小布助手获得系统级权限,支持语音控制拍照等核心功能。vivo 的 Jovi 发布了智能体 2.0 版本,具备了记忆用户习惯和主动服务能力。
虽然从技术上说,荣耀的 YOYO,以及智谱推出的 AutoGLM,也做到了系统级整合,以及相应的自动化操作,例如自动点咖啡、在微信发红包等等,但其中的关键区别在于 " 厂商做 AI" vs " 互联网巨头造手机 ",故事性质完全不同。
荣耀是手机厂商,推 AI Agent,用户觉得就像特斯拉推自动驾驶——天经地义,是本职工作,但字节作为中国最成功的注意力经济公司,它的算法、推荐、广告模式,已经被无数 " 友商 " 研究、提防。
一旦字节声称 " 我要做一个为你服务的 AI",哪怕只是试水 3 万台,也被 " 友商 " 们看作对现有互联网秩序的一次试探性进攻。
这种 " 城门失火,殃及池鱼 " 的担忧,会使得字节的开放生态战略面临着巨大的阻力。
03破局机会:用户痛点与技术的东风
然而,绝境中也并非没有机会。豆包的这次尝试最大的价值在于,它敏锐地捕捉到了当前移动生态中用户最大的痛点。
现在的手机使用体验中,各种开屏、植入广告对人们造成极大干扰,点个 APP 要跳过 5 秒开屏广告,各种 APP 间的跳转,用户体验非常差。
而且某些广告、优惠的关闭图标(就是那个小 "X"),有时候真的很小,很难点,想关闭却一不小心就点开了。
正是这种 " 割裂 + 骚扰 " 的体验,构成了豆包 AI 手机最可能撬动用户需求的缝隙。
如果豆包手机 AI 真能做到自动下单、比价,使用户跳过开屏广告;自动填写砍价链接而不强迫你分享;甚至把多个平台的优惠自动聚合——那它就是在减掉噪音、减掉数字生活里的琐碎摩擦。
这种 " 省心又省眼 " 的体验,恰恰是当前安卓 /iOS 生态最缺的,就连 Siri 也做不到。
在我看来,ANP(Agent Network Protocol)协议可能是字节跳出当前生态困局的关键破局点。
2024 年,ANP 协议开源技术社区提出了这个概念,目标是为数十亿智能体建立统一的连接方式。ANP 的愿景是构建一个开放、安全、高效的智能体网络,允许任意两个智能体进行无缝通信和协作。

ANP 协议的技术原理,类似于互联网的 HTTP 协议,它定义了智能体之间的通信标准和数据格式。
举例来说,如果每个 AI 应用都有一个独特的 " 智能体 ID",那么当豆包手机助手想要调用微信功能时,不需要直接读取微信的界面,而是向微信的智能体发送标准化请求指令,避免了隐私窥探,让不同智能体之间实现 " 标准化合作 "。
这样一来,即使腾讯、阿里以及其他大厂,都在自己的生态内建立了专属的 Agent,大家也不会再次陷入 "APP 孤岛 " 的状态,而是可以通过标准的 ANP 协议互相调用对方的功能。
如果 ANP 协议真的能够成为行业通用标准,那么所有 App 按规矩开放接口,字节这步棋就真的活了。
但现阶段,豆包还是别太急,与其单兵冒进,不如全行业坐下来,好好研究确立标准,达成互联互通的协议。
在这场 "AI 原生系统 " 竞赛的开始,在技术快速迭代的同时,豆包仍更需要仔细打磨和做好隐私保护。在技术、用户体验和生态之间找到平衡点,同时思考怎样在巨头们的严密防守中撬开一道裂缝,才不至于会 " 犯众怒 "。
毕竟,技术是冰冷的,但社会是有血有肉的。当代码撞上人心、算法碰上信任,摩擦在所难免——而真正的创新,不在于跑得多快,而在于能否在摩擦中走出一条被接纳的路。


登录后才可以发布评论哦
打开小程序可以发布评论哦