钛媒体 昨天
智谱AutoGLM与豆包手机的分歧,是AI时代的安卓苹果之战?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

12 月 10 日深夜,智谱开源了其核心 AI Agent 模型 AutoGLM,引发 AI 圈关注。

距离 AutoGLM 第一次出现在公众视野里,已经过去了 111 天。AutoGLM 是智谱 AI 开发的跨端通用智能体,通过自然语言指令自主完成手机、电脑等设备的复杂操作,实现 " 一句话搞定任务 " 的人机交互体验。

作为全球一个具备 "Phone Use" 能力的 AI Agent,AutoGLM 核心功能围绕 " 自主执行 " 展开。它能模拟真人点击、滑动、输入等动作,稳定处理外卖点单、机票预订、朋友圈互动等数十步流程,覆盖 50 多个高频中文应用的核心场景,同时支持跨端协同(手机 + 电脑),例如,手机发指令让电脑自动生成 PPT、整理数据,任务在云端运行,不占用本地设备资源。

2025 年 8 月,AutoGLM 2.0 面向公众开放,强调 " 执行型助手 " 定位,不再局限于对话或信息查询,而是 " 动手 " 完成任务,比如,办公场景中从检索资料到生成视频、PPT 的全流程执行,生活场景中跨应用预订服务等。

但是,由于三方功能的实际体验不够顺畅,在实际体验过程中,授权动作繁琐,语义理解易错等方面问题,让 AutoGLM 的首次亮相并未在 C 端引发现象级传播。

但其构建的新技术范式仍引发了行业震动。

智谱官方表示,这一次 AutoGLM 选择开源,主要基于三方面原因:

一是避免 AI 手机能力被少数厂商垄断,通过开放技术底座推动行业共建;

二是保护用户隐私,让数据与控制权完全归属使用方,支持私有化部署;

三是共享 32 个月的技术积累,降低 Agent 开发门槛。本次开源内容包含训练好的核心模型、Phone Use 能力框架、50+ 高频 App 的 Demo 及文档,均以 MIT 和 Apache-2.0 许可证开放。 

据智谱官方,AutoGLM 开源的首要意义是对抗技术垄断,将 "AI 使用手机 " 这一核心能力基础设施化和民主化。

文档指出,如果 " 会用手机的 AI 能力 " 只掌握在极少数厂商手中,用户的手机将越来越像 " 别人家的入口 ",开发者的创新也会受制于人。通过开源,AutoGLM 将这项能力变为行业可以共同拥有和打磨的公共底座。

开源使得任何开发者或团队都能像使用 " 积木 " 一样,将 AutoGLM 集成到自己的系统中,或进行拆解、重写和改造。这降低了 Agent 开发的门槛,可以催生出多样化的 AI 原生应用、硬件和解决方案,加速 Agent 生态的繁荣。

同时,基于 Phone Use 能力涉及的支付、社交、企业系统等敏感领域的问题,AutoGLM 团队强调,将控制权交还给用户,以此解决信任核心问题。团队明确表示," 不希望也不应该把这些东西握在自己手里 "。

有行业人士对作者表示:"AutoGLM 开源的意义远超一个普通的代码开放项目。它是一次战略性的生态卡位和规则定义,其目标是成为未来 AI Agent,尤其是终端通用 Agent 的基础,就像 Android 之于移动应用生态。"  

结合最近 " 豆包 AI 手机 " 的热潮来看,智谱 AutoGLM 这次开源,也意味着各家公司在智能手机终端的通用 Agent 之争,正走上完全不同的道路。

而这两条路径,正好与多年之前的安卓与苹果之争十分类似。

从策略目标层面来看,AutoGLM 的策略,是成为 AI 时代的基础设施和公共底座,是一套类似于安卓的软件开发环境。而豆包手机助手的策略,是直接抢占硬件入口,通过 "AI 附体手机 " 的方式,抢占用户与数字世界交互的终端。

从 AI 能力部署层面来看,AutoGLM 采用 " 云端智能体 " 范式,为 AI 配备专属的云手机、云电脑,任务在云端虚拟设备中执行,不占用、不干扰用户本地设备;豆包手机直接采用 " 终端具身智能 " 范式,让 AI 直接在用户真实的物理手机上进行 " 模拟点击 " 操作,并将 AI 能力深度集成到手机硬件和系统层,实现多任务并行。

智谱 AutoGLM 的开放模式将训练模型、能力框架等开源,将操作执行能力封装为 API,供开发者融入各类硬件;而豆包与手机厂商(中兴努比亚)合作,推出专属硬件,抢占用户终端,其 " 模拟点击、调度一切 " 的模式,直接挑战了微信、淘宝等超级应用的生态壁垒和用户入口,因此,引发了平台的 " 封禁 "。

智谱 AutoGLM 与豆包手机助手的路线分歧,某种程度上像是传统意义上软件与硬件谁来定义谁的问题,后续必定还有更多的玩家进入这场角力,而智谱 AutoGLM 这次开源,更像是通用 AI Agent 话语权之争的大幕拉开的一个重要信号。(作者|陶天宇,编辑|李程程)

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 开源 朋友圈 基础设施 mit
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论