游戏竞技 昨天
百度云手机上线Operator:让AI智能体在真实世界里爆发生产力
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

2025 百度云智大会期间,百度云手机重磅升级,推出全自研的 Operator 技术——通过自然语言指令,实现 AI 智能体在移动设备端自主完成操作任务。在现场,来自百度智能云的资深技术架构师牟彦滔,为广大 AI 开发者讲述了 Operator 的技术架构,并指导开发者们用自己的手机亲身体验了一把 "1 句指令 = 10 步操作 " 带来的效率进化。

百度云手机:移动设备的智慧效能助手

百度云手机推出的 Operator,是一款专为移动设备打造的智慧效能助手,本质上也是一款为众多 AI 智能体提供的与现实世界交互的工具平台。

Operator 一端联接 AI 大模型能力,为 AI 智能体安装上各类应用和工具,将 AI 力量传送到真实用户身边;一端赋能现实世界中的智能硬件,让手机、摄像头、智能家具、电动汽车等终端设备拥有 AI 的智慧,从而驱动轻量级 AI 模型在边端生态中释放更大的生产力。

Operator 有诸多应用,是数字与真实世界的连接器。

日常生活中,Operator 能点外卖、订机票、自动领取游戏奖励;

办公学习中,Operator 能出内容、当陪练、智能回复私信固粉;

开发者生态中,Operator 能实时处理大规模数据流、并完成不同设备、机型等复杂条件下的产品测试;

边缘侧环境中,Operator 能汇集分散信号并智慧决策,如调整信号灯、优化货架摆放、预警车间违规等等。

当前,安卓应用生态依然是数字技术最前沿最活跃的领域,而基于安卓虚拟化和 ARM 云底座之上的百度云手机 Operator,如同给这些设备全都配置了「智驾模式」—— AI 导航,自主运行,这是对 AI 生产力的极大释放。

Operator 的创新之处

云端执行:Operator 并非在本地设备运行一个庞大的模型,而是为每个指令任务在云端分配了一个安卓虚拟分身,让这个虚拟分身来完成复杂任务。这个分身可以是一台设备,也可以是一批设备,更加适合于高并发、高算力、高集成的工作环境。

全时在线:7x24 小时异步任务处理,云手机不受用户本地算力、网络或设备使用状态的限制,全天候待命,全时段接收和执行指令。即使员工下班关机,Operator 仍能继续完成诸如夜间数据备份、跨时区客户响应、业务订单刷新等任务,实现 " 人歇机不歇 " 的业务连续性。

流畅交互:Operator 通过 VLM 视觉语言模型可做到精准识别交互界面,并模拟人类的点击、输入、滑动等操作,流畅完成多步骤、跨应用的复杂业务流程。这种基于真实交互的方式,极大地降低了自动化流程的构建门槛和误操作,保证任务执行的精确率。

沙箱隔离:Operator 内的每台云端虚拟机都运行在独立的沙箱环境中,彼此隔离,单一任务出错不会影响其他任务或云端主机。同时,企业用户可对 Operator 的操作权限进行细粒度管控,确保自动化流程在安全、可控的范围内运行。

Operator 的技术实现

Operator 是基于云原生安卓虚拟化技术与大模型能力,创新构建了一套 " 环境感知 - 智慧决策 - 自动执行 " 的全自动闭环系统,为企业与开发者带来全新的智能工具选择。

其底层引擎依托于 ARM 架构的百度云手机服务,涵盖 IaaS 资源池化管理、虚拟化技术,以及 PaaS 层的调度编排、视频推流与外设虚拟化,无需适配即可兼容绝大多数移动应用。

依托 MaaS 服务,集成大模型的指令理解与决策能力,结合 MCP 开放生态、丰富的应用知识库与提示词工程,实现模型与业务数据、工具的高效互联,最终打造出能自主制定策略并高效执行的智能体。

硬件赋能:驱动 AI 智能体在边端侧生态的应用发展

百度云手机提供开箱即用的 Operator MCP Server,以及支持 Operator 运行的云手机资源管理平台。

Operator MCP Server,提供封装完整的 Operator 能力接口,用户可直接调用,支持 Agent 创建、任务和环境信息交互、分析规划、任务拆解和执行、云手机工具调用及流程控制的全链路技术解决方案。针对包括设备鉴权、GUI、设备基础操作(如滑动、点击等)、应用管理、I/O 处理(如键盘、音频、视频等)等环节,提供开源或定制化的技术服务。

云手机资源和工具链,基于云原生虚拟安卓实例,支持在多个云手机环境实现多任务同步运行,帮助 Agent 完成对移动 App 工具的调用和任务执行。弥补了当前 MCP 生态不甚完备的困境,解放 Agent 与移动端应用、边缘侧设备的结合和落地,让 AI Agent 融入更广泛的应用生态,驱动更大的价值空间。

智能流程编排:支持客户调用更多海外工具,并可视化搭建自动工作流,形成 " 需求响应 → 工具调用 → 业务执行 " 的完整闭环。未来,我们将更进一步,拓展接入可自定义的各类工作流,通过自然语言交互,即可实时完善、纠正并可视化 Agent 状态,提升工作效率,保证任务执行效果。

延伸海外:打造跨境运营自动化新引擎

百度云手机持续赋能品牌出海,在北美、东南亚等地区部署海外原生机房,为客户提供覆盖全球的网络环境支持,帮助其在 TikTok、Facebook、YouTube、WhatsApp 等主流海外社媒平台上实现本地化、稳定便捷的社媒运营与内容分发。Operator 在出海场景中也优势明显,如:

账号批量托管:同时管理和运营多个账号,自动触发 SOP 运营动作,大幅降低人工成本;

规模获客转化:模拟真实行为,进行规模化内容生产、分发、互动管理,引导流量快速私域转化;

直播运营助手:支持多平台直播、运营,无缝带班主播、活跃直播间互动气氛,自动回复常见问题、规避敏感词;

智能选品测品:及时监测货架平台动态数据,主动测试用户反馈,预测爆款趋势,精准指导选品和备货。

百度云手机旨在帮助更多企业构建安全、高效、可扩展的智慧运营矩阵,让 Operator 成为实际业务中的得力助手。

欢迎共建:探索 AI 智能体的无限可能

百度云手机已在容器虚拟化技术、ARM 架构软硬件应用、移动生态兼容等领域深耕十年,拥有行业领先的自研技术优势和企业服务经验。本次推出 Operator,不仅是云手机在 AI 浪潮中的一次升级,更是与行业共同探索 AI 智能体的无限可能。

欢迎各行各业的合作伙伴前来交流,与百度云手机一起智赢未来。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 百度云 安卓 电动汽车 界面
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论