全天候科技 8小时前
腾讯云的桌面Agent出牌,是一种减法
index.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

作者 | 黄昱

互联网大厂将齐聚在又一个火热的新战场——桌面 Agent。

2 月 6 日,当 " 腾讯云代码助手 CodeBuddy" 官方账号正式宣布桌面 Agent 工具 "WorkBuddy" 启动内测时,这场备受关注的 " 桌面大考 ",又迎来了一个重量级玩家。

腾讯云 CodeBuddy 团队对华尔街见闻表示,WorkBuddy 在腾讯内部很早就推出了,旨在帮助公司内非开发者也能提高日常的效率。如今看到很多办公人群、研究人群、各行各业,对于 " 应用来解决日常任务 " 的诉求越来越强烈,所以基于 CodeBuddy 目前成熟的 AI Coding 基建,推出了轻量便捷极简的产品设计风格。

" 我们会继续深度打磨用户反馈,然后在上半年找合适的时间正式推出这个产品。"

与时下火热的 OpenClaw 能够调取系统级权限和更灵活的操作不同,WorkBuddy 的定位更多是 " 通过读取电脑上的经授权文件夹,实现多类自主操作 "。

这意味着,WorkBuddy 的场景更多是明确文件夹约束下的有限操作。

这或许也折射了腾讯在该领域的 " 减法式 " 产品思考——它假设大多数职场人不仅关心 " 能不能把事做完 ",也担心 AI 会不会捅娄子,于是选择的产品路线并不激进,而是看重稳定、可复用、可交付的执行结果。

WorkBuddy 的推出,不仅标志着腾讯正式加入桌面 Agent 工具的市场竞争,更可视为大厂试图通过 " 智能体 " 这一新变量,重新定义职场效率边界的重要信号。

腾讯入局的时机,恰好踩在了全球桌面 Agent 爆发的临界点上。

就在不久前,OpenClaw 等产品在技术社区迅速走红,用户惊叹于 AI 能够深度访问电脑系统、文件、甚至自主执行跨应用任务。

这种被称为 "24 小时待命贾维斯 " 的体验,让业界直言 " 桌面 Agent 的 ChatGPT 时刻 " 已经到来。

相比于目前市面上火爆的同类工具,WorkBuddy 没有走纯极客路线,而是定位为面向非技术背景的职场人群。

这意味着,它不再要求用户具备编程知识,只需要通过自然语言描述需求,它就能像一个 " 懂行 " 的同事一样去执行任务。这种从 " 技术工具 " 向 " 职场助手 " 的范式转移,是腾讯对桌面 Agent 大众化的一次大胆尝试。

据介绍,WorkBuddy 可以直接在本地电脑自主规划并执行多模态复杂任务。具体来看,WorkBuddy 具备两大特点:

一是深度本地操作能力:,能够 " 听懂人话 " 并 " 真能操作本地文件 "。

在获得授权后,它可以读取文件夹、批量处理文件、生成文档或 PPT 数据深度分析、行业调研、多任务 Agent 并行处理等。这意味着,它打破了传统 AI" 只能看、不能动 " 的尴尬局面,真正切入了办公的最后一公里。

二是多步骤任务的自主规划,与简单的指令响应不同,WorkBuddy 强调 " 带脑子思考 "。

此外,WorkBuddy 还内置了多种海内外的模型和主流 MCP Server 和 Skills 技能包等高阶功能,这使其在保持简单易用的同时,具备了极强的扩展性,能够应对金融、调研、创作等垂直细分场景的深度需求。

华尔街见闻获悉,WorkBuddy 由腾讯云 CodeBuddy 团队开发,此前已在腾讯内部推出并启动内测,目前已经有超过 2000 名不同岗位员工参与深度使用,并在数据处理与分析、构建本地知识库、内容文案创作、海报生成、自动化办公等场景获得广泛应用。

长期以来,尽管大模型在对话框里表现得无所不知,但当用户回到真实的办公场景,面对繁杂的本地文件、琐碎的多任务切换时,大模型往往显得 " 手脚受限 "。

如今,随着 AI 竞争进入下半场,行业竞赛的焦点正在从 " 比拼模型参数 " 转向 " 比拼落地能力 "。单纯的聊天机器人已经无法满足职场人复杂、细碎且极度依赖本地文件的需求。谁能先占据用户的电脑桌面,谁就拿到了通往下一代 "AI 操作系统 " 的门票。

OpenClaw 等工具的爆红已经证明了用户对于 " 能跑在自己电脑里、深度操作应用 " 的 Agent 有着极度饥渴的需求。

腾讯此时出手,既是为了在一众先行者的包围中抢占生态位,也是为了将其深耕多年的企业服务能力,通过 Agent 这一载体进行智能化升级。

然而,在市场情绪被再次点燃的背后,WorkBuddy 以及一众桌面 Agent 玩家也面临着挑战。

首当其冲的便是 " 越权 " 与 " 隐私 " 的博弈。桌面 Agent 的核心价值在于深度访问用户的电脑系统、文件和应用,这种深度的互动意味着用户必须让渡极高的系统权限。正如业界对 OpenClaw"24 小时待命贾维斯 " 的期待一样,越是强大的 Agent,其掌握的个人偏好和本地项目数据就越详尽。

如何在提供便利的同时,确保这些敏感数据不被滥用或在网络传输中泄露,将是 AI Agent 产品必须面对的合规 " 生死线 "。

腾讯云 CodeBuddy 团队告诉华尔街见闻,WorkBuddy 背后依靠 CodeBuddy 的安全保护机制,并通过 " 沙盒隔离 + Skill 标准化 + 危险操作拦截 " 的多层防御策略来应对桌面 Agent 的部署挑战。

其核心思路是:" 授权信任并验证 " —— 信任用户指令意图,通过用户授权验证执行安全性和危险操作黑名单兜底机制。

此外,Agent 与底座模型之间的 " 父子关系 " 也决定了其能力的上限与下限。

尽管桌面 Agent 可以通过工程手段优化执行路径,但 Agent 的基础能力依然由底层大模型施展。一旦底层模型出现 " 幻觉 " 或逻辑断裂,Agent 在自动执行任务中或许也会带来严重后果。

更值得一提的是,桌面 Agent 的兴起,本质上是在重构人与计算机的交互关系。过去以来用户是应用之间的 " 搬运工 ",在浏览器、办公套件和沟通工具间来回穿梭;而随着 WorkBuddy 这类桌面 Agent 的普及,未来的交互范式可能变为 " 以任务为中心 "。

当一个 Agent 能够跨越应用、代表用户完成批量取消邮件订阅或整理价格差异等复杂任务时,传统的应用软件可能会逐渐沦为 Agent 调用的 " 技能包 "。这意味着,未来的桌面生态竞争,可能不再是软件功能的堆砌,而是谁的接口更利于 Agent 调用,谁能提供更适配 AI 的操作环境。

从全球范围来看,桌面 Agent 的竞争才刚刚拉开大幕。不止 Manus、OpenClaw、Claude Cowork 等,还有其它不少同类产品纷纷抢滩上线。

当 AI 真正接管了我们的鼠标和键盘,那是效率的极致提升,也是对数字安全底线的全新考验。随着 " 桌面 Agent 大战 " 的硝烟四起,一场关于生产力范式的变革,已然兵临城下。

评论
大家都在看