雷科技 4小时前
办公场景进入Agent时代!打工人的「工作文件夹」,终于要被AI接管了?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

过去半年,Claude Code 可以称得上异军突起,Claude 模型本身就很突出的代码能力,加上智能体设计思路的特点,已经让它成了开发者群体里评价极高的一款 AI 工具,关键是真的能把复杂的代码任务拆解、执行,并持续推进。

而就在北京时间的今天(1 月 13 日),Anthropic 推出了 Claude Cowork,直接称其为:「用于其他工作的 Claude Code。」

图片来源:Anthropic

Anthropic 并不打算把 Cowork 包装成一个全新的「桌面 AI 助手」,而是试图把 Claude Code 已经被验证过的那套智能体 AI 能力(基于 Claude Agent SDK 构建),迁移到更广泛的 PC 工作场景中:文件整理、资料处理、内容生成、项目维护等。这些场景说起来可能并不性感,却构成了绝大多数知识工作的日常。

从行业角度来看,这也是一个明显的分水岭。过去一年,PC 智能体的讨论始终围绕着「能力上限」展开:一种是侧重云端,在相对简单的云端环境充分发挥智能体 AI 的能力,一种则是基于现实的 PC 操作系统环境,充分模拟人类来使用电脑进行一步一步的操作。

隐私、效率、体验 …… 坦白讲,这两种路线或多或少都存在明显的问题,今天普通消费者更多还是在 AI 对话、Ctrl+C、Ctrl+V 中进行所谓的「AI 办公」。

Claude Cowork 的选择则是不追求系统级接管,而是在指定文件夹中,以日常办公最核心的文件「代理一切」,包括创建、读取、编辑修改文件、批量更改文件名、整理文件等等。除此之外,Claude Cowork 更多就是「用于其他工作的 Claude Code」。

看起来,这并不像一次野心勃勃的「革命」,但或许这才是 AI 彻底改变打工人办公体验的开始。

理解 Claude Cowork,最简单的方式不是看功能说明,而是看它在真实文件里是怎么被用起来的。

在 Simon Willison 的博客中,他分享了一个非常有代表性的例子:把本地存放文章的文件夹交给 Claude Cowork,让它梳理过去几个月未发布的文章草稿,再推荐下最接近发布状态的稿子。

图片来源:Simon Willison's Weblog

这个任务真正麻烦的地方在于,光靠文件名和修改时间并不能给出准确答案。Claude Cowork 的做法是,主动搜索他的网站,逐篇核对文章是否已经上线,再回到本地文件夹中给出最终判断。最后交付的,并不是一段解释过程的文字,而是一份基于真实文件状态整理好的结果。

这个例子之所以重要,是因为它非常清楚地展示了 Claude Cowork 的工作方式:它的处理方式不只是联网搜资料,更重要的是,它能从处理办公最核心的「媒介」——本地文件,可以是 .md、.txt、.docx、.html、.pdf 等各种文件。

某种程度上,这些本地文件也是 AI 最好的上下文。尤其作为媒体编辑,大量稿件、资料都是以文件形式保存在本地,利用 Claude Cowork 完全可以盘活这些「故纸堆」。类似的,各个行业打工人在日常办公中也往往以「文件」作为核心结果,不管是项目总结还是后续的工作,都是 AI 最好的「参考资料」。

本地和云端也不是非此即彼,Claude Cowork 保留了「连接器」功能,可以直接连接 Google Drive、Notion 等平台和服务,将分散在不同平台的内容和本地文件作为 AI 随时可调用的「关键上下文」。

当然不只是读取,更重要的是,Claude Cowork 能够直接创建和修改文件,比如通过云端会议平台(连接器)或本地会议纪要让 AI 总结本周会议并找出待办事项,甚至基于此询问如何提升工作效率。文件的修改也不需要人工进行手动操作,而是 AI 基于本地或云端文件(如 Google Drive)进行编辑。

这恰恰是 Claude Cowork 与我们熟悉的 AI 办公体验之间最本质的区别。过去一段时间里,大多数所谓的 AI 办公,仍然停留在对话层:你把文件上传给 AI,告诉它你想做什么,它给你一段结果,然后你再把这段结果搬回自己的工作目录,继续整理、修改、保存。AI 负责「想」,人负责「落地」。

有意思的是,Claude Cowork 也支持平时不太起眼但很重要的「文件管理」。官方演示中就展示了一个例子,比如将「桌面」设为指定文件夹后,直接可以让 AI 梳理桌面凌乱的文件。

值得一说的是,Claude Cowork 并非基于 GUI 图形用户界面继续一步步的操作,本质上还会借助操作系统的软件接口进行基础操作,还做了沙盒化的处理,一方面避免了 GUI 方式的隐私泄露、攻击等问题,另一方面也避免了全局操作占用用户界面的问题。

说实话,很多开发者对此并不陌生。去年发布的 Claude Code 之所以在开发者群体中引发强烈反响,并不只是因为 Claude 模型在代码能力上公认更强,也是它让 AI 围绕一个真实的工程目录持续工作:理解目标、拆解步骤、修改代码、反复推进。

Claude Cowork 所做的,是把这套已经在代码世界里被验证过的执行范式,迁移到更广泛的 PC 工作场景中。区别只在于对象发生了变化。Claude Code 面对的是代码仓库,而 Claude Cowork 面对的,则是文档、表格、素材和项目文件夹。但两者共享的,是同一种 Agentic AI 的核心逻辑:

围绕一个受控的工作空间,把「目标」转化为一系列可以被执行、也可以被检查的结果。

放到真实办公环境中,Claude Cowork 的价值也变得更加具体,核心是压缩大量长期存在、却很少被认真对待的中间成本:项目资料在数周甚至数月后的回顾与整理,零散素材向可用文稿的转化过程,图片、截图、票据向结构化文档的整理,以及一个长期项目在不同阶段反复积累的维护工作。

这些任务并不复杂,却持续消耗注意力,也极难通过传统的自动化流程彻底解决。Claude Cowork 的意义正在于,让 AI 可以安全地接手这些高频、低风险、但极其耗时的工作。

不过目前体验 Claude Cowork 的门槛还是太高了,仅限订阅 Claude Max(100 美元起 / 月)的 macOS 用户,Windows 端正在开发,但并未透露未来会否下放到 Claude Pro(17 美元 / 月)。

从经验来看,大概率是会的。而且比起 Claude Cowork 本身就是受 Claude Code 程序员用户各种五花八门的用例启发打造出来的,面向更多元的大众用户。唯一的问题是,Cowork 不是唯一在桌面端尝试的通用智能体 AI。

以 OpenAI 的 ChatGPT agent 为代表,部分厂商选择把执行过程几乎完全放在云端。用户输入任务后,可以合上电脑去做别的事,回来拿到一份已经跑完的结果。它解决的是「时间占用」问题,但代价也很明确:执行发生在云端,与本地文件和权限始终隔着一层。

ChatGPT agent 主打云端路线,图片来源:OpenAI

另一方面,以 Gemini Computer Use 为代表,更强调通过图形用户界面进行操作,在可控环境中模拟「像人一样使用电脑」。这种方式直观、通用,但复杂度与风险也随之上升,一旦进入更开放的桌面环境,稳定性和安全成本都会被迅速放大。

在国内,AI 办公走的则是完全不同的方向。无论是阿里的钉钉,还是字节的飞书,智能体都没有试图接管 PC,而是直接嵌入企业协同平台。对普通员工来说,AI 出现的方式更具体:会议纪要、待办事项、文档生成、流程自动流转。执行权被严格限制在平台内部,换来的是权限清晰、风险可控,以及真正能落地的效率提升。

如果再把豆包手机助手的后台运行模式放进来对比,会更有意思。豆包证明了一件事:用户确实愿意把任务交出去,让 AI 在前台和后台持续跑。但它同样提前暴露了另一面——当智能体 AI 开始接管系统层,风控、隐私和越权问题都会迅速浮出水面。

对照之下,Claude Cowork 没有走云端全托管,也没有走本地全局代理,而是把执行权严格限定在「你授权的文件夹」之内,再通过云端模型和连接器补齐能力。这种方式不追求极限效率,却最大程度降低了心理负担和使用风险。

相比更激进的方案,Claude Cowork 提供了一种更容易被接受的中间形态,但已经足够改变日常的办公体验。这或许不是 PC 智能体的终点,却很可能是它真正走向大众之前的开始。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论