扣子3.0——Agent单打独斗的时代结束了

一

前阵子我下单买了个绿联的 USB 摄像头，一百多块。

干啥用？

我想给自己写一个缓解颈椎疲劳的桌面端小应用。

逻辑特别简单：摄像头识别我坐在电脑显示器前的时长（比如 45 分钟），到点了就弹窗。

我这种在家办公一天对着屏幕接近 8 个小时的人，颈椎确实不舒服。

市面上的久坐提醒 App 我试了个遍，这类 App 主要靠纯定时器，但我离开座位的时间它也会算进去。

摄像头方案的好处在于，它知道我神马时候真正做在电脑前。

这活儿我是这么 Vibe Coding 的——

Claude Code 负责架构和写代码，我用得最顺手，它架构的拿捏很牛，代码质量高，而且我冲了 Max 会员；

CodeX 负责生图，毕竟它生图是独一档的，应用里那些图标、提示插画归它。

听上去很美好对吧？

两个顶级 Agent 各管一摊，强强联合。

然后我就掉坑里了。

真实的操作画面是这样的：我开一个终端跑 Claude Code，再开一个窗口跑 CodeX，我在中间传话。

CC 写完一个组件要用到一张图标，我得把需求复制到 CodeX 那边；CodeX 生成完图，我再把文件路径、尺寸、命名规则复制回 CC。

我不知道有木有更简便的方法。

总之一个下午下来，代码没写几行，我倒先被熬成了两个 AI 之间的传话筒。

上下文反复断裂，同一段背景信息我喂了不下五遍。

最后，我还是放弃了它们合作，选择了直接用 CC 搞了一个不用图的极简版——

加州大学欧文分校的 Gloria Mark 教授有个被引到烂的研究：知识工作者每被打断一次，平均要花 23 分 15 秒才能重新进入深度专注状态。

没错，CC 和 CodeX 都很强，强到离谱，就是有点费我。

带着这个怨气，我体验了几天扣子 3.0。

二

我先用一个我自己跑通的真实 Case，让你直观感受一下扣子 3.0 如何解决上边的问题。

作为一个野生科技作者，我日常有个刚需：从 arXiv 上扒论文拉选题。

arXiv 光是 cs.AI 这一个分类，2025 年全年就挂了超过 45000 篇论文，平均每天一百多篇。

再叠上 cs.CL（自然语言）、cs.CV（计算机视觉）这些 AI 强相关分类，arXiv 一个月的新投稿量在 2024 年 10 月就突破了 2.4 万篇的历史纪录。

每天好几百篇新论文，里头绝大多数是纯理论的，离大众比较远。

我要的，是从这几百篇里捞出那种顶尖机构出品，但主题又有大众趣味的论文——能写成爆款选题的那种。

这活，手动几乎没法干。

于是我在扣子 3.0 里拉了个项目群，塞进去三个 Agent，写明白它们（or 他们？）的分工：

扣子（主 Agent），总览全局，协调进度；

科研助理小红（我新创建支持多个科研 skills 的 Agent，后边会细说），负责筛论文；

设计搭子大白，负责把筛出来的论文用 10 页极简 PPT 解读出来，方便我快速 get 逻辑。

我把需求往群里一甩，剩下的就交给它们仨了。

我原以为，所谓多 Agent 协作，无非是主 Agent 把任务切成三块分别派下去，然后各干各的。

结果这三个 Agent 合作的过程比我想象的要细致——

第一个细节：科研助理小红动手前就发现了一个坑—— arXiv 官方 API 只返回作者名字，不返回作者单位。

可我的筛选第一关就卡在机构过滤（至少一位作者来自 QS 前 50 高校，或 OpenAI、Anthropic、DeepMind、DeepSeek 这类前沿机构），没有单位信息这关根本过不去。

小红没硬刚，转头接了 OpenAlex 的 API，那边自带作者单位。她在群里自己说了句，这比纯 arXiv 匹配靠谱得多。

第二个细节：设计搭子大白（管 PPT 的那个）在干自己活儿的间隙，顺手瞄了一眼小红的产出，发现俩人撞车了——

简报路径，小红用的是 " 每日简报 "，大白用的是 " 简报 "；评分体系，小红用 1-3 分的四维度（大众可理解性、生活关联度、话题热度、叙事潜力），大白用的是 1-5 分。

大白的处理方式是：路径和评分，采用小红那套更简洁的。

可以可以。

这俩 Agent 在我完全没插手的情况下，自己就把分工边界、文件命名规范、定时任务冲突全给捋顺了。

支撑这套协作的，是扣子 3.0 的底层设计：每个 Agent 在项目里都有自己独立的 session 在并行推进，彼此之间既能通过项目群聊互相喊话，也能读到对方在项目空间里建的文件。

所以小红一改机构清单，大白那边就看得见。它们围绕同一个目标、共享同一份上下文，这才有了那种凑一块儿开了个会的体感。

最后的产出是这样的：从 OpenAlex 检索到 77 篇目标机构的 arXiv AI 论文，经日期过滤剩 22 篇，趣味性评分后 18 篇合格。

最终推荐 5 篇三星选题——比如 Google 那篇给 AI Agent 装软件工程安全带的。

每一篇，大白都配了 10 页极简 PPT。

整套流程还挂了个每天早 9 点自动跑的定时任务，第二天起就能无人值守。

当然，过程里也有没辣么完美的地方：

大白生成的 PPT 文件 6 到 19MB 不等，太大了，一时半会儿写不进项目空间，暂时还堆在 Agent 的工作目录里。

回过头看整个过程，最戳中我的并非它能筛论文这件事，能筛论文的工具 GitHub 上 daily-arXiv 那种开源项目一抓一大把。

真正满意的是我像是真的招了一个三人小团队：

给他们交代了个活儿，然后他们自己开了个短会，把分工和规范说清楚，再回来跟我汇报结果。

我变成了一个甩需求的老板。

三

聊到这儿，可以下扣子 3.0 的核心判断了。

一句话概括它这次想干的事：做一个 Agent 协作平台。

那么问题来了——为什么说做 Agent 协作平台很重要？

其实 Agent 协作这个方向，2025 年整个行业都在往里冲，但冲法很不一样。

学术和开发者圈子里，多智能体（Multi-Agent）框架已经是显学了。

Anthropic 公布过一组数据：

他们那个 Research 功能，用一个 Claude Opus 当主管、几个 Claude Sonnet 当子 Agent 并行干活，在内部评测里比单个 Claude Opus 单打独斗的成绩高出了 90.2%。

同一个模型家族，同样的底层智商，组成团队之后效果近乎翻倍。

不过，Anthropic 的子 Agent 是各开各的独立上下文窗口，主打并行探索；

扣子的群聊却是所有成员共享同一个上下文，更适合那种需要随时看见彼此在忙啥的协作。

两条路线，是两种不同形态。

扣子的创新之处在于：它把这套多 Agent 协作，包装成了一个所有人都会用的交互。

你不需要懂什么 Multi-Agent 的概念，你只需要会发群消息：@一下某个 Agent，它就接活儿；再 @另一个，接力。

这个动作，大家一说就会。

这背后是扣子的进化：

扣子 2024 年 2 月上线时，是个 AI Bot 开发平台，本质是帮你搭工作流；2025 年 4 月，扣子空间开启内测，升级成能协同办公的通用 Agent 平台；

到这次 3.0，它正式推出多个 Agent 像一个团队一样协作的全新交互。

三级跳，跳得挺清楚。

四

光说判断太虚，我用三个具体的点，说说扣子 3.0 这个协作平台到底强在哪，以及哪些地方还得继续观望。

其一，扣子的Agent 协作，是一种新的交互范式。

前面论文筛选那个 case 已经演示过了，这里我再补一个场景。

我随手创建了一个调研分析、设计 Agent 的群，丢下这个需求——

" 我要给 MacBook Neo 做一个促销，主打学生群体，产品地址是这个：https://www.apple.com.cn/macbook-neo/；

@扣子负责总体把握，@调研分析师小黑负责竞品分析和促销策略，@设计搭子大白出文案和视觉物料。"

几个 Agent 立马就忙活起来，半个小时之后，一份带视觉输出的促销方案就出来了——

在群里沟通这个形态的精髓在于：上下文是共享的，这跟我开头那个两个 Agent 全靠我 Ctrl+V 传话，区别极大。

扣子把协作外化成了一个微信群一样的界面，调度权交还给了你这个群主。该谁说话，你 @一下就行。

这里还有个隐藏福利：人也能进群。

论文那个 case 里我就发现，如果项目还有其他人想看进展，直接把他拉进群，他能自己 @Agent 追问细节，不用我中转传话。

多人加多 Agent，这个组合的想象空间很大。

其二，开放接入 Claude Code、CodeX、OpenClaw，不搞封闭。

这一点我要重点夸，因为它正好戳中了我开头那个痛点的命门。

回到我那个颈椎 App。

在扣子 3.0 里，我可以把本地正跑着的 Claude Code，点一下连接外部 Agent，3 分钟就接进扣子的 Agent 列表；CodeX、OpenClaw 同理。

接进来之后，它们就成了同一个项目群里的成员。

我 @Claude Code 按需求写架构和开发，@CodeX 生图，不同 Agent 在同一个上下文里接力，全程不用切窗口。

在 Agent 生态还远没收敛的今天，谁开放，谁就更容易成为那个被所有人接进去的更好用的工作台。

其三，多端同步，把 Agent 从工位上解放出来。

扣子 3.0 这次桌面端全新上线，App 端、网页端多端协同，还能同步链接飞书、微信。

这个点的价值，得用场景说。

我闺女念小学三年级，写作文很让人头疼，我给扣子 3.0 下了一个任务——做一个类似多邻国的教小朋友写作文的网页工具。

但那天我正好要去一趟医院，我其实就可以在手机上继续和这个任务交互，根本不用带着电脑。

再比如你出门赶高铁，有个文件落在家里的电脑上，路上突然要用。

过去这就是死局，现在桌面端授权之后，你在手机上就能遥控家里那台电脑处理那个文件，Agent 帮你操作，整个过程你人可以在高铁上。

多端同步要解的，就是让 Agent 跟着你的注意力走，而不是反过来让你被设备拴住。

五

讲完三大优势，补一个我觉得很有意思的点——扣子 3.0 的行业技能包：skills。

我前面提到的 " 科研助理小红 " 和 " 设计搭子大白 "，并不是我从零捏出来的，是我从扣子的职业模板里直接创建的。

扣子 3.0 预置了一大堆行业模板：投资理财顾问、调研分析师、科研助理等等。

每个模板背后挂着一组对应的技能包。

比如自媒体运营达人挂的是 " 公众号标题生成 "、" 全网热搜榜 "、" 多平台违禁词查询 "、" 小红书冷门爆款探测器 "、" 小红书每日风向标 " 等十几个技能；

投资理财顾问挂的是 " 科技股分析 "、" 投资机构观点 "、" 板块热点分析 " 等这些 skills。

这些 skills 是被打包好的、有数据支撑、有 Workflow 设计的专业工具。

我做 arXiv 论文筛选这个 case 的时候，挑的就是 " 科研助理 " 职业模板。

小红一上来就主动加载了 arXiv 搜索、OpenAlex 学术数据库、bioRxiv 论文搜索、Crossref REST 文献引用溯源、Semantic Scholar 语义论文搜索、OpenCitations 开放引文库这些科研专用 skills。

她不需要我教她怎么查论文，她已经是一个专业的科研助理了。

在扣子的技能商店，你可以按行业标签搜技能、试用、加载，也可以自己上传自定义技能。

很显然，有了这些 skills，就让扣子 Agent 变成了垂直行业专家。

那么问题来了——这玩意儿到底谁最该试一试？

在我看来，自媒体人、电商运营、开发者、学术党等知识工作者都可以用起来。

他们有个共同点：手上的活，都是判断复杂、流程繁琐、需要多个角色接力。

有一个分工明确的团队干，就轻松多了。

六

最后，聊一点 AI 产品形态的演进。

我个人的观察是，AI 产品走到今天，经历了三次跃迁——

第一次，Chatbot。这一代的关键词是对话。

第二次，Agent。它开始会调用工具、会规划、会自主推进任务。这一代关键词是执行。

第三次，就是当下—— Agent 团队。复杂任务多个专长不同的 Agent 接力。关键词是协作。

扣子 3.0 这次，把宝押在了第三次跃迁上。

回到标题—— Agent 单打独斗的时代，确实要结束了。

往后看，模型能力会继续涨，单个 Agent 还会更强。但决定一个 AI 产品好不好用的那把尺子，可能慢慢要换了。

往后比的，是一群 Agent，能不能像一个靠谱的团队一样，把活儿顺畅地干完。

—— End ——

作者简介：卫夕，公众号 " 卫夕指北 " 出品人，科技专栏作者，专写长文，专写不一样的，专注剖析 AI、广告及互联网的底层逻辑；不关注这个账号，你都不知道你会错过神马！

宙世代

一起剪