卫夕指北 昨天
扣子3.0——Agent单打独斗的时代结束了
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

前阵子我下单买了个绿联的 USB 摄像头,一百多块。

干啥用?

我想给自己写一个缓解颈椎疲劳的桌面端小应用。

逻辑特别简单:摄像头识别我坐在电脑显示器前的时长(比如 45 分钟),到点了就弹窗。

我这种在家办公一天对着屏幕接近 8 个小时的人,颈椎确实不舒服。

市面上的久坐提醒 App 我试了个遍,这类 App 主要靠纯定时器,但我离开座位的时间它也会算进去。

摄像头方案的好处在于,它知道我神马时候真正做在电脑前。

这活儿我是这么 Vibe Coding 的——

Claude Code 负责架构和写代码,我用得最顺手,它架构的拿捏很牛,代码质量高,而且我冲了 Max 会员;

CodeX 负责生图,毕竟它生图是独一档的,应用里那些图标、提示插画归它。

听上去很美好对吧?

两个顶级 Agent 各管一摊,强强联合。

然后我就掉坑里了。

真实的操作画面是这样的:我开一个终端跑 Claude Code,再开一个窗口跑 CodeX,我在中间传话。

CC 写完一个组件要用到一张图标,我得把需求复制到 CodeX 那边;CodeX 生成完图,我再把文件路径、尺寸、命名规则复制回 CC。

我不知道有木有更简便的方法。

总之一个下午下来,代码没写几行,我倒先被熬成了两个 AI 之间的传话筒。

上下文反复断裂,同一段背景信息我喂了不下五遍。

最后,我还是放弃了它们合作,选择了直接用 CC 搞了一个不用图的极简版——

加州大学欧文分校的 Gloria Mark 教授有个被引到烂的研究:知识工作者每被打断一次,平均要花 23 分 15 秒才能重新进入深度专注状态。

没错,CC 和 CodeX 都很强,强到离谱,就是有点费我。

带着这个怨气,我体验了几天扣子 3.0。

我先用一个我自己跑通的真实 Case,让你直观感受一下扣子 3.0 如何解决上边的问题。

作为一个野生科技作者,我日常有个刚需:从 arXiv 上扒论文拉选题。

arXiv 光是 cs.AI 这一个分类,2025 年全年就挂了超过 45000 篇论文,平均每天一百多篇。

再叠上 cs.CL(自然语言)、cs.CV(计算机视觉)这些 AI 强相关分类,arXiv 一个月的新投稿量在 2024 年 10 月就突破了 2.4 万篇的历史纪录。

每天好几百篇新论文,里头绝大多数是纯理论的,离大众比较远。

我要的,是从这几百篇里捞出那种顶尖机构出品,但主题又有大众趣味的论文——能写成爆款选题的那种。

这活,手动几乎没法干。

于是我在扣子 3.0 里拉了个项目群,塞进去三个 Agent,写明白它们(or 他们?)的分工:

扣子(主 Agent),总览全局,协调进度;

科研助理小红(我新创建支持多个科研 skills 的 Agent,后边会细说),负责筛论文;

设计搭子大白,负责把筛出来的论文用 10 页极简 PPT 解读出来,方便我快速 get 逻辑。

我把需求往群里一甩,剩下的就交给它们仨了。

我原以为,所谓多 Agent 协作,无非是主 Agent 把任务切成三块分别派下去,然后各干各的。

结果这三个 Agent 合作的过程比我想象的要细致——

第一个细节:科研助理小红动手前就发现了一个坑—— arXiv 官方 API 只返回作者名字,不返回作者单位。

可我的筛选第一关就卡在机构过滤(至少一位作者来自 QS 前 50 高校,或 OpenAI、Anthropic、DeepMind、DeepSeek 这类前沿机构),没有单位信息这关根本过不去。

小红没硬刚,转头接了 OpenAlex 的 API,那边自带作者单位。她在群里自己说了句,这比纯 arXiv 匹配靠谱得多。

第二个细节:设计搭子大白(管 PPT 的那个)在干自己活儿的间隙,顺手瞄了一眼小红的产出,发现俩人撞车了——

简报路径,小红用的是 " 每日简报 ",大白用的是 " 简报 ";评分体系,小红用 1-3 分的四维度(大众可理解性、生活关联度、话题热度、叙事潜力),大白用的是 1-5 分。

大白的处理方式是:路径和评分,采用小红那套更简洁的。

可以可以。

这俩 Agent 在我完全没插手的情况下,自己就把分工边界、文件命名规范、定时任务冲突全给捋顺了。

支撑这套协作的,是扣子 3.0 的底层设计:每个 Agent 在项目里都有自己独立的 session 在并行推进,彼此之间既能通过项目群聊互相喊话,也能读到对方在项目空间里建的文件。

所以小红一改机构清单,大白那边就看得见。它们围绕同一个目标、共享同一份上下文,这才有了那种凑一块儿开了个会的体感。

最后的产出是这样的:从 OpenAlex 检索到 77 篇目标机构的 arXiv AI 论文,经日期过滤剩 22 篇,趣味性评分后 18 篇合格。

最终推荐 5 篇三星选题——比如 Google 那篇给 AI Agent 装软件工程安全带的。

每一篇,大白都配了 10 页极简 PPT。

整套流程还挂了个每天早 9 点自动跑的定时任务,第二天起就能无人值守。

当然,过程里也有没辣么完美的地方:

大白生成的 PPT 文件 6 到 19MB 不等,太大了,一时半会儿写不进项目空间,暂时还堆在 Agent 的工作目录里。

回过头看整个过程,最戳中我的并非它能筛论文这件事,能筛论文的工具 GitHub 上 daily-arXiv 那种开源项目一抓一大把。

真正满意的是我像是真的招了一个三人小团队:

给他们交代了个活儿,然后他们自己开了个短会,把分工和规范说清楚,再回来跟我汇报结果。

我变成了一个甩需求的老板。

聊到这儿,可以下扣子 3.0 的核心判断了。

一句话概括它这次想干的事:做一个 Agent 协作平台。

那么问题来了——为什么说做 Agent 协作平台很重要?

其实 Agent 协作这个方向,2025 年整个行业都在往里冲,但冲法很不一样。

学术和开发者圈子里,多智能体(Multi-Agent)框架已经是显学了。

Anthropic 公布过一组数据:

他们那个 Research 功能,用一个 Claude Opus 当主管、几个 Claude Sonnet 当子 Agent 并行干活,在内部评测里比单个 Claude Opus 单打独斗的成绩高出了 90.2%。

同一个模型家族,同样的底层智商,组成团队之后效果近乎翻倍。

不过,Anthropic 的子 Agent 是各开各的独立上下文窗口,主打并行探索;

扣子的群聊却是所有成员共享同一个上下文,更适合那种需要随时看见彼此在忙啥的协作。

两条路线,是两种不同形态。

扣子的创新之处在于:它把这套多 Agent 协作,包装成了一个所有人都会用的交互。

你不需要懂什么 Multi-Agent 的概念,你只需要会发群消息:@一下某个 Agent,它就接活儿;再 @另一个,接力。

这个动作,大家一说就会。

这背后是扣子的进化:

扣子 2024 年 2 月上线时,是个 AI Bot 开发平台,本质是帮你搭工作流;2025 年 4 月,扣子空间开启内测,升级成能协同办公的通用 Agent 平台;

到这次 3.0,它正式推出多个 Agent 像一个团队一样协作的全新交互。

三级跳,跳得挺清楚。

光说判断太虚,我用三个具体的点,说说扣子 3.0 这个协作平台到底强在哪,以及哪些地方还得继续观望。

其一,扣子的Agent 协作,是一种新的交互范式。

前面论文筛选那个 case 已经演示过了,这里我再补一个场景。

我随手创建了一个调研分析、设计 Agent 的群,丢下这个需求——

" 我要给 MacBook Neo 做一个促销,主打学生群体,产品地址是这个:https://www.apple.com.cn/macbook-neo/;

@扣子 负责总体把握,@调研分析师小黑 负责竞品分析和促销策略,@设计搭子大白 出文案和视觉物料。"

几个 Agent 立马就忙活起来,半个小时之后,一份带视觉输出的促销方案就出来了——

在群里沟通这个形态的精髓在于:上下文是共享的,这跟我开头那个两个 Agent 全靠我 Ctrl+V 传话,区别极大。

扣子把协作外化成了一个微信群一样的界面,调度权交还给了你这个群主。该谁说话,你 @一下就行。

这里还有个隐藏福利:人也能进群。

论文那个 case 里我就发现,如果项目还有其他人想看进展,直接把他拉进群,他能自己 @Agent 追问细节,不用我中转传话。

多人加多 Agent,这个组合的想象空间很大。

其二,开放接入 Claude Code、CodeX、OpenClaw,不搞封闭。

这一点我要重点夸,因为它正好戳中了我开头那个痛点的命门。

回到我那个颈椎 App。

在扣子 3.0 里,我可以把本地正跑着的 Claude Code,点一下连接外部 Agent,3 分钟就接进扣子的 Agent 列表;CodeX、OpenClaw 同理。

接进来之后,它们就成了同一个项目群里的成员。

我 @Claude Code 按需求写架构和开发,@CodeX 生图,不同 Agent 在同一个上下文里接力,全程不用切窗口。

在 Agent 生态还远没收敛的今天,谁开放,谁就更容易成为那个被所有人接进去的更好用的工作台。

其三,多端同步,把 Agent 从工位上解放出来。

扣子 3.0 这次桌面端全新上线,App 端、网页端多端协同,还能同步链接飞书、微信。

这个点的价值,得用场景说。

我闺女念小学三年级,写作文很让人头疼,我给扣子 3.0 下了一个任务——做一个类似多邻国的教小朋友写作文的网页工具。

但那天我正好要去一趟医院,我其实就可以在手机上继续和这个任务交互,根本不用带着电脑。

再比如你出门赶高铁,有个文件落在家里的电脑上,路上突然要用。

过去这就是死局,现在桌面端授权之后,你在手机上就能遥控家里那台电脑处理那个文件,Agent 帮你操作,整个过程你人可以在高铁上。

多端同步要解的,就是让 Agent 跟着你的注意力走,而不是反过来让你被设备拴住。

讲完三大优势,补一个我觉得很有意思的点——扣子 3.0 的行业技能包:skills。

我前面提到的 " 科研助理小红 " 和 " 设计搭子大白 ",并不是我从零捏出来的,是我从扣子的职业模板里直接创建的。

扣子 3.0 预置了一大堆行业模板:投资理财顾问、调研分析师、科研助理等等。

每个模板背后挂着一组对应的技能包。

比如自媒体运营达人挂的是 " 公众号标题生成 "、" 全网热搜榜 "、" 多平台违禁词查询 "、" 小红书冷门爆款探测器 "、" 小红书每日风向标 " 等十几个技能;

投资理财顾问挂的是 " 科技股分析 "、" 投资机构观点 "、" 板块热点分析 " 等这些 skills。

这些 skills 是被打包好的、有数据支撑、有 Workflow 设计的专业工具。

我做 arXiv 论文筛选这个 case 的时候,挑的就是 " 科研助理 " 职业模板。

小红一上来就主动加载了 arXiv 搜索、OpenAlex 学术数据库、bioRxiv 论文搜索、Crossref REST 文献引用溯源、Semantic Scholar 语义论文搜索、OpenCitations 开放引文库这些科研专用 skills。

她不需要我教她怎么查论文,她已经是一个专业的科研助理了。

在扣子的技能商店,你可以按行业标签搜技能、试用、加载,也可以自己上传自定义技能。

很显然,有了这些 skills,就让扣子 Agent 变成了垂直行业专家。

那么问题来了——这玩意儿到底谁最该试一试?

在我看来,自媒体人、电商运营、开发者、学术党等知识工作者都可以用起来。

他们有个共同点:手上的活,都是判断复杂、流程繁琐、需要多个角色接力。

有一个分工明确的团队干,就轻松多了。

最后,聊一点 AI 产品形态的演进。

我个人的观察是,AI 产品走到今天,经历了三次跃迁——

第一次,Chatbot。这一代的关键词是对话。

第二次,Agent。它开始会调用工具、会规划、会自主推进任务。这一代关键词是执行。

第三次,就是当下—— Agent 团队。复杂任务多个专长不同的 Agent 接力。关键词是协作。

扣子 3.0 这次,把宝押在了第三次跃迁上。

回到标题—— Agent 单打独斗的时代,确实要结束了。

往后看,模型能力会继续涨,单个 Agent 还会更强。但决定一个 AI 产品好不好用的那把尺子,可能慢慢要换了。

往后比的,是一群 Agent,能不能像一个靠谱的团队一样,把活儿顺畅地干完。

—— End ——

作者简介:卫夕,公众号 " 卫夕指北 " 出品人,科技专栏作者,专写长文,专写不一样的,专注剖析 AI、广告及互联网的底层逻辑;不关注这个账号,你都不知道你会错过神马!

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论