友友们,小声问一句,OpenClaw 更新还有人关注吗?
关不关注不重要了,重要的是给大家同步一下,龙虾刚刚长出手脚了!
依旧是那个龙虾之父 Peter,这次带来了全新的 Computer Use 工具 Peekaboo v3 版本——
直接把过去 Agent 类产品只能简单执行,但没法直接操控桌面的问题一把《梭哈》:

Peekaboo v3 不仅能在 MAC 电脑上实现像素级截图,还能读取电脑上每个 UI 的位置。
甚至嘛,它几乎还能完成人类能做的任何操作,比如点击、输入文字、按快捷键这些也能做了……
下面这位网友,直接就是让 Peekaboo v3 做了一个简单的「Computer Use」烟雾测试。
让 Hermes 操作计算器、Peekaboo 读屏幕结果、Python 独立验证答案是否正确,一气呵成成功通过。
兴致来了挡都挡不住,人家立刻立 flag:
好玩好玩,下一步我还要让 Peekaboo 自动翻找以前写过的邮件!(尝鲜 ing …

眼睛 + 手脚都齐了,现在这虾啊,是真的能在咱 Mac 上替我们打工了???
龙虾这下也长出「手」和「脚」了
事实上,Peekaboo(翻译:躲猫猫)已经不是一个新产品了。
早在 OpenClaw 大火之前,去年 11 月份左右,Peter 就动了给 Agent 装手脚的心思。
当时陆陆续续憋了 v3.0.0-beta1 到 beta4 好几个测试版,前后差不多磨了快半年的时间。
直到最近这两天,(不知道是不是感觉再不更点啥龙虾就被大家忘记了,我瞎说的) 直接开启「狂更模式」
v3.1.0、v3.1.1、v3.1.2 开始一个疯狂大更新 ......

那问题来了,这个躲猫猫,Peekaboo 到底是个啥东西呢?
一句话说就是:给你的 Mac 装一双带有眼睛和手的工具包,能让 AI agent 看到屏幕,也能操作鼠标键盘。(省流版)
大家之前如过有用过龙虾或者 Agent 产品,应该能感觉到一个 bug 点——
Agent 确实能帮我们打开网页、跑个流程,可一旦涉及到屏幕上更细的操作,比如戳那个按钮、拖那个文件、把这段字敲到那个输入框里……
它就开始《装瞎》,最后那一步还得咱自己上手操刀。
看不下去的 Peter 清楚地知道,AI 要想在 Mac 上动手,必须有一个能看屏幕、能操作鼠标键盘的工具,这恰好就是 Peekaboo。
这次给 Peekaboo v3 做的事儿,就是把这道墙凿穿:
让 Agent 真的能看,也真的能动,从指手画脚的甲方,变成真的能下场干活的乙方。(doge)

首先是「看」的能力。
Peekaboo v3 不仅能实现像窗口、全屏、菜单栏的像素级截图、还能读取 macOS 上每个 UI 元素的位置、类型、label 等,真 · 慧眼识珠屏幕了。
其实是「动」这事儿上。
像点击、输入文字、按快捷键、滚动、拖拽、切窗口、切桌面(Space)、戳 Dock、点系统弹窗……
一整套真人用 Mac 才会干的事,它现在自己就能干,真 · 能 kuku 上手干活儿了。

但是 Agent 光能看和动还不够,Peekaboo v3 真正让人觉得开大的还在「下面」——
在能力调用上,其支持自然语言 Agent 模式,所以在提示词指令上我们可以直接用大白话甩任务就行。
第二个蛮实用也非常聪明的设计,就是能把所有能力打包成MCP,喂给你常用的 AI 工具。
例如我们在 Cursor 里写代码,跑起来 UI 出 bug 了,以前得自己截屏发给 Cursor 让它看。
但现在 Cursor 自己就能截图、自己看、自己改、自己再跑一遍验证,真 · 全程不用插手。

(躲猫猫这名字还是含蓄了,感觉堪称蜘蛛网了…一招鲜吃遍天 N 个产品了也是… )
Peekaboo v3 的正确打开方式
友友们非常关心的问题来了——那这 Peekaboo v3 到底咋用捏?
好消息是,Peekaboo 为同一套能力,准备了四种不同的「打开方式」。
写代码的、用 AI 编程的、纯用 Mac 的、做 App 的,四拨人各取所需,丰俭由人啊丰俭由人~
第一种,如果屏幕前的友友想写脚本自动化干活,直接用 Homebrew 安装方法就完事儿了~
brew install steipete/tap/peekaboopeekaboo --version
第二种,如果屏幕前的友友日常在用 Claude Code、Cursor、Codex 这类 AI 编程工具。
那这个最香,因为 Peekaboo 可以直接当成 MCP server 接进去:
npx -y @steipete/peekaboo mcp
第三种,如果你就是个普通 Mac 用户,不想搞那些命令行——
去 GitHub Releases 下载 Mac 桌面版 app 就行,有可视化反馈,权限管理也是图形界面,很友好。

第四种,如果你是 Swift 开发者,想把它当库嵌到自己 App 里,直接 Swift Package 引一下就好了~
对了,对于想在 OpenClaw 实用其能力的友友来说,直接「Skill」一下子就 ok。
相当于给虾装了个操作 Mac 的插件,装好之后录屏、辅助功能这些 Mac 权限走 OpenClaw 一次性过,不用再单独给 Peekaboo 开一遍~

最后想说的是,Peter 这波这么着急地狠狠更新一波,说实话也挺能理解……
这两年像 Anthropic 的 Computer Use、OpenAI 自家的 Operator、各种 browser-use 工具全在卷「AI 操作电脑」这条路子。
开源 Agent 领域热起来了,各种 Computer Use 替代方案开始疯狂冒头了。
他必须快啊,才能避免被后来者追上,也算是给自己在 OpenAI 的 Agent 工作提供个最强本地验证平台吧?(我猜哈
(这套「内外兼修」的打法好啊,妙啊)
Peekaboo v3 的一箩筐链接发下面了,感兴趣的友友可以 try try~
参考链接:
[ 1 ] https://peekaboo.sh/
[ 2 ] https://github.com/openclaw/Peekaboo
[ 3 ] https://x.com/search?q=Peekaboo&src=typed_query
一键三连「点赞」「转发」「小心心」
欢迎在评论区留下你的想法!
— 完 —
中国 AIGC 产业峰会最新嘉宾阵容来了!
从 AI 最新架构到应用生态,从 AI 音乐、AI 漫剧、AI 浏览器再到世界模型、AI 硬件 ... 这一次,我们希望聚齐AI 赛道的实战派,百度、智谱、昆仑万维、模思智能、蚂蚁灵波都会来。了解详情
5 月 20 日,北京 · 金茂万丽酒店,@所有人,马上 AI 起来!

一键关注 点亮星标
科技前沿进展每日见


