
Anthropic 最新实验显示,其旗舰模型 Claude Opus 4.7 在无人工协助的情况下,操控四足机器人(机器狗)完成复杂任务的速度,比此前实验中表现最佳的人类团队快了约 20 倍。这一结果标志着大语言模型在物理世界交互能力上的显著跃升。
从辅助到自主:效率的指数级飞跃
早在 2025 年 8 月,Anthropic 进行了名为 "Project Fetch" 的首次实验,发现借助 Claude Opus 4.1 辅助的非专家团队,其表现显著优于仅依赖个人创造力的团队。然而,当时的模型尚无法独立完成任务,甚至在初步连接机器人阶段便会受阻。
随着模型能力的快速迭代,Anthropic 近期对 Project Fetch 进行了复测。在最新的实验中,研究人员仅负责硬件连接、输入初始提示词及批准关键命令,其余步骤均由 Claude Code 中的 Opus 4.7 自主执行。结果显示,Opus 4.7 不仅完成了所有任务,且在效率上实现了质的突破:
在人类团队曾完成的所有任务中,Opus 4.7 的速度至少快了 10 倍。
若对比双方均完成的四项核心任务,Opus 4.7 的平均速度比无 AI 辅助团队快 37 倍以上,比有 AI 辅助团队快 18 倍以上。
除了速度优势,代码质量也大幅提升。Opus 4.7 生成的代码量仅为此前有 AI 辅助团队的十分之一左右,且大部分代码首次运行即有效。尽管模型偶尔会默认使用过时的算法,但其具备自我修正能力,能绕过缺陷找到有效解决方案。
瓶颈犹存:精细闭环控制仍是难点
尽管在路径规划、传感器连接和基础移动等方面表现出色,Claude 在处理需要精细感知的 " 闭环控制 " 任务时仍显吃力。例如,在将沙滩球精准推回起始点的环节中,模型难以像经过练习的人类那样,根据球的实时位置误差动态调整指令。虽然它能将球撞向目标方向,但缺乏精确的控制策略,导致最终任务失败。
Anthropic 指出,这并不意味着大语言模型已完全解决机器人学问题,尤其是底层驱动策略的开发仍需专门研究。但实验揭示了一个清晰的技术演进路径:模型最初作为人类的辅助工具,随后人类帮助模型完善流程,最终模型在特定领域实现高度自主。
迈向 " 物理代理式 AI" 早期时代
此次进展并非源于针对机器人能力的专项优化,而是大语言模型规模扩展后涌现出的通用能力。Anthropic 认为,我们正步入 " 物理代理式 AI" 的早期阶段。正如 AI 模型已能熟练使用软件编辑工具进行自主编码,未来它们也将更轻松地调用现成的物理工具。
尽管要实现具备广泛物理适应性的通用机器人愿景仍面临巨大障碍,但模型能力的迭代速度表明,软硬件结合的自动化轨迹可能比预期来得更快。对于非专家用户而言,AI 正在大幅降低操作物理机器人的门槛,使人类能更快地从繁琐的编程调试过渡到高层级的控制与决策。
【星途科讯 图文丨周鑫雨 首发于 ZAKER 科技,转载请注明出处】


