爱范儿 6小时前
Codex和Claude Code负责人都不写提示词了,AI圈爆火的Loop到底是什么
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

要不说 AI 圈都是造词大师呢,回看过去这一年,都已经造出了多少个新词了。

提示词工程火了,火完之后 Harness 工程,现在又轮到了循环工程。以前是把提示词写好最重要,模型的能力体现在我们喂给它什么样的提示词。后面是 Harness 重要,要想模型产出稳定的结果,给它套一个马鞍,让它在框架内运作很重要。

再到现在,Loop Engineering,循环工程,写提示词、写 Harness 都比不过写好一个循环。

龙虾之父在 X 发文,不要在 Coding Agent 类产品里面写提示词了,我们应该设计一些循环来使用这些 Agent。Codex 负责人 Tibo 也很快转发了这则推文,问网友是否已经开始写嵌套循环了。

Codex 的对家,Claude Code 产品负责人 Boris Cherny 也在接受播客采访时提到,「不跟 Agent 对话,跟 loop 对话,让 loop 替我来 prompt」。

Claude Code 的负责人 Boris Cherny,和产品负责人 Cat Wu 在 Claude 官方回顾 Claude Code 第一年的节目上,聊天过程中两人都表示很喜欢 loop,认为 Loop 是下一个 Leap(飞跃)

和 loop 对话?所以 loop 到底是什么。仿佛还没有看到所谓的 Loop Engineering 到底给一个项目带来了什么改变。例如用控制变量法,一个采用循环工程,一个不使用,两者最后的产出会有什么区别吗?

这些术语就莫名其妙地出现在了社交媒体上,有人说不用管「loop 工程」是什么,它本质就是一种炒作和营销的手段。

一个正在使用 Agent 的用户,自然而然就实现了所谓的 loop 工程,而不是专门有一套流程,符合那套标准,需要被单拎出来,才可以被叫做是 Loop Engineering。

所以是新瓶装旧酒,一套过去的思维方法论,重新套上了新名词吗?

人从写提示词,变成写循环

如果只看技术实现,Loop Engineering 其实没有发明什么全新的东西。Harness、Skill、Agent Workflow 这些系统,过去几年都在尝试让 Agent 自己规划、执行、反思和继续执行。

但今天大家重新开始讨论 Loop,是因为模型终于开始能把循环跑下去了。当 Agent 能连续工作几十分钟、几个小时,甚至跨天完成任务时,人和 AI 协作的单位,也开始从一次对话变成一个完整回路。

什么是 Loop Engineering,这个词听起来很新,讲的事其实很日常:你让 AI 写代码,它写完后你跑测试;测试报错,你把错误贴回去;它再改;你再跑。来回几次,直到代码能用。

这就是一个最原始的 loop:行动、观察、修正、再行动。

区别在于,过去每一轮都靠人手动推动。人要复制报错、追问原因、提醒它别改错文件、判断什么时候该停。Loop Engineering 做的事,是把这些反复发生的动作写成规则,交给系统去执行。

一个完整的 loop,至少要回答五个问题:AI 什么时候开始干活?它能调用哪些工具?它怎么知道自己做错了?它把每一轮结果记在哪里?它什么时候必须停下来交给人?

所以 Loop Engineering 更接近一套工作制度:给 AI 设任务、设工具、设反馈、设记忆、设刹车;prompt 只是这套系统里最小的零件。

放到代码项目里,它可能是这样:每天早上,系统自动检查昨晚失败的代码提交。

AI 读日志,判断是测试波动、依赖问题,还是最近提交引入的 bug。能复现的,它在单独的 worktree 里尝试修复,跑测试,通过后开一个草稿 PR。原因不清楚的,它把现场、尝试过的方法和下一步建议写进一个文件,等人来接手。

放在我们的工作流里,它就是每天早上,AI 自动扫指定的新闻源、社交平台和公司博客。它挑出 5 个可能成稿的选题,补上来源、关键人物、争议点、可用截图和一句话判断。资料不足的地方,它标出来。到我们面前时,它已经整理成一张选题卡。

龙虾之父也在 X 分享了自己的循环工程实践,他让 Codex 维护自己的代码仓库,每 5 分钟唤醒一次并将工作分配给不同的线程。他说通过运用统筹能力,结合分类、自动审核和 Computer Use 技能,已经能让一些工作自主完成。

听起来也很像之前 Claude Code 主打的「做梦」机制,以及 Hermes Agent 的自进化功能,让 Agent 自己从过往上下文学习知识并完善所有的流程。

这也就是 Loop Engineering 的核心变化:Prompt Engineering 时代,人负责写一句好提示词。 Harness Engineering 时代,人开始给模型搭框架。 到 Loop Engineering,人的工作进一步后退了一层。

一个 loop 由什么组成

一个能跑起来的 loop,通常有几样东西。

根据 Google Cloud AI 总监 Addy Osmani 在 X 发布的循环工程文章,一套完整的循环工程,同样是五个积木加一个用来记录的记事本。

五个积木分别是定时任务、worktree、Skill、连接器、子 Agent,以及一个记事本叫状态文件。

定时任务,在 Codex 里它叫 Automations,在 OpenClaw 里面叫 HEARTBEAT,在 Claude Cowork 里面是 Scheduled。通过配置定时任务,我们可以选择对应的项目,自定义一段提示词,再设置对应的运行频率。

这是自动化循环的第一步。在设置定时任务时,也像使用 Codex 里面的 Goal 模式,让 Agent 自动跑,直到完成我们设定的目标。

Worktree 存在的意义,是给每个 Agent 一个独立的工作目录,可以确保 Agent 在循环工程中只是修改各自的分支。

有了 Skill,循环每一圈都可以不用猜测我们的项目是什么。Skill 通过把项目知识写在文件里:构建步骤、团队约定、「上次就是这么出事的,所以不允许这么做了」,让 Agent 有了更充分的记忆,去处理任务。

连接器的主要目的是靠 MCP 协议跳出这个单独的文件系统,获取外界的给定数据库和其他系统信息,来完善整个循环。

子 agent 也是整个体系里最重要的结构,写代码的和审代码必须是两拨人。换一个指令不同、甚至模型都不同的 agent 来挑刺,才能审核出真正的问题。

记忆也很重要。很多 AI 工作流每天都会重复,但每天都从零开始。昨天已经确认过的事实,今天还要再查一次;上周已经否掉的标题风格,这周又被生成出来;某个来源经常不可靠,但 AI 下次仍然引用它。

除了用 Skill 的更新来规范 Agent 的行为,循环还需要一个聊天框外的记忆位置。

记事本,一个状态文件,它在单次对话之外,可以是一个文档、表格、看板,也可以是一份项目规则。里面记录已确认的信息、踩过的坑、偏好的格式、禁用的表达、上次没解决的问题。AI 每次启动时先读它,就能接着往下走。

上手 Loop Engineering

Loop Engineering 常被开发者讨论,是因为代码有天然的反馈机制:测试能不能过,程序能不能跑,错误日志在哪里。这让代码场景看起来特别适合 loop。

但就像 Coding Agent 最后变成了所有人的 Agent,loop 的适用范围也远不止编程。

内容工作里,它可以做选题筛选、资料整理、初稿生成、事实检查、标题优化和发布前检查。

客服工作里,它可以先读客户来信,判断问题类型,整理历史记录,生成回复草稿,并把敏感投诉留给人工处理。AI 不需要直接发出所有回复,它先把问题分好、材料备好,就已经省掉很多时间。

产品和运营工作里,它可以定期整理用户反馈、应用商店评论、社媒讨论和竞品更新。

研究工作里,它可以追踪一个主题下的新论文、新报告、新数据。每天或每周更新一次,把新增内容和已有判断放在一起。

这些场景共同点都是任务会反复出现,流程相对稳定,结果可以被检查,关键判断还在人的手里。

想要真正入门循环工程也不是一件容易的事情,它有个前提:token 管够。

循环会反复读上下文、反复重试、四处探索,不管最后有没有产出, Token 都在燃烧。拥有无限额度的人觉得循环是常识,就像龙虾之父、Claude Code 负责人、Google Cloud AI 总监,他们都有无上限的 Token。

但月付 20 美元的我们,循环跑了两天就达到了周限额。

还有,任务得每周都重复,如果是一次性的活,一句好提示词又快又便宜,重复太少,Agent 又无法从循环中学习到知识。

而反复的循环又得有自动验证、测试、类型检查、构建,需要确保 Agent 在没人盯着的时候可以把烂活拦下来。Agent 还得有高级工程师的素养:日志、复现环境、能跑自己写的代码。

随便缺这里哪一条,循环的成本可能就会高过回报。而 token 成本其实把这个热词拉回了现实,Loop Engineering 不会让 AI 协作变得无成本,它只是把成本从「人一轮轮盯着」的时间成本,转移到「系统一轮轮运行」Money 成本。

新的问题在于,随着模型越来越强,这笔账正在发生变化。

过去,一个任务失败了,人只能回来继续追问、补充上下文、重新解释需求。今天,很多时候 AI 已经能自己尝试、自己验证、自己修正,再把结果交回来。

如果一次循环消耗的 Token,已经接近一个人来回追问几轮的成本,那么真正值得优化的,可能就不再是某一句提示词,而是整个反馈回路。

所以 Loop Engineering 最值得讨论的地方,未必是它算不算一个新学科。

更现实的问题是,当 AI 已经能连续处理多轮任务,人还要不要继续把自己卡在每一次追问里。

有些工作,确实只需要一句好提示词。有些工作,则需要一套能反复运行、能留下记录、能及时停手的流程。

这个分界线,在当下看来,可能比「循环工程」这个名字本身重要得多。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 龙虾
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论