Codex和Claude Code负责人都不写提示词了，AI圈爆火的Loop到底是什么

要不说 AI 圈都是造词大师呢，回看过去这一年，都已经造出了多少个新词了。

提示词工程火了，火完之后 Harness 工程，现在又轮到了循环工程。以前是把提示词写好最重要，模型的能力体现在我们喂给它什么样的提示词。后面是 Harness 重要，要想模型产出稳定的结果，给它套一个马鞍，让它在框架内运作很重要。

再到现在，Loop Engineering，循环工程，写提示词、写 Harness 都比不过写好一个循环。

龙虾之父在 X 发文，不要在 Coding Agent 类产品里面写提示词了，我们应该设计一些循环来使用这些 Agent。Codex 负责人 Tibo 也很快转发了这则推文，问网友是否已经开始写嵌套循环了。

Codex 的对家，Claude Code 产品负责人 Boris Cherny 也在接受播客采访时提到，「不跟 Agent 对话，跟 loop 对话，让 loop 替我来 prompt」。

Claude Code 的负责人 Boris Cherny，和产品负责人 Cat Wu 在 Claude 官方回顾 Claude Code 第一年的节目上，聊天过程中两人都表示很喜欢 loop，认为 Loop 是下一个 Leap（飞跃）

和 loop 对话？所以 loop 到底是什么。仿佛还没有看到所谓的 Loop Engineering 到底给一个项目带来了什么改变。例如用控制变量法，一个采用循环工程，一个不使用，两者最后的产出会有什么区别吗？

这些术语就莫名其妙地出现在了社交媒体上，有人说不用管「loop 工程」是什么，它本质就是一种炒作和营销的手段。

一个正在使用 Agent 的用户，自然而然就实现了所谓的 loop 工程，而不是专门有一套流程，符合那套标准，需要被单拎出来，才可以被叫做是 Loop Engineering。

所以是新瓶装旧酒，一套过去的思维方法论，重新套上了新名词吗？

人从写提示词，变成写循环

如果只看技术实现，Loop Engineering 其实没有发明什么全新的东西。Harness、Skill、Agent Workflow 这些系统，过去几年都在尝试让 Agent 自己规划、执行、反思和继续执行。

但今天大家重新开始讨论 Loop，是因为模型终于开始能把循环跑下去了。当 Agent 能连续工作几十分钟、几个小时，甚至跨天完成任务时，人和 AI 协作的单位，也开始从一次对话变成一个完整回路。

什么是 Loop Engineering，这个词听起来很新，讲的事其实很日常：你让 AI 写代码，它写完后你跑测试；测试报错，你把错误贴回去；它再改；你再跑。来回几次，直到代码能用。

这就是一个最原始的 loop：行动、观察、修正、再行动。

区别在于，过去每一轮都靠人手动推动。人要复制报错、追问原因、提醒它别改错文件、判断什么时候该停。Loop Engineering 做的事，是把这些反复发生的动作写成规则，交给系统去执行。

一个完整的 loop，至少要回答五个问题：AI 什么时候开始干活？它能调用哪些工具？它怎么知道自己做错了？它把每一轮结果记在哪里？它什么时候必须停下来交给人？

所以 Loop Engineering 更接近一套工作制度：给 AI 设任务、设工具、设反馈、设记忆、设刹车；prompt 只是这套系统里最小的零件。

放到代码项目里，它可能是这样：每天早上，系统自动检查昨晚失败的代码提交。

AI 读日志，判断是测试波动、依赖问题，还是最近提交引入的 bug。能复现的，它在单独的 worktree 里尝试修复，跑测试，通过后开一个草稿 PR。原因不清楚的，它把现场、尝试过的方法和下一步建议写进一个文件，等人来接手。

放在我们的工作流里，它就是每天早上，AI 自动扫指定的新闻源、社交平台和公司博客。它挑出 5 个可能成稿的选题，补上来源、关键人物、争议点、可用截图和一句话判断。资料不足的地方，它标出来。到我们面前时，它已经整理成一张选题卡。

龙虾之父也在 X 分享了自己的循环工程实践，他让 Codex 维护自己的代码仓库，每 5 分钟唤醒一次并将工作分配给不同的线程。他说通过运用统筹能力，结合分类、自动审核和 Computer Use 技能，已经能让一些工作自主完成。

听起来也很像之前 Claude Code 主打的「做梦」机制，以及 Hermes Agent 的自进化功能，让 Agent 自己从过往上下文学习知识并完善所有的流程。

这也就是 Loop Engineering 的核心变化：Prompt Engineering 时代，人负责写一句好提示词。 Harness Engineering 时代，人开始给模型搭框架。到 Loop Engineering，人的工作进一步后退了一层。

一个 loop 由什么组成

一个能跑起来的 loop，通常有几样东西。

根据 Google Cloud AI 总监 Addy Osmani 在 X 发布的循环工程文章，一套完整的循环工程，同样是五个积木加一个用来记录的记事本。

五个积木分别是定时任务、worktree、Skill、连接器、子 Agent，以及一个记事本叫状态文件。

定时任务，在 Codex 里它叫 Automations，在 OpenClaw 里面叫 HEARTBEAT，在 Claude Cowork 里面是 Scheduled。通过配置定时任务，我们可以选择对应的项目，自定义一段提示词，再设置对应的运行频率。

这是自动化循环的第一步。在设置定时任务时，也像使用 Codex 里面的 Goal 模式，让 Agent 自动跑，直到完成我们设定的目标。

Worktree 存在的意义，是给每个 Agent 一个独立的工作目录，可以确保 Agent 在循环工程中只是修改各自的分支。

有了 Skill，循环每一圈都可以不用猜测我们的项目是什么。Skill 通过把项目知识写在文件里：构建步骤、团队约定、「上次就是这么出事的，所以不允许这么做了」，让 Agent 有了更充分的记忆，去处理任务。

连接器的主要目的是靠 MCP 协议跳出这个单独的文件系统，获取外界的给定数据库和其他系统信息，来完善整个循环。

子 agent 也是整个体系里最重要的结构，写代码的和审代码必须是两拨人。换一个指令不同、甚至模型都不同的 agent 来挑刺，才能审核出真正的问题。

记忆也很重要。很多 AI 工作流每天都会重复，但每天都从零开始。昨天已经确认过的事实，今天还要再查一次；上周已经否掉的标题风格，这周又被生成出来；某个来源经常不可靠，但 AI 下次仍然引用它。

除了用 Skill 的更新来规范 Agent 的行为，循环还需要一个聊天框外的记忆位置。

记事本，一个状态文件，它在单次对话之外，可以是一个文档、表格、看板，也可以是一份项目规则。里面记录已确认的信息、踩过的坑、偏好的格式、禁用的表达、上次没解决的问题。AI 每次启动时先读它，就能接着往下走。

上手 Loop Engineering

Loop Engineering 常被开发者讨论，是因为代码有天然的反馈机制：测试能不能过，程序能不能跑，错误日志在哪里。这让代码场景看起来特别适合 loop。

但就像 Coding Agent 最后变成了所有人的 Agent，loop 的适用范围也远不止编程。

内容工作里，它可以做选题筛选、资料整理、初稿生成、事实检查、标题优化和发布前检查。

客服工作里，它可以先读客户来信，判断问题类型，整理历史记录，生成回复草稿，并把敏感投诉留给人工处理。AI 不需要直接发出所有回复，它先把问题分好、材料备好，就已经省掉很多时间。

产品和运营工作里，它可以定期整理用户反馈、应用商店评论、社媒讨论和竞品更新。

研究工作里，它可以追踪一个主题下的新论文、新报告、新数据。每天或每周更新一次，把新增内容和已有判断放在一起。

这些场景共同点都是任务会反复出现，流程相对稳定，结果可以被检查，关键判断还在人的手里。

想要真正入门循环工程也不是一件容易的事情，它有个前提：token 管够。

循环会反复读上下文、反复重试、四处探索，不管最后有没有产出， Token 都在燃烧。拥有无限额度的人觉得循环是常识，就像龙虾之父、Claude Code 负责人、Google Cloud AI 总监，他们都有无上限的 Token。

但月付 20 美元的我们，循环跑了两天就达到了周限额。

还有，任务得每周都重复，如果是一次性的活，一句好提示词又快又便宜，重复太少，Agent 又无法从循环中学习到知识。

而反复的循环又得有自动验证、测试、类型检查、构建，需要确保 Agent 在没人盯着的时候可以把烂活拦下来。Agent 还得有高级工程师的素养：日志、复现环境、能跑自己写的代码。

随便缺这里哪一条，循环的成本可能就会高过回报。而 token 成本其实把这个热词拉回了现实，Loop Engineering 不会让 AI 协作变得无成本，它只是把成本从「人一轮轮盯着」的时间成本，转移到「系统一轮轮运行」Money 成本。

新的问题在于，随着模型越来越强，这笔账正在发生变化。

过去，一个任务失败了，人只能回来继续追问、补充上下文、重新解释需求。今天，很多时候 AI 已经能自己尝试、自己验证、自己修正，再把结果交回来。

如果一次循环消耗的 Token，已经接近一个人来回追问几轮的成本，那么真正值得优化的，可能就不再是某一句提示词，而是整个反馈回路。

所以 Loop Engineering 最值得讨论的地方，未必是它算不算一个新学科。

更现实的问题是，当 AI 已经能连续处理多轮任务，人还要不要继续把自己卡在每一次追问里。

有些工作，确实只需要一句好提示词。有些工作，则需要一套能反复运行、能留下记录、能及时停手的流程。

这个分界线，在当下看来，可能比「循环工程」这个名字本身重要得多。

宙世代

一起剪

相关标签