产品实践分享： Re-Act+SOP，让Agent稳定执行 SOP流程（多轮对话形式），低成本解决复杂SOP搭建问题

TFlow AI 作为一款面向 B 端业务场景的 Agent 平台，通过结合 Re-Act 推理 + 行动机制和预设的 SOP 流程，实现了对业务流程的精确控制和执行，为企业提供了一种既灵活又具有确定性的解决方案。本文将深入探讨 TFlow AI 如何利用大型语言模型实现复杂的推理决策任务，并展示其在实际应用中的优势和挑战。

实践产品 TFlow AI 简介：是面向 B 端业务场景 Agent 平台，能按流程处理任务（SOP），围绕目标来进行离散推理。能快速搭建 Ai 客服、AI 导购等应用。

产品允许 LLM 与环境进行交互，根据环境数据的反馈不断的调整行动计划 / 策略。且整个 sop 的过程是由文本来控制，产品基本参数如下：

使用文心一言 3.5 的模型，未微调

做了逻辑处理的 Agent 框架

单条回复的消耗不到 2K token，价格不贵

欢迎体验。（注：流程只需要用文本流程，不需要 work flow）

一、为什么要做

B 端业务场景的需求：确定性

企业服务（对内、对外）通常有相对明确的 SOP 流程或者思考步骤，在业务处理或者对外交互时期望按照流程来执行任务。

对外、对内的服务，期望带来确定性的体验。

例如当用户退换货时，思考流程如下：

A 确定退货原因

b 确认订单是否真实有效

c 确定是否符合退换货政策要求

d 协助解答退货操作

在整个多轮对话沟通过程中的要求：

按照流程执行，需要流程可控，带来确定性的结果。

始终聚焦 " 退换货 " 事情上，不要去解答无关的事情

二、如何通过大模型实现昵？借用 Re-Act 为代表推理 + 行动机制

ReAct 代表一种将推理和行动与语言模型只相结合的技术，用于解决各种语言推理和决策任务。它促使语言模型生成语言推理轨迹和行动，并支持与外部环境的交互。

Re-act 的官方案例示例：

流程说明如下：

目的：找出 Apple Remote 最初设计用来交互的程序，即 Front Row 媒体中心程序

思考 1：我需要搜索 "Apple Remote" 并找到它最初设计用来交互的程序。

行动 1：搜索 [ Apple Remote ]

观察 1： "Apple Remote" 是苹果公司于 2005 年 10 月推出的一款遥控器……用于控制 Front Row 媒体中心程序。

思考 2： Apple Remote 最初设计用于控制 Front Row 媒体中心程序。我需要搜索 Front Row 并找到还有哪些设备可以控制它。

行动 2：搜索 [ Front Row ]

观察 2：没有找到 [ Front Row ] 。相似结果包括："FrontSeat to Earth"、"Front Row Motorsports"、"Front Row ( software ) " 等。

思考 3：没有找到 Front Row。我需要搜索 "Row ( software ) "

行动 3：搜索 Front Row ( software )

观察 3： Front Row 是一款已停产的媒体中心软件……

思考 4： Front Row（软件）可以通过 Apple Remote 或键盘功能键来控制。

行动 4：输出键盘功能键。

案例中 re-act 基于目的 " 找出 Apple Remote 最初设计的媒体中心程序 "，模型自行计划、推理、执行了四个步骤。

搜索 [ Apple Remote ] ，知道程序名称是 [ Front Row ]

搜索 [ Front Row ] ，但是未找到对应的软件。但是需要搜索 Front Row ( software )

搜索 Front Row ( software ) ，找到了控制方式

告知结果：输出控制方式键

在这个过程中，我们有几个发现

推理过程围绕始终围绕着目标 " 找出 Apple Remote 最初设计的媒体中心程序 " 进行

推理过程需要频繁的与外界交互（类似于多轮对话一样，搜索收集信息，观察解决问题）

推理过程类似于执行一个 SOP 流程

ReAct 模式的核心是将观察结果提供给 LLM，使其能够更新其上下文窗口。该模型重新评估信息并根据这些见解采取行动以提高其推理能力。同时将单个推理步骤嵌入在对话的提示。

OK，那是否可以将 Re-Act 与企业的 SOP 流程结合，然后让模型去执行标准的 SOP 流程

三、方案：Re-Act + SOP 流程，让模型来控制 sop 流程

如何实现？对 re-act 执行过程进行变更

1、将推理目标（用户提供）变为企业预设目标，比如 " 目标解决退换货问题、留咨询问题、商品推荐 "。非用户提供的提问

2、将模型执行推理的流程，变更为预设的 SOP 流程；

1. 方案的关键步骤如下

定义任务目标 :：企业明确要解决的任务是什么

预设推理轨迹（one shot）: 设计一个推理 sop 轨迹，描述如何一步一步地进行推理和决策、执行 sop

借助 ReAct 的思考、行动和观察的离散推理能力，与外界进行互动执行 sop 的流程

2. 使用的优势

ReAct 可以帮助语言模型进行更复杂的推理和决策

流程 sop（one shot）为模型的行为提供一定解释性，和可控性

可以支持语言模型与外部环境的交互（即用户多轮对话，实现一个目标）

四、落地效果检验分析

我们以简单的 TFlow 留咨询场景例（注流程只需要用文本描述，不需要 work flow），问答效果如下：

1. Re-Act + SOP 流程的推理过程复盘

Agent 任务执行前提：

Agent 的目标：解答用户疑问，引导用户留咨

推理过程示例（One Shot）：

理解用户的疑问

查询知识库中产品手册、了解对应的解决方法

解答用户的疑问，并用户提供姓名、联系方式、公司名称

将信息插入到 CRM 系统中

第一轮的推理：

用户输入：能介绍一下产品吗？

模型处理：

观察：能介绍一下产品吗？

思考：用户询问了关于产品的介绍，我需要调用知识库接口来查询并解答。

行动：调用知识库

第二轮的推理

知识库返回：「同时相较于第二代客服机器人，TFlow 不只体现在具备情感，使用成本大幅度降低。与市面上常见的 14999 元 / 个、24999 元 / 个、外加会话包计费方式的客服机器人相比，TFlow 直接免费提供机器人服务，只按照实际消耗量收取 token 费用，费用多少由需求量说了算。小企业使用一个月的费用可能不超过 50 元，就可以享受 24 小时无间断的客户服务。让大模型真正的实现降本增效的目标」

模型处理：

观察：用户问题 + 知识库的答案

思考：根据知识库提供的信息，我已经了解了 TFlow 产品的介绍。现在我将简洁地回复用户，并引导用户提供姓名、电话号码和公司名称

行动：回复用户 "TFlow 是一款智能客服机器人，具备情感且使用成本大幅降低。它提供 24 小时无间断的客户服务，并可根据实际消耗量收取 token 费用。同时，TFlow 支持多模态消息处理，并对接主流 SaaS 平台。请问您方便留下您的姓名、电话号码和公司名称吗？"

第三轮的推理

用户输入：曹操

模型处理：

观察：曹操

思考：用户已经提供了姓名，但还没有提供电话号码和公司名称。接下来，我将继续引导用户提供这些信息。

行动：回复用户。" 感谢您的回复，曹操先生。为了更好地为您提供服务，请问您能留下您的电话号码和公司名称吗？"

第四轮的推理：

用户输入：今天天气怎么样？

模型处理：

观察：今天天气怎么样？

思考：用户的问题与 TFlow 产品无关，因此我不进行解答，而是继续引导用户提供电话号码和公司名称。

行动：回复用户。" 非常抱歉，关于天气的问题我无法直接回答。但为了更好地为您提供 TFlow 产品的服务，请问您能留下您的电话号码和公司名称吗？"

第五轮的推理：

用户输入：13018920000

模型处理：

观察：13018920000

思考：用户已经提供了电话号码，但还没有提供公司名称。接下来，我将继续引导用户提供公司名称。

行动：回复用户。" 感谢您的回复，曹操先生。为了完善您的信息，请问您能告诉我您的公司名称吗？"

第六轮的推理

用户输入：网易云商

模型处理：

观察：网易云商

思考：用户已经提供了姓名、电话号码和公司名称，现在我将调用留咨接口将这些信息保存到数据库，并告知用户留咨成功。

行动：调用 CRM 接口

第七轮的推理

接口返回：’ Operation succeeded ’ , ‘ code ’ : 200

模型处理：

观察：’ Operation succeeded ’ , ‘ code ’ : 200

思考：留咨成功，我将告知用户销售人员将在 24 小时内联系他。

行动：回复用户。" 留咨成功！我们的销售人员将在 24 小时内与您联系。感谢您的关注和支持！"

2. 在这个流程中我们可以看到的结论

优势好处：

多轮对话一致性：预设目标和流程后，整个多轮对话的过程都围绕着目标进行，不会进行发散和跑偏。异常信息或者无关信息，被自动过滤

推理可解释性：模型推理的过程参考 SOP 的流程，调整模型的推理，只需要修改流程提示即可。

离散引导：在 re-act 的思考机制下，可以对于信息不完整的情况时，具备自动引导补充的能力。自动调用 CRM 的外部工具。自动和用户互动引导补充信息

灵活性：re-act 自动制定计划，可以根据外部的信息输入，自动调整执行计划或者步骤。

通过这个方案即可实现 Agent 控制 SOP 流程，从而实现既定目标。对于 workflow 具备很强的灵活性。

问题：

只能执行单一的任务目标。

任务流程的描述需要抽象业务来描述。

和 work flow、历程画布相比，模型存在小概率幻觉。

本文由 @易俊源原创发布于人人都是产品经理。未经许可，禁止转载

题图来自 Unsplash，基于 CC0 协议

宙世代

逗玩.AI

相关标签