人人都是产品经理 07-30
产品实践分享: Re-Act+SOP,让Agent稳定执行 SOP流程(多轮对话形式),低成本解决复杂SOP搭建问题
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

TFlow AI 作为一款面向 B 端业务场景的 Agent 平台,通过结合 Re-Act 推理 + 行动机制和预设的 SOP 流程,实现了对业务流程的精确控制和执行,为企业提供了一种既灵活又具有确定性的解决方案。本文将深入探讨 TFlow AI 如何利用大型语言模型实现复杂的推理决策任务,并展示其在实际应用中的优势和挑战。

实践产品 TFlow AI 简介:是面向 B 端业务场景 Agent 平台,能按流程处理任务(SOP),围绕目标来进行离散推理。能快速搭建 Ai 客服、AI 导购等应用。

产品允许 LLM 与环境进行交互,根据环境数据的反馈不断的调整行动计划 / 策略。且整个 sop 的过程是由文本来控制,产品基本参数如下:

使用 文心一言 3.5 的模型,未微调

做了逻辑处理的 Agent 框架

单条回复的消耗不到 2K token,价格不贵

欢迎体验。(注:流程只需要用文本流程,不需要 work flow)

一、为什么要做

B 端业务场景的需求:确定性

企业服务(对内、对外)通常有相对明确的 SOP 流程或者思考步骤,在业务处理或者对外 交互时期望按照流程来执行任务。

对外、对内的服务,期望带来确定性的体验。

例如当用户退换货时,思考流程如下:

A 确定退货原因

b 确认订单是否真实有效

c 确定是否符合退换货政策要求

d 协助解答退货操作

在整个多轮对话沟通过程中的要求:

按照流程执行,需要流程可控,带来确定性的结果。

始终聚焦 " 退换货 " 事情上,不要去解答无关的事情

二、如何通过大模型实现昵?借用 Re-Act 为代表 推理 + 行动 机制

ReAct 代表 一种将推理和行动与 语言模型只相结合的技术,用于解决各种语言推理和决策任务。它促使语言模型生成语言推理轨迹和行动,并支持与外部环境的交互。

Re-act 的官方案例示例:

流程说明如下:

目的:找出 Apple Remote 最初设计用来交互的程序,即 Front Row 媒体中心程序

思考 1: 我需要搜索 "Apple Remote" 并找到它最初设计用来交互的程序。

行动 1: 搜索 [ Apple Remote ]

观察 1: "Apple Remote" 是苹果公司于 2005 年 10 月推出的一款遥控器……用于控制 Front Row 媒体中心程序。

思考 2: Apple Remote 最初设计用于控制 Front Row 媒体中心程序。我需要搜索 Front Row 并找到还有哪些设备可以控制它。

行动 2: 搜索 [ Front Row ]

观察 2: 没有找到 [ Front Row ] 。相似结果包括:"FrontSeat to Earth"、"Front Row Motorsports"、"Front Row ( software ) " 等。

思考 3: 没有找到 Front Row。我需要搜索 "Row ( software ) "

行动 3: 搜索 Front Row ( software )

观察 3: Front Row 是一款已停产的媒体中心软件……

思考 4: Front Row(软件)可以通过 Apple Remote 或键盘功能键来控制。

行动 4: 输出 键盘功能键。

案例中 re-act 基于目的 " 找出 Apple Remote 最初设计的媒体中心程序 ",模型自行计划、推理、执行了四个步骤。

搜索 [ Apple Remote ] ,知道程序名称是 [ Front Row ]

搜索 [ Front Row ] ,但是未找到对应的软件。但是需要搜索 Front Row ( software )

搜索 Front Row ( software ) ,找到了控制方式

告知结果:输出控制方式键

在这个过程中,我们有几个发现

推理过程围绕始终围绕着目标 " 找出 Apple Remote 最初设计的媒体中心程序 " 进行

推理过程需要频繁的与外界交互(类似于多轮对话一样,搜索收集信息,观察解决问题)

推理过程类似于 执行 一个 SOP 流程

ReAct 模式的核心是将观察结果提供给 LLM,使其能够更新其上下文窗口。该模型重新评估信息并根据这些见解采取行动以提高其推理能力。同时将单个推理步骤嵌入在对话的提示。

OK,那是否可以将 Re-Act 与企业的 SOP 流程结合,然后让模型去执行标准的 SOP 流程

三、方案:Re-Act + SOP 流程,让模型来控制 sop 流程

如何实现?对 re-act 执行过程进行变更

1、将推理目标(用户提供)变为 企业预设目标,比如 " 目标解决退换货问题、留咨询问题、商品推荐 "。非用户提供的提问

2、将模型执行推理的流程,变更为预设的 SOP 流程;

1. 方案的关键步骤如下

定义任务目标 ::企业 明确要解决的任务是什么

预设推理轨迹(one shot): 设计一个推理 sop 轨迹,描述如何一步一步地进行推理和决策、执行 sop

借助 ReAct 的 思考、行动和观察的离散推理能力,与外界进行互动执行 sop 的流程

2. 使用的优势

ReAct 可以帮助语言模型进行更复杂的推理和决策

流程 sop(one shot) 为模型的行为提供一定解释性,和可控性

可以支持语言模型与外部环境的交互(即用户多轮对话,实现一个目标)

四、落地效果检验分析

我们以简单的 TFlow 留咨询场景例(注流程只需要用文本描述,不需要 work flow),问答效果如下:

1. Re-Act + SOP 流程的推理过程复盘

Agent 任务执行前提:

Agent 的目标:解答用户疑问,引导用户留咨

推理过程示例 (One Shot):

理解用户的疑问

查询知识库中产品手册、了解对应的解决方法

解答用户的疑问,并用户提供姓名、联系方式、公司名称

将信息插入 到 CRM 系统中

第一轮的推理:

用户输入:能介绍一下产品吗?

模型处理:

观察:能介绍一下产品吗?

思考:用户询问了关于产品的介绍,我需要调用知识库接口来查询并解答。

行动:调用知识库

第二轮的推理

知识库返回:「同时相较于第二代客服机器人,TFlow 不只体现在具备情感,使用成本大幅度降低。与市面上常见的 14999 元 / 个、24999 元 / 个、外加会话包计费方式的客服机器人相比,TFlow 直接免费提供机器人服务,只按照实际消耗量收取 token 费用,费用多少由需求量说了算。小企业使用一个月的费用可能不超过 50 元,就可以享受 24 小时无间断的客户服务。让大模型真正的实现降本增效的目标」

模型处理:

观察:用户问题 + 知识库的答案

思考:根据知识库提供的信息,我已经了解了 TFlow 产品的介绍。现在我将简洁地回复用户,并引导用户提供姓名、电话号码和公司名称

行动:回复用户 "TFlow 是一款智能客服机器人,具备情感且使用成本大幅降低。它提供 24 小时无间断的客户服务,并可根据实际消耗量收取 token 费用。同时,TFlow 支持多模态消息处理,并对接主流 SaaS 平台。请问您方便留下您的姓名、电话号码和公司名称吗?"

第三轮的推理

用户输入:曹操

模型处理:

观察:曹操

思考:用户已经提供了姓名,但还没有提供电话号码和公司名称。接下来,我将继续引导用户提供这些信息。

行动:回复用户。" 感谢您的回复,曹操先生。为了更好地为您提供服务,请问您能留下您的电话号码和公司名称吗?"

第四轮的推理:

用户输入:今天天气怎么样?

模型处理:

观察:今天天气怎么样?

思考:用户的问题与 TFlow 产品无关,因此我不进行解答,而是继续引导用户提供电话号码和公司名称。

行动:回复用户。" 非常抱歉,关于天气的问题我无法直接回答。但为了更好地为您提供 TFlow 产品的服务,请问您能留下您的电话号码和公司名称吗?"

第五轮的推理:

用户输入:13018920000

模型处理:

观察:13018920000

思考:用户已经提供了电话号码,但还没有提供公司名称。接下来,我将继续引导用户提供公司名称。

行动:回复用户。" 感谢您的回复,曹操先生。为了完善您的信息,请问您能告诉我您的公司名称吗?"

第六轮的推理

用户输入:网易云商

模型处理:

观察:网易云商

思考:用户已经提供了姓名、电话号码和公司名称,现在我将调用留咨接口将这些信息保存到数据库,并告知用户留咨成功。

行动:调用 CRM 接口

第七轮的推理

接口返回:’ Operation succeeded ’ , ‘ code ’ : 200

模型处理:

观察:’ Operation succeeded ’ , ‘ code ’ : 200

思考:留咨成功,我将告知用户销售人员将在 24 小时内联系他。

行动:回复用户。" 留咨成功!我们的销售人员将在 24 小时内与您联系。感谢您的关注和支持!"

2. 在这个流程中我们可以看到的结论

优势好处:

多轮对话一致性:预设目标和流程后,整个多轮对话的过程都围绕着目标进行,不会进行发散和跑偏。异常信息或者无关信息,被自动过滤

推理可解释性:模型推理的过程参考 SOP 的流程,调整模型的推理,只需要修改流程提示即可。

离散引导:在 re-act 的思考机制下,可以对于信息不完整的情况时,具备自动引导补充的能力。自动调用 CRM 的外部工具。自动和用户互动引导补充信息

灵活性:re-act 自动制定计划,可以根据外部的信息输入,自动调整执行计划或者步骤。

通过这个方案即可实现 Agent 控制 SOP 流程,从而实现既定目标。对于 workflow 具备很强的灵活性。

问题:

只能执行单一的任务目标。

任务流程的描述需要抽象业务来描述。

和 work flow、历程画布相比,模型存在小概率幻觉。

本文由 @易俊源 原创发布于人人都是产品经理。未经许可,禁止转载

题图来自 Unsplash,基于 CC0 协议

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

逗玩.AI

逗玩.AI

ZAKER旗下AI智能创作平台

相关标签

apple 文心一言 苹果公司 ai
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论