AI开始“确认收货再付款”，但生意没那么好做

编者按：Token 正在重塑 AI 时代的价值坐标。本篇为《Token 经济学》系列第 11 期，探讨 AI 定价模式如何从 " 按用量收费 " 向 " 按结果付费 " 演进，以及这类收费模式的背后逻辑和难点。

图片由 AI 生成

文丨上海期智研究院研究员李彪

编辑丨李海伦

" 豆包或将推出付费版 " 的消息引发全民讨论。6 月 3 日，豆包发布声明，对部分网传价格信息进行了回应，确认将推出专业版，服务将在一定额度内免费。

价格之外，回到订阅模式本身，真正引发大众讨论的并不是 "AI 产品是否应该收费 "，而是用户开始关心：免费 AI 还能免费多久？哪些能力会继续开放，哪些能力会被放进付费层？

相比价格本身，更值得我们关注的是背后的行业信号：随着 AI 产品逐渐从 " 用户增长阶段 " 走向 " 商业化阶段 "，越来越多厂商开始探索稳定、可持续的收费模式。

最近我翻看了不少 AI 产品的定价页面，策略大同小异：一栏栏套餐按用户数、按月份、按调用量排开，像货架上换了包装的同类商品。

我关注到一家名为 "Intercom" 的这家公司却有点特殊。

很多人可能没听过这家公司的名字，但如果你在海外网站上看到过右下角弹出的在线客服聊天窗口，大概率就接触过它所在的这类产品。

Intercom 成立于 2011 年，是一家知名的客户服务与客户沟通软件公司，长期为企业提供在线客服、客户支持和营销自动化工具。随着生成式 AI 兴起，Intercom 又将重心押注在 AI 客服机器人 Fin 上，并将其定位为能够直接处理客户问题的 "AI 客服代理（AI Agent）"。

Fin 的定价页面上，只有一句话：每解决一个客户问题，0.99 美元。没解决，不收钱。

Fin 把 " 解决 " 叫作 "outcome"。简而言之，这件事，我替你做，直到这个需求被处理完，也可以必要时可以转人工、上下文没丢，才算数。它不按对话条数收，也不管你用了多少模型、多少 token、多少次搜索，只认一点：事办成了没有。

这不太像在卖软件，倒像是在雇一个按件计酬的零工。以及不同模型能力之间的价格差异。

这也让企业采购 AI 时，面对的不再只是 " 贵不贵 " 的问题，而是一个更基础的问题：我花这笔钱，到底买回了什么？是一个账号？一次调用？一段模型能力？还是一件已经完成、可以验收的工作？

这个问题，正在成为 AI 定价变化的真正起点。

01 "Token 经济 " 进入结果层

回顾软件商业模式本身的演变规律，会发现 AI 定价权正在经历一次重要转变。

过去传统软件最熟悉的卖法，是卖账号。

公司买 CRM（管理客户和销售流程的软件），按销售人数付费。买客服系统，按座席付费。买协同办公，按员工人数付费。这个逻辑很清楚：我给你一把工具，你的人拿去用。至于最后客户有没有被服务好、销售有没有多签单、合同有没有少出错，主要还是买方自己负责。

后来云计算和 API 出来，软件又学会了按使用量收费。调用一次 API，跑一小时服务器，用掉 1GB 存储，都是钱。大模型延续了这个逻辑，token 成了最常见的计量单位。

这两种收费方式，本质上都没离开 " 工具 " 两个字。

按账号收费，卖的是工具入口。按调用量收费，卖的是工具消耗。买方想要的结果，中间还隔着一层组织工作：要有人配置系统，有人接流程，有人判断对错，有人收尾，有人承担后果。你买的是锤子，盖不盖得起房子，是你自己的本事。

AI 让这层关系开始松动。因为 AI 不只是一个更复杂的按钮。它可以读文本、查资料、调用工具、写入系统、生成记录、触发下一步流程。它越往企业流程里走，就越不像 " 工具 "，而更像一段正在被外包出去的工作。

这时，软件的价格标签也开始跟着变。

再回到 Fin 这家公司，它能这么定价，是因为客服场景天然接近的结果。

如果按对话收费，机器人说得越多越赚钱。按 token 收费，模型消耗越多越赚钱。按处理结果收费，卖方只有把事办成了才有钱拿。买方本就只关心问题有没有处理完，如今卖方的收入也绑在了这上面。

这也是 AI 软件和传统 SaaS 拉开距离的地方。过去软件公司卖的是 " 你可以使用这套系统 "，现在一部分 AI 公司改了口，卖的是一段已经被做完的工作。

值得注意的是，这种形式也开始走出客服领域。做财务自动化的 HighRadius 把按结果收费搬进了对账、应付和到账：其计价逻辑不再是处理了多少张发票、完成了多少次操作，更多的是关注有多少流程能够在无需人工返工的情况下端到端准确完成，并基于由此节省的成本进行分成。

它甚至上线前自己垫资部署、上线后才开始收费，还要和客户先把 " 什么算成功 " 写成一份明确标准。结果定价就这样开始离开天然接近结果的客服，把 " 什么算完成、钱怎么算 " 这些问题，被写在了合同里。

被卖的东西，正在从 " 你可以用 "，转向 " 这件事已经做完 "。

02 先说清楚：什么才算 " 结果 "

不过，要换一种计价方式，是一件很复杂的事情，牵动的不止价格。

按账号收费，预算通常走软件采购。按 token 收费，预算更像技术成本。按 " 做完一件事 " 收费，预算就开始靠近运营、人力、外包这些业务结果。

这意味着一家 AI 软件公司的竞争对手，可能不再只是另一家软件公司。它可能开始和客服外包、流程外包、内容审核团队、财务共享中心，甚至企业自己的运营部门竞争。

价格标签一变，行业边界也跟着变。不是喊一句 " 按效果付费 " 就够了。

" 按结果收费 " 这句话太容易被滥用。

很多公司都喜欢说自己按效果付费，但要把一件工作卖成可计费的结果，至少要回答四个问题。

第一个问题是 " 什么叫做完 "？

客服里相对好办。问题被解决，或者转了人工、上下文没丢，大致能定义。换个场景就麻烦了。

稿件审核，把风险标出来算做完，还是得交出改好的稿子才算？合同初审，是挑出问题就交差，还是得连能替换的条款一起给出来？财务对账更绕，发现一笔异常只是开头，得有人确认、走完后续流程，才谈得上完成。

边界要是说不清，结果就卖不出去。

第二个问题是 " 怎么证明是你做成的 "？

企业不会长期为一句 " 我帮你提升了效率 " 付钱。它要看记录。原来人工要多久，现在多久。原来漏掉多少问题，现在漏掉多少。哪些是 AI 处理的，哪些是人工接手的。失败样本留在哪里，出了争议能不能回看。

所以，结果收费不是一个漂亮的价格页就能撑住。它背后必须有日志、流程记录、人工接管记录、质量统计和复盘机制。

第三个问题是 " 钱怎么算 "？

按调用量收费很简单，用了就付。按结果收费就复杂多了。

假设用户 72 小时后又回来追问，这算不算上一次没解决？AI 处理了一半，人工接手了，费用怎么算？一次对话里解决了三个问题，是一个结果，还是三个结果？机器人答错了，后面又补救成功，要不要收费？

这些都不是产品经理在页面上加一个开关能解决的，最后都要进入合同和对账规则。

第四个问题是 " 出了问题谁负责 "？

这一问最难，也最能看出当前 AI 到底站在哪个位置。

只会出主意的 AI，说到底还是个工具，对错都得你自己扛。能替你动手、往系统里写数据的，就有了点供应商的意思。但只有当它敢拍胸脯说 " 这事交给我 "，做砸了肯补救、重做、退款，甚至赔钱，才算真把自己卖成了 " 完成件 "。出了岔子，它买单。

今天绝大多数 AI 还卡在前两档。能答、能写、能在你授权的范围里做点事，可离 " 交给我，结果我负责 " 这一步，还差得远。

03 结果型 AI，反而让软件 " 变重了 "

很多人会误以为，AI 会让软件变 " 轻 "。一个聊天框，加上一个大模型，好像就能替代一套复杂系统。

结果收费恰恰相反。它会让软件变得更 " 重 "。

因为一旦承诺的结果是 " 做完交付 "，就不能只靠一个回答窗口。任务从哪里来、谁授权、调了哪些工具、什么时候转人工、最后怎么验收，这一整条链子都得你接住。

客服机器人要接知识库、工单系统、用户身份、历史订单和人工客服。合同审核工具要接模板库、条款库、审批流和版本记录。财务对账工具要接发票、订单、支付流水和异常处理流程。

这些东西都不性感，但它们才是结果能不能被签收的基础。

所以，往结果层走的 AI 软件不会变薄，只会变重，从一个 " 工具箱 " 长成一套 " 执行系统 "。

结果型 AI 更像总包商：它不一定生产每一个零件，但要把人、流程、工具、规则和验收组织起来，最后交付一件能签收的工作。这也是为什么真正能按结果收费的 AI 公司，往往不会只是模型能力强。它还要懂流程，懂行业规则，懂异常处理，懂客户内部怎么验收。

04 能不能收费，关键看怎么验收

前段时间，我把一套稿件审核的能力打包成了一个 Skill，让 AI 能直接读取、照着执行：什么算风险，阈值定在哪里，什么情况必须转人工，输出成什么格式。可这套东西里最值钱的，偏偏就是一写出来就守不住的那几样：哪些风险要升级，阈值凭什么定在这条线，边角情况怎么处理。

这正是当前 Skill 这类东西的两难之处。要让 AI 用得上，它就得被读取、被执行，也就等于被暴露。而 Skill 一旦白纸黑字交到买方手里，看一眼就抄走了，卖方原本独门的那点东西，很快就不再独门。越是纯靠规则和文档写成的能力，越绕不开这一点。

所以真到了高价值的场景，值钱的东西不会摆在台面上。

暴露给用户的，是一个接口、一份输入输出的约定。评测集、升级标准、异常处理、持续校准这些最核心的判断，都压在后端，由服务方自己跑、自己更新、自己留日志。表面上你买的像是一个能力包，实际买到的更接近一项持续运行的服务。

更何况，让 AI 接上各种工具、读到各种数据，本身正在变成人人都会的标配。越是这样，市场越不会为 " 我能接上什么 " 付钱，只会为 " 结果有没有稳定交出来 " 付钱。

所以企业最后买的，是背后那台一直在运行、一直在更新、出了岔子有人接着的判断系统。规则写得漂不漂亮，反倒在其次。值钱的能力很难停在一个能下载的文件上，它太容易被抄走，于是被一路推着，变成托管的服务，变成按结果结算的合同。

05 不是所有的场景都适合按结果卖

在交付这件事儿上，还有一个难题是，有些工作很难被卖成 " 完成件 "。

有的探索性工作就很难。比如战略判断、产品方向、开放式研究，本来就不是先定义结果、再按结果交付的，价值往往是在过程里慢慢长出来的。

高度依赖内部经验的也一样。并购尽调、重大投资判断、核心人事决策，AI 不是帮不上忙，问题在于这些工作深深嵌在企业自己的数据、关系、经验和责任结构里，很难拆出来交给外部服务商按结果收费。

风险太高的更不必说。越靠近核心数据、核心客户、核心决策，企业越不愿意把结果责任放出去。

还有一类，是频率太低、太非标的工作。为了按结果收费，企业得搭一套验收、归因、审计和争议处理的机制。要是一年只发生几次，这套东西搭起来就不划算。

所以，结果型 AI 最可能先出现的地方，通常有几个共同点：任务高频，边界清楚，结果容易验收，失败可以补救，风险相对可控。

客服、内容审核、对账、质检、规则检查，都会比战略咨询、投行尽调、组织诊断更早出现。

难点不在能力，在交易。

AI 能做，不代表市场愿意按结果买。只有当 " 完成 " 能定义，" 贡献 " 能证明，" 失败 " 能处理，" 责任 " 能写清楚，结果才会变成商品。

06 中国市场的机会：从工具入口到流程交付

回到中国市场，现在公开价格页上，目前类似 "per outcome" 的写法还不多。

国内大模型和 AI 应用的主叙事，仍然落在 " 模型降价 "" 百万 token 多少钱 "" 套餐包含多少次调用 " 这些单位上。它们直观，容易传播，也符合过去一年国内模型价格战的语境。

但这不代表中国企业不想买结果。电商平台关心客服问题有没有解决，金融机构关心合规初筛有没有拦住风险。内容平台关心审核有没有减少误发。制造企业关心质检和工单有没有缩短周期。

需求一直在，只是它不一定先出现在标准价格页里。

中国市场更可能先以项目制、私有化部署、行业解决方案、效果分成这些方式出现。结果收费很可能已经藏在合同里，只是还没被写成公开、标准化、可比较的价格单位。

这里有一个微妙的差别：美国公司更愿意把新的计费单位直接写在产品页面上，中国公司则更常把它放进销售和交付里谈。前者看起来像标准产品，后者看起来像定制项目。

这会影响结果型 AI 的扩散速度。

标准价格页能让市场快速理解一种新单位。项目制则把经验留在少数客户和少数销售团队手里。结果能不能从 " 一个项目 " 变成 " 一种商品 "，是中国 AI 软件接下来很重要的分水岭。

07 价格标签背后，是一份 " 责任清单 "

在《token 经济学》系列的前几篇梳理中，我们厘清的几件事：

AI 的账单早就不只算 token ——搜索、缓存、运行时、工具调用，底层能力被拆成一项项可计费的资源；而最前沿的模型，仍然不是想买就能买。把这些都摊开之后，真正要问的是：当底层能力被拆得这么细，上层到底会把它们重新包装成什么？

一个答案是动作。比如更新一条记录，生成一封邮件，完成一次查询。

再往上一层，就是结果。 比如解决一个客户问题，完成一次审核，处理完一张工单。

Token 是底层成本，动作是业务步骤，结果是可以买单的完成件。这三者谁也不替代谁，是一层层往上翻译过去的。底层越标准，越容易被压成成本。上层越接近业务结果，越可能成为新的价格锚。

软件过去卖账号，后来卖调用量，现在开始试着卖 " 做完一件事 "。这个变化还很早，也不会覆盖所有行业。但它至少说明，AI 软件改写的东西里，除了产品能力，还有市场愿意为什么掏钱。

Token 仍然重要。它像电费，像带宽，像云资源，是一切的底座。但企业最后愿意多付钱的，往往不是底座本身，而是有人把这些底层能力组织起来，交给它一件能验收、能对账、出了问题能追责的工作。

翻回 Intercom 那一页。0.99 美元真正改变的，不只是收费方式，而是 AI 软件和企业客户之间的责任关系。

当人们对于 AI 定价的模式，从 " 能力付费 "，走向为 " 完成付费 "，AI 软件的价格的标签，也越来越像一份 " 责任清单 "。

宙世代

一起剪