Coinbase 将 GLM 5.2、Kimi 2.7 设为默认模型:AI 支出减半!

2026 年 6 月 27 日，美国加密货币交易平台 Coinbase 正在将中国大模型纳入内部 AI 基础设施，用更低成本的模型承接日常工程任务。

Coinbase CEO Brian Armstrong 发文称，公司正在通过内部 LLM gateway，尝试将开放权重模型设为默认选项，其中包括智谱 GLM 5.2 和月之暗面 Kimi 2.7。

Brian Armstrong：

在 token 使用量指数级增长的情况下，如何让 AI 支出保持平稳？

靠的不是增加使用门槛，也不是费用提醒，而是更好的默认设置、路由和缓存。

1）更好的默认设置，而不是使用上限。

工程师可以选择任何自己想用的模型，但默认选项很重要。我们正在通过自己的 LLM gateway，试验默认使用 GLM 5.2 和 Kimi 2.7 这类开放权重模型，同时仍鼓励工程师根据任务选择合适的模型。

我们有 91% 的员工从来没有触碰到使用上限。因此，我们没有降低额度、增加提醒，而是提高了上限。需要注意的是，代码审查会默认使用多种模型，让它们相互检查工作结果。

2）更好的路由。

在我们的自定义框架中，会先对 prompt 做预处理，然后结合缓存命中情况和模型价格，将任务路由给最适合的模型。

例如，规划阶段可能需要前沿模型，但执行阶段未必需要，因为那可能有些大材小用。最终，不应该由人来选择模型，AI 可以自动完成这件事。

3）更好的缓存。

缓存未命中是最容易推高成本的因素。我们的所有请求都支持缓存，因此会尽可能复用已经 " 预热 " 的缓存。

例如，在正确实现缓存后，我们在 LibreChat 中的缓存命中率从 5% 提升到了 60%。

4）保持上下文精简。

切换任务时，开启新的会话；严格限定文件上下文范围；断开不用的工具。不要只是压缩上下文。目标不是少用 token，而是少浪费 token。

5）更好的可见性。

我们的工程师可以使用任意数量的 token，也可以使用任何他们想用的模型，但我们已经让使用情况变得可见。你在 AI 上花得越多，我们期待你带来的影响也越大。

目标不是压制使用量，而是搭建一套基础设施，让指数级增长变得可持续。

这些做法落地后，在 token 使用量继续增长的同时，我们的 AI 支出已经接近减半。

Armstrong 同时强调，工程师仍然可以根据任务选择合适模型，并非完全切换到单一模型。

Coinbase 的 token 使用量仍在增长，但 AI 支出已经 " 接近减半 "。

Coinbase 通过默认模型、路由和缓存等手段控制成本，其中一项重要变化就是试用中国 AI 公司开发的开放权重模型。

Armstrong 给出的逻辑是，不是限制工程师使用 AI，而是让系统自动选择更便宜、更合适的模型。

简单任务不再默认调用昂贵的前沿闭源模型，复杂任务才交给更强模型处理。

更便宜的默认模型、自动模型路由、更高缓存命中率、更精简上下文，以及让团队清楚看到自己的 AI 成本。

在这套机制下，GLM 5.2 和 Kimi 2.7 扮演的角色不是 " 替代所有模型 "，而是成为 Coinbase 内部 AI 使用的低成本默认层。

Armstrong 提到，公司仍鼓励工程师为具体任务选择正确模型，但默认入口已经开始向开放权重模型倾斜。

这也是中国大模型进入海外企业核心工作流的一个标志性案例。

过去，中国模型更多被放在 " 开源榜单 "" 性价比模型 " 语境中讨论；这一次，Coinbase 给出的不是跑分，而是企业账单。

对于 OpenAI、Anthropic 等美国前沿模型公司来说，Coinbase 的做法释放了一个现实信号，企业客户并不总是需要最强模型，更需要可控成本、稳定路由和可规模化部署。当大量 AI 工作流变成日常工程基础设施后，价格会和能力一样重要。

GLM 5.2、Kimi 2.7 进入 Coinbase 的 LLM gateway，本质上是一次企业级模型采购逻辑变化，前沿模型负责高难度任务，便宜模型承接大规模日常调用。

Coinbase 目前市值 399.5 亿美元：

与此同时，前 Meta 产品经理、硅谷创业者 Xiaoyin Qu 也发表类似观点。

Xiaoyin Qu 发文称，美国和欧洲企业将转向中国模型，理由是企业可以将模型部署在自己的 GPU 上，用内部数据继续后训练，同时保留更强控制权，并更容易解释 AI 支出和 ROI。她认为，问题的关键不是企业是否还需要 OpenAI、Anthropic，而是当 AI 成本快速上升后，企业会更倾向选择可控、可部署、可训练、成本更低的模型底座。

云头条声明：如以上内容有误或侵犯到你公司、机构、单位或个人权益，请联系我们说明理由，我们会配合，无条件删除处理。

宙世代

一起剪

相关标签