2026 年 6 月 27 日,美国加密货币交易平台 Coinbase 正在将中国大模型纳入内部 AI 基础设施,用更低成本的模型承接日常工程任务。
Coinbase CEO Brian Armstrong 发文称,公司正在通过内部 LLM gateway,尝试将开放权重模型设为默认选项,其中包括智谱 GLM 5.2 和月之暗面 Kimi 2.7。
Brian Armstrong:
在 token 使用量指数级增长的情况下,如何让 AI 支出保持平稳?
靠的不是增加使用门槛,也不是费用提醒,而是更好的默认设置、路由和缓存。
1)更好的默认设置,而不是使用上限。
工程师可以选择任何自己想用的模型,但默认选项很重要。我们正在通过自己的 LLM gateway,试验默认使用 GLM 5.2 和 Kimi 2.7 这类开放权重模型,同时仍鼓励工程师根据任务选择合适的模型。
我们有 91% 的员工从来没有触碰到使用上限。因此,我们没有降低额度、增加提醒,而是提高了上限。需要注意的是,代码审查会默认使用多种模型,让它们相互检查工作结果。
2)更好的路由。
在我们的自定义框架中,会先对 prompt 做预处理,然后结合缓存命中情况和模型价格,将任务路由给最适合的模型。
例如,规划阶段可能需要前沿模型,但执行阶段未必需要,因为那可能有些大材小用。最终,不应该由人来选择模型,AI 可以自动完成这件事。
3)更好的缓存。
缓存未命中是最容易推高成本的因素。我们的所有请求都支持缓存,因此会尽可能复用已经 " 预热 " 的缓存。
例如,在正确实现缓存后,我们在 LibreChat 中的缓存命中率从 5% 提升到了 60%。
4)保持上下文精简。
切换任务时,开启新的会话;严格限定文件上下文范围;断开不用的工具。不要只是压缩上下文。目标不是少用 token,而是少浪费 token。
5)更好的可见性。
我们的工程师可以使用任意数量的 token,也可以使用任何他们想用的模型,但我们已经让使用情况变得可见。你在 AI 上花得越多,我们期待你带来的影响也越大。
目标不是压制使用量,而是搭建一套基础设施,让指数级增长变得可持续。
这些做法落地后,在 token 使用量继续增长的同时,我们的 AI 支出已经接近减半。
Armstrong 同时强调,工程师仍然可以根据任务选择合适模型,并非完全切换到单一模型。
Coinbase 的 token 使用量仍在增长,但 AI 支出已经 " 接近减半 "。
Coinbase 通过默认模型、路由和缓存等手段控制成本,其中一项重要变化就是试用中国 AI 公司开发的开放权重模型。
Armstrong 给出的逻辑是,不是限制工程师使用 AI,而是让系统自动选择更便宜、更合适的模型。
简单任务不再默认调用昂贵的前沿闭源模型,复杂任务才交给更强模型处理。
更便宜的默认模型、自动模型路由、更高缓存命中率、更精简上下文,以及让团队清楚看到自己的 AI 成本。
在这套机制下,GLM 5.2 和 Kimi 2.7 扮演的角色不是 " 替代所有模型 ",而是成为 Coinbase 内部 AI 使用的低成本默认层。
Armstrong 提到,公司仍鼓励工程师为具体任务选择正确模型,但默认入口已经开始向开放权重模型倾斜。
这也是中国大模型进入海外企业核心工作流的一个标志性案例。
过去,中国模型更多被放在 " 开源榜单 "" 性价比模型 " 语境中讨论;这一次,Coinbase 给出的不是跑分,而是企业账单。
对于 OpenAI、Anthropic 等美国前沿模型公司来说,Coinbase 的做法释放了一个现实信号,企业客户并不总是需要最强模型,更需要可控成本、稳定路由和可规模化部署。当大量 AI 工作流变成日常工程基础设施后,价格会和能力一样重要。
GLM 5.2、Kimi 2.7 进入 Coinbase 的 LLM gateway,本质上是一次企业级模型采购逻辑变化,前沿模型负责高难度任务,便宜模型承接大规模日常调用。
Coinbase 目前市值 399.5 亿美元:
与此同时,前 Meta 产品经理、硅谷创业者 Xiaoyin Qu 也发表类似观点。
Xiaoyin Qu 发文称,美国和欧洲企业将转向中国模型,理由是企业可以将模型部署在自己的 GPU 上,用内部数据继续后训练,同时保留更强控制权,并更容易解释 AI 支出和 ROI。她认为,问题的关键不是企业是否还需要 OpenAI、Anthropic,而是当 AI 成本快速上升后,企业会更倾向选择可控、可部署、可训练、成本更低的模型底座。
云头条声明:如以上内容有误或侵犯到你公司、机构、单位或个人权益,请联系我们说明理由,我们会配合,无条件删除处理。


登录后才可以发布评论哦
打开小程序可以发布评论哦