国外科技公司，开始集体转向中国大模型

上周，一条来自硅谷的消息刷屏了技术圈。

美国加密货币交易所 Coinbase 的 CEO Brian Armstrong 在社交平台 X 上发了一篇长文，宣布：公司已经把智谱的 GLM 5.2 和月之暗面的 Kimi K2.7 设为全体工程师的默认大模型。

效果立竿见影：AI 支出直接砍掉近一半，而 Token 使用量还在持续增长。

Armstrong 特意强调了一个细节：这次成本优化没有降低任何人的额度，纯粹靠换用两款中国开源模型就实现了。

值得一提的是，Coinbase 不是什么小公司——纳斯达克上市，市值超百亿美元，全球合规要求极高的金融科技巨头。把中国开源模型设为「默认选项」这件事，在整个美国企业界释放了一个非常强烈的信号。

但这件事真正值得关注的地方在于，Coinbase 远远不是个例。

把时间稍微往前拨一点，会发现 Coinbase 只是这条长链上最新的一环。

最早公开「倒戈」的美国大公司是 Airbnb。

2025 年下半年，CEO Brian Chesky 就已经在媒体采访中直言，公司 " 在很大程度上依赖阿里巴巴的 Qwen 模型 " 驱动 AI 客服，并且评价 Qwen" 比 OpenAI 的产品更好更便宜 "。

他们的运行数据证明了这个判断：问题解决时间从 3 小时压缩至 6 秒，人工依赖降低 15%，年节省约 40 万美元。

更多海外公司则是悄悄完成了替换。

今年 3 月，估值近 300 亿美元的 AI 编程工具 Cursor 发布新模型 Composer 2，24 小时内就被开发者扒出底座是月之暗面的 Kimi K2.5。联合创始人事后承认 " 一开始没说明基于 Kimi，是个失误 "。

如果说 Cursor 是 " 低调借力 "，那么有些公司则是被成本直接逼到了墙角。

今年 6 月，AI Agent 创业公司 Lindy 的创始人 Flo Crivello 公开透露，其使用的 Token 推理成本已经超过员工薪资总额。经过 9 个月评估，他将 100% 的生产流量迁移至 DeepSeek V4，年节省数百万美元。他说：" 对于像我们这样消耗大量 Token 的公司来说，100% 必须要这么做，否则就是不负责任。"

不止创业公司，同样在 6 月，科技巨头微软宣布考虑在 Copilot 中用 DeepSeek 代替 ChatGPT 和 Claude。

与此同时，近期 Glm 5.2 也在硅谷引发了高度关注。Snowflake 的 CEO 测算后认为 GLM 5.2 能以低得多的价格做到与 Claude 相当的性能。Vercel 的 CEO 实测 GLM 5.2 后公开发推表示震惊。

名单还在变长。几乎每一周都有新的海外公司宣布：默认模型换了。

OpenRouter 平台的数据把这个趋势量化得更加清晰：

这个全球最大的 AI 模型 API 聚合平台上，美国开发者占比高达 47%，中国开发者仅约 6%，调用数据主要反映的是海外开发者的真实选择。

截至今年 5 月，中国模型的周调用量已经连续多周压过美国模型。

要知道，一年前中国模型在这个平台上的份额不足 2%。15 个月内国产模型的份额从 2% 攀升至 61%，这条增长曲线几乎是垂直的。

那么，为什么国外科技公司纷纷开始转向中国模型？

要知道，转向的代价可不小：这些公司需要承担换模型带来的工程成本、合规风险、以及组织用惯了一线国际大模型的阻力。

最直接的答案是价格。

GLM 5.2 的调用价格约为 Claude Opus 4.8 的六分之一。DeepSeek V4 Pro 的输入成本比 Claude Sonnet 便宜 7 倍，输出成本便宜 17 倍。MiniMax M2.5 完成一个日常编程任务约耗费 0.15 美元，而 Opus 4.6 约需 3 美元，20 倍的差距。

面对这样的价差，任何一个对成本负责的 CFO，都很难再把 " 必须用美国闭源模型 " 当成铁律。

但如果只看到价格，就会低估这件事。

真正让转向变成一种必然的，是两个更深层的变化同时发生了。

第一个变化，性能差距基本被抹平。

斯坦福大学 2026 年 AI 指数报告的核心结论之一就是：中美模型在能力上基本没有差距了。

GLM 5.2 在第三方评测 Artificial Analysis 上取得 51 分，与 Anthropic、OpenAI 并列前三，成为全球得分最高的开源权重模型。

当「便宜但不够好」这个印象被打破，海外企业迁移的阻力就消失了大半。

第二个变化更加关键。

2026 年 AI 的主流使用方式，已经从简单的对话问答转向了 Agent 工作流。

一个 Agent 任务动辄消耗几十万上百万 Token，按量付费的 API 成本瞬间成了企业的大头开支。

测算显示，当 Agent 渗透率爬到 8%，它整体消耗的 Token 就追平了聊天对话消耗的 Token，往后还有 5 倍以上的增长空间。

在 Agent 时代，Token 单价每下降一个数量级，对企业来说可能意味着月度账单下降两个数量级。便宜，从锦上添花变成了生死线。

OpenRouter 首席运营官 Chris Clark 如是说道：中国模型之所以获得大量调用，是因为它们在美国公司运行的 Agent 工作流中占比不成比例地高。

换句话说，推动中国模型登顶的主力军，就是那些来自硅谷的开发者。

他们用中国模型跑 Agent，不是出于什么政治立场，纯粹是算完账之后的理性选择。

值得关注的是，这场模型使用迁徙，还揭示了一个 AI 模型竞赛逻辑的最新趋势。

AI 模型竞赛的上半场，大家拼的是能力。谁的分数高，谁的 benchmark 好看，谁就是赢家。

下半场的规则变了。

当顶尖模型之间的能力差距收窄到 1% - 5% 以内，" 聪明程度 " 已经很难构成决定性优势。

真正决定胜负的，开始变成能力「之外」的东西。这个「之外」，国内正在分化出几条完全不同的赛道。

第一条赛道：对标 Opus 4.X 的能力但便宜。

这是 Glm 5.2、Kimi K2.7 Code、Qwen3.7-Max、MiniMax M3、Seed 2.1 们切入的赛道。

它们解决的是国内大部分用户无法访问国外模型，又想用上国外模型的需求；同时也恰好满足了国外用户 " 恰好够用 " 但比肩一流模型 " 相对便宜 " 的实际需求。

这个赛道的商业逻辑是丛林法则：谁的能力更强，谁的调用量就最多。

目前来看，Glm 5.2 正在凭借国内外较好的口碑，独占这个赛道的鳌头。

第二条赛道：便宜且稳定的 Agent 底座。

这是 DeepSeek V4 Pro 和 MiMo-V2.5-Pro 正在切入的方向。它们的核心卖点不是 " 比 GPT-5.5 更聪明 "，而是 " 在 Agent 工作流中足够好用、足够便宜、足够稳定 "。

开头提到的 Coinbase 的做法就是典型案例，Armstrong 在文中详细描述了他们的策略：用智能路由把请求分配给最适合的模型。规划类任务可能需要前沿模型，但执行类任务用前沿模型就是浪费。

这个定位的商业逻辑极其清晰：在 Agent 时代，95% 的 Token 消耗发生在执行层，只有 5% 发生在需要顶尖推理能力的规划层。谁能把执行层的成本打下来，谁就拿走了最大的市场。

美团最近推出的新模型 LongCat-2.0 也在切入这条赛道：追求物美价廉、面向垂直场景优化、强调部署效率和调用稳定性。

第三条赛道：极致速度。

小米最近发布的超高速模型 MiMo-V2.5-Pro-UltraSpeed，走的是另一个方向。

当 Agent 需要实时响应，当交互体验对延迟极度敏感，模型的推理速度本身就变成了核心竞争力。小米的超高速模型（1000 token/s，可以在 tokendance 体验），在这个维度上继续推进，把 " 快 "，做成了一种独立的产品价值。

对于那些需要实时交互的场景，从智能客服到实时翻译到游戏 NPC，响应速度的差距用户感知非常明显：200ms 和 2 秒之间的差距，可能就是一个 Agent 产品成功和失败的分水岭。

小编注：以上提到的各个模型，大家都可以在 TokenDance 上体验。

把视角再拉远一点，会发现这些分化背后有一个更大的产业逻辑在运作。

Fortune 杂志在今年 6 月发了一篇重磅的分析文章，标题直击要害：《中国不是要在 AI 上打败美国，它在玩一场完全不同的游戏》。

文章的核心观点是：

中美两国的 AI 市场并非在同一场竞赛中竞争，而是在不同的经济约束和市场需求下运行着平行赛道。中国 AI 的核心并非追赶前沿模型竞赛，而是致力于 AI 的产业化应用，构建一个更精简、更开放的替代生态系统。

Washington Post 给出了一个更精准的概括：中国 AI 的策略是：good enough + much cheaper + widely available.

翻译一下就是：足够好用，便宜很多，广泛可得。

这个策略在 Agent 时代的杀伤力被成倍放大了：

因为 Agent 对 Token 的消耗是对话的十倍百倍，" 便宜 " 在这个语境下的含义完全不同。它决定的是一家公司能不能大规模部署 Agent，能不能让 AI 真正渗透进业务流程的每一个环节。

Gartner 的预测直接给出了量化判断：

在 AI 组合中纳入中国大模型的全球企业占比，将从 2025 年的 5% 上升至 2027 年的 50%。两年时间，十倍增长。

当然，这场迁徙面临的阻力同样真实：数据安全和合规问题，始终是海外公司头上绕不开的一道坎。

Coinbase 选择了一条折中路径：把开源权重下载到自有服务器运行，代码和数据不流向中国的 API 接口。从而实现 " 能力归中国模型、数据留自己服务器 "。这个模式，很可能成为美国企业采用中国大模型的标准范式。

不过，对技术能力有限的中小企业来说，这条路的门槛依然不低。

不止如此，地缘政治风险也不容忽视：智谱 AI 已被列入美国实体清单。

此外，美国政府对 Anthropic 和 OpenAI 最新的旗舰模型实施管制，虽然短期内反而为中国开源模型打开了窗口，但长期的政策走向仍然充满不确定性。

不过有一点越来越清楚：当推理成本超过员工工资，当 Agent 时代的 Token 账单按指数级增长，企业面对的越来越是一道简单的算术题。

而算术题，不接受意识形态作为答案。

回到开头的问题：为什么国外科技公司，开始集体转向中国大模型？

这是因为，2026 年 AI 产业最核心的一个矛盾：所有人都想让 AI 用得更多，但所有人都发现按现有成本结构根本用不起。

而中国大模型正好给这个矛盾提供了解法。

AI 模型竞赛上半场拼能力的时代，属于 OpenAI 和 Anthropic。但下半场，赛道分化了：有人继续追求国内能力天花板，有人把 " 够用且便宜 " 做到极致，有人把速度拉到物理极限。

这些差异化赛道的共同点是：它们都在回答同一个问题——在 Agent 时代，怎样让全世界的开发者和企业用得起 AI。

谁先把这个问题答好，谁就拿到了下一阶段最大的市场。

目前来看，中国大模型正在给出一个越来越有说服力的答案。

而全球的企业，正在用真金白银为这个答案投票。

- 完 -