特工宇宙 20小时前
国外科技公司,开始集体转向中国大模型
index.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

上周,一条来自硅谷的消息刷屏了技术圈。

美国加密货币交易所 Coinbase 的 CEO Brian Armstrong 在社交平台 X 上发了一篇长文,宣布:公司已经把智谱的 GLM 5.2 和月之暗面的 Kimi K2.7 设为全体工程师的默认大模型。

效果立竿见影:AI 支出直接砍掉近一半,而 Token 使用量还在持续增长。

Armstrong 特意强调了一个细节:这次成本优化没有降低任何人的额度,纯粹靠换用两款中国开源模型就实现了。

值得一提的是,Coinbase 不是什么小公司——纳斯达克上市,市值超百亿美元,全球合规要求极高的金融科技巨头。把中国开源模型设为「默认选项」这件事,在整个美国企业界释放了一个非常强烈的信号。

但这件事真正值得关注的地方在于,Coinbase 远远不是个例。

把时间稍微往前拨一点,会发现   Coinbase 只是这条长链上最新的一环。

最早公开「倒戈」的美国大公司是 Airbnb。

2025 年下半年,CEO Brian Chesky 就已经在媒体采访中直言,公司 " 在很大程度上依赖阿里巴巴的 Qwen 模型 " 驱动 AI 客服,并且评价   Qwen" 比 OpenAI 的产品更好更便宜 "。

他们的运行数据证明了这个判断:问题解决时间从 3 小时压缩至 6 秒,人工依赖降低 15%,年节省约 40 万美元。

更多海外公司则是悄悄完成了替换。

今年 3 月,估值近 300 亿美元的 AI 编程工具 Cursor 发布新模型 Composer 2,24 小时内就被开发者扒出底座是月之暗面的 Kimi K2.5。联合创始人事后承认 " 一开始没说明基于 Kimi,是个失误 "。

如果说 Cursor 是 " 低调借力 ",那么有些公司则是被成本直接逼到了墙角。

今年 6 月,AI Agent 创业公司 Lindy 的创始人 Flo Crivello 公开透露,其使用的 Token 推理成本已经超过员工薪资总额。经过 9 个月评估,他将 100% 的生产流量迁移至 DeepSeek V4,年节省数百万美元。他说:" 对于像我们这样消耗大量 Token 的公司来说,100% 必须要这么做,否则就是不负责任。"

不止创业公司,同样在 6 月,科技巨头微软宣布考虑在 Copilot 中用 DeepSeek 代替 ChatGPT 和 Claude。

与此同时,近期 Glm 5.2 也在硅谷引发了高度关注。Snowflake 的 CEO 测算后认为 GLM 5.2 能以低得多的价格做到与 Claude 相当的性能。Vercel 的 CEO 实测 GLM 5.2 后公开发推表示震惊。

名单还在变长。几乎每一周都有新的海外公司宣布:默认模型换了。

OpenRouter 平台的数据把这个趋势量化得更加清晰:

这个全球最大的 AI 模型 API 聚合平台上,美国开发者占比高达 47%,中国开发者仅约 6%,调用数据主要反映的是海外开发者的真实选择。

截至今年 5 月,中国模型的周调用量已经连续多周压过美国模型。

要知道,一年前中国模型在这个平台上的份额不足 2%。15 个月内国产模型的份额从 2% 攀升至 61%,这条增长曲线几乎是垂直的。

那么,为什么国外科技公司纷纷开始转向中国模型?

要知道,转向的代价可不小:这些公司需要承担换模型带来的工程成本、合规风险、以及组织用惯了一线国际大模型的阻力。

最直接的答案是价格。

GLM 5.2 的调用价格约为 Claude Opus 4.8 的六分之一。DeepSeek V4 Pro 的输入成本比 Claude Sonnet 便宜 7 倍,输出成本便宜 17 倍。MiniMax M2.5 完成一个日常编程任务约耗费 0.15 美元,而 Opus 4.6 约需 3 美元,20 倍的差距。

面对这样的价差,任何一个对成本负责的 CFO,都很难再把 " 必须用美国闭源模型 " 当成铁律。

但如果只看到价格,就会低估这件事。

真正让转向变成一种必然的,是两个更深层的变化同时发生了。

第一个变化,性能差距基本被抹平。

斯坦福大学 2026 年 AI 指数报告的核心结论之一就是:中美模型在能力上基本没有差距了。

GLM 5.2 在第三方评测 Artificial Analysis 上取得 51 分,与 Anthropic、OpenAI 并列前三,成为全球得分最高的开源权重模型。

当「便宜但不够好」这个印象被打破,海外企业迁移的阻力就消失了大半。

第二个变化更加关键。

2026 年 AI 的主流使用方式,已经从简单的对话问答转向了 Agent 工作流。

一个 Agent 任务动辄消耗几十万上百万 Token,按量付费的 API 成本瞬间成了企业的大头开支。

测算显示,当 Agent 渗透率爬到 8%,它整体消耗的 Token 就追平了聊天对话消耗的 Token,往后还有 5 倍以上的增长空间。

在 Agent 时代,Token 单价每下降一个数量级,对企业来说可能意味着月度账单下降两个数量级。便宜,从锦上添花变成了生死线。

OpenRouter 首席运营官 Chris Clark 如是说道:中国模型之所以获得大量调用,是因为它们在美国公司运行的 Agent 工作流中占比不成比例地高。

换句话说,推动中国模型登顶的主力军,就是那些来自硅谷的开发者。

他们用中国模型跑 Agent,不是出于什么政治立场,纯粹是算完账之后的理性选择。

值得关注的是,这场模型使用迁徙,还揭示了一个 AI 模型竞赛逻辑的最新趋势。

AI 模型竞赛的上半场,大家拼的是能力。谁的分数高,谁的 benchmark 好看,谁就是赢家。

下半场的规则变了。

当顶尖模型之间的能力差距收窄到 1% - 5% 以内," 聪明程度 " 已经很难构成决定性优势。

真正决定胜负的,开始变成能力「之外」的东西。这个「之外」,国内正在分化出几条完全不同的赛道。

第一条赛道:对标 Opus 4.X 的能力但便宜。

这是 Glm 5.2、Kimi K2.7 Code、Qwen3.7-Max、MiniMax M3、Seed 2.1 们切入的赛道。

它们解决的是国内大部分用户无法访问国外模型,又想用上国外模型的需求;同时也恰好满足了国外用户 " 恰好够用 " 但比肩一流模型 " 相对便宜 " 的实际需求。

这个赛道的商业逻辑是丛林法则:谁的能力更强,谁的调用量就最多。

目前来看,Glm 5.2 正在凭借国内外较好的口碑,独占这个赛道的鳌头。

第二条赛道:便宜且稳定的 Agent 底座。

这是 DeepSeek V4 Pro 和 MiMo-V2.5-Pro 正在切入的方向。它们的核心卖点不是 " 比 GPT-5.5 更聪明 ",而是 " 在 Agent 工作流中足够好用、足够便宜、足够稳定 "。

开头提到的 Coinbase 的做法就是典型案例,Armstrong 在文中详细描述了他们的策略:用智能路由把请求分配给最适合的模型。规划类任务可能需要前沿模型,但执行类任务用前沿模型就是浪费。

这个定位的商业逻辑极其清晰:在 Agent 时代,95% 的 Token 消耗发生在执行层,只有 5% 发生在需要顶尖推理能力的规划层。谁能把执行层的成本打下来,谁就拿走了最大的市场。

美团最近推出的新模型 LongCat-2.0 也在切入这条赛道:追求物美价廉、面向垂直场景优化、强调部署效率和调用稳定性。

第三条赛道:极致速度。

小米最近发布的超高速模型 MiMo-V2.5-Pro-UltraSpeed,走的是另一个方向。

当 Agent 需要实时响应,当交互体验对延迟极度敏感,模型的推理速度本身就变成了核心竞争力。小米的超高速模型(1000 token/s,可以在 tokendance 体验),在这个维度上继续推进,把 " 快 ",做成了一种独立的产品价值。

对于那些需要实时交互的场景,从智能客服到实时翻译到游戏 NPC,响应速度的差距用户感知非常明显:200ms 和 2 秒之间的差距,可能就是一个 Agent 产品成功和失败的分水岭。

小编注:以上提到的各个模型,大家都可以在 TokenDance 上体验。

把视角再拉远一点,会发现这些分化背后有一个更大的产业逻辑在运作。

Fortune 杂志在今年 6 月发了一篇重磅的分析文章,标题直击要害:《中国不是要在 AI 上打败美国,它在玩一场完全不同的游戏》。

文章的核心观点是:

中美两国的 AI 市场并非在同一场竞赛中竞争,而是在不同的经济约束和市场需求下运行着平行赛道。中国 AI 的核心并非追赶前沿模型竞赛,而是致力于 AI 的产业化应用,构建一个更精简、更开放的替代生态系统。

Washington Post 给出了一个更精准的概括:中国 AI 的策略是:good enough + much cheaper + widely available.

翻译一下就是:足够好用,便宜很多,广泛可得。

这个策略在 Agent 时代的杀伤力被成倍放大了:

因为 Agent 对 Token 的消耗是对话的十倍百倍," 便宜 " 在这个语境下的含义完全不同。它决定的是一家公司能不能大规模部署 Agent,能不能让 AI 真正渗透进业务流程的每一个环节。

Gartner 的预测直接给出了量化判断:

在 AI 组合中纳入中国大模型的全球企业占比,将从 2025 年的 5% 上升至 2027 年的 50%。两年时间,十倍增长。

当然,这场迁徙面临的阻力同样真实:数据安全和合规问题,始终是海外公司头上绕不开的一道坎。

Coinbase 选择了一条折中路径:把开源权重下载到自有服务器运行,代码和数据不流向中国的 API 接口。从而实现 " 能力归中国模型、数据留自己服务器 "。这个模式,很可能成为美国企业采用中国大模型的标准范式。

不过,对技术能力有限的中小企业来说,这条路的门槛依然不低。

不止如此,地缘政治风险也不容忽视:智谱 AI 已被列入美国实体清单。

此外,美国政府对 Anthropic 和 OpenAI 最新的旗舰模型实施管制,虽然短期内反而为中国开源模型打开了窗口,但长期的政策走向仍然充满不确定性。

不过有一点越来越清楚:当推理成本超过员工工资,当 Agent 时代的 Token 账单按指数级增长,企业面对的越来越是一道简单的算术题。

而算术题,不接受意识形态作为答案。

回到开头的问题:为什么国外科技公司,开始集体转向中国大模型?

这是因为,2026 年 AI 产业最核心的一个矛盾:所有人都想让 AI 用得更多,但所有人都发现按现有成本结构根本用不起。

而中国大模型正好给这个矛盾提供了解法。

AI 模型竞赛上半场拼能力的时代,属于 OpenAI 和 Anthropic。但下半场,赛道分化了:有人继续追求国内能力天花板,有人把 " 够用且便宜 " 做到极致,有人把速度拉到物理极限。

这些差异化赛道的共同点是:它们都在回答同一个问题——在 Agent 时代,怎样让全世界的开发者和企业用得起 AI。

谁先把这个问题答好,谁就拿到了下一阶段最大的市场。

目前来看,中国大模型正在给出一个越来越有说服力的答案。

而全球的企业,正在用真金白银为这个答案投票。

- 完 -

评论
大家都在看