马斯克称中国大模型可能明年Q1到Fable级别，智谱CEO“不需要那么久”

原文标题：《网友提问 " 中国大模型何时达到 Fable 级别？"，马斯克 " 可能明年 Q1"，智谱 CEO 唐杰 " 不需要那么久 "》

围绕 Anthropic 前沿模型遭出口管制下架，一场关于中国大模型追赶时间表的公开辩论正在 X 平台上演，多方观点的交锋折射出 AI 行业格局加速重塑的现实。

在智谱 AI 发布 GLM-5.2 后，6 月 18 日，一名 X 用户向独立研究员、AI 开发博主 Teortaxes 提问" 中国大模型何时达到 Fable 级别 "。

Teortaxes 给出了 7 个月的时间差判断，马斯克随即回复 " 可能（2027 年）第一季度 "，智谱 AI CEO 唐杰则直接表态 " 不需要那么久 "。

马斯克随后补充，在基准测试上追赶相对容易，但以 " 真实实用性 " 衡量，明年 Q1 也已经相当出色。

这场对话的背景是 GLM-5.2 在关键编程基准 FrontierSWE 上取得 74.4 分，仅落后 Anthropic 顶级闭源模型 Opus 4.8 约 1 个百分点，并超过 GPT-5.5。

华尔街见闻此前提及，美国商务部对 Anthropic 旗下 Fable 5 和 Mythos 5 实施出口管制，要求向任何外国人提供访问权限前须取得政府许可证，Anthropic 随即关闭两款模型的全球访问权限。

技术追赶与 AI 成本两股力量同步作用，正在重塑全球 AI 竞争格局。正如 zerohedge 所指出的，当 "10% 的智能差距 " 可能对应 "90% 的成本优势 " 时，逾 5 万亿美元的资本配置是否存在错配，将成为市场持续追问的核心命题。

时间表之争：从 7 个月到 " 不需要那么久 "

争论的起点来自 Teortaxes 对 GLM-5.2 性能位置的判断。

他认为，GLM-5.2 整体能力处于 Opus 4.7 至 4.8 区间，他表示 Opus 的视觉能力本身较弱，综合考虑视觉能力后中国大模型差距大致为 7 个月。

他的推算逻辑是，Mythos 模型于 2026 年 2 月初达到 Preview 状态（即 ≥Opus 4.8 的功能水平），以此类推，中国模型达到完整 "Fable" 级别的时间窗口约在 2026 年 11 月至 12 月。

马斯克的判断则更为保守，仅以 "Probably Q1" 回应，对应 2027 年一季度。

但他随后补充了一个重要分层：在基准测试层面，追赶进展或许确实令人印象深刻；而以 " 真实实用性 " 衡量，即便到 Q1 也已相当不易。

他点名 Anthropic 的优势正在于专注于提升真实智能，这种能力不显现在基准分数上，但直接反映在营收上。

对于马斯克的言论，有 AI 业内人士认为，马斯克的预测相对保守，中美模型水平的时间差可能短于 7 个月。

谷歌 DeepMind 首席执行官德米斯 · 哈萨比斯此前也表示，中国的人工智能模型在能力上可能 " 只差几个月 " 就能赶上海外。

唐杰的回复则更为简短直接："won't take that long" ——不需要那么久。这一表态隐含了智谱对自身迭代速度的信心，但并未给出具体时间节点。

AI 研究机构 Proximal 评价称，GLM-5.2 是 " 第一个真正缩小了 Anthropic/OpenAI 与其他模型提供商之间巨大技术鸿沟的模型 "。

GLM-5.2 的技术坐标：逼近闭源前沿，差距仍存

围绕这场时间表讨论，GLM-5.2 的技术指标是核心依据。

6 月 15 日，智谱宣布正式上线并开源新一代旗舰大模型 GLM-5.2。在全球百万用户参与盲测的前端开发评估系统 Code Arena 上，该模型位列全球可用模型第一位。

与以往主打即时问答能力的模型不同，GLM-5.2 主攻 " 长程任务 " ——让 AI 不再只做即时问答，而能像人一样连续工作数小时、自主跑完一个完整的大型工程。

根据发布数据，GLM-5.2 参数规模为 753B，配备 1M token 稳定上下文窗口，采用 MIT 协议完全开源。

在长程编程基准 FrontierSWE 上，GLM-5.2 得分 74.4，Opus 4.8 为 75.1，差距约 1 个百分点，同时超过 GPT-5.5 的 72.6 以及 Opus 4.7。

在 PostTrainBench（测试 Agent 训练小模型能力）上，GLM-5.2 以 34.3 分排名第二，仅次于 Opus 4.8 的 37.2，高于 GPT-5.5 的 28.4。

差距仍然存在。在最高难度的 SWE-Marathon 基准上，GLM-5.2 得分 13.0，而 Opus 4.8 为 26.0，落差明显。

三个基准加在一起，传递的信息是：在中等复杂度的长程任务上，GLM-5.2 已经进入了与顶级闭源模型同台竞争的区间；在最极端复杂度的任务上，它仍然落后，但在开源阵营里独占鳌头。

Anthropic 模型下架，开源替代逻辑加速成立

驱动这场讨论的另一重要背景，是 Anthropic 旗下 Fable 5 和 Mythos 5 的突然下线。

华尔街见闻提及，Anthropic 事件暴露出闭源商业模型在可获得性上的脆弱性，并为开源阵营带来了超越技术层面的战略价值。

在 GLM-5.2 发布的同时，智谱 AI CEO 唐杰在 X 平台发表声明：

在前沿模型被无故切断访问的时刻，我们更加确信一件事：科学应当是全球的。通往 AGI 的道路绝不能由高墙围困。

这一时机选择将开源从技术路线提升至技术主权的叙事层面。该条推文在 24 小时内获得超过 88 万次浏览和 252 条回复。

东方证券认为，开源模型具备开放权重、自主可控、可本地部署等特征，使其成为规避地缘政治风险、保障业务连续性的更优选择。

由于国内模型性能领先、多数开源、API 调用成本较低，中国模型已在 OpenRouter 等 Token 分发平台上占据领先位置。叠加 Anthropic 两款模型下架，国产模型 API 调用量有望进一步提升。

但从中长期逻辑看，成本下降与访问门槛降低，可能推动词元消耗量和算力需求同步扩张。对投资者而言，开源模型份额提升与算力需求高增，正在成为 AI 产业链重估的核心变量。