美国刚下令关停 Anthropic 最强的 Claude 模型,第三天,北京一间 AI 实验室就把同等上下文窗口的产品甩上了 GitHub,还顺手贴了张 MIT 许可证。这不是段子,是 6 月 15 日智谱 AI 给全球开发者上的一堂 " 你禁你的,我开我的 " 公开课。
智谱 AI 在 2024 年 5 月刚拿下 4 亿美元融资、估值冲上 30 亿美元时,可能还没人料到它会以这种方式上头条。现在大家看明白了:那次融资买的不只是算力,还有一张随时可以打出去的 " 开源牌 "。这张牌的核心叫 GLM-5.2,一个上下文窗口 100 万 token、用 MIT 许可完全开源的模型。

100 万 token 有多大?它和 Anthropic 2026 年 5 月发布的 Claude Opus 4.7 完全持平,理论上可以一次性吃下几十万字的超长文档、整部小说或者全年财报,还能记住每个细节来回推理。但区别在于,Anthropic 的模型是专有授权,只能通过 API 调用,而智谱直接把模型权重、推理代码和微调框架全数丢出,附带六个字:随便用,随便改,随便卖。
MIT 许可在这里不只是个法律标签,更像一扇卸掉门锁的仓库大门。任何国家的开发者,只要有一台足够硬的服务器,就可以本地部署这个级别的前沿模型,不用申请任何出口许可,不用看华盛顿的脸色。智谱自己将这次发布定位为 " 地缘政治对冲 ",翻译过来就是:美国可以用行政命令切断企业之间的依赖,但切断不了开源社区的分发链路。
地缘戏码的铺垫只用了两天。6 月 13 日,美国政府以国家安全为由,要求 Anthropic 关停其性能最强的 Claude 模型,消息迅速见于科技情报平台 gentic.news。同一天,英伟达也出面否认了 Anthropic 关于芯片通过拉丁美洲走私的指控。两件事合在一起看,出口管制从芯片蔓延到模型权重本身已成定局。而智谱选择的回应不是抗议,而是赶在禁令扩散前,把一个开源的 " 模型复制品 " 洒向全球。
这样一来,中国开发者如果想用同等水平的语言模型,不必再等待某个美国厂商是否能拿到许可证,全球那些原本被划在受限区域的研究机构,也可以名正言顺地用 GLM-5.2 跑实验。智谱虽然没有披露训练算力开销和基准分数,但透露它在中文推理任务上 " 具备竞争力 ",开源包里的微调框架也让企业能快速适配自己的数据。
放到开源模型竞技场里看,GLM-5.2 的卡位相当刁钻。Meta 的 Llama 4.5 发布于 2026 年 4 月,上下文限制在 512K token,捆绑的是定制商业许可,对部分大公司来说条款并不友好。阿里旗下的 Qwen3.5 则支持 256K token,用的是 Apache 2.0,已经算宽松,但在窗口长度上差了一个量级。谷歌的 Gemini 2.0 Ultra 能处理 200 万 token,可惜它连开重量的门都没开。目前开源的参数量模型里,GLM-5.2 的 100 万 token 窗口是最大的,再配上一个比 Llama 更自由的 MIT 许可,这让它在企业部署和学术研究两个方向都拿到了先手。
企业场景用大上下文模型,往往是为了省掉切分文档、维护索引的工程成本,现在不但有大窗口,还能自由商用和二次开发,对看重合规和控制权的团队吸引力不小。而学术圈更容易被 MIT 许可打动,因为这意味着论文可复现、修改没限制,协作成本降到最低。智谱显然在赌:只要下载量跑起来,生态自然会反推对 GLM 系列的认知和依赖。
接下来几个指标值得盯紧。中文推理基准 C-Eval 和 MMLU-CN 的分数一旦公布,就能判断 " 竞争力 " 到底是客气话还是硬实力。90 天内企业端下载量若超过 10 万次,意味着这波开源不只是公关操作,而是切切实实抢到了开发者的本地部署席位。再远一步,美国出口管制的制定者会不会被迫回应 " 开源绕路 " 的现实,要么调整政策,要么只眼开只眼闭,这将是 2026 年夏天最微妙的技术与政策博弈。


登录后才可以发布评论哦
打开小程序可以发布评论哦