智谱GLM-5.2开源:百万token上下文,MIT许可硬扛出口禁令

美国刚下令关停 Anthropic 最强的 Claude 模型，第三天，北京一间 AI 实验室就把同等上下文窗口的产品甩上了 GitHub，还顺手贴了张 MIT 许可证。这不是段子，是 6 月 15 日智谱 AI 给全球开发者上的一堂 " 你禁你的，我开我的 " 公开课。

智谱 AI 在 2024 年 5 月刚拿下 4 亿美元融资、估值冲上 30 亿美元时，可能还没人料到它会以这种方式上头条。现在大家看明白了：那次融资买的不只是算力，还有一张随时可以打出去的 " 开源牌 "。这张牌的核心叫 GLM-5.2，一个上下文窗口 100 万 token、用 MIT 许可完全开源的模型。

100 万 token 有多大？它和 Anthropic 2026 年 5 月发布的 Claude Opus 4.7 完全持平，理论上可以一次性吃下几十万字的超长文档、整部小说或者全年财报，还能记住每个细节来回推理。但区别在于，Anthropic 的模型是专有授权，只能通过 API 调用，而智谱直接把模型权重、推理代码和微调框架全数丢出，附带六个字：随便用，随便改，随便卖。

MIT 许可在这里不只是个法律标签，更像一扇卸掉门锁的仓库大门。任何国家的开发者，只要有一台足够硬的服务器，就可以本地部署这个级别的前沿模型，不用申请任何出口许可，不用看华盛顿的脸色。智谱自己将这次发布定位为 " 地缘政治对冲 "，翻译过来就是：美国可以用行政命令切断企业之间的依赖，但切断不了开源社区的分发链路。

地缘戏码的铺垫只用了两天。6 月 13 日，美国政府以国家安全为由，要求 Anthropic 关停其性能最强的 Claude 模型，消息迅速见于科技情报平台 gentic.news。同一天，英伟达也出面否认了 Anthropic 关于芯片通过拉丁美洲走私的指控。两件事合在一起看，出口管制从芯片蔓延到模型权重本身已成定局。而智谱选择的回应不是抗议，而是赶在禁令扩散前，把一个开源的 " 模型复制品 " 洒向全球。

这样一来，中国开发者如果想用同等水平的语言模型，不必再等待某个美国厂商是否能拿到许可证，全球那些原本被划在受限区域的研究机构，也可以名正言顺地用 GLM-5.2 跑实验。智谱虽然没有披露训练算力开销和基准分数，但透露它在中文推理任务上 " 具备竞争力 "，开源包里的微调框架也让企业能快速适配自己的数据。

放到开源模型竞技场里看，GLM-5.2 的卡位相当刁钻。Meta 的 Llama 4.5 发布于 2026 年 4 月，上下文限制在 512K token，捆绑的是定制商业许可，对部分大公司来说条款并不友好。阿里旗下的 Qwen3.5 则支持 256K token，用的是 Apache 2.0，已经算宽松，但在窗口长度上差了一个量级。谷歌的 Gemini 2.0 Ultra 能处理 200 万 token，可惜它连开重量的门都没开。目前开源的参数量模型里，GLM-5.2 的 100 万 token 窗口是最大的，再配上一个比 Llama 更自由的 MIT 许可，这让它在企业部署和学术研究两个方向都拿到了先手。

企业场景用大上下文模型，往往是为了省掉切分文档、维护索引的工程成本，现在不但有大窗口，还能自由商用和二次开发，对看重合规和控制权的团队吸引力不小。而学术圈更容易被 MIT 许可打动，因为这意味着论文可复现、修改没限制，协作成本降到最低。智谱显然在赌：只要下载量跑起来，生态自然会反推对 GLM 系列的认知和依赖。

接下来几个指标值得盯紧。中文推理基准 C-Eval 和 MMLU-CN 的分数一旦公布，就能判断 " 竞争力 " 到底是客气话还是硬实力。90 天内企业端下载量若超过 10 万次，意味着这波开源不只是公关操作，而是切切实实抢到了开发者的本地部署席位。再远一步，美国出口管制的制定者会不会被迫回应 " 开源绕路 " 的现实，要么调整政策，要么只眼开只眼闭，这将是 2026 年夏天最微妙的技术与政策博弈。

宙世代

一起剪

相关标签