算力游侠 19小时前
Anthropic停服后,智谱AI逼近巨头并谋上市
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

周四下午,智谱 AI(Z.ai)技术负责人郑勤锴在北京总部一层会议厅里,面对记者亮出一张基准测试对比图。图上三条曲线几乎贴在一起,只有最后一处拐点微微落后。" 这个模型已经可以和顶尖闭源模型掰手腕了," 他说话时,身后的投屏还留着一行字:GLM-5.2 发布次日,Anthropic 宣布暂停全球对其最先进模型的访问。" 说实话,我们也没想到时机这么巧合。"

GLM-5.2 的登场方式确实带着一丝戏剧性。就在美国公司 Anthropic 切断外部对 Claude 系列高级模型的调用权限后不到 24 小时,这款来自中国的开源模型就冲上了公共基准榜单的前排。在 Artificial Analysis 的大型语言模型智能总榜上,它排到第四;在 Code Arena 专门评估前端编码能力的赛道里,更是抢到第二的位置。很多开发者还处在 " 被封堵 " 的错愕中,突然发现有一个开源替代方案,推理成本只有美国头部闭源模型的六分之一左右。社交媒体上随即出现大量截图比对,有人写道:" 中国开源模型第一次摸到天花板了?"

郑勤锴把这种反应称为 " 被解封的需求遇上了准备良久的供给 "。他解释,GLM-5.2 的总参数量达到 7500 亿,配备 100 万 token 的上下文窗口——足够一次性处理整本《三体》三部曲的文本量。更关键的是,团队专门把训练重心压在编码和长周期自主任务上,也就是 " 智能体 " 场景:让模型不仅能回答问题,还能像程序员一样规划步骤、调用工具、完成一连串复杂动作。他说:" 以前开源模型在聊天上或许还行,一遇到写代码、操控环境就露怯。我们想让所有人看到,开源能做到的,不只是聊天。"

在回答关于公司整体走向的提问时,郑勤锴把话题拉回到一个更根本的目标:通用人工智能(AGI)。他说智谱 AI 的使命就是拿到 AGI,当前所有资源都投向如何把模型智能推到上限," 上市也好,融资也好,都是为了更快地逼近这个目标。" 就在同一个月,公司对外宣布将开启上海与香港的双重上市计划,只是尚未披露具体募资金额。消息传出后,股价从 1 月港股首发起,累计涨幅已经超过 2000%,本周市值一度跨过 1 万亿港元的门槛——约合 1280 亿美元。投资者的热情很难说与 GLM-5.2 的表现无关。

但故事不只发生在中国市场。一场围绕 "AI 基础设施依赖 " 的焦虑正在很多国家蔓延。就在上周的七国集团峰会上,加拿大和法国的领导人先后对过度依赖美国控制的 AI 系统表达了警惕。一位匿名的 G7 随行官员向媒体透露,闭源模型的突然 " 拔插头 ",让一些政府机构措手不及,他们原以为可以稳定接入的服务一夜之间跳出了 " 地区不可用 " 的提示。" 这已经不是技术问题,是信任问题。" 该官员称。智谱 AI 的开源发布无意中踩上了这个敏感的时间节点,顺势让自己变成了一个 " 备选项 " ——虽然它并不来自那些寻求替代的国家,但开源许可意味着谁都可以自行部署、自行掌控。

分析师过去一直给中国头部的 AI 模型定下一个时间差:大概比美国领先模型慢四到六个月。但 GLM-5.2 的出现让这个估算需要重新标定。此前,中国团队已经用一系列开源模型先后超越了谷歌的 Gemma 和 Meta 的 Llama 系列,但那些追赶更多发生在同等开源赛道里。而这一次,智谱 AI 直接跳入了和 Claude、GPT-4o 这类顶级闭源系统的对比阵列中,并且是首个在编码和智能体任务上被认可为 " 可匹敌 " 的中国开源模型。郑勤锴特意强调了这个比较的粒度:" 不是说整体评分接近,而是我们在很具体的、有商业价值的任务上,跑出了相当的成绩。"

还有一个细节容易被忽略—— GLM-5.2 发布时同步适配了多种国产芯片基础设施,包括华为的昇腾集群。公司的技术博客里提到,推理过程可以在云端、也可以在本地硬件上顺畅运行,这对很多受限于出口管制、无法采购最新 GPU 的企业和研究机构来说,意味着一个现实的选择。郑勤锴没有展开讲国产芯片的细节,但他说了一句概括性的话:" 重要的不是我们用了谁的芯片,而是我们有能力让模型在多种硬件上跑起来,并且保持这种成本结构。" 六分之一开销的对比,如果放在国内芯片集群上,还能进一步压缩,这笔经济账对大量想落地 AI 应用的开发者有直接吸引力。

从时间表上看,智谱 AI 选择此时推动双重上市,借力的不只是资本窗口。公司内部把 GLM-5.2 定位为 " 开源先锋 ",接下来还要继续加码多模态和更长链任务,希望把纯文本的能力延展到真实世界的感知与操控中。郑勤锴告诉我们,CodeGeeX 团队已经在做下一版模型的前期实验,方向之一就是让模型自己学会更高效地使用工具、更自主地拆分任务。" 我们的逻辑很简单:如果要逼近 AGI,模型必须能做事,而不仅仅能说事。" 他说这话时语气平淡,但会议室里的投资人明显坐得更直了一点。

中国开源 AI 模型第一次在如此近的距离上咬住了美国投入巨资打造的前沿实验室,这件事本身传递出一个信号:封锁和禁令或许会延缓,但无法阻止追赶。而对许多正在重新审视自身 AI 依赖关系的国家来说,一个性能够用、成本更低、部署灵活的备选项,突然就从不存在的状态变成了一个可以点开下载的页面。这也许是比任何排名数字都更值得琢磨的地方。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 开源 美国 程序员 三体
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论