驱动之家 3小时前
全球中文大模型战力榜发布:前三被海外包揽 国产有惊喜
index.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

快科技 2 月 4 日消息,今天,SuperCLUE 发布 2025 年年度中文大模型基准测评报告。

23 个国内外模型参与角逐,覆盖数学推理、科学推理、代码生成等六大核心维度。

从结果来看,海外闭源模型依旧占据头部位置,Anthropic 旗下的 Claude-Opus-4.5-Reasoning 以 68.25 分位居榜首。

谷歌的 Gemini-3-Pro-Preview 和 OpenAI 的 GPT-5.2 ( high ) 分别以 65.59 分、64.32 分紧随其后,包揽前三名。

不过,国产大模型正加速从跟跑向并跑迈进。国内开源最佳模型 Kimi-K2.5-Thinking 和闭源最佳模型 Qwen3-Max-Thinking,分别以 61.50 分、60.61 分位列全球第四和第六。

在部分细分领域,国产模型表现亮眼,比如 Kimi-K2.5-Thinking 在代码生成任务中以 53.33 分夺冠,Qwen3-Max-Thinking 在数学推理任务中与 Gemini-3-Pro-Preview 同获 80.87 分,并列全球第一。

从整体格局看,海内外开闭源模型差异显著。闭源阵营呈现海外领先、国产追赶态势,开源阵营则是国产主导、海外式微,国内开源模型 Top5 均大幅领先海外开源模型。

评论
大家都在看