中国“平价”开源大模型首次跻身全球前五！MiniMax-M2挑战硅谷霸主

国内大模型赛道再迎重磅玩家。记者刚刚从国内 AI 独角兽公司稀宇极智（MiniMax）获悉，该公司发布并开源的新一代文本大模型 MiniMax-M2 在全球权威测评榜单 Artificial Analysis （AA）中总分位列全球前五、开源第一，跻身全球第一梯队，与 OpenAI、Anthropic、Google 等硅谷巨头同台竞技。值得一提的是，这个成绩是在 M2 价格仅为 Claude Sonnet 4.5 的 8% 的基础上实现的，并且相较后者推理速度快了接近一倍。这意味着，中国 AI 企业正以 " 高智能 + 低成本 " 的新组合，向全球 AI 格局发起正面冲击。

中国首个开源跻身全球前五的大模型

根据 Artificial Analysis 最新榜单，MiniMax M2 在编码、指令遵循和智能体（Agent）等核心任务上全面进入全球前列。顶级代码能力：专为端到端开发工作流打造，在 Claude Code、Cursor、Cline、Kilo Code、Droid 等多种应用中表现卓越；强大 Agentic 表现：出色规划并稳定执行复杂长链条工具调用任务，协同调用 Shell、Browser、Python 代码执行器和各种 MCP 工具；极致性价比 & 速度：通过高效的激活参数设计，实现智能、速度与成本的最佳平衡。

顶级性能的 " 平价 " 模型掀起算力成本革命

OpenRouter 作为全球最具影响力的 AI 模型聚合与调用平台之一，其数据源于真实开发者的使用行为，极具代表性和权威性。M2 在其平台上线不到两天，模型调用量已跻身全球前 10。

M2 仅有 10B 激活参数（总参 230B）的轻量级模型，在保持卓越性能的同时，实现了更低的延迟与成本，以及更高的吞吐效率，完美契合了新兴多智能体工作流对高效协同与快速响应的需求。M2 综合成本 API 价格定在每百万 Token 输入 0.3 美金 /2.1 元人民币，以及输出 1.2 美金 /8.4 元，同时在线上提供 TPS（每秒输出 Token 数）在 100 左右的推理服务（还在快速提升）。这个价格是 Claude Sonnet 4.5 的 8%，而推理速度快了接近一倍，在大规模调用中保持高效响应。

极致的智能水平、响应延迟与成本效率体验，让海外的 AI 开发者给予中国开源模型一致好评。知名平台 LMarena 第一时间发 X，向开发者推荐 M2 模型测试； Reddit 社区技术大 V 在基准测试中运行了 MiniMax M2，" 它获得了 58.3% 的分数，这算是相当不错的表现 "；CoreViewHQ 联合创始人兼 CTO Ivan Fioravant 表示，"MiniMax-M2 的表现相当出色！甚至比 Claude 4.1 Opus 还要好，即使在实际使用中也令人印象深刻 "；更有海外个人开发者接入 API 进行了广泛测试，并在技术社区分享真实案例。

为 "AI+" 千行百业提供核心引擎

从 M2 深度优化的方向（编码和 Agent）不难看出，这次文本模型更新清晰地指向了 B 端市场和开发者生态。

对于国内市场而言，这一定位同样具有重大的行业意义。当前，中国正在大力推动数字经济发展，AI 与实体经济的深度融合是关键路径。"AI+" 赋能千行百业的背后，迫切需要一个强大的基础大模型作为核心引擎。M2 的出现，正是为这一进程提供了强大的技术底座。凭借其在代码生成、工具调用和深度搜索方面的卓越能力，M2 有望在国内金融、工业、医疗、教育、文化等众多行业的智能化转型中扮演关键角色。

例如，在金融行业，其强大的深度搜索（Deep Search）能力可用于更精准的研报分析和信息挖掘；在工业领域，其代理（Agentic）能力能够出色地规划执行复杂工具链，用于优化工厂生产流程和自动化运维；在软件开发领域，其专业的代码编程能力则快速化身为 " 超级程序员 " 。

为了加速这一规模化普及进程，MiniMax 同步带来两份大礼包：一是发布后两周内开放全球 API 接口免费调用；二是上线国内版 MiniMax Agent，它拥有 " 高效与 " 专业 " 双模式——前者适配轻量级对话、基础编码等场景，后者则针对全栈开发、专业 PPT 制作等复杂需求优化，实现不同场景下的高效化，同样，MiniMax Agent 在网页端与 app 限时免费，将普惠进行到底。

宙世代

一起剪

相关标签