
国内大模型赛道再迎重磅玩家。记者刚刚从国内 AI 独角兽公司稀宇极智(MiniMax)获悉,该公司发布并开源的新一代文本大模型 MiniMax-M2 在全球权威测评榜单 Artificial Analysis (AA)中总分位列全球前五、开源第一,跻身全球第一梯队,与 OpenAI、Anthropic、Google 等硅谷巨头同台竞技。值得一提的是,这个成绩是在 M2 价格仅为 Claude Sonnet 4.5 的 8% 的基础上实现的,并且相较后者推理速度快了接近一倍。这意味着,中国 AI 企业正以 " 高智能 + 低成本 " 的新组合,向全球 AI 格局发起正面冲击。
中国首个开源跻身全球前五的大模型
根据 Artificial Analysis 最新榜单,MiniMax M2 在编码、指令遵循和智能体(Agent)等核心任务上全面进入全球前列。顶级代码能力:专为端到端开发工作流打造,在 Claude Code、Cursor、Cline、Kilo Code、Droid 等多种应用中表现卓越;强大 Agentic 表现:出色规划并稳定执行复杂长链条工具调用任务,协同调用 Shell、Browser、Python 代码执行器和各种 MCP 工具;极致性价比 & 速度:通过高效的激活参数设计,实现智能、速度与成本的最佳平衡。
顶级性能的 " 平价 " 模型掀起算力成本革命
OpenRouter 作为全球最具影响力的 AI 模型聚合与调用平台之一,其数据源于真实开发者的使用行为,极具代表性和权威性。M2 在其平台上线不到两天,模型调用量已跻身全球前 10。

M2 仅有 10B 激活参数(总参 230B)的轻量级模型,在保持卓越性能的同时,实现了更低的延迟与成本,以及更高的吞吐效率,完美契合了新兴多智能体工作流对高效协同与快速响应的需求。M2 综合成本 API 价格定在每百万 Token 输入 0.3 美金 /2.1 元人民币,以及输出 1.2 美金 /8.4 元,同时在线上提供 TPS(每秒输出 Token 数)在 100 左右的推理服务(还在快速提升)。 这个价格是 Claude Sonnet 4.5 的 8%,而推理速度快了接近一倍,在大规模调用中保持高效响应。
极致的智能水平、响应延迟与成本效率体验,让海外的 AI 开发者给予中国开源模型一致好评。知名平台 LMarena 第一时间发 X,向开发者推荐 M2 模型测试; Reddit 社区技术大 V 在基准测试中运行了 MiniMax M2," 它获得了 58.3% 的分数,这算是相当不错的表现 ";CoreViewHQ 联合创始人兼 CTO Ivan Fioravant 表示,"MiniMax-M2 的表现相当出色!甚至比 Claude 4.1 Opus 还要好,即使在实际使用中也令人印象深刻 ";更有海外个人开发者接入 API 进行了广泛测试,并在技术社区分享真实案例。
为 "AI+" 千行百业提供核心引擎
从 M2 深度优化的方向(编码和 Agent)不难看出,这次文本模型更新清晰地指向了 B 端市场和开发者生态。
对于国内市场而言,这一定位同样具有重大的行业意义。当前,中国正在大力推动数字经济发展,AI 与实体经济的深度融合是关键路径。"AI+" 赋能千行百业的背后,迫切需要一个强大的基础大模型作为核心引擎。M2 的出现,正是为这一进程提供了强大的技术底座。凭借其在代码生成、工具调用和深度搜索方面的卓越能力,M2 有望在国内金融、工业、医疗、教育、文化等众多行业的智能化转型中扮演关键角色 。

例如,在金融行业,其强大的深度搜索(Deep Search)能力可用于更精准的研报分析和信息挖掘;在工业领域,其代理(Agentic)能力能够出色地规划执行复杂工具链,用于优化工厂生产流程和自动化运维;在软件开发领域,其专业的代码编程能力则快速化身为 " 超级程序员 " 。
为了加速这一规模化普及进程,MiniMax 同步带来两份大礼包:一是发布后两周内开放全球 API 接口免费调用;二是上线国内版 MiniMax Agent,它拥有 " 高效与 " 专业 " 双模式——前者适配轻量级对话、基础编码等场景,后者则针对全栈开发、专业 PPT 制作等复杂需求优化,实现不同场景下的高效化,同样,MiniMax Agent 在网页端与 app 限时免费,将普惠进行到底。


登录后才可以发布评论哦
打开小程序可以发布评论哦