国产模型霸榜OpenRouter token调用量暴增背后编程、智能体成决胜点

《科创板日报》2 月 24 日讯（编辑宋子乔） 春节期间国产大模型的使用情况可谓如火如荼。OpenRouter 最新周度数据显示，平台前十模型总 token 量约 8.7 万亿，中国模型独占 5.3 万亿，占比 61%。

当周 token 调用量前三模型均为国产大模型，分别为 Minimax M2.5、Kimi K2.5、GLM-5，调用量环比上周分别变动增加 197%、下降 20%、增加 158%。其中，MiniMax M2.5 以 2.45 万亿 token 空降榜首，Kimi K2.5 以 1.21 万亿紧随其后，智谱 GLM 5 和 DeepSeek V3.2 分列第三、第五。

OpenRouter 是全球最大的大模型 API 聚合平台，可为开发者提供统一 API 接口，以访问全球数百种大语言模型。其核心功能包括多模型调用、智能路由优化和透明的性能排行榜，旨在解决多模型集成复杂和厂商封锁问题。

从该平台提供的数据看，编程（Coding）和智能体（Agent）正成为大模型的两大核心比拼点。

OpenRouter 整体调用量近期大幅攀升。官方确认，M2.5 带动了 100K 至 1M 长文本区间的增量调用需求，这个区间正是智能体工作流的典型消耗场景。

论 token 调用量，在此平台排名前三的国产大模型都聚焦于提升编程能力和智能体（Agent）任务的自动化水平，是 2026 年初国产大模型在应用层面的重要突破。

稀宇科技（MiniMax）于 2 月 13 日发布 MiniMax M2.5，称该模型为全球首个为智能体场景原生设计的生产级旗舰模型。其发布后七天的调用量即突破 3.07T tokens，凭借在编程和 Agent 工作流中的卓越性能与极低的成本，成为开发者首选。

月之暗面（Moonshot AI）于 1 月 27 日发布 KimiK2.5，该模型采用原生多模态架构，能通过调度多达 100 个 "Agent 分身 " 并行工作，将复杂任务效率提升 3 到 10 倍。该模型在多个细分榜单（如编程、工具调用）中均排名第一，其调用量远超 Gemini 3 和 Claude 模型。据澎湃新闻报道，该大模型发布不到一个月，Kimi 近 20 天累计收入已超过 2025 年全年总收入，增长主要受全球付费用户及 API 调用量大涨共同推动，其中海外付费用户数快速增长。

智谱于 2 月 12 日发布 GLM-5，该模型参数规模进一步扩展，采用了稀疏注意力机制，是其专为复杂系统工程与长程 Agent 任务设计的旗舰模型。凭借免费、200K 上下文窗口等优势，该模型发布后用户迎来高速增长，智谱对 Coding Plan 先后进行了限售、涨价等动作，除夕当天官宣全网寻找 " 算力合伙人 "。

随着 AI 模型应用场景深化，用户从简单问答转向复杂工作流，如让模型重构代码、改写文件、生成文档等，以及智能体模式普及，当前 token 消耗呈现明显的 " 通胀 " 趋势。

性能提升的同时，国产模型仍以性价比优势出圈。如 MiniMax M2.5 和智谱 GLM-5 相比 Claude Opus 4.6 具备显著的成本优势：在输入环节，MiniMax M2.5 与 GLM-5 的价格均为 0.3 美元 / 百万 token，而 Claude Opus 4.6 则高达 5 美元 / 百万 token，是前两者的约 16.7 倍；在输出环节，MiniMax M2.5 的价格为 1.1 美元 / 百万 token，GLM-5 为 2.55 美元 / 百万 token，而 Claude Opus 4.6 的输出价格达 25 美元 / 百万 token，分别是 MiniMax M2.5 的约 22.7 倍和 GLM-5 的约 9.8 倍。

上述国产模型并不能完全反映国内模型厂商的 token 调用量情况。据海通国际证券，数据显示，火山引擎的大模型日均 token 调用量已从 2024 年底的 2 万亿增长至 2025 年底的 63 万亿；阿里云外部客户 2025 年日均 token 调用也已接近 5 万亿，2026 年目标至少 15-20 万亿，内部业务日均调用则计划从 16-17 万亿拉到 100 万亿。从全行业看，中国整体日均 token 消耗 2024 年初为 1000 亿，2025 年中突破 30 万亿，2026 年 2 月主流大模型合计日均 token 消耗已到 180 万亿级别。

东莞证券最新研报表示，随着国产模型的编程、智能体能力提升，其调用量大幅增加，国产大模型在编程、智能体领域对标全球头部模型，有望进一步加快应用落地，加速 token 消耗量上涨。

长江证券此前表示，随着编程和多模态模型和产品的逐步成熟，下游应用场景有望被真正打开，带来大量的高质量 token 需求。参照海外 AI 产业发展规律，从资本开支投入到 token 需求爆发存在约两年的滞后期。国内大厂的 AI 资本开支周期较海外滞后约一年，于 2024 年下半年开启。因此，国内云厂商收入已开始兑现增长，而 token 数量的真正爆发预计将在 2026 年到来。

宙世代

一起剪

相关标签