科创板日报 02-24
国产模型霸榜OpenRouter token调用量暴增背后 编程、智能体成决胜点
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

《科创板日报》2 月 24 日讯(编辑 宋子乔) 春节期间国产大模型的使用情况可谓如火如荼。OpenRouter 最新周度数据显示,平台前十模型总 token 量约 8.7 万亿,中国模型独占 5.3 万亿,占比 61%

当周 token 调用量前三模型均为国产大模型,分别为 Minimax M2.5、Kimi K2.5、GLM-5,调用量环比上周分别变动增加 197%、下降 20%、增加 158%。其中,MiniMax M2.5 以 2.45 万亿 token 空降榜首,Kimi K2.5 以 1.21 万亿紧随其后,智谱 GLM 5 和 DeepSeek V3.2 分列第三、第五。

OpenRouter 是全球最大的大模型 API 聚合平台,可为开发者提供统一 API 接口,以访问全球数百种大语言模型。其核心功能包括多模型调用、智能路由优化和透明的性能排行榜,旨在解决多模型集成复杂和厂商封锁问题。

从该平台提供的数据看,编程(Coding)和智能体(Agent)正成为大模型的两大核心比拼点。

OpenRouter 整体调用量近期大幅攀升。官方确认,M2.5 带动了 100K 至 1M 长文本区间的增量调用需求,这个区间正是智能体工作流的典型消耗场景。

论 token 调用量,在此平台排名前三的国产大模型都聚焦于提升编程能力和智能体(Agent)任务的自动化水平,是 2026 年初国产大模型在应用层面的重要突破。

稀宇科技(MiniMax)于 2 月 13 日发布 MiniMax M2.5,称该模型为全球首个为智能体场景原生设计的生产级旗舰模型。其发布后七天的调用量即突破 3.07T tokens,凭借在编程和 Agent 工作流中的卓越性能与极低的成本,成为开发者首选。

月之暗面(Moonshot AI)于 1 月 27 日发布 KimiK2.5,该模型采用原生多模态架构,能通过调度多达 100 个 "Agent 分身 " 并行工作,将复杂任务效率提升 3 到 10 倍。该模型在多个细分榜单(如编程、工具调用)中均排名第一,其调用量远超 Gemini 3 和 Claude 模型。据澎湃新闻报道,该大模型发布不到一个月,Kimi 近 20 天累计收入已超过 2025 年全年总收入,增长主要受全球付费用户及 API 调用量大涨共同推动,其中海外付费用户数快速增长。

智谱于 2 月 12 日发布 GLM-5,该模型参数规模进一步扩展,采用了稀疏注意力机制,是其专为复杂系统工程与长程 Agent 任务设计的旗舰模型。凭借免费、200K 上下文窗口等优势,该模型发布后用户迎来高速增长,智谱对 Coding Plan 先后进行了限售、涨价等动作,除夕当天官宣全网寻找 " 算力合伙人 "。

随着 AI 模型应用场景深化,用户从简单问答转向复杂工作流,如让模型重构代码、改写文件、生成文档等,以及智能体模式普及,当前 token 消耗呈现明显的 " 通胀 " 趋势。

性能提升的同时,国产模型仍以性价比优势出圈。如 MiniMax M2.5 和智谱 GLM-5 相比 Claude Opus 4.6 具备显著的成本优势:在输入环节,MiniMax M2.5 与 GLM-5 的价格均为 0.3 美元 / 百万 token,而 Claude Opus 4.6 则高达 5 美元 / 百万 token,是前两者的约 16.7 倍;在输出环节,MiniMax M2.5 的价格为 1.1 美元 / 百万 token,GLM-5 为 2.55 美元 / 百万 token,而 Claude Opus 4.6 的输出价格达 25 美元 / 百万 token,分别是 MiniMax M2.5 的约 22.7 倍和 GLM-5 的约 9.8 倍。

上述国产模型并不能完全反映国内模型厂商的 token 调用量情况。据海通国际证券,数据显示,火山引擎的大模型日均 token 调用量已从 2024 年底的 2 万亿增长至 2025 年底的 63 万亿;阿里云外部客户 2025 年日均 token 调用也已接近 5 万亿,2026 年目标至少 15-20 万亿,内部业务日均调用则计划从 16-17 万亿拉到 100 万亿。从全行业看,中国整体日均 token 消耗 2024 年初为 1000 亿,2025 年中突破 30 万亿,2026 年 2 月主流大模型合计日均 token 消耗已到 180 万亿级别。

东莞证券最新研报表示,随着国产模型的编程、智能体能力提升,其调用量大幅增加,国产大模型在编程、智能体领域对标全球头部模型,有望进一步加快应用落地,加速 token 消耗量上涨。

长江证券此前表示,随着编程和多模态模型和产品的逐步成熟,下游应用场景有望被真正打开,带来大量的高质量 token 需求。参照海外 AI 产业发展规律,从资本开支投入到 token 需求爆发存在约两年的滞后期。国内大厂的 AI 资本开支周期较海外滞后约一年,于 2024 年下半年开启。因此,国内云厂商收入已开始兑现增长,而 token 数量的真正爆发预计将在 2026 年到来。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

kimi ai 编程 春节 科创板
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论