《科创板日报》2 月 24 日讯(编辑 宋子乔) 春节期间国产大模型的使用情况可谓如火如荼。OpenRouter 最新周度数据显示,平台前十模型总 token 量约 8.7 万亿,中国模型独占 5.3 万亿,占比 61%。
当周 token 调用量前三模型均为国产大模型,分别为 Minimax M2.5、Kimi K2.5、GLM-5,调用量环比上周分别变动增加 197%、下降 20%、增加 158%。其中,MiniMax M2.5 以 2.45 万亿 token 空降榜首,Kimi K2.5 以 1.21 万亿紧随其后,智谱 GLM 5 和 DeepSeek V3.2 分列第三、第五。
OpenRouter 是全球最大的大模型 API 聚合平台,可为开发者提供统一 API 接口,以访问全球数百种大语言模型。其核心功能包括多模型调用、智能路由优化和透明的性能排行榜,旨在解决多模型集成复杂和厂商封锁问题。
从该平台提供的数据看,编程(Coding)和智能体(Agent)正成为大模型的两大核心比拼点。
OpenRouter 整体调用量近期大幅攀升。官方确认,M2.5 带动了 100K 至 1M 长文本区间的增量调用需求,这个区间正是智能体工作流的典型消耗场景。
论 token 调用量,在此平台排名前三的国产大模型都聚焦于提升编程能力和智能体(Agent)任务的自动化水平,是 2026 年初国产大模型在应用层面的重要突破。
稀宇科技(MiniMax)于 2 月 13 日发布 MiniMax M2.5,称该模型为全球首个为智能体场景原生设计的生产级旗舰模型。其发布后七天的调用量即突破 3.07T tokens,凭借在编程和 Agent 工作流中的卓越性能与极低的成本,成为开发者首选。
月之暗面(Moonshot AI)于 1 月 27 日发布 KimiK2.5,该模型采用原生多模态架构,能通过调度多达 100 个 "Agent 分身 " 并行工作,将复杂任务效率提升 3 到 10 倍。该模型在多个细分榜单(如编程、工具调用)中均排名第一,其调用量远超 Gemini 3 和 Claude 模型。据澎湃新闻报道,该大模型发布不到一个月,Kimi 近 20 天累计收入已超过 2025 年全年总收入,增长主要受全球付费用户及 API 调用量大涨共同推动,其中海外付费用户数快速增长。
智谱于 2 月 12 日发布 GLM-5,该模型参数规模进一步扩展,采用了稀疏注意力机制,是其专为复杂系统工程与长程 Agent 任务设计的旗舰模型。凭借免费、200K 上下文窗口等优势,该模型发布后用户迎来高速增长,智谱对 Coding Plan 先后进行了限售、涨价等动作,除夕当天官宣全网寻找 " 算力合伙人 "。
随着 AI 模型应用场景深化,用户从简单问答转向复杂工作流,如让模型重构代码、改写文件、生成文档等,以及智能体模式普及,当前 token 消耗呈现明显的 " 通胀 " 趋势。
性能提升的同时,国产模型仍以性价比优势出圈。如 MiniMax M2.5 和智谱 GLM-5 相比 Claude Opus 4.6 具备显著的成本优势:在输入环节,MiniMax M2.5 与 GLM-5 的价格均为 0.3 美元 / 百万 token,而 Claude Opus 4.6 则高达 5 美元 / 百万 token,是前两者的约 16.7 倍;在输出环节,MiniMax M2.5 的价格为 1.1 美元 / 百万 token,GLM-5 为 2.55 美元 / 百万 token,而 Claude Opus 4.6 的输出价格达 25 美元 / 百万 token,分别是 MiniMax M2.5 的约 22.7 倍和 GLM-5 的约 9.8 倍。
上述国产模型并不能完全反映国内模型厂商的 token 调用量情况。据海通国际证券,数据显示,火山引擎的大模型日均 token 调用量已从 2024 年底的 2 万亿增长至 2025 年底的 63 万亿;阿里云外部客户 2025 年日均 token 调用也已接近 5 万亿,2026 年目标至少 15-20 万亿,内部业务日均调用则计划从 16-17 万亿拉到 100 万亿。从全行业看,中国整体日均 token 消耗 2024 年初为 1000 亿,2025 年中突破 30 万亿,2026 年 2 月主流大模型合计日均 token 消耗已到 180 万亿级别。
东莞证券最新研报表示,随着国产模型的编程、智能体能力提升,其调用量大幅增加,国产大模型在编程、智能体领域对标全球头部模型,有望进一步加快应用落地,加速 token 消耗量上涨。
长江证券此前表示,随着编程和多模态模型和产品的逐步成熟,下游应用场景有望被真正打开,带来大量的高质量 token 需求。参照海外 AI 产业发展规律,从资本开支投入到 token 需求爆发存在约两年的滞后期。国内大厂的 AI 资本开支周期较海外滞后约一年,于 2024 年下半年开启。因此,国内云厂商收入已开始兑现增长,而 token 数量的真正爆发预计将在 2026 年到来。


登录后才可以发布评论哦
打开小程序可以发布评论哦