5 月 27 日一早,雷军在微博宣布,小米 MiMo-V2.5 系列做了一次大幅度的价格调整,最高降幅达到 99%,不再区分上下文窗口。

小米:MiMo-V2.5 系列 API 永久降价
对价格体系进行永久性翻新
@小米技术表示,过往几个月,通过 MiMo Orbit、百万亿 Token 创造者激励计划等活动,让更多人有机会体验 MiMo,并解决真实的问题——这是 MiMo 在规模化应用道路上的第一步。而现在,随着底层技术的不断精进,终于可以做一件更彻底的事——对整个模型价格体系进行一次永久性翻新。
MiMo-V2.5 系列 API 永久降价
相比原始 API 定价,新定价最高降幅可达 99%,且不再区分上下文窗口长度。

本次调价于北京时间 5 月 27 日 0:00 正式生效,全球同步调整。
Token Plan 计费体系优化
加量不加价,用量提升至原 5-8 倍,解锁更充沛的生产力。示例:在 Agent 或 Code 场景下,可用 Token 数量为:

计费规则调整,更加清晰易懂,所见即所得。

此外,无论当前套餐用量如何,所有已订阅 Token Plan 且当前仍在有效期的用户(包括参与百万亿 Token 创造者激励计划并获得 Token Plan 的用户,涵盖 Apache 软件基金会专属福利用户)的 Credits 额度将于北京时间 5 月 27 日 0 点全量重置,并按新计费规则执行。
小米技术表示,本次价格调整背后,离不开团队在推理系统上的持续优化。基于 SGLang HiCache 完整支持 SWA(Sliding Window Attention),将 KV Cache 在 GPU 显存、CPU 内存、SSD 等多级存储之间的数据搬运量降低至优化前的近 1/7,并将可缓存 token 数量提升至优化前的近5 倍,显著提升了缓存命中率和推理效率。
同时,通过优化专家并行方案、输入长度分桶策略等,进一步提升了集群输入吞吐能力,从而在保障服务质量的前提下持续降低单位 token 服务成本。后续将发布更加详细的推理优化技术 Blog。
雷军:未来三年
在 AI 领域投入 600 亿元
值得注意的是,就在 5 月 26 日晚,雷军在微博公布了小米集团一季度业绩:

营收 991 亿元,经调整净利润 61 亿元,全球月活超 7.46 亿,AIoT 平台连接设备数超 11 亿。智能电动汽车及 AI 等创新业务收入 199 亿元,当季新车交付 80856 台,490 家汽车销售门店。
研发投入 90 亿元,同比增长 33.4%,研发人员总数 26048 人,预计全年研发投入超 400 亿。
Xiaomi MiMo-V2.5-Pro 跻身 Artificial Analysis 榜单综合智能指数、Agent 指数全球开源模型并列第一,未来三年在 AI 领域投入 600 亿元。
来源 / 每日经济新闻、@雷军、@小米技术


登录后才可以发布评论哦
打开小程序可以发布评论哦