【CNMO 科技消息】5 月 27 日,小米创办人雷军发文称,MiMo-V2.5 系列 API 永久降价;Token Plan 计费体系优化,用量提升至原来的 5-8 倍。推荐养龙虾、编程的朋友仔细看看。

Xiaomi MiMo
据 CNMO 科技了解,小米 MiMo-V2.5 系列 API 永久降价,相比原始 API 定价,新定价最高降幅可达 99%,且不再区分上下文窗口长度。本次调价于北京时间 5 月 27 日 0:00 正式生效,全球同步调整。Token Plan 计费体系优化,用量提升至原 5-8 倍,同时计费规则调整,更加清晰易懂。

此外,小米方面表示,无论当前套餐用量如何,所有已订阅 Token Plan 且当前仍在有效期的用户(包括参与百万亿 Token 创造者激励计划并获得 Token Plan 的用户,涵盖 Apache 软件基金会专属福利用户)的 Credits 额度将于北京时间 5 月 27 日 0:00 全量重置,并按新计费规则执行。针对 Token Plan 已过期的历史付费用户,小米也同样准备了惊喜好礼,将在未来一周宣布。

值得一提的是,本次价格调整背后,离不开小米技术团队在推理系统上的持续优化——将 KV Cache 在 GPU 显存、CPU 内存、SSD 等多级存储之间的数据搬运量降低至优化前的近 1/7,并将可缓存 token 数量提升至优化前的近 5 倍。同时,小米通过优化专家并行方案、输入长度分桶策略等,进一步提升了集群输入吞吐能力,从而在保障服务质量的前提下持续降低单位 token 服务成本。


登录后才可以发布评论哦
打开小程序可以发布评论哦