小米大模型宣布永久降价，最高降幅99%

作者｜李香香

编辑｜叶映橙

5 月 27 日，小米旗下 MiMo 大模型团队公告称，对 V2.5 系列模型 API 进行永久性降价，最高降幅达 99%，不再区分上下文窗口长度。同时优化 Token Plan 计费体系，同等价格下用量提升至原来的 5-8 倍。随后雷军转发此消息做出同等内容回应。

小米技术官方微博表示，本次价格调整背后，离不开团队在推理系统上的持续优化。基于 SGLang HiCache 完整支持 SWA（Sliding Window Attention），将 KV Cache 在 GPU 显存、CPU 内存、SSD 等多级存储之间的数据搬运量降低至优化前的近 1/7，并将可缓存 token 数量提升至优化前的近 5 倍，显著提升了缓存命中率和推理效率。

降价消息前一天晚间，小米集团发布一季度业绩：营收 991 亿元，经调整净利润 61 亿元；智能电动汽车及 AI 等创新业务收入 199 亿元，当季新车交付 80856 辆；研发投入 90 亿元，同比增长 33.4%。雷军同时宣布，未来三年在 AI 领域投入 600 亿元，预计全年研发投入超 400 亿元。目前，MiMo-V2.5-Pro 已在 Artificial Analysis 榜单综合智能指数、Agent 指数上位列全球开源模型并列第一。

宙世代

一起剪

相关标签