作者|李香香
编辑|叶映橙
5 月 27 日,小米旗下 MiMo 大模型团队公告称,对 V2.5 系列模型 API 进行永久性降价,最高降幅达 99%,不再区分上下文窗口长度。同时优化 Token Plan 计费体系,同等价格下用量提升至原来的 5-8 倍。随后雷军转发此消息做出同等内容回应。

小米技术官方微博表示,本次价格调整背后,离不开团队在推理系统上的持续优化。基于 SGLang HiCache 完整支持 SWA(Sliding Window Attention),将 KV Cache 在 GPU 显存、CPU 内存、SSD 等多级存储之间的数据搬运量降低至优化前的近 1/7,并将可缓存 token 数量提升至优化前的近 5 倍,显著提升了缓存命中率和推理效率。
降价消息前一天晚间,小米集团发布一季度业绩:营收 991 亿元,经调整净利润 61 亿元;智能电动汽车及 AI 等创新业务收入 199 亿元,当季新车交付 80856 辆;研发投入 90 亿元,同比增长 33.4%。雷军同时宣布,未来三年在 AI 领域投入 600 亿元,预计全年研发投入超 400 亿元。目前,MiMo-V2.5-Pro 已在 Artificial Analysis 榜单综合智能指数、Agent 指数上位列全球开源模型并列第一。


登录后才可以发布评论哦
打开小程序可以发布评论哦