21世纪经济报道 6小时前
小米大模型宣布永久降价,最高降幅99%
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

作者|李香香

编辑|叶映橙

5 月 27 日,小米旗下 MiMo 大模型团队公告称,对 V2.5 系列模型 API 进行永久性降价,最高降幅达 99%,不再区分上下文窗口长度。同时优化 Token Plan 计费体系,同等价格下用量提升至原来的 5-8 倍。随后雷军转发此消息做出同等内容回应。

小米技术官方微博表示,本次价格调整背后,离不开团队在推理系统上的持续优化。基于 SGLang HiCache 完整支持 SWA(Sliding Window Attention),将 KV Cache 在 GPU 显存、CPU 内存、SSD 等多级存储之间的数据搬运量降低至优化前的近 1/7,并将可缓存 token 数量提升至优化前的近 5 倍,显著提升了缓存命中率和推理效率。

降价消息前一天晚间,小米集团发布一季度业绩:营收 991 亿元,经调整净利润 61 亿元;智能电动汽车及 AI 等创新业务收入 199 亿元,当季新车交付 80856 辆;研发投入 90 亿元,同比增长 33.4%。雷军同时宣布,未来三年在 AI 领域投入 600 亿元,预计全年研发投入超 400 亿元。目前,MiMo-V2.5-Pro 已在 Artificial Analysis 榜单综合智能指数、Agent 指数上位列全球开源模型并列第一。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

小米 雷军 ai 命中率 香香
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论