夏至未至,大模型行业的价格战已经打到了白热化的程度。
过去一年,企业级大模型的 Token 调用成本暴跌了 67%,开源模型拿下了企业 Token 调用量 38% 的份额。
就在一周前,DeepSeek 扔下一颗深水炸弹—— V4-Pro 模型的 API 从临时打折变成永久降价,百万 Token 的输入缓存命中价格压到 0.025 元,网友戏称 " 收了个电费 "。
当行业还没缓过神的时候,5 月 27 日凌晨,小米突然宣布 MiMo-V2.5 系列 API 永久降价,最高降幅高达 99%,且不再区分上下文窗口长度。
短短几天时间,两条重磅消息把大模型赛道的价格锚点彻底打穿了。
MiMo 亮剑,深夜降价
先说这次降价本身。
小米技术官方公告显示,MiMo-V2.5-Pro 的输入缓存命中价格调整后仅为 0.025 元 / 百万 tokens,相比原来 256k 规格的 1.40 元降了 98%,对比长窗口的 2.80 元达到了 99% 的降幅。
标准版 MiMo-V2.5 也不含糊,输入缓存命中价格降到 0.020 元,较原价最高降了 98%。
●图源:小米技术
也就是说,过去调用一次大模型的成本,现在能调用几十次甚至上百次。对此小米技术官方表示,这是一次对整个模型价格体系进行永久性翻新。
与此同时,TokenPlan 计费体系也得到了优化。
此前不少开发者吐槽套餐价格偏贵、Token 不够用,这次小米给出了 " 加量不加价 " 的方案:
同等付费价格下,可用 Token 数量提升到原来的 5-8 倍,计费规则简化为:不再区分上下文窗口长度,所见即所得。
此外,所有当前有效的 TokenPlan 用户额度在 5 月 27 日零点全部重置,按新规则执行,已经过期的历史付费用户据说也有惊喜。
小米此次降价并非单纯的低价竞争,背后是技术底座的持续迭代。
小米技术团队基于 SGLangHiCache 完整支持了 SWA,将 KVCache 在多级存储之间的数据搬运量降到优化前的近 1/7,可缓存 Token 数量提升近 5 倍,同时通过专家并行方案、输入长度分桶策略等优化,持续降低了单位 Token 服务成本。
目前 MiMo-V2.5 系列,已经覆盖商用普惠市场的主要场景。
可能很多人对 Xiaomi MiMo 的印象,还停留在 " 小米也做了个模型 " 上。
但实际上,Xiaomi MiMo-V2.5-Pro 在 Artificial Analysis 榜单上综合智能指数和 Agent 指数均位列全球开源模型并列第一,跻身全球所有大模型总榜前五,与 Claude Opus 4.6、GPT-5.4 等闭源旗舰比肩。
同一时期,MiMo-V2-Pro 以超过 30% 的市占率登顶 OpenRouter 平台周榜第一,周调用量达到 4.82 万亿 Token。
从追赶者到领跑者,小米 AI 只用了一年多的时间。
六百亿豪赌,雷军下注了
就在降价消息炸开的前一晚,5 月 26 日,小米发布了 2026 年第一季度财报。
核心数据显示:总营收 991 亿元,经调整净利润 61 亿元,研发投入 90 亿元同比增长 33.4%,研发人员总数突破 2.6 万人,硬核科技投入力度可见一斑。
财报明确提到,Xiaomi MiMo-V2.5-Pro 已跻身全球开源模型双料第一,MiMo 大模型助力 HermesAgent 登顶全球调用量榜首,成为第一贡献模型。
雷军明确对外表态:未来三年,小米在 AI 领域的投入将超过 600 亿元,今年至少 160 亿元。
●图源:小米
据悉,小米 2025 年全年总收入 4573 亿元,净利润不到 300 亿。这意味着小米未来三年要在 AI 上烧掉两年多的利润。
即便当年 all in 造车时,雷军也才说十年投入 100 亿美元,而 AI 的三年投入,年均超过 200 亿,力度之大前所未有。
小米 AI 业务的快速崛起,离不开核心人才的加持。
此前 95 后顶尖 AI 技术人才罗福莉加盟小米,曾在业内引发不小震动,传闻雷军以千万年薪力邀其加入。
在她的统筹下,MiMo 从 V2 系列一路迭代到 V2.5 系列,4 月 23 日更是一口气官宣了四款新模型,时隔上一代发布仅 36 天。
如今,小米 MiMo 研发团队平均年龄仅 25 岁,清北毕业生占比超六成,年轻且顶尖的人才阵容为模型快速迭代提供了核心动力。
而罗福莉本人曾在多个公开场合表达过对 AI 前景的大胆判断,她认为大模型完全可能 " 自己左脚踩右脚提升 ",甚至预言 AGI 将在两年内到来。这样的技术野心,显然需要真金白银来支撑。
预计小米全年研发投入将超过 400 亿元,而其中相当大的一部分会花在 AI 上。
在 AI 加速重构 " 人车家全生态 " 的战略下,小米正把大模型能力注入手机、汽车、IoT 全场景,从跨端 AI Agent 到车载语音助手,从智能家居到工业质检,每一块都在铺 AI 的底座。
汽车盈转亏,雷军慌不
如果说大模型降价是小米在进攻,那么 Q1 财报的另一面则揭露了这家公司正在承受的压力。
财报显示,小米集团总营收同比下滑 10.9% 至 991.42 亿元,经调整净利润 60.72 亿元,同比大跌 43.1%,毛利同比下降 14.2%,经营利润更是从去年同期的 131.3 亿元骤降至 53.1 亿元。
●图源:小米集团
可以看到,各条业务线的冷热分化非常明显。
手机 × AIoT 分部收入 792.8 亿元,同比下滑 14.5%;智能手机出货量 3380 万台,同比下降 19.2%。
但手机的平均售价却逆势涨到了 1310 元,创下历史新高,中国大陆高端智能手机销量占比也达到了 23.5%。
这说明小米在主动收缩中低端机型、向高端要利润。
IoT 业务相对稳健,毛利率达到了 25.2% 的历史高位,境外 IoT 收入创下新高。但外界最关心的还是汽车。
一季度智能电动汽车及 AI 等创新业务收入 198.6 亿元,营收占比飙升至 20%,已正式成为小米的第二大业务支柱。
当季交付 80,856 辆新车,在行业淡季和产品切换的双重压力下实现了同比增长 6.6%。
然而,由于巨大的工厂折旧、产能爬坡和前瞻研发投入,汽车业务一季度净经营亏损达到了 31.3 亿元,在连续两个季度盈利之后,再度转亏。
怎么理解这个数字?
放眼同级新势力,一季度零跑以 11.02 万辆登顶销冠,理想以 9.51 万辆稳居第二,蔚来交付 8.35 万辆,小米以 7.86 万辆排名第四。
●图源:中汽数研
但零跑背后是五个以上的产品线在同时跑量,理想也是 L 系列加纯电五六个系列打天下,蔚来更是主品牌叠加乐道、萤火虫超过六个系列。
而小米就 SU7 和 YU7 两个系列。论每款车型的平均贡献效率,小米甩开所有对手不止一个身位;论产品线单一带来的结构性风险,小米同样甩开了所有对手不止一个身位。
一季度小米汽车的处境很微妙。老 SU7 已经停产,交付全靠 YU7 系列扛着;新一代 SU7 虽然在 3 月下旬开启交付后,4 月单月卖了 26826 辆、占当月总销量的 73%,但 YU7 在 4 月的零售量已从年初巅峰的 3.7 万辆回落至 9876 辆。
两款车的此消彼长,像极了青黄不接的过渡期。
●图注:YU7 与 Model Y 销量对比,八败两胜
但从财报电话会上释放的信号来看,雷军并不慌张。
小米 CFO 林世伟在会上透露,董事会已启动总额不超过 200 亿港元的股份回购计划,截至披露时小米 2026 年累计回购已超过 80 亿港元,回购力度位居港股第二。
真金白银回购股票,确实比任何口头表态都更有说服力。更何况小米汽车的毛利率一季度达到了 20.1%,放在整车行业已经是一个相当拿得出手的工业化起点,单车均价 23.5 万元也在行业中处于第一梯队。
管理层在电话会上坦言,亏损主要来自跨年订单的购置税补贴、SU7 Ultra 高端车型交付占比下降、以及核心零部件价格上涨的三重叠加,属于阶段性因素而非结构性问题。
价格战打到头,然后呢
随着 DeepSeek 和小米前后降价,一个清晰的信号浮出了水面:大模型 API 正在从高毛利的收费入口,变成基础设施级别的水电煤。
梁文锋此前说过一句话,公司的定价哲学很简单:核算成本后定价,不贴钱,也不赚暴利,AI 应该是普惠的、人人用得起的。
此次小米的降价幅度比 DeepSeek 更猛,背后是同样的逻辑:技术的价值,最终要体现在被使用的广度上。
降价不意味着不赚钱。当调用成本降到足够低,下游的应用生态才会真正爆发。
Agent 开发、代码辅助、智能客服、语音交互 ...... 这些场景的商业化,靠的不是高价卖 Token,而是海量调用带来的规模效应。
小米的算盘很清楚:用降价把开发者拉进自己的生态,用生态的繁荣反哺模型迭代,再用模型能力的领先守住定价的话语权。
而相比于雷军的豪赌最终能否让小米在 AI 时代站稳脚跟,开发者们可能更关心下一个降价的会是谁。
* 编排 | 黄家俊 审核 | 黄家俊
行业资讯、案例资料、运营干货,精彩不停
扫码加入高质量群 ↓↓↓【备注:进群】
2000 万品牌经理人内参!
聚焦头部与标杆,助力品牌高端化。
品牌专访微信:jiangnan254(备注:专访)
百万品牌经理人都在看 ↓↓↓


登录后才可以发布评论哦
打开小程序可以发布评论哦