钛媒体 11小时前
小米大模型再亮剑,底层逻辑为何变了?
index.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

文 | 时间线 Timelines,作者 | 赵明,编辑 | 周易

「我相信,真正的智能绝对不是在文本中读出来的,而是在交互中活出来的」。

2025 年 12 月 17 日,在今年度的小米「人车家全生态」合作伙伴大会上,小米宣布自研 AI 大模型 Xiaomi MiMo-V2-Flash 正式开源上线——而 Xiaomi MiMo 大模型负责人罗福莉也首次正式亮相,谈到了她对于 AI 的理解。

在演讲中,罗福莉多次表达了「物理世界导向」对于 AGI 实现的重要性。

她表示,多模态和真实世界交互才是通往 AGI 的关键,而非依靠文本。在她现场展示的 PPT 中,小米刚刚开源的大模型 Xiaomi MiMo-V2-Flash 也就此做出解读:真正的智能必须是一个具身的、嵌入环境的、通过与物理世界持续交互而涌现的属性。

某种程度上,罗福莉的这次演讲,代表了小米对于大模型和 AGI 的思考,以及小米在 AI 道路上的核心理念:与数字世界 AI 相比,更加强调物理世界的 AI 重要性。

很明显,以罗福莉的入职和亮相为代表,小米确实正在 AI 人才和大模型领域加大投入,而 AI 本身也是小米整体技术研发投入的三大核心板块之一。

那么,小米 AI 这一波,到底行不行?

95 后罗福莉,首次交卷了

从外界的视角来看,2025 小米「人车家全生态」合作伙伴大会的最大看点,其实是小米 MiMo 大模型负责人罗福莉的演讲。

这要从罗福莉本人在 AI 领域的关注度说起。

公开数据显示,罗福莉是一名 95 后,她本科毕业于北京师范大学,硕士毕业于北京大学计算语言学研究所,师从万小军教授。罗福莉在北京大学攻读硕士期间,就曾经在人工智能领域顶级国际会议 ACL 上发表 8 篇论文,其硕士期间在国际级会议上累计发表论文超过 20 篇。

从职业生涯来看,罗福莉毕业后加入阿里达摩院,担任机器智能实验室研究员,主导开发多语言预训练模型 VECO,并推动了 AliceMind 项目的开源工作。随后在 2022 年,罗福莉加入 DeepSeek 母公司幻方量化,并且以深度学习研究员的角色参与研发 DeepSeek-V2 等模型。

而在 DeepSeek 的经历,成为了罗福莉备受关注的核心支点。

2024 年 12 月,第一财经新皮层报道,DeepSeek-V2 的关键开发者之一罗福莉将加入小米——根据知情人士的说法,雷军认为小米在大模型领域发力太晚,于是亲自挖人,重金招募能够领军小米大模型的人才,支付的薪酬水平在千万元级别。

在当时的舆论场中,,类似于「雷军千万年薪挖角 95 后 AI 天才少女」这样的词条也登上热搜。

不过,一直到 2025 年 11 月 12 日,罗福莉才通过社交媒体对外确认,自己正在 Xiaomi Mimo 团队做 AGI 相关工作——此番在小米「人车家全生态」合作伙伴大会登台,也是罗福莉在小米的第一次公开亮相。

在会上,罗福莉主要介绍了 Xiaomi MiMo-V2-Flash 大模型的一些内容。

她表示,Xiaomi MiMo-V2-Flash 是一个非常小的模型,总参数只有 309B,激活参数只有 15B,但它在多数评测中超过了参数量更大的 DeepSeek V3.2 和 K2-Thinking,在全球大致处于相同水位的顶尖模型速度和成本象限里,MiMo-V2-Flash 实现了低成本、高速度,已初步具备模拟世界的能力。

其中,在技术层面,MiMo-V2-Flash 采用 3 层 MTP 推理加速并行 Token 验证,实现了 2.0-2.6 倍的推理速度提升。这种效率优势对于实际应用场景至关重要,特别是在资源受限的边缘设备上。

「我都不愿意称它是一个非常大的模型,但是它的代码能力,在我来看它已经进入了全球 top 2」,罗福莉表示。

值得一提的是,Xiaomi MiMo-V2-Flash 已经正式开源,采用了对开发者友好的 MIT 开源协议,基础版权重已经在 Hugging Face 上发布,支持深度思考和联网搜索功能。

关于 Xiaomi MiMo-V2-Flash ,卢伟冰表示,它是迈向 Agent 时代的全新语言基座。

不过,从商业的角度来看,MiMo-V2-Flash 作为 小米 MIMo 大模型家族的最新成果,其本质上也是为了小米的「人车家全生态」而服务。

实际上,罗福莉也表示,通过统一多模态感知能力,MiMo 能够为理解物理世界打下基础,从而更好地嵌入各种智能终端设备。这包括智能手机、智能汽车、智能家居设备等,形成一个无缝衔接的智能生态系统。

换句话说,MiMo 大模型将成为小米用来连接「人车家」三端的「智能大脑」。

大模型之路,已悄然转折

小米入局大模型的时间,其实非常早。

早在 2023 年 8 月,在雷军的年度演讲中,这位小米掌门人就表示,小米全面拥抱大模型,并且在 2023 年 4 月组建小米了 AI 大模型团队——据了解,该团队的负责人是小米技术委员会 AI 实验室大模型团队负责人栾剑。

当时,雷军表示,小米大模型技术的主力突破方向是「轻量化」和「本地部署」;他还表示,小米自研的 13 亿参数端侧模型已经在手机端跑通了 Demo,而且部分场景效果可以媲美 60 亿模型在云端的运算效果。

值得一提的是,在这次演讲之前,小米公司开发的大规模预训练语言模型 MiLM-6B/1.3B 就登陆了代码托管平台 GitHub,参数规模最高达 64 亿,而且现身在 C-Eval、CMMLU 基准评测榜单。

可以说,MiLM 在很长一段时间里都是小米大模型的代名词。

2024 年 5 月,小米公司宣布其大语言模型 MiLM 已正式通过大模型备案。当时,小米官方强调,小米大模型将逐步应用于小米汽车、手机、智能家居等产品中,为用户带来更加智能化的体验。

到 2024 年 11 月,小米宣布 MiLM 升级至二代 MiLM2,丰富了模型的参数矩阵,参数规模同时向下和向上扩充,实现了云边端结合,参数尺寸最小为 0.3B,最大为 30B,其中 MiLM2-30B 模型专门为云端设计;同时,新模型在指令跟随、翻译和闲聊等一系列能力上平均提升超 45% ……

当时,小米官方也表示,小米第二代自研大模型取得的进步和成果,已经开始渗透到真实的业务场景与用户需求中,不仅帮助集团内部解决了多样化的业务需求、实现工作提效,也已经在澎湃 OS、小爱同学、智能座舱、智能客服中开始应用落地。

不过,也正是在这个时间节点,小米的大模型之路,开始进入转折点。

实际上,据第一财经「新皮层」报道,正是在 2024 年年底,雷军挖来了罗福莉。以罗福莉的正式入职为节点,小米自研大模型的重心开始逐步切换,而小米则在 2025 年年初组建了「大模型 Core」团队,并且在 4 月份发布了小米 MiMo 系列的首个模型,也就是 MiMo-7B。

实际上,在此次发布 Xiaomi MiMo-V2-Flash 之前,小米就已经以 MiMo 的名义推出了一系列模型,包括推理大模型 MiMo-7B、视觉推理大模型 MiMo-VL、原生端到端音频生成模型 MiMo-Audio、端侧视觉语言大模型 MiMo-VL-Miloco、具身大模型 MiMo-Embodied。

对此,一位长期关注小米的 AI 行业人士告诉我们,小米在大模型领域的核心支点,已经从以往的以往的 MiLM 悄然转向为如今的 MiMo。

那么,小米 MiMo 下一步会如何发展?

对此,罗福莉其实也已经表态——她表示,下一代基座模型将会重点关注模型参数规模的增大与上下文长度的扩展;模型将是原生多模态的,意味着要用文本、视觉、音频原生融合的统一架构实现端到端的物理世界感知与推理。另外,算法与底层硬件相结合,提升训练与推理效率。

可见,小米 MiMo 不仅仅是要解决数字 AI 的问题,也要在很大程度上解决物理 AI 领域的难题,这确实是一个不小的目标。

加码补课技术,但依旧务实

小米对于 AI 和大模型的态度转变,本质上是伴随着其业务发展而产生的。

比如,2023 年上半年,随着 ChatGPT 的横空出世,国内掀起了一波大模型竞赛,当时小米表示不会做 OpenAI 类的大模型,但会积极拥抱 AI,将其与自身业务深度结合。这背后的背景是,小米当时还是把 AI 落地的重点场景考虑在智能手机上。

但如今,随着小米汽车业务的迅猛发展和小米「人车家全生态」的逐步成熟,小米对于 AI 落地场景的理解更加全面,对于大模型的重要性有了不一样的感知。

这才是小米通过自研 MiMO 持续加码 AI 的核心逻辑。

不过,即使是大模型,小米投入到 AI 大模型的逻辑,与腾讯、阿里、字节等互联网巨头在 AI 领域的布局,还是有着明显的不同。

毕竟,小米不是一家纯粹的软件公司或互联网公司,它本质上是全球最大的消费电子物联网公司之一。根据小米公布的数据,小米全球月活用户数达到 7.42 亿;硬件生态方面,小米 AIoT 平台连接设备数达到 10.4 亿,硬件合作伙伴数量突破 15000 家。

所以,小米   MiMo 大模型的终极落地场景,就是在万物互联的端侧设备上,包括手机,也包括汽车。

基于此,我们也能够理解,MiMo-V2-Flash 模型的特质在于,它是一款端云结合、侧重端侧的轻量化大模型;它的核心逻辑是端侧优先,其目的把一个更小参数量的模型,通过极致的蒸馏和量化,实现本地化部署,直接塞进小米手机或者小米汽车的车机里。

这在本质上,也是 MiMo-V2-Flash 的命名包含有「Flash」字样的关键原因。

从这个角度来看,小米对于大模型的思考和业务发展逻辑其实也非常明晰——那就是在加大力度投入到大模型同时,依旧非常务实,更加侧重于自身的业务落地场景,更加强调软硬件结合的核心产品逻辑。

值得一提的是,考虑到小米的「人车家」全生态,尤其是车端本身也是 AI 落地的核心场景之一,所以,小米对于大模型的思考,更加侧重于对于物理世界的感知和交互,也就是让大模型超脱数字世界的范畴,与物理世界更好地融合。

所以,小米做大模型的底层出发点,也天然地与具身智能产生了密切关联,这是小米做大模型最有挑战的地方——但是从另外一个角度来看,也是最有潜力的地方。

回过头来看,小米花重金投入到大模型,本质上也是在补课——补上大模型的课,也是补上研发投入到核心科技的课。尤其是在 AI 技术进入到无人区和深水区之后,这样的研发投入对于当前的小米来说,确实是非常必要的。

当然,小米不仅仅是在花大力气投入到 AI 之中,也在砸钱投入到芯片和操作系统的研发中,包括此前的玄戒 O1 芯片和小米 Vela 等,以及这次开源的 Xiaomi   MiMo-V2-Flash,也是这些研发过程的阶段性成果。

但很明显,还不够。

值得注意的是,就在本次小米「人车家全生态」合作伙伴大会上,小米集团合伙人、总裁卢伟冰又再次强调称,小米今年预计研发投入达到 320 亿元到 330 亿元,2026 年预计投入约 400 亿,未来五年小米将在研发上投入 2000 亿元。

他还强调:「小米的长期目标是成为全球硬核科技的引领者」。

不过,从资本市场的角度来看,小米在 12 月 17 日的股价并没有因为其对外释放的研发成果而出现明显的回升,甚至在此后两天还出现了一定的下行——从资本市场的反馈来看,至少到目前为止,外界对于小米加码硬核科技、加码研发投入的叙事逻辑还并不买单。

很明显,尽管小米在 AI、芯片等领域已经拿出了一些成果,小米距离一家真正意义上的硬核科技公司,还有相当长的距离。

毕竟,对于任何一家企业来说,从技术研发到产品落地,再到最终市场认可,这从来都是一条漫长且充满不确定性的过程——要在 AI 落地上实现这个阶段性过程,小米除了继续投入大量的金钱和时间之外,还需要更强大的战略定力。

评论
大家都在看