量子位 8小时前
小米给智能家居做了个“大模型大脑”
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

智能家居不够 " 智能 ",怎么办?小米集团给出了智能家居未来探索方案Xiaomi Miloco

该方案基于大模型独特的开发范式,用户可以跟智能家居系统对话沟通,经过大模型的推理计算,自动完成家庭生活中的各类智能需求和规则

随着人工智能技术的飞速发展,AI 大模型在理解人类语言方面取得了显著进展,能够越来越贴合人们日常的交互需求。与 AI 大模型的优秀表现相比,当下智能家居行业体验却显得不那么 " 智能 "。

目前,多数智能家居系统依赖预设规则引擎,用户必须手动配置诸如 " 温度>30 ℃开空调 " 等等诸多触发条件,使得整个智能家居交互过程显得既机械又繁琐。

如果能把大模型的能力接入进来,则会简单且智能很多。比如你直接说 " 当我读书时,帮我打开台灯,播放舒缓的音乐 ",系统在识别到读书动作时就会自动完成操作。

小米认为,AI 代表未来方向,「大模型 + 智能家居」是行业大势所趋。

Miloco 的出现,重构了家庭智能范式。

同时,Miloco 还高度重视隐私安全问题,端侧部署大模型保障用户隐私不被侵犯。

目前,Miloco 已面向全社会开放,并在 GitHub 上线(链接见文末),开发者可部署、体验,参与技术共建。

让智能家居 " 理解生活 "

传统智能家居的体验瓶颈,本质源于 " 规则预设固化 " 与 " 生态协同不足 " 的双重制约。

用户需手动配置繁琐的自动化规则,且不同品牌设备间缺乏统一联动标准,最终不得不花费大量精力 " 适配系统 "。

而 Miloco 的核心研发目标,是为家庭赋予一个能理解生活细节的 "AI 大脑 "——

它可以保存你的 " 雨天关窗 "" 睡前调温 " 等场景偏好,能读懂 " 想睡个好觉 " 背后对温度、光线、噪音的综合需求,更能实现跨生态设备协作,在持续交互中优化体验,真正做到越用越贴心。

这种 " 懂生活 " 的能力,植根于 Miloco 对大模型技术的场景化落地。

作为智能家居未来探索方案,Miloco 将自研大模型能力部署到家庭边缘设备。

结合米家摄像机的实时视觉信息,通过标准化的 MCP 协议封装,Miloco 实现了米家生态与 Home Assistant(全球最大开源智能家居社区)生态的无缝打通。

同时,Miloco 也支持第三方 IoT 平台接入,让 " 用自然语言定义全屋智能 " 从概念走向实用。

小米大模型打底,四层技术架构

Miloco 的全屋智能差异化体验,依托于 Xiaomi MiMo-VL-Miloco-7B 端侧视觉语言大模型与四层完整架构的坚实支撑。

它从交互、感知、生态、安全四个维度优化全屋智能的交互逻辑与扩展能力,构建更贴合用户需求的智能家居解决方案。

核心支撑:Xiaomi MiMo-VL-Miloco-7B 端侧视觉语言大模型

作为 Miloco 智能体验的技术核心,Xiaomi MiMo-VL-Miloco-7B端侧视觉语言大模型为全屋智能赋予了 " 感知 + 理解 " 的核心能力,是实现场景化智能联动的关键所在。

Xiaomi MiMo-VL-Miloco 端侧视觉语言模型,基于小米自研 MiMo-VL-7B 大模型优化构建,凭借强大的视觉 - 语言融合能力,赋予家庭摄像头 " 理解画面 " 的感知力。

它可以轻松实现全屋视觉问答,比如查询 " 看看画面里有什么 "" 看看我的猫在哪 ";

还支持规则智能触发,比如当有人读书时打开台灯,或者当有人玩手机时发米家通知提醒;

更复杂的联动控制也不在话下,比如看看小孩有没有在玩手机?在玩手机的话音箱播放 " 该写作业了 ";或者根据画面中人的心情状态去设置灯光颜色。

同时,该模型还能完成场景化动态推理,例如检测到当画面里面有人时,根据画面中人的穿衣风格来生成赞美文案,然后用智能音箱播报生成的赞美文案;或者当画面里有人在睡觉,根据画面中人是否盖被子来调整空调的温度。

这一技术突破推动智能家居从 " 单一条件触发 " 的初级阶段,正式迈入 " 多维度场景感知 " 的高阶形态。

而这一核心能力的落地与延伸,均依赖于 Miloco 的四层完整架构体系。

四层完整架构,保障系统稳定与扩展潜力

从用户交互到硬件支撑,Miloco 构建了全链路技术体系并实现全部开放——

开发者可修改和扩展体系中任何一层的能力,确保功能稳定落地与未来灵活扩展,更为 " 开放共创 " 预留出足以承载无限创意的充足空间。

用户层:负责用户与系统的交互,当前已支持 WebUI 交互方式,后续将规划 App 端接入,进一步降低使用门槛;

应用层:作为系统 " 决策中枢 ",承接用户层需求,负责能力调度、大模型管理、云端服务协同及 MCP 服务适配;

能力平台层:提供信息源接入、设备控制、空间建模、存储记忆、多模态理解等底层能力,为上层应用提供技术支撑;

硬件层:涵盖算力、存储、网络等基础硬件支持,确保端侧计算高效运行,保障数据处理的实时性与安全性。

Miloco 的开放性打破了生态壁垒,开发者可借助其大模型能力,联动 Home Assistant 以及第三方平台的设备,探索更具想象力的全屋智能场景。

同时,项目坚持 " 隐私安全优先 " 原则,所有视觉数据可在家庭端侧完成计算,不向外部服务器传输,从技术层面保障 " 家庭隐私不外流 ",打消用户数据安全顾虑,真正实现 " 开放与安全兼顾 "。

推动智能家居进入大模型时代

Miloco 的发布,是小米将大模型技术落地家庭场景的重要实践,更是对智能家居体验升级的一次探索。

通过端侧大模型与全链路开放的结合,为行业提供了一种新的技术思路——让智能家居告别传统 " 硬编码规则 " 的局限,转向 " 对话式交互 + 视觉感知 " 的人机交互新形态。

这种新形态的核心,是从 " 人适应设备 " 到 " 设备适应人 " 的转变:用户无需学习复杂操作,可通过自然语言轻松设置自动化。

这种形态之下,设备不再是孤立的控制单元,而是能主动理解场景、协同工作的 " 生活辅助伙伴 "。

未来,小米将持续迭代 Miloco 的技术能力,与全球开发者共同推动全屋智能行业向着更开放、更智能、更贴合用户需求的方向发展。

开源链接:https://github.com/XiaoMi/xiaomi-miloco

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—    —

我们正在招聘一名眼疾手快、关注 AI 的学术编辑实习生 

感兴趣的小伙伴欢迎关注  了解详情

点亮星标

科技前沿进展每日见

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

智能家居 小米 ai 智能家居行业 assistant
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论