驱动之家 06-26
没网也能用!谷歌发布离线机器人AI模型:具备视觉识别、语言理解能力
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

快科技 6 月 26 日消息,据媒体报道,Google DeepMind 推出革命性机器人控制模型 Gemini Robotics On-Device。

该模型的核心突破在于能在机器人本地离线运行,无需依赖云端连接,即可同时处理视觉识别、语言理解与动作执行任务,流畅响应人类指令完成任务。

作为专为双臂机器人设计的 VLA(视觉 - 语言 - 动作)基础模型,Gemini On-Device 能直接解析自然语言指令并驱动机器人执行相应动作。

其本地运行特性在医疗操作、灾难救援、工厂自动化等对实时性和稳定性要求高的场景中优势显著,有效避免了云端传输的延迟和潜在风险。

该模型还具备较强的平台适应性,通过少量学习即可适配不同机器人硬件,有望加速机器人技术的普及。不过,其在复杂环境下的安全策略和高级逻辑规划方面仍需完善。

目前发布的模型基于 Gemini 2.0 架构,尚未集成最新的 Gemini 2.5 特性,产业化应用处于测试阶段。Gemini Robotics On-Device 的推出是谷歌在通用机器人 AI 领域的关键布局,将与英伟达 GR00T、OpenAI RT-2 等竞争对手展开角逐。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

机器人 谷歌 英伟达 视觉识别 医疗
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论