钛媒体 App 3 月 10 日消息," 稚晖君 " 创业项目智元机器人今日发布了首个通用具身基座模型——智元启元大模型(GenieOperator-1),它开创性地提出了 Vision-Language-Latent-Action(ViLLA)架构,该架构由 VLM(多模态大模型)+MoE(混合专家)组成,实现了可以利用人类视频学习,完成小样本快速泛化,降低了具身智能门槛,并成功部署到智元多款机器人本体。(智元机器人官方公众号)
钛媒体 App 3 月 10 日消息," 稚晖君 " 创业项目智元机器人今日发布了首个通用具身基座模型——智元启元大模型(GenieOperator-1),它开创性地提出了 Vision-Language-Latent-Action(ViLLA)架构,该架构由 VLM(多模态大模型)+MoE(混合专家)组成,实现了可以利用人类视频学习,完成小样本快速泛化,降低了具身智能门槛,并成功部署到智元多款机器人本体。(智元机器人官方公众号)
登录后才可以发布评论哦
打开小程序可以发布评论哦