编译 | 江宇
编辑 | 漠影
机器人前瞻 4 月 30 日消息,初创公司 Dyna Robotics Inc. 正式公布其自主研发的人工智能模型 DYNA-1,专为驱动机器人而设计。
DYNA-1 模型的发布,距离 Dyna Robotics Inc. 成立仅一个月。Dyna 在创立时,即获得由 CRV 和 First Round Capital 领投的 2350 万美元种子轮融资。Dyna 的首席执行官林登 · 高(Lindon Gao)曾创立零售科技公司 Caper Inc.,该公司开发了商店无人结账系统,并于 2021 年被 Instacart 以 3.5 亿美元收购。
Dyna 正在开发一套自动化系统,包含并排放置的两个机械臂,旨在为餐厅、杂货店等企业实现重复性任务的自动化。如今发布的 DYNA-1 模型正是为这些机械臂提供智能支持的核心技术。
为实现经济效益,机器人需长时间稳定执行相同任务。
Dyna 指出,许多搭载现有 AI 模型的机器人,在数小时运行后易出现错误,需人工干预解决,这不仅增加维护成本,还会因机器人停机导致产量下降。
Dyna 宣称,DYNA-1 在长时间运行中的可靠性远超传统算法。在一项内部测试中,搭载 DYNA-1 的机械臂在 24 小时内折叠了超过 700 张餐巾,准确率高达 99.4%,且无需任何人工干预。
Dyna 在博客中表示:" 餐巾折叠涉及一系列独特挑战,包括从一叠餐巾中精确抽取单张餐巾,以及在意外拉出多张餐巾时进行恢复的能力。"
DYNA-1 的开发采用了行业标准的强化学习方法。在强化学习中,工程师为 AI 设定与实际应用相似的训练任务,每次任务完成后,模型会收到反馈以优化性能,通常通过一种称为 " 奖励模型 " 的算法生成。
" 奖励模型 " 的核心在于评估 AI 完成任务的准确性,并据此提供反馈,进而提升模型表现。
为提升 DYNA-1 的性能,Dyna 开发了一款定制化奖励模型。相较于现有算法,该模型在评估 AI 是否准确完成训练任务方面表现更优,从而提供更高质量的反馈,进一步增强 DYNA-1 的性能。
" 奖励模型 " 进度估算
此外,DYNA-1 展现了技能迁移能力。内部测试显示,其在餐巾折叠训练中获得的技能可部分应用于其他复杂操作任务,如衣物折叠和杯子填充。
搭载 DYNA-1 的机器人进行杯子填充任务
搭载 DYNA-1 的机器人还能在无需大量手动重新配置的情况下,适应新环境。
在训练过程中,DYNA-1 在定制化 " 奖励模型 " 的指导下,执行大量任务,并学习不同动作的效果与结果。Dyna 团队表示:" 通过长时间的运行,DYNA-1 积累了丰富的动作经验,能够理解每种动作可能带来的后果。这种经验使 DYNA-1 无需为特定客户环境进行额外的预训练,就能直接在实际场景中成功完成餐巾折叠任务。"
传统上,由 AI 驱动的机器人价格昂贵,通常高达数十万美元。Dyna 计划,以远低于市场平均价格的策略销售其硬件。据《财富》杂志 2025 年 3 月报道,Dyna 的目标是将机器人硬件价格显著降低到传统市场价格的一个数量级以下。
此次 DYNA-1 的发布标志着 Dyna Robotics 在机器人自动化领域的进展,其高可靠性、低成本的解决方案有望为餐饮和零售行业带来改变。
登录后才可以发布评论哦
打开小程序可以发布评论哦