智东西 08-19
稚晖君人形机器人全家桶发布:穿针拧螺丝搓麻将,机器娃没满月就干活,开源大招杀疯了!
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

作者 | 香草 云鹏

编辑 | 心缘

打麻将、拆快递、纽扣穿针,还能做 30KG 重物提拉!

沉寂一年,稚晖君带着他的二代机器人全家桶重磅回归,秀出的各种新技能令人眼前一亮。

智东西 8 月 18 日报道,今日," 野生钢铁侠 " 稚晖君一连亮出5 款智元人形机器人,全程整活儿,前有机器人开瓶盖、倒可乐、搬重物,后有机器人上场主持、穿针、搓麻将、推销卖车,最后还有老父亲稚晖君陪伴 " 夹子手机器娃 " 蹒跚学步的感人成长 Vlog,并甩出 "0 元购" 终极大招。

智元不仅首次定义具身智能的五级技术演进路线图,而且公布了最新商业化进展:团队面向量产做了大量的正向设计分析、系统方案重构、核心部件自研;远征系列产品规模量产正在进行,接收到来自制造业、交互服务行业等不同客户的大量订单,整个团队都在加班加点准备批量交付。

稚晖君还秀了一波大格局,化身 " 赛博源神 ",从数据集、设计图纸、软件框架、中间件源码到运控算法,通通开源,要让人人可造人形机器人。

智元机器人此次发布了 "远征" 与 "灵犀" 两个系列,共 5 款商用机器人新品,包括远征 A2、远征 A2-W、远征 A2-Max、灵犀 X1以及灵犀 X1-W

发布会一开场,稚晖君直接和远征 A2 机器人家族的几位成员演了一出 " 人机小品 "。

远征 A2 系列秀出不少新技能,比如远征 A2-W 机器人用开瓶器开可乐瓶、操作榨汁机做出一杯 " 葡汽可乐 "、精准将榨汁机中的饮料倒入杯中。

" 大力士 " 远征 A2-Max 则原地抱起 80 多斤的重物。整体来看,机器人的肢体动作流畅灵巧,相比去年 8 月首次出场时,显然娴熟了许多,但动作属实有点太过缓慢,光是做饮料就花了整整 3 分钟。

演完小品后,稚晖君转身走入发布会现场,一台远征 A2 机器人直接登台当主持人,介绍了远征 A2 系列机器人家族。

远征 A2 系列包括远征 A2、远征 A2-W远征 A2-Max三款机器人,分别针对交互服务、柔性制造重载特种场景,内嵌大语言模型,可实现超拟人音色语音对话,各种技能都可以持续学习。

▲远征 A2 语音交互现场演示

作为今天发布会的 "One More Thing",稚晖君亮出自家的首款模块化机器人灵犀 X1,它个头不大,可以看作是 " 青春版 " 机器人,在成本方面有大幅优化。

稚晖君带领不到 10 人的团队,在不到 3 个月的时间里,就把灵犀 X1 从概念做成了整机。灵犀 X1 从组装完成到今天,还不到两周的时间,因此是 " 还没满月就出来干活了 "。

值得一提的是,灵犀 X1 有个 "机机模式",手机可以直接放到机器人里,做机器人的 " 大脑 ",这个 " 脑洞 " 确实够大。

灵犀 X1 的屏幕可以定制画面,比如显示稚晖君自己的脸,颇有一种机器人带上了 Vision Pro 的既视感。

为了避免 " 价格战 ",稚晖君直接给灵犀 X1 定价为 "0 元 ",全面开源。

在应用场景方面,远征 A2 可以在 4S 店内作销售导购,多语言交流,了解用户需求,例如听到顾客想喝水就去拿水,路上可以自动避障;在工厂里,远征 A2 基本可以完成质检上料、货架摆放货物等工作。

一、全身40+主动自由度,灵巧手19自由度,四大子域核心系统

人形机器人远征 A2全身采用外骨骼设计,身高体重都与成年人类相仿,可续航超 2 小时,行走速度每秒 1 米。

在外形方面,远征 A2 比上一代远征 A1 更像人了,脑袋更圆、四肢比例更协调,腿部形态从 A1 的反屈膝设计变为了正屈膝。

远征 A2-W由一个人形上半身和背后的机械身体组成,主要用于工业制造领域,其主动自由度 22 个,续航超过 5 小时,每秒可行走 1.5 米以上。双臂写作、多模态感知、持久作业等是远征 A2-W 针对制造场景进行的针对性优化。

远征 A2-Max最大的特点就是力大无穷,其主动自由度达到 53 个,双臂可称重 80 斤以上。

远征 A2 系列产品的工业设计采用了家族化 ID 语言,有助于实现量产以及独特的视觉识别特征。

在核心零部件上,远征 A2 系列借鉴新能源汽车的系统,将机器人的核心系统划分为动力域、感知域、通信域、控制域四个子域。

动力域方面,远征 A2 的关节模组在上一代的基础上面向量产做了大量的优化和测试,其中部分关节电机的峰值扭矩可以达到 512 Nm。

视触觉灵巧手也全面升级,拥有 19 个自由度,其中 12 个为主动关节。

基于灵活的手部关节和视觉、触觉感知,灵巧手现在可以轻松拧螺丝、拆快递。

通用的物品抓取更是不在话下,还能双手配合倒水。

纽扣穿针这样的精细活,灵巧手也能轻松实现。

远征 A2 拥有 7 自由度双臂,单臂自由度达到 3+2+2+N,臂展 60 厘米。双臂内置六维力传感器,可以配合实现更复杂的操作。

感知域方面,远征 A2 增加了激光雷达、全景相机等传感器,可实现全域安全、局部避障。基于自研的系统算法,机器人对环境的理解也大幅提升。

通信域方面,智元团队自研了一套轻量化、高性能的智能机器人通信框架 AimRT,可以完全不依赖第三方中间件。

值得一提的是,这一框架将在下个月底全面开源

控制域方面,远征 A2 在去年 Model base 的基础上增加了数据驱动的 Learning base,使用两种方式共同驱动机器人的行为优化,行走起来更稳定自然。

在运动算法层面,智元构建了一套由自然语言指令集驱动,可以适配不同机器人硬件的 AgentOS。

基于机器人本体,AgentOS 定义了技能库,通过多模态大模型去定义机器人的状态,再由任务执行器来驱动各种原子技能去进行任务操作,然后再进行反馈来获取这信号。

AgentOS 目前还在预研初期,不过从开头的自制饮料等演示来看,它已经实现了比较好的任务编排效果。

远征 A2 的整体框架参考强化学习来构建,整个机器人是一个软硬件非常复杂的系统,既涉及到内部各个硬件模块的协同和部署,也需要软件跟算法做高效的配合

智元构建了开放软硬件平台 AIMA,将远征 A2 的复杂系统的二次开发能力,开放给外部更多的开发者,共同去构建整个生态。

二、交互服务、柔性制造领域落地,自研数据采集全流程开源

稚晖君首次公布了智元机器人的具身智能技术演进路线图,从 G1 到 G5 分别对应基础自动化、通用原子技能、端到端操作技能、端到端操作大模型以及最终的AGI,类似自动驾驶领域的 L1、L2、L3 分级。

去年一年,智元机器人在 G2、G3 阶段并行研发,其中基于 G2 的原子能力已经实现实际场景的落地应用。

例如在交互服务场景中,远征 A2 可以针对客户进行精准营销。在汽车 4S 店内,它可以作为导购为客户提供服务。基于记忆能力,远征 A2 能够知道顾客上次看中的是哪款车,并主动推荐体验。

基于多模态大模型,远征 A2 能对不同意图指令精准识别。比如当小朋友说口渴了,远征 A2 会主动询问需要什么饮品,并取回来交给她。

在行进的路上,远征 A2 还能智能避障,躲开碰到的人或物品。

基于语言动作大模型,远征 A2 可以端到端生成自然动作,比如说 "1 万现金优惠 " 时,它非常自然地比了个 1 的手势。

虽然从人形机器人演进的角度来看,远征 A2 已经实现了很大的进步,但仅凭其现在慢吞吞的说话和做事效率,离替代人类销售还差得远。

柔性制造场景中,远征 A2-W 可以基于多模态感知、双臂协作、原子模块化等能力,实现工件投料、上下料、质检、搬运等,还能在不同工序间自动转场。

智元具身智能数据系统 AIDEA是稚晖君放出的另一个关键大招,包括仿真平台、机器学习平台、功能部署平台、数据平台,可以说是智元机器人从实验室到工厂再到量产商用的关键基础。

具身领域有一个很大的痛点,就是真实场景数据稀缺。它不像大语言模型有海量的互联网免费数据,也不像自动驾驶每天有上百万汽车在路上采集到的真实数据。

为了解决这一痛点,智元自研了具身智能数据系统 AIDEA,形成了一套全流程稳定可靠的数据采集方案。

AIDEA 将在今年 Q4 全面开源百万条真机、千万条仿真数据集,此外,今年下半年智元将会落地百台以上机器人专门用于数据采集。

三、首个模块化机器人灵犀 X1 亮相,团队不到 10 人,2 个月从概念到整机

在发布会临近尾声的时候,稚晖君还带来了一个One more thing:智元机器人首个模块化机器人灵犀 X1,就藏在发布会开头远征 A2-Max 举起的箱子里。

灵犀 X1 由智元 X-Lab打造,这是智元于 6 月新成立的一个实验室,也叫 "稚晖君实验室",专门做一些前沿技术创新类研究。这台灵犀 X1,是由不到 10 个人,在两个多月的时间内从无到有自研得到的。

灵犀 X1 身高 133 厘米,体重不到 66 斤,十分小巧。其手臂使用串并联混合结构,整臂重量只有 2kg,这使得它可以支持更灵活的运动、更高效的控制。

灵犀 X1 还创新推出 "机机模式",也就是机器人 + 手机,把手机放到机器人的 " 头 " 里来做大脑,让手机本身的麦克风、扬声器、屏幕等硬件,以及网络、AI 算力等软件能力,为机器人带来新的突破。

通过在远征系列上积累的各种研发经验,灵犀 X1 上也自研了两款全新的关节,其全身 30 多个自由度,均由这两款关节提供支持,做到了极致的标准化。

灵犀 X1 也推出了用于数据采集的机器人灵犀 X1-W,相比远征 A2-W 成本更低。

就像稚晖君本人一样,智元机器人可谓是将开源贯彻到底。灵犀 X1 的本体设计图纸、软件框架、中间件源码,以及基础运控算法都将全面开源。

四、沉寂一年,华为天才少年 " 闷声干大事 "

自智元机器人首款人形机器人远征 A1 发布,刚好过去一整年的时间。如果说远征 A1 是从零到一的突破,那么这次发布的远征 A2,则是在从 1 到 100 的 AGI 之路上,迈出的重要一步。

智元机器人成立于去年 2 月,致力于研发具身智能机器人产品及应用生态。带着创始人之一稚晖君的光环,智元机器人从诞生之初就备受科技圈关注。

稚晖君本名彭志辉,本硕均毕业于电子科技大学,毕业后曾在 OPPO 研究院 AI 实验室担任算法工程师,随后在 2020 年加入 " 华为天才少年计划 ",从事昇腾 AI 芯片和 AI 算法相关研究工作。

那一年的华为天才少年,总共有 6 名。

▲稚晖君华为天才少年签约纪念

稚晖君的另一个身份,是科技圈知名 up 主,因在 B 站发布的一系列硬核科技产品视频而闻名。

视频中的他软硬件 " 通吃 ",从写代码、画电路图,到建模、装配全部 DIY,独立制作了给葡萄缝针的钢铁侠机械臂、" 能够自己行走 " 不摔跤的自行车、模块化机械键盘等有趣的项目。

▲稚晖军 B 站主页

2022 年 12 月,稚晖君宣布已从华为离职创业,次年 2 月就正式成立了智元机器人(上海智元新创技术有限公司),作为联合创始人之一担任 CTO 和首席架构师。

智元机器人也备受资本青睐,目前已完成 A3 轮融资,投资方包括比亚迪、BV 百度风投、红杉中国、高瓴创投等知名企业或机构,估值也早在去年就超过 10 亿美元,晋升独角兽。

结语:人形机器人明星独角兽重磅 " 回归 "

就在上周,美国人形机器人创企 Figure 刚刚发布第二代机器人 Figure 02,要做 " 地表最强人形机器人 "。Figure 02 第四代手部拥有 16 个自由度,比特斯拉的擎天柱二代多了 5 个,而远征 A2 则更胜一筹达到 19 个。

在自媒体时代,稚晖君就时常 " 闷声干大事 ",半年做一个项目惊艳全场。在过去一年中,智元机器人一直比较低调,此次时隔一年再办发布会,稚晖君果然没让大家失望,不仅甩出超强远征 A2 全家桶,还带来了灵犀 X1 这一惊喜新品。光是现场演示,就已经打败了一大半同类产品。

在生态方面,智元看起来是要走和稚晖君本人同样的开源路线,让更多开发者参与进来,共同为远征 A2、灵犀 X1 的迭代添砖加瓦。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

逗玩.AI

逗玩.AI

ZAKER旗下AI智能创作平台

相关标签

机器人 麻将 开源 钢铁侠 技能
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论