IT时报 4小时前
全球华人Top5科学家联手破局 大晓机器人开辟具身智能“第三路径”
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

具身智能,一个半年融资近 200 亿的超级赛道,但绝大多数机器人仍停留在 " 表演 " 阶段,数据荒、常识差、泛化难、通用性不足 …… 还有非常多的核心挑战留给它一一突破。

12 月 18 日,大晓机器人在上海横空出世,目标是为每一个机器人装上聪明的大脑。

甫一问世,大晓机器人的格局就打开了,发布行业首创的 ACE 具身研发范式、首个开源且商业应用的开悟世界模型 3.0(Kairos 3.0),以及让具身本体拥有自主空间智能的具身超级大脑模组 A1,构建全链自主可控、开放协同的生态体系。

科学家 " 天团 "

大晓机器人取自两位 " 灵魂人物 " 的名字——商汤科技联合创始人、执行董事、大晓机器人董事长王晓刚与大晓机器人首席科学家陶大程,两位曾经的大学室友,同属于全球华人 Top5 科学家,在命运的齿轮转动之下,又并肩站在技术变革点上,机器人开始在与真实世界互动中走出 " 数据的洞穴 ",真正理解万象规律,从而学会与世界精准交互。大晓机器人的深层含义由此显露—— " 大千世界,晓识万象 "。

陶大程作为澳大利亚科学院院士,曾荣获 IEEE 计算机学会技术成就奖,在学术领域持续推动人工智能基础研究的边界拓展,也深度参与科技企业的技术战略布局与产品落地实践,他曾出任京东探索研究院创始院长、优必选人工智能首席科学家。

大晓机器人汇集来自南洋理工大学、香港大学和香港中文大学的全球稀缺的 AI 领域前沿科学家:吕健勤、李鸿升、刘子纬、潘新钢、赵恒爽、刘希慧。他们是全球顶尖 AI 实验室 MMLab 的核心成员,也是环境智能、世界模型、具身模型领域的开拓者,这一 " 科学家天团 " 将是大晓机器人抢占技术制高点的重要力量。

从左往右:潘新钢 李鸿升 陶大程 王晓刚 吕健勤 刘子纬 赵恒爽

主流技术路径为难人、为难机器

人类的智能蕴藏于数据之中,数据始终是 AI 进化的核心支撑。AI 1.0 的人工标注时代,包含 1400 万张图像、覆盖数万个类别 ImageNet 数据集,若由单人全职完成全部标注,需长达 10.5 年。进入 AI 2.0 大语言模型时代,数据规模实现指数级跃升,以 Common Crawl 为代表的互联网文本数据集,让单人全职进行原创撰写需超过 12 万年才能完成。

迈入具身智能时代,行业面临数据量级的断崖式缺口。智能驾驶领域,特斯拉 FSD V14 在世界模型仿真器的加持下,每日训练量相当于人类驾驶员 400 万小时,约等于 500 年的驾驶经验。而当前具身智能领域的真机数据量级仅为 10 万小时,这一悬殊差距清晰表明,具身智能的研发无法延续传统研发路径,必须实现范式革新,才能突破发展瓶颈。

" 以机器为中心 " 的研发范式,其根本局限在于将机器人本体及其硬件参数置于研发流程的核心,本质上是用极高的资源消耗,换取有限且僵化的 " 智能 "。

当前主流的数据采集方式是通过采集员真机遥操,海量收集各类机器人的本体数据,本质是让人去适配和迁就机器的多样性。这一路径导致数据采集成本高昂、效率低下,且产出的技能模型严重绑定于特定硬件," 智能 " 被禁锢在单一躯壳之内,无法形成通用的认知与适应能力,已成为行业向规模化、通用化发展的关键障碍。

当前,特斯拉、Figure AI 正集体放弃此前依赖的真机遥操路径,转而探索纯视觉学习方案,其理想是让机器人通过观看海量视频,直接习得人类的动作与智慧。但这种学习方式缺乏对三维物理世界的力学规律、物理属性和动作意图理解,学习曲线陡峭,存在难以逾越的 " 现实鸿沟 "。

上述两种路径都无法理解人所处世界的物理规律和人类行为的因果一致性,陷入本质困境:前者是 " 为难人 ",后者是 " 为难机器 "。

第三种研发范式

大晓机器人提出 " 以人为中心(Human-centric)" 的 ACE 具身研发范式,为行业带来第三条路径。环境式数据采集可实现一年千万小时的数据收集,开悟世界模型 3.0 则不断放大真实数据价值,使其达到上亿小时数据规模的效果。

王晓刚解释道,ACE 研发范式颠覆了传统逻辑,将人类与物理世界的互动规律作为核心研究起点,以环境式数据采集为引擎,构建了一套 " 环境式数据采集—开悟世界模型 3.0 —具身交互 " 的全链路技术体系。

ACE 范式核心技术之一是环境式数据采集技术,以人为中心构建全要素采集体系,整合第一视角与第三视角视频、力触觉信息、运动轨迹、语音等多模态数据,打造基于物理基础的 3D 资产库,全面覆盖具身模型训练所需的各类交互信息,实现了多视角协同、长程任务覆盖与全维度信息捕捉的跨越式升级。

该技术路径具身智能带来四大核心数据价值。一是数据维度更全面,完成超 10 个视角、8 种模态、4 大类物品属性的多模态数据升级,实现全要素覆盖;二是任务覆盖更长程,支撑分钟级、数百种原子动作的复杂任务;三是交互精度更高,达到亚像素级标准,可精准追踪人手精细化操作等复杂动作;四是采集效率更具规模化,能快速完成从十万小时到千万小时的海量数据积累。

在即时零售仓储场景中,该方案已实现多视角数据采集,覆盖数万种 SKU,完成仓储分拣与打包全流程,涵盖五大阶段 13 个原子动作;在居家、零售等多元场景中,也已实现对人体自然行为、物品交互轨迹的精准捕捉,甚至能复现遥操作范式下难以实现的生鲜抓取、精细化放置等任务。

以环境式采集数据为基,大晓机器人发布了首个开源且商业化应用的世界模型——开悟世界模型 3.0,形成跨本体的统一世界理解框架,融合物理规律、人类行为和真机动作,使机器不仅能 " 理解 " 物理世界因果规律,还能 " 生成 " 长时动静态交互场景,进而 " 预测 " 万千可能。

作为首个 " 多模态理解—生成—预测 " 的世界模型,开悟世界模型 3.0 通过视觉、3D 轨迹、触觉、摩擦力等多维度信息输入,深度理解真实世界的物理规律与人类行为的底层逻辑,让模型能形成 " 知其然,知其所以然 " 的思维链。

大晓机器人打造了开悟具身智能世界模型产品平台,集成 " 文生世界、像驱世界、迹塑世界 " 等多模态生成能力,内置支持 11 大类、54 细类,累计 328 个标签,覆盖 115 个垂类具身场景,开发者只需输入简单指令,就能快速生成可视化的任务模拟内容,并可一键分享,大幅降低具身智能的开发门槛。

开悟世界模型 3.0 于 12 月 18 日面向全行业开源,大晓机器人向全行业开放 API,让所有企业都可以使用开悟世界模型工具链,推动各类轻量化、定制化具身智能产品快速涌现。

开悟世界模型 3.0 已与沐曦股份、壁仞科技、中科曙光等多款厂商国产芯片完成适配,极大提升了芯片性能,全面赶超国际顶尖芯片;如同 DeepSeek 与国产芯片的全链路生态所带来的变革,形成从底层算力到上层智能应用的协同合力,重塑全球空间智能的竞争格局。

给机器人装上 " 超级大脑 "

大晓机器人还推出具身超级大脑模组 A1,在现场演示中,搭载该模组的机器狗无需预采高精地图即可适应复杂、动态、陌生环境。依托模型的视觉理解和运动规划能力,机器人能实现动态环境下鲁棒、安全、合理的路径生成,真正实现 " 自主行动 "。

" 前进 50 厘米 "" 绕过障碍 "" 靠近目标 "…… 具身超级大脑模组 A1 具备拥有云端交互能力,能实时解析自然语言指令与图像语义的意图关系,像人一样理解复杂的现实世界,生成可执行的中间指令,再由底层控制器精确执行。这使得机器狗不仅能够在复杂环境中完成自主巡检、跟随、避障等多样任务,而且能根据自然语言指令精准完成任务。

此外,大晓机器人结合 Insta360 全景感知方案与商汤方舟通用视觉平台,构建起全方位、高精度的环境感知体系。不仅能覆盖超 10 个行业,还可实现超 150 个智能化应用场景适配。

具身超级大脑模组 A1 让具身智能真正具备了走进产业一线的能力,在安防、能源、交通、文旅等对设备可靠性要求极高的场景中,长期稳定工作。

全链路自主可控

要实现全链路自主可控,必须靠生态驱动。

在具身本体领域,大晓已携手智元机器人、银河通用、钛虎机器人、国地中心等多家头部企业,打通全新技术范式、世界模型与机器人硬件的适配链路,共同打造适用于不同场景的解决方案。

芯片领域,开悟世界模型 3.0 已经与沐曦、壁仞科技、中科曙光、辉曦智能、影微创新等多款国产厂商芯片完成适配,极大提升了芯片性能。

硬件领域,大晓机器人与 Insta360、卧龙电驱、帕西尼等伙伴深度绑定,依托硬件厂商的感知等各类硬件,强化世界模型、模组产品对多视角、动态场景的信息采集能力。

在云服务与数据层面,大晓机器人联合商汤大装置、腾讯云、火山引擎、商汤方舟、算丰信息等平台,构建全流程支持体系。借助云服务商的算力调度能力,降低中小厂商的研发成本;依托库帕思、中建西南院的数据资源,优化世界模型的场景泛化能力。

落地,是规模化发展的开端。开放,是中国具身智能走向未来的姿态。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

机器人 ai 人工智能 王晓
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论