从 " 能动起来 " 到 " 能干起来 ",从 " 能干起来 " 到 " 能创造价值 ",再从 " 创造价值 " 走向 " 创造新的产业文明 " —— 这正是部署态时代,具身智能带给人的想象空间。
6 月 24 日,智元联合创始人、总裁兼 CTO 彭志辉在 2026 上海 MWC(世界移动通信大会)发表主旨演讲,围绕 " 三智一体 " 部署态,拆解具身智能从技术验证到规模化落地的核心逻辑,分享具身智能赋能实体产业的实践思考与未来展望。

拐点已至:具身智能从 " 炫技 " 走向 " 干活 "
彭志辉开篇便点出行业关键转折:过去几年,大家讨论具身智能,更多是在讨论炫酷的 Demo 和对未来的预期;今天,核心命题变成了——它能不能真正进入产业、进入业务、进入每天都在发生的真实工作流。这不是某一家公司的判断,而是全球产业的共识。特斯拉擎天柱(Optimus)正在加速量产节奏,计划 2026 年实现千台级交付;而智元则在 3 月底率先完成第 10000 台通用具身机器人下线,成为全球首个突破万台量产的具身智能企业。两条路线、两种节奏,指向同一个方向:具身智能正在从实验室里的技术突破,走向现实世界里的生产力部署。
彭志辉指出,2026 年产业出现了拐点,原因在于 " 大模型智能 + 本体可靠 + 数据飞轮 " 这三件事,第一次在同一个时间窗口里同时成立。大模型解决了 " 理解世界 " 的问题,机器人本体正在跨过 " 可靠执行 " 的门槛,真实场景部署开始形成数据飞轮——三者的汇聚,正在推动具身智能从概念走向生产力。
走向生产力的基础则是 " 三智一体 " 和 " 部署态 "。这个范式的核心洞察是:具身智能不是单一技术的突破,而是本体、运动智能、作业智能、交互智能四个维度的协同进化。放眼全球,智元是唯一一家同时具备这四层全栈能力,并完成万台量产验证的公司。
三智一体:" 部署态 " 落地的生产力密码
本体是入场券,本体决定场景边界。智元是业界唯一拥有全系列全场景产品布局的公司,从全尺寸人形远征系列、半尺寸人形灵犀系列,到轮式人形精灵系列、四足机器人酷拓系列,覆盖从工业到商业、从科研到消费的多元场景。不同形态的机器人适配不同场景,人形机器人适合服务业,四足机器人适合开放巡检,轮臂机器人适合进工厂。更关键的是量产能力:从 2023 年的 6 台到 2025 年 1 月的 1000 台,再到 2025 年底的 5000 台、2026 年 3 月的 10000 台,智元用三年时间走完了从原型到万台量产的跨越,成为全球量产速度最快、数量最多的具身智能企业,而最新的数字里程碑,据彭志辉透露,也将马上揭晓。
运动智能是基础,决定能不能稳定可靠高效执行。 智元推出的 BFM 基座模型,通过大规模人类动作数据训练统一的行为基座,让机器人具备零样本、少样本适应新任务的能力。核心创新包括特权信息分布蒸馏、引入运动学约束的 Motion Decoder 以及满足动力学稳定性的 Action Decoder。BFM 将 " 动作 " 从离散技能库升级为可组合、可迁移、可生成的基础语言;在此基础上,GCFM 生成式运控模型进一步让机器人从 " 跟随动作 " 进化到 " 自己想动作 ",实现文生动作、音生动作、多模生动作的系统化,还有感控一体模型 AGILE。
作业智能决定价值创造,这是 " 部署态 " 落地的核心。智元构建了从数据、仿真、训练、执行到持续进化的完整闭环:AGIBOT WORLD 2026 开源数据集为真实世界理解提供高质量数据基础;Genie Sim 3.0 仿真平台将部署前验证推向更高效率;GO-2 具身基座大模型开创了任务理解与执行的知行合一能力;GE-2 世界模型斩获 WorldArena 世界模型总分冠军,构建了可推演、可迭代的虚拟环境,使策略模型能够在其中持续进化;SOP 真实世界学习系统,则让机器人在真实世界中快速进化,形成 " 部署产生数据、数据提升能力、能力促进更多部署 " 的正向飞轮。
彭志辉介绍,目前正在江西龙旗工厂进行的 6 天全流程作业直播,8 台精灵 G2 实现了全球首个 3C 电子产线质检工段全覆盖,直播第二天,累计观看人数已经超过 400 万人次。这证明:具身智能已真正具备工业级部署能力,能够作为常态化生产力持续创造价值。
交互智能决定融合深度。 机器人不是孤立存在的,它需要与人协作、与人沟通、理解人的意图。智元即将发布的 WITA-Omni 硅光动语大模型是首个机器人原生端到端、全模态交互大模型,它将视觉、听觉与动作融为一体,告别模态拼接带来的信息误差,让语言、语音、表情和动作不再割裂,而是像人一样协调地表达。在彭志辉看来,交互的终局不是正确回答人类的问题,而是让人愿意继续和它说下去。
在应用落地方面,目前,智元已推出七大生产力解决方案,覆盖产线上下料、工业搬运、物流分拣、导览导购、服务零售、安防巡检、商业清洁等核心场景。
生态为基:从单点突破到产业共创
未来的具身智能不可能靠一家公司独自完成,必须构建开放、完整、可复制的生态技术体系,智元打造的 AIMA(AI Machine Architecture)架构,就是这样一个产业级底座。AIMA 通过统一架构把 " 三智一体 " 打通:底层是 Link-U OS,向下平台化硬件,向上标准化接口;中间是智能服务层,包括 Agent Framework、多模态交互框架、全身运控框架、作业框架;上层则分别对应 LinkCraft、LinkSoul 和 Genie Studio,把运动智能、交互智能、作业智能落成开发平台。再往外,是商业、工业、家庭三大场景,以及整机、硬件、系统软件、解决方案伙伴,还有高校、研究机构、企业开发者。
为了推动生态繁荣,智元启动了 " 元苼 " 生态发展计划,未来 5 年总投入超 22 亿元,2026 年率先投入 1 亿元,覆盖科研学术创新、教育人才培养、生态伙伴发展、开发社区运营四大方向。同时,智元还在探索 RaaS(机器人即服务)新模式,通过全球租赁网络平台 " 擎天租 " 降低客户使用门槛,让更多企业能用得起、用得好具身智能。
从具身智能企业的发展模式来看,智元选择的是 " 全栈自研 + 开放生态 " 的路线,既掌握核心技术,又通过开放平台汇聚产业力量。在产业爆发期,生态的广度和深度往往决定最终的产业格局。
彭志辉最后说到:今天我们谈 " 三智一体 ",本质上不是在谈一组技术名词,而是在谈一种新的生产力组织方式。机器会成为新的生产力,模型会成为新的基础设施,平台会成为新的创新土壤,生态会成为新的增长引擎。从 " 能动起来 " 到 " 能干起来 ",从 " 能干起来 " 到 " 能创造价值 ",再从 " 创造价值 " 走向 " 创造新的产业文明 " —— 这正是部署态时代,具身智能带给人的想象空间。
1、猎云网原创文章未经授权转载必究,如需转载请联系官方微信号进行授权。
2、转载时须在文章头部明确注明出处、保留官方微信、作者和原文超链接。如转自猎云网(微信号:lieyunjingxuan
)字样。
3、猎云网报道中所涉及的融资金额均由创业公司提供,仅供参考,猎云网不对真实性背书。
4、联系猎云,请加微信号:jinjilei


登录后才可以发布评论哦
打开小程序可以发布评论哦