投中网 6小时前
10个月融了10个亿,物理AI的智谱要来了
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_font3.html

 

眼下,具身智能最大的技术分野大概就是 VLA 路线的可行性。支持者认为,这是具身智能的终极路线,反对者则已经为此 " 默哀 "。

过去两年,VLA(vision-language-action 视觉 - 语言 - 动作)模型几乎是机器人 " 大脑 " 的主流叙事。机器人通过视觉观察环境,通过语言理解人类指令,再把理解转化为动作输出。今年以来,包括英伟达首席研究科学家、具身自主研究团队负责人范麟熙,以及宇树科技创始人王兴兴等行业人士,都曾公开表达对纯 VLA 路线的担忧。在他们看来,真实世界的数据稀缺、泛化能力不足以及系统稳定性等问题,仍是摆在 VLA 面前的现实挑战。

当技术路线尚未收敛,产业界已经开始寻找更务实的答案。

据悉,具身大脑公司星源智即将发布全球速度最快的 " 具身交互世界模型 ",让机器人不再只是感知环境、执行指令,而开始具备一种面向物理世界的主动推演能力。6 月 3 日,星源智宣布完成最新一轮融资。投资方涵盖头部财务投资、国资与产业资本三大维度:松禾资本、创东方、华控基金等知名机构联合投资;中车资本、北工投资、国君创新投、江西金控等国资加持;产业方埃泰克、恒兴集团、奇安投资的深度合作;同时,老股东元生创投连续三轮追加投资。截至目前,成立仅 10 个月,星源智已累计融资 10 亿元人民币。

此前,北京智源研究院曾成功孵化出如今最高市值超 8000 亿港元的大语言模型公司智谱。星源智凭借对 " 世界模型 " 这一关键技术的原创性突破,目标成为具身智能领域下一个 " 智谱 "。据悉,星源智本轮融资将重点投入下一代具身大脑与世界模型的核心技术研发、产品规模化量产落地、以及顶尖人才引进与团队建设三大方向。

具身智能的发展,始终面临两道绕不开的难题。

一方面,真实世界数据获取成本极高。机器人需要在复杂环境中不断试错、学习,而高质量真机数据的采集效率远低于互联网时代的大模型训练方式,导致纯端到端模型难以形成复杂长程任务所需的泛化能力。另一方面,大模型对算力、功耗和实时性的要求极为严苛,在机器人本体上实现稳定部署与规模化应用,依然存在不小挑战。

从创立之初,星源智便没有选择单纯追逐参数规模,而是走上了一条 " 软硬一体、端侧部署 " 的差异化路线。

其核心是一套 " 具身大小脑 " 协同架构。其中," 具身大脑 " 负责语言理解、环境感知、任务规划以及长程推理,并具备反思与重规划能力;" 具身小脑 " 则承担导航、操作等运动控制任务,负责将决策转化为具体动作执行。

这种分层设计,与国际头部具身智能公司 PI 和 Figure AI 提出的 " 快慢系统 " 理念颇为相似:慢系统负责思考和决策,快系统负责实时控制和执行。不同之处在于,星源智坚持全模型端侧部署,并自研算力平台,尽可能摆脱对云端算力的依赖,让机器人能够在真实场景中实现更稳定、更低时延的运行。

如果说 " 大小脑 " 解决的是机器人如何行动的问题,那么世界模型解决的则是机器人如何理解行动后果的问题。

当前不少世界模型主要依赖视频生成思路,通过预测未来画面来模拟世界变化。但在星源智看来,对于机器人而言,更关键的问题并非 " 未来会出现什么画面 ",而是 " 我的动作将如何改变世界 "。

基于这一思路,星源智构建了具身交互世界模型。模型通过学习 " 当前状态—动作—未来状态 " 之间的动态关系,在潜空间中捕捉运动物体、交互对象以及关键状态变化,并进一步将这些能力用于动作生成、内部预演和动作修正。

这意味着,机器人不再只是感知环境、执行指令,而开始具备一种面向物理世界的主动推演能力。在真正伸手抓取、移动物体或执行任务之前,它会先在内部完成一次 " 模拟演练 ":如果这样做,环境会发生什么变化;如果失败,是否存在更优方案;下一步又该如何调整。

该 " 具身交互世界模型 " 的核心价值在于,让机器人从 " 看见世界 ",走向 " 理解交互 ";从 " 执行动作 ",走向 " 预判后果 "。在这一技术框架下,世界模型不再只是一个用于生成画面的预测模块,而是成为连接感知、决策与控制的关键中枢。它有望帮助机器人以更低的数据成本、更高的推理效率和更泛化的任务执行能力,进入复杂、开放、持续变化的真实物理环境。

剑指物理 AI 的 " 智谱 "

在业内看来,世界模型正在成为继大语言模型之后,具身智能领域最重要的技术竞争方向之一。其核心价值在于帮助机器人建立对物理世界运行规律的理解能力,从而降低对海量真实数据的依赖,并提升跨场景泛化能力。

相比许多以工程落地为主的创业团队,星源智最大的特点在于其兼具科研能力与产业化经验。

目前,公司已组建起一支国内少有的世界模型复合型团队。核心成员来自清华大学、北京大学、慕尼黑工业大学、智源研究院等顶尖高校和研究机构,长期深耕世界模型、强化学习和具身智能方向。

早在 2024 年,核心成员便提出了与 JEPA 相近的技术思路,相关研究工作也早于 LeWorldModel 等后续方案,部分理念如今已逐渐成为具身智能世界模型领域的重要技术范式之一。

刘东表示,公司始终坚持 " 技术深耕 " 与 " 量产落地 " 双轮驱动的发展路径,希望成为具身大脑和世界模型领域的全球领先企业。

成立不到一年,星源智的商业化进展已明显提速。

据了解,公司打造的软硬一体化解决方案已深度服务头部机器人本体厂商,客户覆盖超过 70% 的头部具身智能企业,并成为英伟达 Jetson Thor 平台全球最大的出货合作伙伴之一。

此外,星源智还在持续拓展产业场景落地,已与北京亦庄机器人公司展开战略合作,在政务服务、智能巡检、导览导购等场景推进应用;同时与头部能源集团、电力集团开展深度协同,在电力巡检、能源设施运维等高价值场景实现规模化部署。

伴随本轮融资完成,公司同步宣布:北京智源研究院将持续深度支持星源智世界模型建设,双方共同成立 " 具身交互世界模型实验室 ",通过人才导入、资源互补、技术互补等方式,共同开发前沿的具身交互世界模型技术,加速科技成果的转化与应用。

作为北京智源研究院在具身时代重点孵化与持续支持的核心项目,星源智目标成为具身智能领域下一个 " 智谱 "。

下面是投资机构对星源智的观点:

松禾资本表示:具身智能是人工智能走向物理世界的终极载体,而‘世界模型’则是突破通用具身智能的核心密码。星源智团队不仅拥有前瞻的技术视角,更难得的是具备极强的工程落地能力,能够将前沿的世界模型技术高效转化为赋能本体的各种技能。我们非常看好星源智在‘软硬协同、端侧部署’路线上的战略定力,相信公司将成为具身智能产业发展的关键变量。

中车转型升级基金表示:在轨道交通装备、新能源装备等领域,我方看到了星源智带来的变革潜力。星源智的技术方案打破了传统工业机器人 " 只能在既定规则下运行 " 的局限,其算法模型表现出的泛化能力与环境适应性令人印象深刻。后续中车相关产业公司将积极探索与星源智在产业应用中深度协同,挖掘具身大脑更多可能性,赋能轨道交通及新能源装备数字化、智能化升级。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论