作者 | 柴旭晨
编辑 | 张晓玲
在科技与资本的交汇处,新的风暴正在酝酿。这次,风暴的中心不再是虚拟世界的代码与算法,而是连接 AI 与物理世界的桥梁——具身智能。顺势,AI 界的领头羊阿里也来搅局了。
近期,阿里通义千问技术负责人林俊旸发文称,其在 Qwen 内部组建了一个关于具身智能的小组。这标志着阿里正式进军物理 AI。事实上就在一个月前,阿里云领投了国内机器人创业公司自变量机器人的 1.4 亿美元融资。
从投资到亲自下场,阿里的野心昭然若揭,它正全力以赴,为 AI 寻找一具能够感知和改造物理世界的 " 身体 "。这背后是一个深刻的时代背景:我们正处在一个奇特的 AI" 断层 " 时代。
一方面,AI 的 " 大脑 " ——以通义千问、GPT-4 为代表的大语言模型,正以前所未有的速度进化,展现出惊人的认知与生成能力。但另一方面,AI 的 " 身体 " 却显得笨拙。在物理世界中,除了特定场景下的工业机械臂,几乎看不到能够自主理解环境、与人协同的智能物理实体。
如此断层亦蕴含着巨大机遇,去年吴泳铭就直言,AI 最大的想象力是接入现实世界。在今年 6 月的年度股东大会上,黄仁勋强调,AI 和机器人技术是最大的两个增长机会,代表着数万亿美元级别的增长机会。
眼下,OpenAI、Google、软银、英伟达等巨头们纷纷在具身智能赛道重点布局。一场为 AI" 寻找身体 " 的战争已经悄然打响,对于正处在转型与价值重估关口的阿里而言,这也将是它实现 ASI 的宏伟理想、" 再伟大 " 的关键一极。
从云端到现实
10 月 8 日,林俊旸发布了一条分量十足的消息:团队已正式建立 " 机器人和具身智能小组 "。
林俊旸在推特中指出,多模态基础模型正转变为基础 Agents,这些 Agents 可以利用工具和记忆,通过强化学习进行长视野推理," 它们绝对应该从虚拟世界走向物理世界 "。
这意味着,阿里要决心让通义千问从语言世界跨进物理世界。就在不久前的云栖大会上,阿里巴巴集团 CEO 吴泳铭断言,行业正进入 AI 的 " 自主行动 " 阶段。吴泳铭说,未来或将有超过全球人口的智能体和机器人与我们共同工作生活。
对阿里而言,将 AI 从云端推向实体世界正是其通往超级人工智能(ASI)宏大蓝图中至关重要的一步。事实上,在台下阿里已经为进军具身智能而布局已久。
自 2024 年以来,阿里集团陆续投资了逐际动力、星动纪元、宇树科技、星海图、灵心巧手等一批具身智能公司。阿里云则在今年 9 月领投了自变量机器人的 1.4 亿美元融资。
有知情人士指出,去年上半年,阿里开始重点关注具身智能," 投了几乎所有具身智能公司 "。因为机器人是大模型能力从数字世界走入物理世界最理想的载体。阿里通过投资宇树、逐际动力、自变量机器人等不同技术路线的公司,抢占赛道。
显然,阿里对具身智能的布局并非一时兴起。要理解其动机,必须将其置于阿里当前的内外部环境以及对未来科技终局的判断之中。
首先,这是战略的必然性:AI 的终点必然是物理世界。当大语言模型的能力趋于完善,其价值的进一步释放必然要求它能够感知、理解并改造物理世界。一个只能在对话框里运行的 AI,其商业天花板是可见的,但一个能够通过机器人实体与环境互动的 AI,潜力则是无限的。
阿里的动作放在全球 AI 版图上看,并不孤单。
就在同一周,软银集团宣布以 54 亿美元收购 ABB 的工业机器人业务;英伟达 CEO 黄仁勋也再次提到,AI 与机器人是 " 数万亿美元级别的长期增长机会 "。马斯克将其人形机器人 " 擎天柱 " 视为特斯拉未来价值的核心,首先要颠覆自家工厂的生产模式。
全球巨头都在下场,物理 AI 成了下一个战场。对于阿里而言,其商业帝国的根基——电商、物流、新零售都与物理世界紧密相联。无论是菜鸟网络遍布全球的智慧仓储,还是盒马鲜生的自动化供应链,都存在大量需要与物理实体交互的场景。
可以说,这些场景是具身智能最直接、最广阔的应用试验场。因此,将 AI 能力 " 实体化 " 是对其核心业务升级的内生需求。
面对如此激烈的竞争格局,阿里如果缺席,无异于将未来物理世界的入口拱手让人。这是阿里为资本市场讲述增长新叙事、注入 " 强心剂 " 的迫切需要。
近年来,阿里核心电商腹地遭遇拼多多、抖音等新业态的冲击。此时亟需一个充满想象力的新故事来重新点燃投资者的信心。云计算与 AI 无疑是这个新故事的最佳主角,而具身智能的加入,则为这个故事增添了最硬核的一章。
它将阿里的能力从线上延伸到线下,从虚拟拓展到现实,向资本市场传递了一个清晰的信号:阿里正进化为一家能够定义未来物理世界形态的、更底层的科技平台型公司。
有行业研究人士向华尔街见闻指出,通过直接参与机器人研发,阿里既能验证大模型在真实物理环境中的适应性,反向驱动模型在噪声处理、因果推理等领域的进化;又能拓展数据采集维度,将训练场景从文本图像延伸至机械控制、传感器反馈等工业级应用。
这种从商业模式创新到硬核科技创新的转型,是重塑其市场估值、开启第二增长曲线的关键。
填补行业鸿沟
" 现在 AI 写文作画,已经比 99.99% 的人都要做得好。但真正让 AI 干活,还是一片荒漠。" 在一个月前的外滩大会,宇树科技创始人王兴兴在圆桌论坛发言时如是说道。
可以说,当下正处在一个技术 " 断层 " 地带。一边是 AI" 大脑 " 大模型的智慧正在以指数级速度爆发,另一边是 AI" 身体 " 的笨拙与物理世界的复杂性形成了鲜明对比。这道鸿沟限制了 AI 的潜力。
牌桌上的玩家们已经达成共识:让 AI 拥有身体,进入物理世界 " 干活 ",是一片巨大的蓝海。
摩根士丹利预测,到 2050 年,全球人形机器人将累计部署 10 亿台,市场规模达 5 万亿美元。这一数字大约是 2024 年全球 20 家最大汽车制造商总收入的两倍。据中金估算,中国人形机器人潜在市场空间有望于 2050 年达 22.8 万亿元,2024-50 年复合年均增长率达 24.7%。
如此确定性,将全球具身智能市场推向了爆发的前夜。各路玩家和资本都争先恐后,极力把握这股历史性的机遇。优必选、宇树科技、银河通用、智元机器人等企业都宣布今年预计量产千台人形机器人。
燥热的氛围下,今年机构们的热钱也争相涌进具身智能赛道。有行业投资人士表示,今年以来具身智能领域频频出现单笔超 5 亿元人民币级别的融资,包括宇树、银河通用、千寻智能、星动纪元、逐级动力、它石智航等。
一个爆发的新趋势已经逐渐浮现。不过,掘金的过程并非一蹴而就,如何让大模型完全融入具身智能,是眼下横亘在 AI 落地物理世界的关键卡点。
而阿里,要做填补这一鸿沟的 " 卖铲人 "。
此前,王兴兴曾多次表示,与硬件相比,具身智能更大的挑战是大模型方面的短板," 最大的问题是具身智能 AI 不够用。"
过去很多大模型在虚拟场景里表现亮眼,一到物理世界就水土不服。因为传统大模型依赖海量互联网文本数据训练,而具身智能需物理世界交互数据,数据更少量且获得难度更高。
不仅如此,阿里云智能集团公共云事业部具身智能负责人高飞向华尔街见闻指出,未来几年行业数据量将稳步攀升,对应的清洗、存储和训练压力也会随之放大。" 仅凭具身智能公司一己之力,这样的压力是很难顶住的 "。
好在,阿里做好了准备。
目前,阿里 Qwen3-Max 参数规模突破万亿,在复杂任务分解上表现突出,能支撑机器人处理 " 拆快递 - 分类物品 - 摆放收纳 " 等多步骤任务;Qwen3-VL 则强化了 3D 空间感知与动态物体追踪,可精准识别物体位置、判断运动轨迹。
" 最近一段时间我跑了大概 30 家具身智能公司,跟他们的 CEO 深度沟通后了解到,他们大部分都在用 Qwen-VL 模型去做后训练。" 高飞向华尔街见闻说道。
这种选择的共性背后有着充分的技术理由。Qwen-VL 在空间感知、动态视觉理解、路径规划等方面的能力,恰好契合了具身智能对 " 大脑 " 的核心需求。
此外,阿里云智能集团公共云事业部具身智能解决方案负责人王旭文指出,过去几年,阿里服务头部大模型公司和汽车新势力的过程中 " 一步一步踩坑 ",积累了大量的基础设施和实战经验。因为具身智能和智能驾驶在工程架构方面有着高度的相似性,所以这些经验都能够复用。
这种从模型底层到应用层的全链路支撑能力,让阿里云在具身智能赛道拥有了一个几乎不可复制的竞争优势。可以说,在量产机器人这条路上,阿里云正在帮整个行业扫清障碍。当这些能力从软件模拟场景转向真实世界,具身智能就将真正进入爆发时刻。
重估阿里:全栈 AI 闭环
由此,阿里的野心也渐渐清晰:由通义千问担当通用的 " 大脑 ",负责任务理解与规划;由阿里投资的硬件公司担当专用的 " 执行单元 ",负责动作落地。田丰甚至认为,阿里具备将自身业务与平头哥芯片技术融合的潜力。未来有机会构建起机器人领域的 AppStore 应用生态圈。
在这场关乎未来的全球牌局中,每一位玩家都手握不同的牌。事实上,阿里已经组合培育好一套独特的底牌——一套覆盖了从算力、云、模型到应用场景的 " 全栈 AI" 闭环。这不仅是其参与竞争的资本,更是其重塑价值、重述 " 伟大 " 叙事的核心。
回看市场,我们可以看到两种截然不同的巨头成长路径。以软银集团为例,其创始人孙正义是一位卓越的 " 猎手 ",通过外部收购和投资,快速拼凑起一个覆盖全球的 " 信息革命 " 生态。
相比之下,阿里巴巴的路径更像是一种 " 耕种 ",依托自身庞大的业务生态,从内部培育技术生长的土壤。这种模式的优势在于,技术与场景之间存在着天然的联系,在具身智能时代,这种联系构建了一个独一无二的飞轮效应。
这个 " 全栈 AI" 闭环可以被清晰地解构。它的地基是阿里云作为全球领先的云计算平台,为 AI 的研发和运行提供了海量的、弹性的计算资源。它的大脑,是基于强大算力研发的、并在阿里内部多个场景中得到锤炼的通义千问大模型。它的身体,则是通过组建内部团队和投资外部公司正在补齐的机器人硬件与控制算法。
而这个闭环最核心、最难以被复制的优势,是其无与伦比的试验场——丰富的应用场景。从菜鸟网络的数百万平方米的仓库,到盒马鲜生的自动化门店,再到淘宝天猫的海量商品处理,阿里拥有世界上最庞大、最复杂的真实物理商业场景。
这四个层次共同构成了闭环:真实场景产生海量数据;数据输入阿里云进行计算和模型训练;训练优化后的 " 通义千问 " 大脑指挥机器人;机器人在真实场景中执行任务并产生新的数据,反过来进一步优化模型。
这个飞轮一旦转动起来,其迭代速度和效率将是惊人的。它能让 AI 模型和机器人算法在真实物理世界的反馈中快速进化,远远超过那些只能在实验室环境中进行测试的竞争对手。
因此,押注具身智能,是阿里试图通过 AI 叙事 " 再次伟大 " 的必然选择。阿里不仅是一家成功的商业公司,更是一家拥有底层核心技术的硬核科技公司。
有行业投资人指出,只有全栈,才能把 AI 做成真正的基础设施,让 AI 应用更低门槛地普及到各个行业。在全栈 AI 的巨大想象空间下,阿里的估值逻辑随之再加码。
近期,高盛将阿里 2026-28 财年资本支出预测大幅上调至 4600 亿元。高盛认为,AI 资本支出转化正重塑阿里增长预期," 阿里 AI 云计算能力的突破性进展和国际化扩张潜力为股价提供了新的上涨动力 "。
历史的车轮滚滚向前,每一次计算平台的变革,都会诞生新的王者。如今,我们正站在一个由 AI 和机器人共同定义的新时代的门槛上。阿里这家曾定义了中国一个商业时代的巨头,正试图通过构建一个从云端到地面的全栈 AI 闭环,抓住这次变革的缰绳。
这无疑是一场充满风险的豪赌,但对于一个渴望 " 再次伟大 " 的巨人而言,这或许是唯一正确的道路。世界正在重估阿里巴巴,而答案,或许就藏在那些即将被赋予智能的 " 身体 " 之中。
登录后才可以发布评论哦
打开小程序可以发布评论哦