ImageNet作者苏昊回国任教复旦！李飞飞高徒，具身第一高引，出任通用物理AI院长

具身智能领域论文被引次数最高的华人学者，带着十七年海外积淀，回来了。

刚刚，在第五届中国三维视觉大会（China3DV 2026）上，李飞飞弟子、ImageNet 作者苏昊正式被复旦官宣加盟。

加盟复旦后，苏昊将担任浩清特聘教授，领衔建设通用物理智能研究院并出任院长。

△图源：复旦大学官方公众号

对于苏昊的回归，复旦大学官方将其定义为复旦 " 面向智能时代的关键落子 "。

实际上，早在官宣之前，UCSD 和复旦校内已有传言流出，称具身智能领域的领跑者苏昊即将赴复旦任教。

如今靴子落地，坐实了这一场备受期待的回国。

谁是苏昊？

苏昊，具身智能领域论文被引次数最高的华人学者，ImageNet 缔造者之一，ShapeNet、PointNet、PartNet、SAPIEN、ManiSkill 等一众奠基级项目的主导者，具身智能公司 Hillbot 联合创始人兼 CTO。

在此之前，他是加州大学圣地亚哥分校（UCSD）计算机科学与工程系副教授，同时还是具身智能实验室主任。

早前，苏昊在 UCSD 的个人主页已经停止维护、不再更新。

在苏昊新的个人主页上，已经更新了在复旦的最新任职。

截至目前，其谷歌学术被引次数超过 14.5 万次，在具身 AI 领域的华人学者中排名第一。

去年，他还与谢赛宁共同获得了 CVPR 青年学者奖，理由是表彰他们在计算机视觉领域的杰出贡献。

值得一提的是，苏昊还是弋力（清华叉院助理教授）、卢策吾（穹彻智能创始人、上交教授）、王鹤（银河通用创始人、北大助理教授）、严梦媛（OpenAI 研究员）、莫凯淳（英伟达研究员）等一众知名学者的师兄。

从北航到普林斯顿，再到斯坦福

2002 年，苏昊进入北京航空航天大学攻读计算机科学本科，是北航高等理工学院的第一届学员。

本科期间，他师从中科院院士、前北航校长李未教授，研究数理逻辑与定理自动证明。

2005 年，经李未教授推荐，他前往微软亚洲研究院（MSRA）实习，师从孙剑、沈向洋、周明。

彼时他主攻自然语言处理，但随着研究深入，他逐渐意识到，相较于抽象的语言，直接来自物理世界的信号（如视觉）才是理解智能更根本的途径。

苏昊的研究重心，也由此转向计算机视觉。

2008 年，在沈向洋的推荐下，苏昊先后在普林斯顿和斯坦福参与了 ImageNet 项目，并在 2009 年跟随李飞飞正式转入斯坦福。

ImageNet 这一奠基性数据集，后来推动了近二十年的人工智能浪潮。

在 ImageNet 之后，苏昊与李佳合作了 Object Bank，进一步提升了图像在高层视觉任务中的语义表示能力，使得简单分类器也能在物体识别和场景分类等任务上取得优异性能，这篇研究发表于 2010 年的 NIPS 上。

3D 视觉的奠基人

当 2D 视觉的方法论日趋完善后，苏昊将目光转向 3D 视觉。

2014 年，在获得北航数学博士学位后的他，在 Leonidas Guibas 指导下于斯坦福攻读计算机博士，主攻三维感知。

2015 年，他发布 ShapeNet ——全球第一个大规模 3D 数据集，包含逾 300 万个 3D CAD 模型，涵盖 3135 个类别，被外界誉为 "3D 领域的 ImageNet"。

ShapeNet 发布后，3D 视觉研究随即进入黄金发展期。

2017 年，PointNet 与 PointNet++ 相继发布，让 3D 视觉相关论文在顶会的占比从不足 10% 跃升至 70%。

其中 PointNet 是首个直接处理原始点云数据的深度学习模型，而 PointNet++ 则进一步捕捉点云中的局部结构信息。

这两项工作，如今已广泛应用于自动驾驶系统。

2018 年获得斯坦福计算机博士后，苏昊又发布了 3D 物体数据集 PartNet，并入职加州大学圣地亚哥分校。

从视觉到具身

感知之后，苏昊的下一个问题是，能不能把具体的感知算法整合进一个更大的系统？

这一思考，驱动他从计算机视觉迁移到机器人研究。

2020 年，他基于 PartNet 发布了全球第一个以可泛化操作为核心的模拟器—— SAPIEN（命名灵感来自《人类简史》中的 " 智人 "），为机器人视觉与交互任务的研究搭建了关键基础设施。

2021 年，他又在此基础上推出 ManiSkill 机器人操作仿真平台，用于测试和训练机器人操作技能。

同年 ICCV，苏昊发起 workshop，聚焦基于物理的建模与仿真、基于学习的仿真、人体仿真到具身视觉和机器人学习等广泛主题。

这些成果，也延续到了苏昊创办的具身智能公司Hillbot上。

2024 年，苏昊加入了具身智能的创业浪潮，创办了 Hillbot，并担任首席技术官。

Hillbot 旗下拥有的两张王牌，正是苏昊此前发布的 SAPIEN 仿真器及 ManiSkill 训练平台，主打模拟与 3D 生成。

另外，Hillbot 已与英伟达合作，借助 Nvidia Cosmos 平台生成高仿真视频训练数据。

产品方面，Hillbot 推出了轮式机器人 Hillbot Alpha，基于仿真训练，主要用于复杂环境下的移动操纵任务，如零售店、咖啡馆和制造车间等。

为什么选择复旦？

对于加盟复旦这个选择，苏昊给出了简洁而坚定的解释：

因为复旦要做的事，与我要做的事，是同一件事。

那件事，指的便是推动 " 物理智能 " 的最终实现。

所谓物理智能，是让 AI 系统在物理世界中有效完成任务——既能理解这个世界，也能执行恰当的行动。

在苏昊看来，这不仅是算法问题，更涉及机器人实体、多学科交融，以及一个完善的产业生态。

他看中复旦的理由具体而落地，复旦拥有深厚的数学、物理学科根基，积极推进的新工科建设，以及地处上海和长三角中心的产业与区位优势。

△图源：复旦大学官方公众号

以此为目标，加盟复旦后，苏昊将领衔建设通用物理智能研究院。

该学院依托复旦大学智能机器人与先进制造创新学院，打破传统院系划分，不设学科边界，完全围绕问题导向，汇聚数学、物理、计算机、人机交互、脑机接口等多领域顶尖人才。

他直言，研究院的目标是培养未来 5 到 10 年的人工智能领军人物。

在人才培养理念上，他强调两点——高品位的科研眼光（知道什么问题值得做）和长周期的探索耐心（愿意把问题做完）。

论文不是目标，而是副产品。真正的标尺，是能否在真实世界中实现智能体的有效行动与自主决策。

研究院将重构课程体系，缩短从基础到前沿的路径，让学生尽早进入科研与实践，同时大力支持师生创新创业，推动成果转化。

具身智能：乐观，但谨慎

对于当下火热的具身智能赛道，苏昊的判断是 " 谨慎的乐观 "。

乐观的底气来自问题本身，因为这是一个既有科学深度、又有巨大产业潜力的真问题。

谨慎则来自于现实，因为当前涌现出的大量精彩演示，与真正的通用能力之间，仍存在关键断层。

而填补这一断层的核心，正是物理智能。

△图源：复旦大学官方公众号

谈到 " 具身智能的 ChatGPT 时刻 "，苏昊坦言，短期内实现大语言模型那种程度的泛化还不现实，但在更长时间尺度上，方向是清晰的。

他预见，具身智能将深度渗透制造业、服务业、养老行业等领域，最终推动人类走向 " 人机正面互动、人机共存的时代 "。

而通往那一未来的桥梁，正建立在今天对物理智能的扎实探索之上。

苏昊从中国出发，一路从 2D 到 3D，从视觉到具身，一步步打通 " 让机器理解世界 " 的关键路径。

如今，他带着这一切回来了——落脚复旦，直面物理智能这道真正的难题。

世界级 AI 科学家的加盟，也把复旦在 AI 和具身智能，推向了世界最前沿。

参考链接：

[ 1 ] https://mp.weixin.qq.com/s/sv768xtTCHv6Uy9qbD92EA

[ 2 ] https://www.haosu.ai/

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法！

— 完 —

谁会代表 2026 年的 AI？

龙虾爆火，带动一波 Agent 与衍生产品浪潮。

但真正值得长期关注的 AI 公司和产品，或许不止于此。

如果你正在做，或见证着这些变化，欢迎申报。

让更多人看见你。 https://wj.qq.com/s2/25829730/09xz/

一键关注点亮星标

科技前沿进展每日见