对话张亚勤:AI不是泡沫,但AI公司有泡沫

（来源：暗涌 Waves）

「AI 不一定要学人，不一定要超过人。」

访谈｜海若镜巴芮

6 月盛夏，在清华无锡研究院智能产业创新中心，我们见到了张亚勤院士。他匆匆赶来，一进门，就建议让室内温度降得更低些。

访谈中，聊起当下具身智能、AI 投资创业热潮，张亚勤也觉得大家应该降降温，" 更冷静些，不要急躁 "。

五年前，张亚勤创建了清华大学智能产业研究院（以下简称 AIR ) ，聚集了多位有 AI 产业经验的知名教授。据介绍，如今 AIR 的第一届博士生已经毕业；而这里孵化、走出的十家公司，累计 " 融资约 150 亿元，估值 1500 亿元 "。其中，华深智药、它石智航等独角兽，在资本市场备受追捧。

1500 亿估值是个亮眼数据，但张亚勤却告诉我们：AIR 首要任务是做科研；孵化公司只是自然长出的副产品，而且多数公司正处在 " 证明能力 " 的阶段。

作为国内最年轻的 IEEE fellow、中国工程院院士，张亚勤经历过技术革命和资本周期的潮起潮落。在他看来，当下 AI 所处阶段，像 1998-1999 年的互联网，正在大规模投资基建（电力 + 算力 + 算法）。长期看 AI 产业充满巨大潜力，"AI 没有泡沫，但早期 AI 公司会有泡沫 "，未来万亿市值巨头可能不是眼前的明星公司。

2026 年，" 物理 AI" 成为了技术开发和资本押注的最热方向，而过去五年，张亚勤和团队在自动驾驶、具身智能仿真、工业能效 AI 等已布局了多家公司。对于 " 趁市场热多融资 " 的惯性，他直言拿太多钱，业务不聚焦，结果可能是钱烧完了却没转化成业绩。

近几年，张亚勤每年都会给出 AI 发展的观点预判。比如，在 2024 年 6 月，他提出需要开发新的 AI 算法体系，包括世界模型、Agent 等，以实现百倍效率提升。从时间维度，为什么说当下 AI 像 1998 年的互联网？面向物理世界的 AI 数据缺失，VLA、世界模型技术路线如何结合？如何看待教授创业？

自 2024 年起，每年 6 月，AIR 都会在无锡举办一场 " 太湖对话 "，今年已是第三届。以下是论坛前夕，张亚勤与「暗涌 Waves」的对话（经编辑）：

教授重站创业 C 位，

「暗涌」：三年前，投资机构还在系统反思 " 不投教授 "。新一轮具身智能和 AI 创业中，科学家又重新站在了 C 位，你怎么看待 " 教授创业 "？

张亚勤：这轮 AI 创业是强技术驱动，因此教授技术能力和理念就格外重要。现在，中国有一批高水平教授，已经能做出世界级的主流创新，而不再是跟随美国。

科学家创业有三种方式：第一种，教授从院所离职，All in 创业；第二种，教授以学术为主，将好的研究与技术转化成企业，但他并不直接管理公司，公司市场化运作；第三种，教授仍在学校就职，同时还管理多家公司。第三种，基本做不成。

「暗涌」：第一、二种方式比较好？投资人可能更偏好投全职创业的教授。

张亚勤：第一种有成功的。像高通，是由两位 MIT 教授创建；AIR 彭建教授全职创立了华深智药，在 AI 制药赛道表现非常好。

但其实大部分教授不适合 run company，即便 all in，教授做 CEO 创业的失败几率也远高于普通创业者。这在中美都一样。因为把研究变成技术，把技术变成产品，再把产品规模化铺开，中间有很多鸿沟。很少有人既懂前沿研究，可以从 0 到 1；又懂市场和商业化，能从 1 到 N。

AIR 教授创业大部分是第二种：科学家有了不起的研究和技术，作为联合创始人或首席科学家去孵化企业，以技术入股。同时，企业寻找一位懂商业和工程的 CEO，按市场化方式运作。这样能发挥教授的优势，也兼顾企业的发展特点，是比较好的模式。

「暗涌」：全职创业，一旦成功，会有非常大的收益。

张亚勤：全职创业的风险也很大，可能到最后商业没做好，科研也丢了。来 AIR 的教授绝大多数是想做科研，希望有用的基础研究成果能产业化，最好有团队帮他们做产业化。我也比较喜欢在学校做科研、培养人才，我们学院有三个博士生拿过清华特奖。

AIR 的定位还是一家科研机构，并非是孵化器。孵化器通常会一次孵化很多项目，有 VC 投资机制、靠规模取胜，但我们一年只有一两个公司出来。

「暗涌」：AIR 一个目标是为行业输送 CTO、顶级架构师，你觉得培养这类人才的核心是什么？

张亚勤：核心是在成长阶段就要有产品和系统思维。只在校园里，没有真实场景和数据，博士生也能做算法、写论文；但关键是验证它能否在真实系统里跑起来。

这也是 AIR 成立的一个初衷。我们跟字节、阿里、百度、比亚迪等 20 多家大企业合作，通过联合实验室等方式做科研项目，AIR 很多学生都会到大厂实习，参与到最前沿的研发系统中，做规模化验证。

「暗涌」：现在有许多年轻的大学生、极客辍学创业。

张亚勤：现在年轻人确实厉害，我很支持 AIR 有商业头脑的博士生、博后去创业。

高中生、本科生辍学创业，过去也有，像比尔 · 盖茨、扎克伯格。但这个成功率得看统计结果，对多数人而言，还是上完学比较好，不急那两年。大学也有提前毕业的通道，高校也鼓励学生孵化创业。

「暗涌」：适合做创业公司 CEO 的人很稀缺。你会帮孵化公司找 CEO 么，比较青睐怎样的 CEO 画像？

张亚勤：创业第一步，在技术孵化阶段，教授可以兼顾一些公司管理工作。最难的是下一步，找到 CEO，把工程团队和商业模式搭建起来。现在我们孵化的多数企业正从第一步走向第二步，还处于 " 证明自己 " 的阶段。

理想状态是我能为每一个团队配个合适的 CEO，但事实上，我真的配不了（笑）。

CEO 不一定是职业经理人，可能是连续创业者、科研团队里的年轻人。现在 AI 的人才，我们反而比较容易找，难得是找到产业里扎根很深的人，既有产业经验，又能理解一部分 AI 技术。

核心是这个人要有非常强的信念感，创业过程一定会遇到很多困难，有些人在艰难时候会容易动摇。没有信念感，几乎做不成。

我还是想说一句，不能把创业想得太简单。像 1500 亿这样的估值数字，其实没太大意义。企业最终还是要靠技术实现商业化，有收入、有利润，形成竞争力。

「暗涌」：创业公司拿到高估值，应该算阶段性的成果，但你觉得要格外冷静？

张亚勤：我看到是一种风险。市场期望越高，你需要证明得就越多，这个阶段必须清醒。在学院里我会给大家泼冷水，（成立公司前）会问他们很多：到底要解决什么问题；AI 能解决什么；谁来为产品买单。短期拿到高估值，并不能说明已经成功了。

比如当前机器人赛道，现在有几百家公司，但可能三四年后只会剩下 20 家公司。像大模型赛道，最终国内可能只剩下三四家。我们经历过互联网泡沫，当时资本市场比现在还狂热，但很多明星公司迅速在市场上消失了。

「暗涌」：这种冷静，跟 " 趁着市场好，多融资 " 的逻辑，冲突吗？

张亚勤：创业需要足够的钱，但钱不是最重要的因素。

做 startup 本来就是九死一生，一定要聚焦。如果还没想清楚，就拿很多钱，什么都干；更多情况是：钱烧完了，也没能转化成业务结果。当一家企业有真正好的产品、独特的技术、足够强的团队和清晰的前景，一定会有人愿意投。

「暗涌」：人人都说 AI、具身行业有泡沫，却也都义无反顾地往里冲。这种氛围跟上一波互联网创业有点像，但又很不一样。

张亚勤：不同的是，多数互联网公司一开始没有规模化收入，但这次 AI 头部公司的收入增长很快，像 OpenAI、Anthropic 的收入增速史无前例，所以市场对 AI 更有信心。

这种高增长能不能持续，我不确定。

目前全球几家科技巨头，在数据中心、芯片等方面的投入非常高，这也是基于对未来的高预期——花了之后还能赚回来。这些投入到底能不能转化成订单、收入？我觉得还需要证明。

未来 2-3 年是关键的观察期，如果（巨头）收入不能按现在预期的指数曲线走，这个循环就会受到影响。大公司会受到影响，小企业会更加敏感。

「暗涌」：以互联网技术周期对照的话，你觉得现在 AI 大概处在什么阶段？

张亚勤：可能相当于 1998、1999 年。互联网刚刚兴起，雅虎被追捧的阶段。

互联网不是泡沫，但互联网早期很多企业有泡沫。长期看 AI 产业没有泡沫，但 AI 公司和估值会有泡沫。短期的资本炒作没有意义。做企业还是要专注，愿意做脏活累活，用结果证明自己的价值。

让机器人先干脏活苦活

「暗涌」：你此前提到机器人还没有迎来 chatGPT 时刻，通用机器人可能还得 10-15 年。这中间的 " 卡点 " 关键有哪些？

张亚勤：通用的家庭机器人、服务机器人确实还需要很久，可能 10 年以上。但如果是在特定场景中，做具体工作的机器人其实很快就可以实现。像无人驾驶，本质是 " 开车机器人 "，技术难点基本已经突破，剩下的更多是工程化和商业问题。像工业机器人，进程会更快。

家庭机器人面对的环境非常开放、复杂，最重要的是它要和人交互：和人说话、理解人的意图、真正完成动作。这其中还有一些科学问题没解决，理论和算法都还没有真正突破。

「暗涌」：为什么物理世界 AI 会慢很多？

张亚勤：十年前，我就把智能分成三类：数字智能、物理智能和生物智能。

数字智能发展得快，是因为过去 20 多年，互联网积累了海量数据，文字、图片、视频都可以训练模型，有 scaling law，再加上算法和算力，模型的通用能力就会变强。

但物理世界情况不同。第一，我们没有那么多数据；第二，物理世界的场景非常分散；第三，数字世界的比特，要和物理世界的原子结合起来。原子世界，并不遵从摩尔定律。关节、手等机械结构的控制，也不是靠堆算力能解决。所以物理智能的进展会更慢一些。

没有足够的数据怎么办？有几种方式：一是学人，从第一人称视角，收集人和世界交互的数据；二是机器人自己去采集数据；三是在仿真环境里模拟各种场景，生成模拟数据。

但是，在模拟器里跑通了，到真实世界里不一定能 work。所以我们在做 RSR（Real-to-Sim-to-Real），从真实世界到模拟场景，再回到真实世界，形成闭环。这个闭环非常难，AIR 周谷越教授在这个方向做了很多年，在特定场景很快就会有突破。

「暗涌」：面对物理世界数据缺失的挑战，目前有哪些可行的技术路线？现在关于 VLA、世界模型的讨论非常热烈。

张亚勤：现在确实有一些方法，但还没能像互联网那样，收集到如此海量的数据。

一种方式，是把大语言模型的方法论向外拓展，到能够处理自然语言、理解视觉信息并操控物理行动的 VLA 模型（Vision-Language-Action）。

这一路线的好处在于主线还是语言，能用到现在大语言模型已形成的方法论；但问题是动作往往很难用语言精确描述。对机器人而言，视觉是最重要的输入，所以还有一种思路是从视觉直接产生动作，把语言作为辅助。

另一路径是世界模型。世界模型也有很多种，构想是希望机器真正去理解这个世界。怎么理解？有很多不同方式，比如做模拟器等。我觉得最终的方法，可能是这两种路线结合起来。

「暗涌」：怎么理解 " 两种路线的结合 "？

张亚勤：做 VLA、做各种不同的世界模型，我觉得没有绝对的对与错。要两种路线结合，是因为机器人面对的环境相当复杂。比如自动驾驶，开车过程更像以视觉为主、端到端的系统，不需要很多语言。

但机器人很多时候是通过与人对话、获得指令，它需要理解语言；做事时，又主要依靠视觉形成决策，再转化为电机的动作信号。这个过程，目前还没有清晰的 scaling law 可用。

在语言模型中，token（词元）是人类经过抽象的、有结构有含义的字，但图片的最小物理单元是像素，一片像素本身没有物理含义；动作也是一样的道理。

AIR 老师做了很多探索，詹仙园团队研发的 X-VLA 系统，尝试把不同机械臂、机器人的能力 " 归一化 "，实现部分技能的可泛化，可跨设备迁移。也有团队让模型观看大量流视频，来理解视频中的动作和环境。

在很多科研问题没突破的情况下，一方面要继续做通用性的研究，同时也要先在通用性要求没那么高的特定场景里，着手解决真问题。

「暗涌」：现在机器人可以率先用在哪些场景？

张亚勤：我觉得（机器人）首先要在真实生产力场景里用起来，先做人不愿意做的事，比如在极危险、艰苦的地方作业。比如我们现在和煤科院合作，开发煤矿场景里的无人车、机器人；和首创合作，开发地下管网巡检机器人、电网机器人等。

这类场景，目前还需要人机协作。我一直在讲，AI 和具身智能还是要帮助人，而不是上来就让机器人抢人的工作。

「暗涌」：当下 AI 领域有一个趋势，是不断追求 " 超级智能 "、" 通用 AI"。但听下来，你并不认为这是目前最重要的事？

张亚勤：作为科研目标，这当然可以。但从社会和企业角度，我认为还是要解决具体问题。

有些美国企业开始钻牛角尖，一味追求智能上限，仿佛拥有了 " 超级智能 "，什么都可以做。但假如没有明确目标，只是 " 学人、要比人更厉害 "，风险往往不可控。

而且，AI 是不是一定要 " 学人 "，一定要 " 超过人 "？我觉得未必。

人有好的部分，也有坏的缺陷；AI 在放大能力的同时，也会放大那些人性中坏的部分。这就有安全和伦理风险。

「暗涌」：你会格外关注 AI 可能存在的哪些风险？

张亚勤：AI 现在主要有三类风险：失控、滥用和系统性风险。系统性风险也包括失业等社会问题，但目前我更关注失控和滥用。

AI 系统越来越复杂，很多机理是人类并不清楚的黑盒。而且具备行动能力的 agent，正从实验室走向现实部署，存在自主复制、约束逃逸等现实隐患。2026 年 4 月，Anthropic 披露了模型 Claude Mythos，但没有向公众开放。因为 Mythos 能自主识别软件漏洞，有形成大面积网络攻击的风险。

所以，在一个 AI 产品、技术被设计时，就要明确它到底解决什么问题，这样 AI 的可控性会更强一点。AI 终究是要帮助人，让人活得更久、更舒适、更幸福一点。

宙世代

一起剪

相关标签