新浪财经 7小时前
对话张亚勤:AI不是泡沫,但AI公司有泡沫
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_caijing1.html

 

(来源:暗涌 Waves)

「AI 不一定要学人,不一定要超过人。」

访谈|海若镜 巴芮

6 月盛夏,在清华无锡研究院智能产业创新中心,我们见到了张亚勤院士。他匆匆赶来,一进门,就建议让室内温度降得更低些。

访谈中,聊起当下具身智能、AI 投资创业热潮,张亚勤也觉得大家应该降降温," 更冷静些,不要急躁 "。

五年前,张亚勤创建了清华大学智能产业研究院(以下简称 AIR ) ,聚集了多位有 AI 产业经验的知名教授。据介绍,如今 AIR 的第一届博士生已经毕业;而这里孵化、走出的十家公司,累计 " 融资约 150 亿元,估值 1500 亿元 "。其中,华深智药、它石智航等独角兽,在资本市场备受追捧。

1500 亿估值是个亮眼数据,但张亚勤却告诉我们:AIR 首要任务是做科研;孵化公司只是自然长出的副产品,而且多数公司正处在 " 证明能力 " 的阶段。

作为国内最年轻的 IEEE fellow、中国工程院院士,张亚勤经历过技术革命和资本周期的潮起潮落。在他看来,当下 AI 所处阶段,像 1998-1999 年的互联网,正在大规模投资基建(电力 + 算力 + 算法)。长期看 AI 产业充满巨大潜力,"AI 没有泡沫,但早期 AI 公司会有泡沫 ",未来万亿市值巨头可能不是眼前的明星公司。

2026 年," 物理 AI" 成为了技术开发和资本押注的最热方向,而过去五年,张亚勤和团队在自动驾驶、具身智能仿真、工业能效 AI 等已布局了多家公司。对于 " 趁市场热多融资 " 的惯性,他直言拿太多钱,业务不聚焦,结果可能是钱烧完了却没转化成业绩。

近几年,张亚勤每年都会给出 AI 发展的观点预判。比如,在 2024 年 6 月,他提出需要开发新的 AI 算法体系,包括世界模型、Agent 等,以实现百倍效率提升。从时间维度,为什么说当下 AI 像 1998 年的互联网?面向物理世界的 AI 数据缺失,VLA、世界模型技术路线如何结合?如何看待教授创业?

自 2024 年起,每年 6 月,AIR 都会在无锡举办一场 " 太湖对话 ",今年已是第三届。以下是论坛前夕,张亚勤与「暗涌 Waves」的对话(经编辑):

教授重站创业 C 位,

「暗涌」:三年前,投资机构还在系统反思 " 不投教授 "。新一轮具身智能和 AI 创业中,科学家又重新站在了 C 位,你怎么看待 " 教授创业 "?

张亚勤:这轮 AI 创业是强技术驱动,因此教授技术能力和理念就格外重要。现在,中国有一批高水平教授,已经能做出世界级的主流创新,而不再是跟随美国。

科学家创业有三种方式:第一种,教授从院所离职,All in 创业;第二种,教授以学术为主,将好的研究与技术转化成企业,但他并不直接管理公司,公司市场化运作;第三种,教授仍在学校就职,同时还管理多家公司。第三种,基本做不成。

「暗涌」:第一、二种方式比较好?投资人可能更偏好投全职创业的教授。

张亚勤:第一种有成功的。像高通,是由两位 MIT 教授创建;AIR 彭建教授全职创立了华深智药,在 AI 制药赛道表现非常好。

但其实大部分教授不适合 run company,即便 all in,教授做 CEO 创业的失败几率也远高于普通创业者。这在中美都一样。因为把研究变成技术,把技术变成产品,再把产品规模化铺开,中间有很多鸿沟。很少有人既懂前沿研究,可以从 0 到 1;又懂市场和商业化,能从 1 到 N。

AIR 教授创业大部分是第二种:科学家有了不起的研究和技术,作为联合创始人或首席科学家去孵化企业,以技术入股。同时,企业寻找一位懂商业和工程的 CEO,按市场化方式运作。这样能发挥教授的优势,也兼顾企业的发展特点,是比较好的模式。

「暗涌」:全职创业,一旦成功,会有非常大的收益。

张亚勤:全职创业的风险也很大,可能到最后商业没做好,科研也丢了。来 AIR 的教授绝大多数是想做科研,希望有用的基础研究成果能产业化,最好有团队帮他们做产业化。我也比较喜欢在学校做科研、培养人才,我们学院有三个博士生拿过清华特奖。

AIR 的定位还是一家科研机构,并非是孵化器。孵化器通常会一次孵化很多项目,有 VC 投资机制、靠规模取胜,但我们一年只有一两个公司出来。

「暗涌」:AIR 一个目标是为行业输送 CTO、顶级架构师,你觉得培养这类人才的核心是什么?

张亚勤:核心是在成长阶段就要有产品和系统思维。只在校园里,没有真实场景和数据,博士生也能做算法、写论文;但关键是验证它能否在真实系统里跑起来。

这也是 AIR 成立的一个初衷。我们跟字节、阿里、百度、比亚迪等 20 多家大企业合作,通过联合实验室等方式做科研项目,AIR 很多学生都会到大厂实习,参与到最前沿的研发系统中,做规模化验证。

「暗涌」:现在有许多年轻的大学生、极客辍学创业。

张亚勤:现在年轻人确实厉害,我很支持 AIR 有商业头脑的博士生、博后去创业。

高中生、本科生辍学创业,过去也有,像比尔 · 盖茨、扎克伯格。但这个成功率得看统计结果,对多数人而言,还是上完学比较好,不急那两年。大学也有提前毕业的通道,高校也鼓励学生孵化创业。

「暗涌」:适合做创业公司 CEO 的人很稀缺。你会帮孵化公司找 CEO 么,比较青睐怎样的 CEO 画像?

张亚勤:创业第一步,在技术孵化阶段,教授可以兼顾一些公司管理工作。最难的是下一步,找到 CEO,把工程团队和商业模式搭建起来。现在我们孵化的多数企业正从第一步走向第二步,还处于 " 证明自己 " 的阶段。

理想状态是我能为每一个团队配个合适的 CEO,但事实上,我真的配不了(笑)。

CEO 不一定是职业经理人,可能是连续创业者、科研团队里的年轻人。现在 AI 的人才,我们反而比较容易找,难得是找到产业里扎根很深的人,既有产业经验,又能理解一部分 AI 技术。

核心是这个人要有非常强的信念感,创业过程一定会遇到很多困难,有些人在艰难时候会容易动摇。没有信念感,几乎做不成。

我还是想说一句,不能把创业想得太简单。像 1500 亿这样的估值数字,其实没太大意义。企业最终还是要靠技术实现商业化,有收入、有利润,形成竞争力。

「暗涌」:创业公司拿到高估值,应该算阶段性的成果,但你觉得要格外冷静?

张亚勤:我看到是一种风险。市场期望越高,你需要证明得就越多,这个阶段必须清醒。在学院里我会给大家泼冷水,(成立公司前)会问他们很多:到底要解决什么问题;AI 能解决什么;谁来为产品买单。短期拿到高估值,并不能说明已经成功了。

比如当前机器人赛道,现在有几百家公司,但可能三四年后只会剩下 20 家公司。像大模型赛道,最终国内可能只剩下三四家。我们经历过互联网泡沫,当时资本市场比现在还狂热,但很多明星公司迅速在市场上消失了。

「暗涌」:这种冷静,跟 " 趁着市场好,多融资 " 的逻辑,冲突吗?

张亚勤:创业需要足够的钱,但钱不是最重要的因素。

做 startup 本来就是九死一生,一定要聚焦。如果还没想清楚,就拿很多钱,什么都干;更多情况是:钱烧完了,也没能转化成业务结果。当一家企业有真正好的产品、独特的技术、足够强的团队和清晰的前景,一定会有人愿意投。

「暗涌」:人人都说 AI、具身行业有泡沫,却也都义无反顾地往里冲。这种氛围跟上一波互联网创业有点像,但又很不一样。

张亚勤:不同的是,多数互联网公司一开始没有规模化收入,但这次 AI 头部公司的收入增长很快,像 OpenAI、Anthropic 的收入增速史无前例,所以市场对 AI 更有信心。

这种高增长能不能持续,我不确定。

目前全球几家科技巨头,在数据中心、芯片等方面的投入非常高,这也是基于对未来的高预期——花了之后还能赚回来。这些投入到底能不能转化成订单、收入?我觉得还需要证明。

未来 2-3 年是关键的观察期,如果(巨头)收入不能按现在预期的指数曲线走,这个循环就会受到影响。大公司会受到影响,小企业会更加敏感。

「暗涌」:以互联网技术周期对照的话,你觉得现在 AI 大概处在什么阶段?

张亚勤:可能相当于 1998、1999 年。互联网刚刚兴起,雅虎被追捧的阶段。

互联网不是泡沫,但互联网早期很多企业有泡沫。长期看 AI 产业没有泡沫,但 AI 公司和估值会有泡沫。短期的资本炒作没有意义。做企业还是要专注,愿意做脏活累活,用结果证明自己的价值。

让机器人先干脏活苦活

「暗涌」:你此前提到机器人还没有迎来 chatGPT 时刻,通用机器人可能还得 10-15 年。这中间的 " 卡点 " 关键有哪些?

张亚勤:通用的家庭机器人、服务机器人确实还需要很久,可能 10 年以上。但如果是在特定场景中,做具体工作的机器人其实很快就可以实现。像无人驾驶,本质是 " 开车机器人 ",技术难点基本已经突破,剩下的更多是工程化和商业问题。像工业机器人,进程会更快。

家庭机器人面对的环境非常开放、复杂,最重要的是它要和人交互:和人说话、理解人的意图、真正完成动作。这其中还有一些科学问题没解决,理论和算法都还没有真正突破。

「暗涌」:为什么物理世界 AI 会慢很多?

张亚勤:十年前,我就把智能分成三类:数字智能、物理智能和生物智能。

数字智能发展得快,是因为过去 20 多年,互联网积累了海量数据,文字、图片、视频都可以训练模型,有 scaling law,再加上算法和算力,模型的通用能力就会变强。

但物理世界情况不同。第一,我们没有那么多数据;第二,物理世界的场景非常分散;第三,数字世界的比特,要和物理世界的原子结合起来。原子世界,并不遵从摩尔定律。关节、手等机械结构的控制,也不是靠堆算力能解决。所以物理智能的进展会更慢一些。

没有足够的数据怎么办?有几种方式:一是学人,从第一人称视角,收集人和世界交互的数据;二是机器人自己去采集数据;三是在仿真环境里模拟各种场景,生成模拟数据。

但是,在模拟器里跑通了,到真实世界里不一定能 work。所以我们在做 RSR(Real-to-Sim-to-Real),从真实世界到模拟场景,再回到真实世界,形成闭环。这个闭环非常难,AIR 周谷越教授在这个方向做了很多年,在特定场景很快就会有突破。

「暗涌」:面对物理世界数据缺失的挑战,目前有哪些可行的技术路线?现在关于 VLA、世界模型的讨论非常热烈。

张亚勤:现在确实有一些方法,但还没能像互联网那样,收集到如此海量的数据。

一种方式,是把大语言模型的方法论向外拓展,到能够处理自然语言、理解视觉信息并操控物理行动的 VLA 模型(Vision-Language-Action)。

这一路线的好处在于主线还是语言,能用到现在大语言模型已形成的方法论;但问题是动作往往很难用语言精确描述。对机器人而言,视觉是最重要的输入,所以还有一种思路是从视觉直接产生动作,把语言作为辅助。

另一路径是世界模型。世界模型也有很多种,构想是希望机器真正去理解这个世界。怎么理解?有很多不同方式,比如做模拟器等。我觉得最终的方法,可能是这两种路线结合起来。

「暗涌」:怎么理解 " 两种路线的结合 "?

张亚勤:做 VLA、做各种不同的世界模型,我觉得没有绝对的对与错。要两种路线结合,是因为机器人面对的环境相当复杂。比如自动驾驶,开车过程更像以视觉为主、端到端的系统,不需要很多语言。

但机器人很多时候是通过与人对话、获得指令,它需要理解语言;做事时,又主要依靠视觉形成决策,再转化为电机的动作信号。这个过程,目前还没有清晰的 scaling law 可用。

在语言模型中,token(词元)是人类经过抽象的、有结构有含义的字,但图片的最小物理单元是像素,一片像素本身没有物理含义;动作也是一样的道理。

AIR 老师做了很多探索,詹仙园团队研发的 X-VLA 系统,尝试把不同机械臂、机器人的能力 " 归一化 ",实现部分技能的可泛化,可跨设备迁移。也有团队让模型观看大量流视频,来理解视频中的动作和环境。

在很多科研问题没突破的情况下,一方面要继续做通用性的研究,同时也要先在通用性要求没那么高的特定场景里,着手解决真问题。

「暗涌」:现在机器人可以率先用在哪些场景?

张亚勤:我觉得(机器人)首先要在真实生产力场景里用起来,先做人不愿意做的事,比如在极危险、艰苦的地方作业。比如我们现在和煤科院合作,开发煤矿场景里的无人车、机器人;和首创合作,开发地下管网巡检机器人、电网机器人等。

这类场景,目前还需要人机协作。我一直在讲,AI 和具身智能还是要帮助人,而不是上来就让机器人抢人的工作。

「暗涌」:当下 AI 领域有一个趋势,是不断追求 " 超级智能 "、" 通用 AI"。但听下来,你并不认为这是目前最重要的事?

张亚勤:作为科研目标,这当然可以。但从社会和企业角度,我认为还是要解决具体问题。

有些美国企业开始钻牛角尖,一味追求智能上限,仿佛拥有了 " 超级智能 ",什么都可以做。但假如没有明确目标,只是 " 学人、要比人更厉害 ",风险往往不可控。

而且,AI 是不是一定要 " 学人 ",一定要 " 超过人 "?我觉得未必。

人有好的部分,也有坏的缺陷;AI 在放大能力的同时,也会放大那些人性中坏的部分。这就有安全和伦理风险。

「暗涌」:你会格外关注 AI 可能存在的哪些风险?

张亚勤:AI 现在主要有三类风险:失控、滥用和系统性风险。系统性风险也包括失业等社会问题,但目前我更关注失控和滥用。

AI 系统越来越复杂,很多机理是人类并不清楚的黑盒。而且具备行动能力的 agent,正从实验室走向现实部署,存在自主复制、约束逃逸等现实隐患。2026 年 4 月,Anthropic 披露了模型 Claude Mythos,但没有向公众开放。因为 Mythos 能自主识别软件漏洞,有形成大面积网络攻击的风险。

所以,在一个 AI 产品、技术被设计时,就要明确它到底解决什么问题,这样 AI 的可控性会更强一点。AI 终究是要帮助人,让人活得更久、更舒适、更幸福一点。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 张亚勤 air 融资 物理
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论