汽车商业评论 20小时前
对话元戎周光:一个现实的浪漫主义者
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

主零桥梁,进步阶梯

撰文 | 温   莎

编辑 | 黄大路

设计 | 甄尤美

"我希望公司以后可以成为基础设施,我特别喜欢拿中国移动来举例,它已经不是一个公司的名字了,而是成为一个名词了。"

2026年5月16日上午,广州,元戎CEO周光在第十八届轩辕汽车蓝皮书论坛与贾可的尖峰对话JackTok上,说出这段话。

在他之前,是地平线创始人兼CEO余凯、卓驭科技CEO沈劭劼的对话,周光在台下认真听了一个多小时。贾可的第一个问题,这些智能驾驶公司的负责人已经回答过很多遍了,但能有机会回答的人,每年都在减少。

"未来,智能驾驶公司还能留几家?"贾可问到。周光没给数字,他给了两个时间点。

2020年,元戎决定不做高精度地图,"我们应该是第一个放弃掉高精度地图线路的曾经顶尖的L4公司。"

2023年,元戎决定不做自研芯片,"我们应该在2023年的时候就断了芯片的念头,当时我们是想做芯片的。"

在做了两次减法之后,元戎还有留下来的资格。

两次减法

2019年2月,元戎成立于深圳。周光是创始人,清华基科班毕业,后赴德州大学达拉斯分校读人工智能博士,公司成立时,国内L4赛道的主流路径是"高精度地图+规则",周光在JackTok对话时把这条路形容为"开火车","开火车是不需要靠太多人工智能的。"他说。

2019年CVPR(Conference on Computer Vision and Pattern Recognition,IEEE国际计算机视觉与模式识别会议)大会之后,周光写下了公司发展:靠人工智能能解决静态感知。一年后,元戎放弃了高精度地图。

放弃的逻辑是反向的,不是高精地图贵,是高精地图不能泛化。"我们之前做过高清地图,知道那个方案是没有办法泛化的。"周光的算法是:"买两台车,配两个懂传统机器人技术的工程师,基本上两个月就可以串一个Demo,再花点时间打磨,能做出一条固定线路的全无人方案。"

但这条路没那么好走。无图选定之后,端到端是自然落点。"有图就是规则配规则……无图之后有很多的不确定性在现实世界当中不完美、不连续,通过神经网络处理会比较好。"

第二次减法发生在2023年。当年底ChatGPT之后大模型范式确立,周光把自研芯片的计划终止。

终止的逻辑也是反向的。在小模型范式下,端到端模型大约200T算力够用。"你都200T了,自研芯片或者是外面芯片比的就是‘我便宜’,最终你是要靠价格去拿订单。但大模型出来之后,未来几年的算力斜率是很陡峭的。"

周光认为,在陡峭曲线上做芯片的公司,会被下一代芯片厂商的下一代产品超过。还有一个更长期的逻辑,让元戎不再执着于自研芯片,"只有分工才能做到极致。"

与之相相对应的,头部造车新势力蔚小理也都在做芯片。"他们为什么要自研芯片"贾可问道,周光巧妙的借用了上一场对谈中余凯的一句话,"他们可能都想当马斯克。"

从2016年开始,特斯拉就已经开始组建团队自研芯片,截至2026年已推进至AI5(第五代)流片完成,计划2027年量产,算力达2000–2500TOPS,并布局自建晶圆厂(Terafab)以实现全栈掌控。

马斯克的芯片自研路线很成功。在周光看来,在自动驾驶芯片领域,英伟达是特斯拉的追随者。

"特斯拉所有物理端侧推理芯片,第一代是特斯拉做,第二代英伟达做,因为它快,第三代是其他的芯片厂商,英伟达的Drive Thor在跟特斯拉的HW4,下一代芯片在跟HW5,都是特斯拉在前面。"

一次豪赌‌

周光说自己不想当马斯克。两次断舍离的减法之后,周光不再做"看起来该做的事",剩下的是他不得不做的事情,也是要赌的事。

他赌的是一次范式转换。"智驾在2026年以前完全不是大模型的范式,都是小模型的范式,也不太需要那么多钱。"周光说。"但我认为从今年开始,自动驾驶会进入大模型的竞争节奏。"

2026年,大模型批量上车。小鹏、理想,还是吉利、智己,乃至大众等车企,纷纷推出了自己的方案;地平线、Momenta等智驾供应商,以及火山引擎、腾讯等玩家也悉数登场,元戎的转折来得更早。

让他笃定转型的是多模态视频生成。"我们就在想视频生成的本质任务是什么,你为了预测视频未来的几秒钟,隐藏空间就是预测视频里人物的行为。换到车端,如果能预测车的行为,等价于自动驾驶。"

智驾的下一站不是更精细的规则,而是更大的模型,周光意识到了这一点。

元戎启行2025年初开始做VLA,视觉-语言-动作模型。"去年一年不仅我们在尝试,小鹏、理想都有在做大模型的尝试。"周光承认走过弯路:"理论上来讲出来了之后,抄是最快的……但我觉得永远需要有人去Do Something Different。"

不止元戎,Waymo也走过这一步。"Waymo已经成功切换到大模型范式了,不是大家想象中的还在死磕高清地图。Waymo的CTO公开讲过他们成功切到端到端大模型、基座模型。"

大模型也有天花板。行业讨论自动驾驶进度,各大智能驾驶创始人最经常被问的问题就是,"什么时候能到L4"。周光用另一个单位:MPCI(‌Miles Per Critical Intervention‌,即‌每多少公里发生一次安全性接管‌,数值越大代表系统越安全)回答了这个问题。

"千公里MPCI自动驾驶还是辅助驾驶,还是一个L2.9。"周光认为,大模型的天花板是万公里MPCI,"千公里到万公里这一段,正是特斯拉V14到V15想突破的,特斯拉V14达到千公里安全接管,这是10倍于目前所有小模型的结果。"

行业都在猜测智能驾驶的终局,周光认为,智驾会分叉成两条路。

一条卷成本。用100T的小芯片做小模型,"毕竟很多车不可能装一个几万元的芯片。这条路的智驾成本占整车的比例继续压低,还是维持几个点吧,小几个点的那种"。

另一条做极致安全。算力从1000T推到10000T,"到干掉人",这条路的智驾成本占整车的比例会继续往上走。

两条路径,两类公司,两种结局。

周光的落点清楚,元戎不在卷成本那条上,"更大的算力真正是把人从简单的、重复的劳动中解放出来,这是我们的愿景。"

成为基础设施

走第二条路,靠的不是算力账,是人。

2026年4月,元戎首次对外确认:前DeepSeek研发负责人、多模态技术核心研究员阮翀已加盟元戎,出任首席科学家。阮翀此前与梁文锋共同署名论文9篇,深度参与DeepSeekMoE、DeepSeek-V3、Native Sparse Attention和Janus系列等底层研究,是2025年9月《Nature》收录论文《DeepSeek-R1》的作者之一。

技术大神的加入让元戎的未来有多了一些确定性,贾可在JackTok上问周光:智能驾驶还能从哪些公司挖人?

周光说挖人不只是钱的事,阮翀的加入"挺有偶然","本来是十多年的朋友才来的"。

他承认,事实上大模型人才不太容易流通。

不容易流通的方向是双向的。一个方向,是AI公司不愿意来智驾。"OpenAI也好,在Anthropic也好,我只知道Waymo的人往那边跑,最近Waymo两个负责人刚刚去了OpenAI。"

另一个方向,是智驾公司不容易把人挖到通用AI的工资水平。贾可转述余凯和沈劭劼在前一场对话里的判断,"他们看不上咱们搞自动驾驶的。"

周光没有接这个话,"也都不是钱能搞定的。"他说,也要有好的股权激励体系,公司愿景和价值观相符,文化很关键。

元戎启行的愿景很清晰,成为基础设施,像中国移动那样的名词。

周光不是第一次这样说。2024年11月,元戎启行获得长城汽车1亿美元C1轮战略融资。融资发布会上,周光说过同一句话:"我相信,通用人工智能时代,AI会成为基础设施,也坚信元戎启行会是AI 3.0时代的主要参与者。"

"你的目标就是要把元戎从现在的聚光灯上干到聚光灯下去?"贾可问到。"差不多吧。"他回答。

成为基础设施的前提是先被广泛地用。

元戎启行在2026年的KPI是三个数:辅助驾驶系统交付规模突破100万辆,MPCI提升到1000公里以上,用户高频使用率达到50%。截至2026年3月,元戎启行累计交付近30万台搭载城市NOA的车型,累计行驶里程超13亿公里,系统成功避免前向碰撞14.1万次、后向碰撞4.7万次。

从30万到100万,是元戎2026年要走的路;从聚光灯下到名词,是元戎下一个十几年要走的路。

以下为贾可与周光的对话实录,《汽车商业评论》整理,此处略有删节。

贾可:第十八届轩辕汽车蓝皮书论坛JackTOK继续TOK,接下来我们请到的是元戎CEO周光先生上来跟我一起对谈。

刚才和余凯、沈劭劼就自动驾驶已经进行了一个小时的TOK,接下来和周光进一步把话题延伸,他也认真听了上面两位的分享。我问刚才那两位,不叫留下谁,我想问还能留几家,有一个大概数。

我知道中国自动驾驶第三方公司舞台上活跃的几家,大家都很清楚;但元戎在这方面一直走在技术的前沿,比如端到端,在中国可能你是最早干这个事情的,是不是这样?

周光:对的,我们应该是在2020年开始做无图,端到端是从这套无图演进过来的。

贾可:也就是说你们一直走在时代的前列,走到今天发展这个过程,越来越被主机厂、媒体发现你们的力量。你说一下,你们为什么能够从无图开始?以前我们都知道做高清地图,但是没有想到技术范式在转移,你们当时转向无图的转折是什么契机?

周光:智驾这个行业是比较早就有的,2016、2017年,当时智驾行业从业人员各种都有,但我们团队一直都是做AI出来的,第一天就开始做深度学习的。

2019年CVPR的时候我们就感觉通过人工智能应该是可以解决静态感知的问题,所以2020年就决定要做无图。其实也没有管行业里面怎么看,因为我们之前做过高清地图,知道那个方案是没有办法泛化的。

可能做Demo非常快。我记得当时买两台车,只要有人懂传统机器人那些技术,基本上两个月就可以串一个Demo,再花点时间打磨一下可能也能做到一条固定线路的全无人,但是从AI来讲知道这个玩意肯定是不泛化的,所以很早就决定了做静态感知,就是无图。

做完了无图之后自然而然你会发现无图的智驾一定要配合端到端,有图的时候不是端到端,有图就是规则配规则,有图的自动驾驶就像开火车,开火车不需要靠太多人工智能;但是无图之后在现实世界中有很多的不确定性。

不确定、不完美、不连续,通过神经网络处理会比较好,就有了后面的端到端,端到端也是我们当时最先推出来的。

贾可:你刚才说你的转折,从高清地图到无图到做端到端,因为你是搞AI的。

周光:对。我们公司核心成员基本上都是做人工智能出来的,也不是其他行业转行过来的,这是我们一个比较不同的点,今天做大模型的全都是做人工智能出来的,很少有跨行业的。

贾可:你觉得余凯和沈劭劼都是做AI的吗?

周光:他们都是大AI行业的。

贾可:还不是你说的AI行业?

周光:都是AI行业的。

1

 大模型的天花板

贾可:刚才他们讲,现在国外的数字AI公司、包括做物理AI的都是大公司巨头,每年要很多钱;中国公司本质上大部分搞智驾的没有那么多钱,大模型大力出奇迹,你怎么看?

周光:智驾去年以前完全不是大模型的范式,都是小模型的范式,也不太需要那么多钱,通过精细化的数据采集、通过传统小模型的训练范式就能做,但我从今年开始,自动驾驶会进入大模型的竞争节奏。

不仅自动驾驶,今年尤其是在多模态技术突破以后,这种大厂对自动驾驶也感兴趣了,尤其是多模态视频生成,我们就在想视频生成的本质任务是什么,是你预测这个视频的下一秒或者下10秒,你为了预测视频未来的几秒钟,隐藏的空间就是预测视频里面人物的行为。行为如果换在车端,如果我能预测车的行为,是不是就等于自动驾驶了。

贾可:他们说预测车的行为不需要预测10秒,只要3—5秒就够了?

周光:AI从任务本质来讲,其实预测行为跟预测未来几秒钟视频是高度类似的,尤其是在视频生成有了这么多突破之后,今年初视频生成的模型越来越真实了,也符合物理了。这个其实是Trigger向大模型、尤其是多模态视频生成领域专家进入这个行业的原因。

说实话,预测视频远远没有在物理世界里预测机器人应该做什么更好玩,而且我觉得产生的价值是不一样的:视频生成能干啥,就是弄点电影、小视频;如果你能够预测所有的物理运动,其实你就等于是具身,百倍、千倍大于视频生成。这是不奇怪的,而且我觉得这些人一定会进入这个行业的。

贾可:现在元戎启行的大模型能力到什么程度了?刚才两位都说90分了,多模态原生基座模型包括强化学习+世界模型也好,大模型到90分了,但是我觉得似乎好像有点乐观,你准确评价元戎启行现在大模型能力到底多少。你说过现在彻底从小模型到大模型,但现在很多还只是中模型。

周光:这么来说吧。2025年年初就开始尝试做大模型,当时叫VLA。去年一年不仅我们在尝试,小鹏、理想都有在做大模型的尝试。到今年突然之间我感觉行业整个都在说Physical AI,我们去年年初的时候就提了Physical AI这个事了,所以才有了后面的VLA,通过一年的迭代发现还是走了一些弯路的。

直到今年年初,一个是多模态生成带来行业预训练整体的提升,我觉得在年初的时候还是比较关键的;国内有一家公司已经在这方面有一些进展了,我觉得这个还是挺欣慰的。

贾可:去年的时候?

周光:今年年初的时候。

贾可:不是自动驾驶公司吧?

周光:是自动驾驶公司。我觉得这是一个好事,你看到这个方向能够有进展其实蛮好的。在去年经过一年大模型方向的尝试,还是发现了一些问题,比如真正想在自动驾驶物理世界做好大模型,你需要大模型的人,这也是我们通过一年的试验发现需要大模型的人过来,大模型的人更有经验处理海量的数据。

不只是我们,最近和Waymo朋友的交流,Waymo已经成功切换到大模型范式了,不是大家想象的Waymo还是死磕高清地图。最后Waymo的CTO讲话也讲了他们成功切换到端到端大模型、切换到基座模型了。它可能是目前上车效果最好的,因为它毕竟还是一个工控机,提前可以上7B、10B的模型,今天所谓量产车里面都还没有那么大的模型。

贾可:刚才余凯和沈劭劼都讲了,他们实际上都是端到端+基座模型。但这一块你刚才说去年也走了一些弯路,弯路主要是指什么?

周光:大模型擅长的是什么,大模型擅长的是场景的理解、长时序、长场景的理解;像小模型、端到端擅长的是规则,擅长处理即时信息,处理1秒以内的信息,这可能是规则最擅长的;再往下做,小模型可能处理2秒、3秒,但是3秒以后对场景的理解、对时序的理解就不是小模型和规则擅长的了,肯定还是需要大模型的能力。

目前看到大模型在即时响应上有它的问题。

贾可:什么问题?

周光:大模型目前需要即时响应有它的弊端,不能很快地响应需要马上反应的情况,所以怎么训好这个大模型,让它对即时响应也能够产生效果,我觉得还是蛮难的,需要有真正大模型经验的人来。

贾可:这里面我有两个问题,把大模型即时响应能力训练好,一方面需要做大模型的人来干这个事情,也就相当于人才有点迭代、或者转折了?

周光:也不只是我们,哪怕Waymo、特斯拉也有这种感受。大模型有它的天花板。今天的智驾也没有摸到这个天花板,我们今天还讨论50、100公里一次的接管;大模型的范式上了就是千公里起,当你到了之后并不是说可以快速到1万、10万,发现到了一个点上也是有天花板的。

贾可:这取决于有更多做大模型的人来干这个事情,就跟刚才他们讲的搞数字AI的人来干这个事情可能会更顺利一些、更顺畅一些,还是取决于AI芯片算力能到多少TOPS?我看现在整个AI芯片本身还不具备这么高的算力。

周光:我觉得芯片是肯定的,我们也不可能拿着10年前的显卡跑大模型,也不现实。我觉得芯片是本质的,目前来说500T以上的芯片是可以作为大模型最低的要求。

贾可:500T能做多少参数?

周光:500T是比较小的大模型,1B到2B左右。

贾可:1B到2B大模型能达成的自动驾驶效果怎么样?

周光:我们直接看特斯拉。特斯拉FSD V14已经做到千公里安全接管,这是10倍于目前所有小模型的结果。

贾可:它的算力也就是500TOPS。

周光:从英伟达这个Orin-X算力芯片级别切换到Thor这个算力级别,目前来说在国内并没有体现出来Thor明显强于英伟达Orin-X,但我们看到的是特斯拉从V13到V14,就是所谓的算力从100T、200T切换到500T以上有明显的提升,其实就在于你上了这种大模型的架构、用大模型的范式来做,这一步的增幅是确定的,从100到1000这一步增幅是确定性有的。

当你切换大模型、以及到500T以上的芯片,毕竟有人跑通了,我觉得没有人跑通是最让人最难受的。

贾可:如果做到L3级别的话,需要多少算力的芯片来匹配这个大模型?

周光:如果说我们讨论的L3是一个受限制场景的话,它可能跟算力要求并不大。

贾可:那L4,直接L4吧。

周光:如果说全域的,具备泛化能力的全无人,我觉得才会对模型的本身有要求,如果只是这几条路能开。

贾可:那个不算。

周光:5年前就已经全无人了。

贾可:那L4,直接说L4。

周光:对,规模化的,我觉得是5000T以上吧,因为1000T以上的接管我们也是看到了的,对吧,500T的芯片能做到,毕竟V14已经交答案了,但现在你看V15的芯片算力已经是一个质变,最新流片的信息来看,特斯拉的AI 5芯片是接近于3000T的算力,144GB的高带宽内存,这个在基层方面的成本都是非常昂贵的。这一代,我觉得是寄希望于能够从1000T到10000T吧,我相信对10000T的期待应该是在10倍的提升。

贾可:那你觉得这样的芯片会什么时候出来呢?比如说5000TOPS的芯片会什么时候出来?

周光:我觉得在明年下半年应该就会有,今年可能会有一些缝合的芯片,比如说小鹏的图灵芯片就是几个拼在一起的,通过一些技术手段,真正单颗单芯片会在明年出来,应该都有规划。

贾可:英伟达的吗?

周光:不止一家,都有这个规划了,当马斯克开始跑的时候,所有人都需要跟上的。

贾可:那只要两颗就能到1万TOPS了?

周光:对。

贾可:可以串在一起吧?

周光:对,所以说未来智驾还是可以卷成本的,还是可以用100T小芯片做小模型,毕竟很多车不可能装几万元的芯片。另外一条路就是极致的安全,1000到10000再到干掉人,这是一条路,可能这条路的智驾成本会在整车上继续上升,另外一条路可能还是维持几个点吧,小几个点的那种,我认为是两条路径的。

贾可:元戎启行是追求大算力做L4、L5吗?

周光:我们整体研发方向是往基座模型走的,毕竟之前我们做的小模型也是在2024年、2025年都交了版本,这个更多还是降本,是不是可以用更便宜的芯片去做这件事,更大的算力真正把人从简单的、重复的劳动中解放出来,这是我们的愿景。

贾可:5000TOPS或者10000TOPS是匹配你说的大模型是400亿参数(40B)的大模型,如果达到那样的一个大模型,也就说不是完全无人驾驶了?

周光:也不是。其实你要看像Tesla,哪怕今天的Waymo,它是一个不受算力限制的公司,他们切换了大模型范式,但其实还是会有问题的,只不过你面对的Corner Case也许到1万的时候会面临这代技术架构的天花板,我觉得可能到万公里级的,其实大模型也会有一个天花板的。

贾可:这个天花板到底能不能捅破?

周光:我不知道,每一代技术架构都有自己的天花板,像小模型的天花板,我觉得是百公里的MPCI,在城市里面,因为到高速上面都到几百、千公里了,这没有什么好说的。

贾可:千公里日常根本就不需要接管了。

周光:对。千公里MPCI的自动驾驶还是辅助驾驶,还是一个L2.9,那你为什么要买一个一千公里MPCI的自动驾驶?为什么不买一个一百公里的呢?你要回答这个问题,我都干不掉人,对不对?

2

 自动驾驶是一种信仰

             

贾可:你们是找了DeepSeek的阮翀来做你们的CTO,是吧?

周光:不是,是首席科学家。

贾可:首席科学家说过一句话,好像说自动驾驶系统是一种信仰。

周光:是的。

元戎启行首席科学家阮翀演讲

贾可:信仰的话,某种意义上就跟你刚才的话是匹配的,是总归有一个天花板,那是不是永远都达不到?

周光:也不是,就像今天我们已经运行的Robotaxi其实就是几千公里、一千公里的MPCI,通过运营手段可以实现商业化,现在一些运营能力很强的公司看似布局Robotaxi了,不是因为技术方面。

1万公里,我觉得是摸得到的,是没问题的,但1万公里肯定做不到。如果你没有运营、后台没有人,我觉得也不行。现在有1万公里,你可以做到人车比1:20,高峰期你可以把这个东西拿出来,然后通过地勤、通过云端运营做全维度运营的,这个今天也验证了,今天Robotaxi都已经验证了万公里级的。

但真实数据,我最近也知道他们MPCI的数据还没有到这个级别,还少一些的,就已经可以了,这是一个运营问题。只不过说一个100万公里MPCI不需要运营了,这可能跟人是一样的。

贾可:所以现在元戎启行在Robotaxi这一块也是在投入的?

周光:我觉得自动驾驶的终局一定是把人给去掉的,问题是你以什么样的角色去参与这个行业。为什么说我们在2020年的时候决定不去做高精度地图了,2021年的时候已经证明了这不是一条正确的路,我们应该是第一个放弃掉高精度地图线路的曾经顶尖的L4公司。

贾可:对。所以现在你觉得是一条正确的路,你找到了可以做Robotaxi运营这方面能够?

周光:人车比嘛,其实通过云端、地勤种种手段去做。

贾可:未来,你觉得家庭无人驾驶汽车,因为它没有运营,自己开、自己做,你觉得这方面未来会消失吗?还是说会给他们提供?

周光:我觉得还是得有。我们假设来说,如果技术不能从1万突破100万,那就是说这个车只能靠运营能力很强的团队或者公司去做,那你家庭用肯定也得有。

贾可:也有?

周光:对,你也得有。很难说一个家庭的车交给第三方帮你运营,牵涉到隐私,牵涉到很多问题在里面。

3

 L4什么时候能到

贾可:按照你现在大模型的能力,加上芯片现在的能力,你觉得L4什么时候能到?就是刚刚余凯讲到的"闭眼开"。

周光:我觉得千公里是看得见的,千公里到万公里其实正是特斯拉想突破的。Waymo今天的万公里级是端到端,还是配合了一些传统的高精度地图的辅助信息,只不过已经不是传统那套以规则驱动的线路了,是一个端到端的大模型线路,但高精地图会作为提示词存在,这还是有范式的区别。

我觉得很快的,今年马斯克就会给出一个答案,如果说是无图、轻图的模式,大规模量产的模式是不是能跑通到万公里级。

贾可:你说现在Waymo还有高清地图,现在主流不都是轻图了吗?

周光:今天是指这些Robotaxi公司,这么说吧,还是会用一些地图元素,可能不再是曾经高清地图的模式了,是轻地图模式的存在了。

贾可:如果是这样,对于家庭自动驾驶技术、用到家庭车上几年能到L4,因为小鹏讲也是很快,5年之内可能就到了,有那么乐观吗?

周光:我觉得一年左右到千公里,可能两年左右到万公里级别,两三年吧,我觉得这是确定性的。再往后走,其实还是不确定的。

贾可:是的。现在我们元戎启行的MPCI现在大概是多少了?

周光:今天就是几十到百级别,我觉得基于小模型的自动驾驶基本都在这个区间里,可能各有优劣势,这个场景你好一点、那个场景我好一点,换个城市我好一点,小模型就这样,大家平均分都是60—70,这是小模型的现状是没有谁是断代、领先的。

贾可:现在大家不都号称大模型了吗?

周光:你想跑100T、200T算力芯片,怎么能是号称大模型呢?

贾可:是大模型的思路,是吧?

周光:你也跑不了,说实话,那种芯片要跑大模型的参数确实挺难的。

贾可:你刚才说特斯拉500TOPS也能到千公里,你觉得今年我们能到千公里吗?

周光:我们的目标是今年希望到千公里。一年的时间内是问题不大的,其实牵涉到范式切换之后的验证迭代和稳定提升,这肯定要一定时间,但我觉得一年左右问题不大,是比较确定性的。

贾可:千公里达到以后算哪个级别,是L3还是?

周光:L3,到底你是基于什么样的模型能力去兜底,更多时候是运营概念。比如我虽然是普域的1000公里,可能在广州的花城大道和其他几个道上,我就通过电子围栏在这几个区间之内实现更高级别的安全性,甚至不排除也都有人在后台运营,毕竟模型提升是一回事,兜底又是一回事,两者的技术还是不太一样。

大模型里的人也会做AI Safety,也要解决幻觉的问题,还要解决一些关键词不能问,这可能也是由小模型规则来驱动的。

4

 元戎为什么不做芯片

   

贾可:元戎不做芯片,你想过要做芯片吗,还是依靠外部?

周光:我们应该在2023年的时候就断了芯片的念头,我们是想做芯片的。

贾可:为什么断了这个念头?

周光:因为看到大模型出来了,觉得不适合搞芯片了。如果大模型没出来,你就会觉得技术就是这样子的,小模型的端到端就是200T,如果200T是这个赛道的终极目标,那做个芯片是有明显的降本可能。

大家都是200T,自研的芯片或者是外面的芯片比的就是"我便宜",最终还是要靠这个去拿订单,但是你看到大模型这么Powerful,而且预判未来几年的技术斜率是很陡峭的,我觉得做芯片是不明智的。

当然,我们还有一点长期的想法,是觉得这个可能还是得分工的,只有分工才能做到极致。

贾可:蔚小理他们做芯片明智吗?他们也做芯片。

周光:可能都想当马斯克嘛,这也不是我说的,我只是借鉴一下刚才凯哥(余凯)的那句话。

贾可:对,你看特斯拉也做芯片,马斯克明智吗?

周光:我是这么看芯片公司在自动驾驶和机器人领域的地位。第一是特斯拉,因为本质上来讲车端的芯片是推理芯片,不是一个训练芯片,一定是特斯拉在最前面,然后才是英伟达,因为它跟得快。

贾可:跟得快,英伟达在跟?

周光:那肯定是英伟达在跟特斯拉,这毫无疑问的。你看那个Thor(英伟达DRIVE Thor)不就是在跟HW49(特斯拉Hardware 4.0)吗?下一代的芯片就跟HW5了,都是特斯拉在前面。

贾可:主要特斯拉走在前面了,没有人给它做这个芯片,它只能自己做。

周光:对。我觉得特斯拉所有物理端侧推理芯片,第一代是特斯拉做,第二代英伟达做,因为它快,第三代是其他的芯片厂商。这是我心里的看法,不是特斯拉第二个、英伟达第一个,是特斯拉第一个。

贾可:这个逻辑就通了。我们现在用的是高通的8797?

周光:对

贾可:英伟达我们也用?

周光:对,Thor。

贾可:但国际地缘政治形势,会导致我们未来用芯片、自动驾驶的芯片受限吗?

周光:今天来芯片,我反而觉得训练端还好,因为训练端的芯片哪怕工艺制程差一点,电费便宜;推理端说实话还是没有先进制程,挺危险的,毕竟(要)接电池。

比如说人家按照每瓦TOPS算,现在顶尖的可以做到每瓦15、20TOPS,如果说你用传统工艺可能就1瓦1TOPS,电池就扛不住,倒不是说造不出来,就是电池扛不住。如果你需要500T的算力,你是1瓦1TOPS的制程,那500瓦的散热器都烧化了。

我觉得车端能接受的估计是三五百瓦的芯片,顶天了;三五百瓦估计都是用非常好的液冷才能够处理的,100瓦以下可以靠风冷,5000瓦我不知道怎么搞。

贾可:今年黑芝麻华山A2000也是AI芯片,它的算力也算国内比较高的了。

周光:对。

贾可:这样的芯片能匹配大模型吗?

周光:其实只要是为大模型设计的芯片,同时算力满足要求,工具链跟上都行的,只是说,第一代在英伟达上去验证是最快的,因为它的生态稳定性高,但我相信这都可以跟上的,就像今天国内小模型的芯片,说实话,国内都造得没毛病了。

贾可:华山A2000已经算是大模型的AI芯片了吗,往这个方向去了?

周光:感觉是这样的一个目标,应该是属于摸到门槛了。

5

 要做基础设施

  

贾可:自动驾驶取决于芯片算力和大模型进一步模型能力的提升,模型能力进一步提升还取决于未来更多搞大模型的人才,你们挖来了DeepSeek的阮翀,那未来自动驾驶公司还能从哪些公司挖人,从Waymo这些AI公司?

周光:其实阮翀来这个行业,或者说来我们公司还是挺偶然的,有各种机遇的原因,本来是十多年的朋友才来的,其实不太容易流通的。

贾可:不太容易从那个方向流?

周光:对,不太容易流通。其实你的底层逻辑还是我讲的,多模态的突破,目前来说多模态是视频生成的突破。

下一个阶段,如果这个人对做事情本身更有追求,我觉得他来这个行业挺有意思的,因为你能预测视频,下一步你能预测动作、预测行为,其实这就是在物理世界里面进行操控,这是一个高度相关的任务。

但是你也知道在OpenAI也好,Anthropic也好,我只知道Waymo的人是往那边跑的,最近Waymo两个负责人刚刚去了OpenAI。

贾可:是的,因为刚才沈先生和余凯也讲了,他们看不上咱们搞自动驾驶的。

周光:那也不是。我觉得第一个是你有一个很好的股权激励体系,这也蛮重要的。

贾可:所以阮翀过来的话,一方面你有很好的股权激励体系。

周光:还有就是我们的愿景。我觉得你吸引这样的人才,公司得有一个愿景,你得有长期思维,有技术Taste,文化原因很关键。

贾可:不单单只是钱的问题,是吧?

周光:对,都不是钱能搞定的。

贾可:你觉得元戎启行的愿景是什么,什么样的文化吸引了像阮翀这样的人来?

周光:我其实特别希望我们公司以后可以成为基础设施。

贾可:AI的基础设施?

周光:对。我特别喜欢拿中国移动来举例,我们今天提"中国移动"是说你是手机信号、是手机这个事儿,其实它已经不是一个公司的名字了,它已经成为一个名词了。我觉得其实任何吊的技术过了20年,这应该是你最好的归宿了。

贾可:20年以后我就不跟你对谈了,因为你已经是基础设施了。

周光:对。20年之后你变成了一个很厉害的公司,而且还被广泛地讨论,这已经是最大的成功,这就是我们的愿景。我小时候看到亲戚拿一个大哥大出来,中国移动的,觉得特别厉害,当时去移动工作都是特别厉害的。

贾可:对。所以你的目标就是要把元戎从现在的聚光灯上干到聚光灯下去,差不多这个意思,是吧?

周光:对,我觉得差不多这个意思。

贾可:现在元戎启行的目标也很远大,物理AI世界的基础设施,不光是做自动驾驶,做机器人这方面,我们也要做吗?

周光:车子是第一个能大规模提供数据级的场景,很多时候你要做机器人,我觉得从车入手是最理性的。就像大厂,目前来说多模态的负责人下场第一个选择的都是车,而不是直接进入机器人市场。

是因为汽车提供的数据足够验证你的基模、验证你的体系、验证你的各种实验,你今天选择一个机器人还在讨论摄像头装哪儿、传感器怎么搞,天天还在搞那个,我觉得对做模型本身来讲可能稍微早了点。

从车端出发去验证物理世界的基模,再到机器人端去验证整个链路,我觉得从技术层面是比较好的。

贾可:我问一个有点弱智的问题,大模型的人才,他如果考大学,他学什么专业才能往这个方向上去?

周光:我觉得数学和物理专业是最好的。因为底层也不是编程的事儿,你非要说什么IOI (国际信息学奥林匹克竞赛),NOI(全国青少年信息学奥林匹克竞赛)‌,感觉也不是。

我觉得不管是Anthropic,还是OpenAI都特别喜欢招数学家和物理学家,哪怕这些人不会编程,就像我们计科班的姚顺宇就是物理专家,之前他也是做高能物理的,博士也是做高能物理的,之后又从Anthropic离职去了DeepMind,我觉得数学、物理的背景会比较好,其实就在于你对逻辑,数学物理是世界最本质的东西,你对最本质的东西的思考可能才是最有意义的。

6

  现实与浪漫

贾可:我觉得你带领的元戎启行,你们做的很多方向都是开风气之先的,你愿意做一些很领先的事情,而不是跟随,实际上这是很难的,有时候很容易成为先烈。

周光:对,要Take the Risk。就像去年一年尝试的VLA,其实就是大模型的尝试,说实话,也不是说没走弯路的,这肯定是有的。理论上来讲出来了之后,抄是最快的,基本上都是告诉你这怎么抄,但我觉得永远需要有人去Do Something Different。

就是一句话来说,谁都能做,那要你来干什么呢?

贾可:所以你还是追求这种价值的。

周光:那也不是,还是要脚踏实地优先。

贾可:商业?

周光:对,没有商业基础的追求是没有意义的,所以首先都是脚踏实地。

贾可:商业跟价值相结合嘛。

周光:对,叫做务实浪漫主义或者浪漫务实主义。务实上面是你的商业有闭环,我们做得也并不差,我们公司在业务上做得还可以,现在在商业上的交付都有很好的成绩,在交付面也是非常领先的,市占率是非常领先的。

贾可:你是浪漫的现实主义还是现实的浪漫主义者?

周光:我觉得是看,如果是大方向可能得是浪漫优先,但具体做事还是务实优先。比如我们目前就是毅然决然不做高精度地图,那一定是浪漫在前面的;我们率先决定要去做基模、做大模型,这是浪漫优先,但是这个大方向定了之后我要干嘛,还是务实。

贾可:浪漫的现实主义在先,还是现实的浪漫主义在先?

周光:我觉得大方向上的浪漫,具体落地得现实。

贾可:那还是现实的浪漫主义。

贾可:帮我们解释一下这两个玩偶。

周光:选择这两个玩偶也是因为我们公司做智驾,我们一定要选择路。我觉得第一要憨厚老实,而且圆乎乎的,感觉很憨厚老实,如果你选一个大长腿,那感觉不算憨厚老实,再有一些科技元素,比如头顶上戴两条天线,可能就代表了脑机接口、远程遥控。

其实是憨厚老实同时有科技感,我们的吉祥物一定是给人憨厚老实的形象,而不是Aggressive的。

贾可:这两个是一样的是吧,还是一公一母?

周光:不是一公一母,是两个版本。这是三周年,这个是五周年。

贾可:好的。我们希望20周年以后,我们在线下解耦,不是在线上讨论。感谢周光总给我们分享了关于自动驾驶现实和浪漫两个方面的见解。

AI改变时代,她关注改变

请关注《汽车商业评论》兄弟媒体

   

申报铃轩奖请认准官方唯一申报通道

铃轩奖官方网站

点击下图 扫码报名

点击阅读原文报名

▼ 

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

中国移动 周光 ceo 智能驾驶 广州
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论