AutoLab 前天
马斯克吹了两年的AI5芯片,真要干翻英伟达了?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

马斯克口中的史诗级产品终于要来了!

不是特斯拉的新车,而是传闻已久的 AI5 芯片。

在最近的一档播客中,马斯克透露特斯拉 AI5 芯片相比 AI4 实现了 40 倍性能提升,计算能力提升 8 倍,内存增加 9 倍。

同时,由于 AI5 还是期货,马斯克也没忘夸赞一下目前的 AI4。

他表示当前 AI4 芯片加持的 FSD 将实现比人类安全 2-3 倍甚至 10 倍的自动驾驶,FSD V14 也将是自 V12 以来最大的一次升级。

此前,马斯克就透露 AI5 这款芯片已完成关键评审,一旦落地成真,它将超越英伟达 Thor 芯片和小鹏图灵 AI 芯片,成为现阶段世界上算力最强的智能驾驶芯片。

然而这样一款大算力芯片仍然不是特斯拉的终极目标。

下一代 AI6 芯片已经在路上了,马斯克表示:AI6 芯片会在 AI5 上实现更大突破。

那么,AI5 到底有多强,特斯拉在自研芯片这条路上又走了多少弯路呢?

自研,图啥?

根据目前爆料的信息来看,AI5 的算力高达 2000-2500 TOPS,功耗仅有 150-200W,仅比 HW4 高 20% 左右,但性能最高能强出 40 倍。

首先从架构上,AI5 就做了大改动,用上了矩阵乘法引擎。

跟此前通用的 ALU 不同,它把 " 乘 - 加 " 操作做成固定的数据通路,把精度、带宽之类的全部都锁死了。

只干一件事的好处自然也很明显:干得飞快,效率还高。

同时它能支持从 FP16 到 BFLOAT16 再到 INT8 的混合精度,相当于同一个操场里,既能踢足球,也能跑步,还能做广播体操,体育课可以根据需求自然灵活变动。

最后,AI5 采用统一缓存层次结构,类似于不再给每个人配备统一的小冰箱,而是大家一起用一个零食柜,谁饿了谁就自己去拿,不用来回跑,FSD 跑起来自然更顺。

调整架构,自然是为了提高整体的效率,说到底,无非是要在 " 算得狠、传得快、用得省 " 三个方面进步。

特斯拉这次把这三件事直接拆开成了三个班子,把它比喻成给你家装修的工程队:

张量加速器就是搬砖队,它只负责算大矩阵,效率超高;

矢量 DSP 则是装修队,激活函数、归一化这些零碎活他全包;

RISC-V 小核则是打杂调度的前台,只管收快递、关灯省电,谁缺料都能秒送。

比起此前一个团队干三件事,这次 AI5 直接请了三个团队各负责各的,同时还为了让数据拿得更快些,建立了一个 " 三级抽屉 ":

SRAM 暂存器就像是手边的抽屉:工具就放在搬砖队桌上,随手拿;

统一二级缓存则是办公室文件柜:大家共用,中等大小的特征图、模型参数先缓存在这;

LPDDR5X 外部 DRAM 是远程的大仓库:门口有个智能灯,活少就降频降压,活多再调亮,省电费;

这种就近拿、按需拿的策略,能省时间也省跑腿的精力。

AI5 首次上车应该就是 Cybercab。

是的,就是那台特斯拉专门打造的无人驾驶出租车,为了安全性和冗余性,它的计算能力本来就要求极高,性能大幅提升的 AI5 刚好能用上。

之后的机器人和改款车型也应该都会用上 AI5。

有意思的是,AI5 只是刚露面,AI6 就已经有消息了。

特斯拉和三星签署了一项 165 亿美元的协议,会一起研发 AI6,性能预计比 AI5 还能再提升个两三倍。

当然,在 AI5 量产都得等到明年年底的情况下,AI6 肯定是更远的饼。

但这并不妨碍特斯拉的拥趸为马斯克重燃信心。

在 8 月份,马斯克亲自解散了 Dojo 超算团队,这在当时引起了轩然大波,粉丝一度悲观地认为马斯克放弃了自研这条路。

在马斯克后来解释了自己的用意:" 特斯拉分散资源,研发两种截然不同的 AI 芯片是没有意义的。特斯拉会把所有经历都集中在 AI5、AI6 以及后续 AI 系列芯片上。"

那么,特斯拉的自研之路,到底为什么在过去两年一度走进了死胡同呢?

自研,真难?

要回答这个问题, 得先回到 2014 年。

作为进入中国市场的首款产品,特斯拉 Model S 上搭载了第一代智能化平台 HW1.0,核心芯片采用了 Mobileye 的 EyeQ3,算力甚至不足 1TOPS。

但当时的辅助驾驶芯片寥寥无几,马斯克别无选择。

除了算力太低之外,更让马斯克无可奈何的是,由于 Mobileye 历来采用 " 黑盒交付 ",算法无法更改,特斯拉的辅助驾驶没有优化的可能性。

当时特斯拉的工程师把 EyeQ3 的 SDK 形象称作 " 玻璃盒 " ——能看见输出,却改不了任何参数。

所以,马斯克同步也在着手自研智能驾驶算法。

2016 年,特斯拉推出 HW2.0 平台,计算平台换为英伟达定制版 Drive PX2,算力提升到 12TOPS。

算力提升后,特斯拉推出新一代辅助驾驶功能的速度反而更慢。

因为在当时,无论是特斯拉内部团队还是英伟达团队,都没有辅助驾驶算法的研发经验。

不过英伟达提供的开放式平台,倒是让实打实练手的特斯拉团队积累了宝贵的经验。

后来马斯克挖来了一大批顶尖人才,组建了一支深度研究智能驾驶的队伍,特斯拉的智能驾驶才走上正轨。

2019 年,特斯拉推出了 HW3.0 平台,内置两颗自研芯片,算力提升到 144TOPS,搭载在了 Model Y 和 Model 3 上。

这款自研芯片由特斯拉设计,三星代工,过程一如既往的不顺利。

比如当时三星采用的 14nm 工艺,早期良率波动,而且成本偏高。

外界质疑的声音也不断袭来,舆论着重攻击了两颗 FSD 芯片的算力还没有单颗英伟达 Orin X 的算力高。

面对这些问题,特斯拉对内和三星深度合作,优化封装测试,对外提出了 " 有效算力 ",强调 FSD 与纯视觉算法深度耦合,有效算力接近。

2023 年,特斯拉发布了 HW4.0 平台,新车搭载两颗自研芯片,根据固件逆向推算,算力大幅提升到 720TOPS 以上,不仅搭载于现款乘用车型,还作为目前德州 Robotaxi 试点车队的算力平台。

HW4.0 刚上车的时候同样也遇到了一些困难。

老版车主无法享受和新版车主同样的软件服务,引起过一阵退订风波。

最后以特斯拉装聋作哑,坚持 " 不退款 " 立场告终。

在今年的六月份,马斯克在德克萨斯州推出了 Robotaxi 服务,在服务运营期间,副驾始终有一位安全员在车内监督。

而在车辆行驶过程中,Robotaxi 也经常会有鲁莽驾驶或者违反交通法规的现象。

这说明,目前为止 FSD 距离 " 完全无人驾驶 " 还有很长的路要走。

虽然痛苦,但这是一条必须要走的路,马斯克依旧在向之前承诺的 " 完全无人驾驶 " 继续迈进。

写在最后

FSD 正在拓展至全球越来越多的国家,成功进入澳洲之后,近期有传闻特斯拉 FSD 降落地韩国。与此同时,FSD 即将要更新到 V14 版本。

特斯拉的软件能力与表现是独树一帜的,凭借 HW4.0 的硬件,就交付了 Robotaxi 与更多国家可用的 FSD。

那么你相信未来的 AI5、AI6 能够让马斯克实现他的宏伟蓝图吗?

END

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

马斯克 特斯拉 英伟达 自动驾驶 芯片
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论