雷锋网新智驾 前天
对话理想星环OS架构负责人黄震:自研不是我们的口号
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

自研操作系统的开源,是今年年初理想汽车一个 " 开创性 " 的举动。

相比于智能驾驶等与终端用户体验相关的高话题度,操作系统一直站在聚光灯的边缘。

作为 2021 年全面启动自研的组织部分,理想汽车操作系统(以下称星环 OS)的起步并不算早。从内部架构看,星环 OS 归属于 CTO 谢炎管理。谢炎上任之后的第一件事是扩充星环 OS 的研发团队,2023 年时部门规模将近 200 人。

理想汽车在 2024 年首次实现自研操作系统星环 OS 上车。截至 2024 年底,星环 OS 已完成八次迭代,在理想 L9 Max 车型上实现 200 万行代码的量产验证。

今年三月,星环 OS 扩展了芯片适配框架。数据显示,新芯片适配周期从行业平均 180 天缩短至 28 天,适配成本降低 75%,覆盖英飞凌 TriCore、瑞萨 RH850 主流芯片大厂,也包括地平线、芯驰的 ARM 架构,以及被广泛关注的开源 RISC-V 芯片架构。

李想的态度显而易见的满意。他曾对外表示:" 那真的是做得好,明显的好,如果你做得不好的东西出去开源不就丢人吗?"

9 月 16 日,理想汽车在北京研发总部,与长城汽车、英飞凌、中科创达、德赛西威等共 16 家生态伙伴与理想共同签署《星环 OS 社区章程》。

黄震是星环 OS 的架构负责人,在 2021 年年底加入理想,从零开始搭建操作系统的系统架构团队,也见证了操作系统的许多 " 里程碑事件 "。

理想如何从 0 到 1 开启操作系统的自研工作?在这个过程中,又是如何贯彻、执行理想的 " 目标聚焦 "、" 高执行力 " 等方法论?

以下为雷峰网与黄震的对话内容,雷峰网作了不改变原意的编辑

" 新势力的自研 OS,没有代差 "

雷峰网:您是什么时候加入理想?

黄震:2021 年年中,理想开始搭建操作系统的自研团队,我是在 2021 年底加入进来。当时理想汽车 CTO 谢炎还没来。

那时候的团队有两类角色,一类是软件架构师,另一类是软件开发工程师,负责整个操作系统的开发、交付。

我来了以后相当于填补了软件架构师的空白,从零开始把这部分的团队搭建了起来。

雷峰网:这两个团队的角色和分工是什么?

黄震:两个团队都在一个大部门里,只是分工上的侧重点有些不同,而且现在的实践经验证明,矩阵式组织是比较合理的。

这样的部门架构一是避免做技术的人太专注于技术,我们最终还是要做产业落地,二是避免做技术做得太局限,所以我们设置了两个团队,让他们互相去权衡、碰撞。

任何技术方向都会有权衡,如果让一个单独的团队完全封闭地去做操作系统的自研,会容易出现重大技术路线的决策错误,或者技术的价值没有体现出来。

比如有些学者出身的主管过于技术派,什么难做什么,就难免会忽略客户价值,还有另一类主管,过于循规蹈矩,可能只会一味复制他人,难以突破。

理想的操作系统团队人数并不多,但是能做出成绩,把有限的精力、资源用到刀刃上,跟两个团队的相互监督、碰撞密不可分。

雷峰网:理想操作系统的架构团队成员背景如何?

黄震:团队里没有应届生,都是社招,都是来自各个大厂做操作系统的优秀团队。

雷峰网:2021 年决定自研时,业内各家车企的自研操作系统是什么样的状态?

黄震:新势力车企都在做芯片跟操作系统的自研。

追求自研本质是打差异化。一开始是自研应用软件,随着应用软件往下做深就做系统,然后再做芯片。

我 2021 年入职的时候,李想就说理想是一家 AI 企业。所以那时候已经开始布局操作系统跟芯片。

我知道小鹏、蔚来也在做,更早的华为就不用说了。其次,特斯拉跟苹果这类优秀的公司也有这个模版,说明系统自研这条路是通的。

雷峰网:有没有评估过理想的自研身位,入局是否有点晚?

黄震:在新势力车企中,理想做系统自研不算早,但也不算特别晚。当时除了特斯拉,国内的车企都还处于起步阶段。本质上没有代差。

做了操作系统这么久,我比较看重技术挑战跟价值的绑定,想做出既有价值,又在技术上有挑战的事。

当时我上网找各家老板的演讲视频观看,感觉李想应该是能把这个事情贯彻得比较好的,所以就选择了理想。

雷峰网:2022 年,理想在内部推动 IPD(集成产品开发)时,操作系统团队的体感是什么?

黄震:我所在的操作系统部门对 IPD 流程很熟悉,甚至做成了一个先锋。后面操作系统部门牵头完善 IPD 流程的部署方法,让别的部门参考,然后一起把 IPD 流程固化下来。

IPD 流程刚开始推行的时候,我们团队经历了一个比较痛苦的立项过程。

最大的挑战在于立项时技术人员要讲清楚技术的价值和承诺,比如车上的开发效率提高多少?成本预计能降低多少?性能提升多少?

这也是 IPD 的价值所在。如果没有 IPD 流程,可能会变成去学别人,觉得因为华为、特斯拉做了,我们也该做。

IPD 流程还会经历每个阶段的不断审核,项目做到一半投资人也有权利否定。如果某个阶段做完,审核后觉得不够好,理论上是可以把项目停掉的。

雷峰网:有哪些部门会介入到 IPD 流程里?

黄震:从立项开始,每个项目都有一个 IPD 流程,还有一个决策小组。决策小组里除了研发,还会有财务、人力,从一开始就是一个完整的监督委员会,很健全。

雷峰网:内部投资人对项目目标的论证经过了多长时间?

黄震:半年多,中间会有一些弯路。

举个例子,我们开始觉得微内核这个方向不错,但后面会发现微内核在又卷又快的智驾领域,目前是用不起来的,然后又要重新论证。

操作系统是价值最不好讲的领域,因为研发投入太大。讲性能的价值,也不能过度承诺,要论证如何做到、代价是什么。

所以,论证阶段我们就会开发一些原型来评估,同时也会去跟内部的智能车控开发团队沟通。他们相当于内部的甲方,可以通过他们了解现在系统的不足。

这样一来,立一个项目要反反复复论证半年,甚至超过半年,但我觉得很值得。

雷峰网:相比自研,还有继续沿用 AUTOSAR 等成熟系统等选择,如何克服操作系统自研项目立项的阻力?

黄震:需要用技术语言去说服他们,这个过程确实比较痛苦、漫长。

在一些其他公司,举个大旗叫自研替代,就可以完成立项。但对于理想来说,自研替代不是你的价值,不能说从 0 到 1 是自研替代,从 1 到 10 再把各个成本降下来。

在理想,从 0 到 1 就有很高的要求,要讲清楚技术的优秀之处,并将技术的价值换算成成本、效率、性能以及产品力。

雷峰网:李想曾经说过,星环 OS 很大程度是被 " 逼上梁山 ",芯片产能短缺是核心因素。从您的角度是怎么看的?

黄震:对我们来说是一个契机。

星环 OS 现在是做一个整体,一开始肯定是单独击破。对于车控系统来说,最大的契机就是这么一个 " 逼上梁山 " 的大环境,包括当时的芯片供应问题,成本涨幅高于 10 倍,国产替代又用不起来。

这样一来,自研操作系统在车控领域的价值一下子就很清楚了,到现在还在受益。

以前我们老跟供应商去围绕芯片、软件去谈判,还要考虑供应商是否能支持,现在想选哪个选哪个,我们有操作系统团队,可以适配过来。

现在理想选芯片不会考虑软件移植的问题,都是看它的交付时间、成本、算力够不够等硬指标。

雷峰网:李想平时跟操作系统团队沟通多吗?

黄震:双向沟通的话,主要是汇报为主。重要项目的立项最后会到李想那里,李想对于项目价值会发表意见,提出性能要达到什么样的程度;交付上车的时候李想也会拍板,比如这个项目是今年全面去切,还是今年切一部分明年切一部分,李想会做最终决策。

另外就是一些重要节点的 IPD 流程,李想会参与。单向沟通更多,包括企业文化的宣讲,以及每周一次的 AI 会议。李想经常讲他对 AI 的新的认知,也会单独给操作系统团队讲技术方面的认知。

在我的印象里,李想对用户价值和可衡量的指标是要求非常高的,但是当时操作系统几个大项目立项的时候,谢炎已经来了。

谢炎一直是做操作系统的,所以技术层面的决策,包括操作系统的方向、指标,他就已经完成决策了。到了李想那里,可能只是去立项、申请预算投入。

雷峰网:操作系统自研,哪些事情值得投入大量人力,哪些不需要重复做功?

黄震:从价值到解决的问题,到为什么我们能解决好,都有非常严谨的论证。

首先,我们会去看需要解决什么问题,要认识这个问题的合理性,是什么一步步导致了这个问题——是传统车企的惯性,还是以前车企分工模式的问题。

找到这个问题以后,我们也会看不同的解决方式。

我们为什么能自信地说星环 OS 是业界第一个开源的、可以商用的整车操作系统,那是因为立项的时候我们去调研了开源社区,没有其他更早的开源项目,只有一些学校里的研究项目。

其中有一些部分我们从来不考虑,比如在智能座舱上做一个自研系统去替代安卓。安卓生态太强大了,不是我们能撼动的,智驾的操作系统和芯片才是我们的持续发力点。

雷峰网:操作系统的自研,有哪些内部的 " 里程碑事件 "?

黄震:在我看来,前面都是铺垫,上车才是核心。这里面有几件标志性事件。

芯片选择自由是从 2023 年左右实现,车控系统是一个里程碑,是最早上车的,打磨出来反响还不错。

通信总线从去年开始上车,通信总线替代了 RTI 公司的 DDS,而且从 0 到 1 做到了核心指标的超越。

最后就是跟自研芯片的结合,也是一个比较里程碑的事件。

雷峰网:理想的操作系统与自研芯片团队都在谢炎体系之下,两个团队如何配合?

黄震:芯片团队跟操作系统团队应该是一起成立的,芯片招人更难,所以可能起步稍微晚一点。芯片团队跟操作系统团队都在谢炎底下,两个团队一起合作做了不少事情。

芯片团队需要一个足够强大的基础软件团队一起启动,从各个指标开始一起去做,才能把这个事情做好。现在的芯片各种 Tradeoff(权衡)的东西太多了,要做出差异化优势,必须有个强大的基础软件团队来一同决策。

软硬结合是个大的课题,这里会按芯片的不同模块分成十几个小组。

每个小组有一个硬件的人,也有一个软件的、资深的人,然后两个人一起去密集地讨论要做到什么样。

这其中肯定是有各种权衡,而且谢炎给我们贯彻的理念是:对于操作系统来说,降低非必要的复杂度、提出差异化软硬结合设计是我们的价值体现。而不是说,理想定义的芯片在所有方面都多么厉害,那还需要我们干什么?

我们的核心价值是充分理解业务方的需求,在理解需求的基础上,在软件做一些权衡。

降本是一个考核维度,还有一个维度是增强一次流片的成功率,不要在不该耍花活的地方增加成本。软硬件的人坐在一起,会聊很多,会评估各种困难。我们都在谢炎的管理体系之下,大家相互特别信任。

雷峰网:之前跟一位头部智驾供应商的 CEO 聊过,他们做芯片可能还是抱着先流片出来,然后再去迭代的心态,你怎么看?

黄震:他们有他们的挑战,需要满足多个客户的需求,客户肯定是既要又要,他们的不确定性会比车企自研自用更大,所以这么做也合理。我刚提到的一次上车指的是车企自研自用的芯片,自己用的话其实没理由还要试水一代。

雷峰网:星环操作系统与地平线、英飞凌、芯驰等等芯片厂商的适配速度有多快?

黄震:大概在 4-6 周,主要看芯片的改动大不大。如果是比较大的改动,4-6 周基本可以适配到我们的系统上,因为首先我们是双方一起投入。如果是小的改动,芯片的升级不大那就更快。适配速度的不同,主要取决于硬件变化的幅度。

至少在理想使用芯片的时候,适配已经不是问题,没有哪个特别慢,或者卡住了。

如果需要提速的话,加一些人力,两周也可以做到,这也就是我们说的 " 芯片选择自由 "。

举个例子,车上如果有三个域控,那我们完全可以选择三个不一样的芯片。以前,如果使用三个不一样的芯片,那就是三个供应商,适配起来非常难受。

现在不存在这个问题,理想有可以自己快速适配,对上的都是同一套的东西。

降低硬件的复杂度是我们的价值体现

雷峰网:理想的软硬件团队在上海、杭州、北京都有,分开三个地方的考虑是什么

黄震:主要是人才吸引力。理想的软硬件团队起步在北京,后来上海在这方面做得不错,就来了上海,后来又成立了杭州分部,是因为我们看到杭州这方面的人才也不少,尤其是操作系统。

华为、OPPO 以及阿里有不少基础软件的研究力量,一些毕业生也会选择在杭州工作。

雷峰网:星环 OS 最终是要面向整个汽车行业的,那么在市面上已有成熟的操作系统、切换底层系统风险极高的情况下,友商是否愿意采用 " 理想系 " 技术?

黄震:反馈比我们想象中积极。很多车企现在还没有做自研操作系统,不是认为没必要,而是一开始可能没腾出手来想这件事。现在遇到一些问题,让他们觉得还是需要有自己的系统或者开源的,大家一起做是有必要的。

其中,我觉得最大的出发点是,车企和控制器厂商都想做跨域融合,但这个事情沿用传统黑盒模式做不了。

很多智能汽车给用户的体验都是端到端的。举个例子,比如智能汽车扫描出来前面有小孩子横穿马路,最后刹车,这个过程是跨好几个芯片的,如果不是车企自己控制操作系统,要想优化这件事情,就要让不同的黑盒厂商坐在一起去做,这些厂商之间有些是竞争关系,很难让他们一起把指标做到极致。

这样一来,车企需要有一个横向的技术把各个控制器拉通,最典型的就是操作系统。如果操作系统自主可控,就能做到跨域创新。

而这个出发点不仅车企有,控制器厂商也有。控制器厂商面对同行竞争,想呈现解决方案级的竞争力,希望自己电机上的软件可以跟别的域结合得很好,加起来实现价值。

还有一个原因是卷迭代效率到需求。卷迭代效率如果能有自研系统或者开源系统,就能掌握节奏。

雷峰网:一些中小车企可能缺乏二次开发能力。此前,理想曾承诺将提供工具链和技术文档,并与芯片企业合作简化适配流程。能否谈谈这部分工作的进展和难点?

黄震:工具链开源了一部分,车控系统里面的我们自用的工具链,基本都开源出来了。

我们做的工具链也是满足车企现在的需求的,达到快速迭代的目的,也分了简化版跟增强版。传统的车可能需要配上千个参数,其中大多数其实没必要配。

简化版提供了各种自动化的配置,只识别一些关键的需要用户配置。增强版是对系统的各种问题定位、分析、监控做了增强,我们做操作系统的这方面是比较擅长的。

雷峰网:不管是 QNX 微内核还是 Linux 宏内核,现有的 OS 体系都已经比较完整,鉴于开发周期,验证,行业认可,生态等问题,也没有必要再重新去开发新的内核。理想有没有真正做到内核 OS 自研?

黄震:我们自己对星环 OS 的定义,它是一个广义的操作系统。星环 OS 包含从最底层的虚拟化到上层中间件的非常多的组件,各个组件是否需要重新自研主要看必要性,在内核上确实没有必要重复再去做,但更底层的虚拟化是纯自研的,未来也会开源。

现在云端的虚拟化很成熟,但云端的虚拟化技术过于复杂,我们想做一个更安全、高效的虚拟化。

在车控领域,我们内核可以达到纯自研,但是在智能驾驶领域,我们用的是 Linux 叠加一些内核自研技术。同时,我们在 Linux 社区也有很多贡献,Linux 本来也允许做一些定制化。

再往上,各种中间件、各种通信组件,都是我们自己做。

雷峰网:中间件部分可以称为自研了吗?有人说有点像 ROS2 ?

黄震:都是自研的。我们从头去开发各种通信类的中间件,还有异构算力的调度、图像处理等都是自研的。

有点像 ROS2 给机器人用的那一套,但解决的问题不一样。当时也研究过 ROS2,但是最后没用。干的活有点像,但最后的事情是分开的。

另外,智驾还有推理加速,围绕这个我们做了很多自己的工作,异构计算的一些框架都需要自己去开发。

雷峰网:放眼行业,蔚来、比亚迪、小鹏、还有百度、斑马智行等厂商都有自己的 " 自研 " 操作系统,在您的角度,操作系统最少要做到什么程度才能算是自研,这个是否有一个客观标准?

黄震:我认为理想还是比较务实的,不太宣称自研这个词。我们自己做了整车的操作系统,但自研不是目的。

如果公司有一个自己的软件团队,能把这个操作系统做成自己可定义的,可以增加一些自己需要的组件,在一些指标上能做得比标准版更优秀,我认为都算是自研。

雷峰网:星环 OS 是在今年 3 月宣布开源的,大概什么时候开始思考开源这个事情?

黄震:2 月份左右。之前在公司内部的技术大会,我们团队也一直给李想做汇报,他也了解到自研操作系统在去年就已经能达到关键指标业界领先。

当时 2 月份决定开源,3 月份就宣布了,然后我们 4 月底到 5 月拿出来第一个版本。

雷峰网:距离 2025 年末还有 2 个月左右时间,在这接下来的时间里,您为团队设立的 okr 有哪些?

黄震:现在操作系统 0-1 做好了,接下来主要是把操作系统的 1-10 做好。比如说各个域打通、跟自研芯片结合好,以及性能、成本、工具、开发效率的更进一步提升,操作系统上接业务下接硬件,其实还是有很多可以做的。

除了开源,操作系统团队最主要的目标还是给公司创造价值,在理想一代代的车上体现出这些价值。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

芯片 雷峰网 开源 英飞凌 cto
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论