快科技 7 月 5 日消息,理想在今晚的智能驾驶夏季发布会上宣布,正式启动端到端 +VLM 的早鸟计划。
据介绍,端到端最大的特点就是取掉了 NPN,不依赖于先验信息,可以真正实现全国都能开,有导航就能开。
端到端模型则更进一步,通过传感器将数据输入模型,就能直接输出行驶轨迹。
通过车内的端到端和大模型部署,可以让自动驾驶快速处理,延迟更低、上限更高,用户所能感受到整套系统的动作、决策更加拟人。
VLM 则是视觉语言模型,整体算法架构是由一个统一的 Transformer 模型组成,将 Prompt(提示词)文本进行 Tokenizer(分词器)编码,然后将前视 120 度和 30 度相机的图像以及导航地图信息进行视觉信息编码,通过图文对齐模块进行模态对齐,统一交给 VLM 模型进行自回归推理。
VLM 输出的信息包括对环境的理解、驾驶决策和驾驶轨迹,并传递给系统 1 控制车辆。
VLM 会时时刻刻思考当前的驾驶环境,给系统 1 合理的驾驶建议,同时系统 1 也可以在不同场景下调用不同的 Prompt 问题,主动向系统 2 进行求助,帮助系统 1 解决部分场景。
简单来说,VLM 可以让车辆具有思考能力,让自动驾驶的操作更像人类老司机的处理方式。
登录后才可以发布评论哦
打开小程序可以发布评论哦