科技 7 月 29 日消息,在今晚举办的理想 i8 上市发布会上,理想自动驾驶负责人郎咸朋上台分享了理想自研 VLA 司机大模型的相关内容,据悉,这是一款视觉语言行动模型。
VLA 即 Vision-Language-Action Model,理想汽车希望该模型能让 AI 真正成为司机,成为交通领域的专业生产工具,像人类司机一样工作,甚至喊出了 " 买车送司机 " 的口号。
VLA 的实现是一个进化过程,经历了三个阶段。
第一阶段是 2021 年起自研的依赖规则算法和高精地图的辅助驾驶,类似 " 昆虫动物智能 "。
第二阶段是 2023 年起研究,并于 2024 年正式推送的端到端 +VLM 辅助驾驶,接近 " 哺乳动物智能 "。
第三阶段的 VLA 开启 " 人类智能 " 阶段,能通过 3D 和 2D 视觉的组合完整看到物理世界,且拥有完整的脑系统,具备语言、思维链推理能力,既能看,也能理解并真正执行行动。
VLA 司机大模型以 " 司机 Agent(智能体)" 的产品形态呈现,用户可通过自然语言与司机 Agent 沟通,简单通用的短指令由端侧的 VLA 直接处理,复杂指令则先由云端的 VL 基座模型解析,再交由 VLA 处理。
理想汽车依托自有编译团队,自研底层推理引擎,使英伟达 Orin-X 芯片可通过 INT4 量化的方式运行 VLM,并且凭借芯片、控制器设计和自研汽车操作系统等综合能力,实现了让双 Orin-X 芯片和 Thor-U 芯片运行同等规模的 VLA 司机大模型。
也正因如此,所有理想汽车 Max 版车型,即便是 2022 款理想 L9 Max,均可升级到 VLA 司机大模型。
此外,郎咸朋还表示,搭载了地平线 J6M 智驾芯片的 Pro 车型(焕新版理想 L 系和 i8 Pro),将在今年底升级城市 NOA 功能。
登录后才可以发布评论哦
打开小程序可以发布评论哦