盖世汽车 前天
德赛西威:Native AI 开发新范式
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

硬件能力的升级与电子电气架构的集中化演进,正在为 AI 在车端的规模化落地提供坚实土壤。2026 年 6 月 25 日,德赛西威 AI 实验室负责人刘怡初在第八届 AI 智能座舱大会上表示,随着单算力成本快速下降、多模态感知能力日趋成熟,模型与硬件正进入 " 双向奔赴 " 的阶段。与此同时,用户对智能座舱的期待已从 " 可用 " 向 " 好用 " 和 " 更懂我 " 跃迁,可持续学习、自我进化、从被动响应走向主动服务,成为 Native AI 的核心特征。

在他看来,端云协同是这一轮变革的关键路径。云端模型聚焦复杂任务的通用规划能力,端侧则通过场景感知与 Skill 化封装,成为云端能力的延伸与补充。随着 Agent 形态从单点功能向持久化、主动化演进,算力架构也从座舱域控走向中央域控与 AI Box 的柔性扩展,一个三位一体的技术底座正在成型。从 "AI Ready" 到 "AI Native" 的范式转变,最显著的区别在于动作空间从封闭集走向开放集,系统具备了自适应与自进化的能力。

围绕这一方向,德赛西威重点推进 Agent 运行时底座、端侧推理框架与交互仿真平台三大模块的构建。推理框架聚焦多平台适配、上下文压缩与解码加速,在带宽与算力受限的端侧环境中提升推理效率与稳定性;交互仿真平台则通过因果推理与生成式模型,模拟真实座舱交互与长尾场景,为 Agent 的快速验证与迭代提供支撑。刘怡初表示,德赛西威将持续以开放全栈、快速落地的价值主张,推动 AI 座舱从炫酷场景走向可规模化交付的工程实践。

 

刘怡初博士   | 德赛西威 AI 实验室负责人

以下为演讲内容整理:

技术驱动力与需求侧变革:智能座舱为何需要原生 AI

从技术驱动力来看,硬件能力的升级使得模型能够从云端逐渐走向端侧。架构从分布式向集中式的演进,以及硬件单算力成本的快速下降,为 AI 在端侧上车提供了丰厚的技术土壤。与此同时,多模态感知能力的成熟、端云协同能力的增强,以及模型知识密度的不断增加,使得模型能力与硬件能力形成了双向奔赴的趋势。技术拐点已然成熟。

从需求侧来看,汽车被当作移动的智能终端,用户体验的需求被重构。传统座舱对 " 可用 " 的要求,已进化到 " 好用 " 乃至 " 更懂用户 " 的更深层次。德赛西威认为,原生 AI 的特性主要体现在两点:一是可持续学习,能够自我优化迭代进化,这需要通过底层的记忆模块来实现;二是从被动的单点功能执行,进化到主动的服务。

Agent 运行时底座:构建安全高效的端侧中枢

在原生 AI 开发的技术层面,德赛西威认为有三个重要模块,首先是 Agent 运行时底座。考虑到新一代智能体拥有更强的权限范围和操作能力,若直接部署在域控或云端均存在一定限制,因此将其部署在 AI Box 上具备三大优势。第一,能够将座舱域控的关键信号、车控服务等能力进行 Skill 化集成,但其权限受到编排、审核与审计,不会对整车安全造成威胁。第二,将端侧模型以及舱外感知的能力进行 Skill 化。第三,AI Box 通常仅利用其 GPU 或 NPU 进行模型推理,将 Agent 运行时部署其中,也能充分利用其 CPU 资源。此外,它还能连接云端大模型进行复杂的任务规划,并将云端生态服务进行 Skill 化定制,从而起到整体中枢的作用。

在车端,Skill 化与 PC 端存在显著区别,车端有更强烈的安全审核需求。因此,Skill Contract 需要具备至少八个层面的协议能力,包括描述前置条件、执行策略以及日志审计,以确保权限审计管理协议在车端执行的安全性。以一个样板场景为例,当用户输入 " 洒水车过来后关窗 " 的指令时,云端规划会复用哨兵感知链路的摄像头和 AVM 输入链路,通过 Prompt 重配更改端侧感知模型的目标调整和触发条件配置,最终完成自动关窗的任务。整个过程涉及从 HMI 到 HAI 的授权与策略,并在确认权限审计与流程状态后,在车端完整执行。用户只需输出指令,系统便复用了哨兵链路和端侧模型的感知能力,实现了端侧模型作为云端模型触手和端侧模态感知补充的功能,同时规避了模型数据出舱的问题。

端侧模型推理框架:突破硬件限制的关键技术

第二个重要模块是端侧模型的推理框架。该框架旨在让模型在不同硬件平台和异构算力架构上稳定运行,并具备多平台多模型调度、上下文压缩编译、资源占用分段式服务化、高优先级任务打断等增强特性。模型层面支持 LLM 和 VLM。对于端侧模型而言,30B 参数量的模型是一个较为可用的门槛,其通常采用 MoE 架构,单次推理激活的参数可能在 3B 左右。

在一次完整的大模型推理流程中,从 Query 输入、Encoder 编码、Prefill 及 KV Cache 更新,到最终的 Decode 逐 Token 循环输出,德赛西威会进行 PD 计算图分离、KV Cache 全生命周期管理,以及在 Decode 层面采用投机采样等加速技术,以突破硬件带宽限制。该推理框架将大语言模型主干与其他多模态进行了解耦,多种模态实现 Token 统一后输入主干进行推理,这使得适配不同模态模型时,能够更快地使模型上车。在工程端,该框架能节省首响速度,提升受带宽限制影响的 Decode 速率,并降低内存占用。

在 KV Cache 层面,德赛西威主要进行了压缩和复用。压缩通过低比特量化减少 RAM 占用,这对于控制 AI Box 的 BOM 成本至关重要。KV Cache 的复用则主要在多轮对话及 Agent 编排的特定提示词场景下,对大量缓存进行复用和压缩。在多模态流式编码与填充方面,为了减少首响延迟,采用了分块输入的方式,有效降低了 TTFT。在上下文压缩方面,结合 Agent 开发链路,通过微调模型时使用 DSL 等技术,压缩输出长度和词表,使端侧模型构建 Agent 时的上下文长度得以精简。在大模型推理的解码阶段,德赛西威主要通过 SSD 自推理、传统投机解码和块级扩散解码三种方式来突破显存带宽限制。自推理对显存友好,落地成本较低;投机解码需训练好小模型以提高命中率,理论上限更高;块级扩散解码的理论提升范围更大,有望进一步提升吞吐量。

座舱世界模型:交互仿真的新范式

第三个重要模块是 Agent 开发完成后的交互仿真平台。类比智能辅助驾驶领域从分段式到端到端的技术演进,座舱的交互仿真也需要一种新的测试方法。对于一段式模型,无法像分段式那样在 ASR 后或 TTS 前进行文本校准和监测,因此需要一个 " 座舱世界模型 " 来模拟用户与座舱之间的交互。它的作用是进行闭环仿真座舱、生成长尾稀有数据以及自动化验证待测模型或 Agent。

其核心架构是一个因果 Agent,能够推理舱内的故事线并进行因果演化。系统使用多个 Text-to-Image 模型,多步可控地生成舱内和舱外的场景渲染图片和传感器输入数据,并通过因果推断 Agent 输入车身信号数据,不同类别的数据需做到模态对齐和时间同步。对于端到端方案,输入直接为音频,系统使用 TTS 模型模拟多麦克风输入、主驾多云区环境噪音等。因果 Agent 会接收反馈,闭环推进下一时间点的场景,完成整个闭环仿真链路。该平台的用途主要包括座舱场景测试,由因果 Agent 持续推进故事线,模拟用户口语化的打断与纠错;生成难以采集的长尾 Corner Case 数据;由于其生成式模型的特性,动作操作范式也是开集路线,覆盖率更广。整体生成链路从极简指令类别的补全,到多维度补全图像和故事线细节,再到任务生成,最后通过大模型驱动多轮交互和待测模型的模拟评估。在此过程中,会进行模型对齐人类偏好的工作,并通过保留口语化、倒装句、自我纠正等特征,使仿真环境更贴近真实座舱场景。

展望与挑战

德赛西威目前在智能座舱领域的产品矩阵较为全栈和丰富,通过 AI 大模型、用户交互设计以及 EEA 架构方案,依托座舱融合的计算方案,融合生态组合形成丰富的产品线。其价值主张是开放全栈、快速实现,旨在与业界同仁共同推动下一代 AI 座舱的发展。未来,如何在保证安全的前提下,进一步优化端侧模型的性能与效率,以及如何构建更逼真、更全面的座舱世界模型以应对日益复杂的交互场景,将是行业共同面对的挑战。

(以上内容来自德赛西威 AI 实验室负责人刘怡初于 2026 年 6 月 25 日 -26 日在第八届 AI 智能座舱大会暨 2026 第四届车载显示与感知技术革新峰会上发表《Native AI 开发新范式》主题演讲。)

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 德赛西威 智能座舱 用户体验 拐点
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论