德赛西威：Native AI 开发新范式

硬件能力的升级与电子电气架构的集中化演进，正在为 AI 在车端的规模化落地提供坚实土壤。2026 年 6 月 25 日，德赛西威 AI 实验室负责人刘怡初在第八届 AI 智能座舱大会上表示，随着单算力成本快速下降、多模态感知能力日趋成熟，模型与硬件正进入 " 双向奔赴 " 的阶段。与此同时，用户对智能座舱的期待已从 " 可用 " 向 " 好用 " 和 " 更懂我 " 跃迁，可持续学习、自我进化、从被动响应走向主动服务，成为 Native AI 的核心特征。

在他看来，端云协同是这一轮变革的关键路径。云端模型聚焦复杂任务的通用规划能力，端侧则通过场景感知与 Skill 化封装，成为云端能力的延伸与补充。随着 Agent 形态从单点功能向持久化、主动化演进，算力架构也从座舱域控走向中央域控与 AI Box 的柔性扩展，一个三位一体的技术底座正在成型。从 "AI Ready" 到 "AI Native" 的范式转变，最显著的区别在于动作空间从封闭集走向开放集，系统具备了自适应与自进化的能力。

围绕这一方向，德赛西威重点推进 Agent 运行时底座、端侧推理框架与交互仿真平台三大模块的构建。推理框架聚焦多平台适配、上下文压缩与解码加速，在带宽与算力受限的端侧环境中提升推理效率与稳定性；交互仿真平台则通过因果推理与生成式模型，模拟真实座舱交互与长尾场景，为 Agent 的快速验证与迭代提供支撑。刘怡初表示，德赛西威将持续以开放全栈、快速落地的价值主张，推动 AI 座舱从炫酷场景走向可规模化交付的工程实践。

刘怡初博士 | 德赛西威 AI 实验室负责人

以下为演讲内容整理：

技术驱动力与需求侧变革：智能座舱为何需要原生 AI

从技术驱动力来看，硬件能力的升级使得模型能够从云端逐渐走向端侧。架构从分布式向集中式的演进，以及硬件单算力成本的快速下降，为 AI 在端侧上车提供了丰厚的技术土壤。与此同时，多模态感知能力的成熟、端云协同能力的增强，以及模型知识密度的不断增加，使得模型能力与硬件能力形成了双向奔赴的趋势。技术拐点已然成熟。

从需求侧来看，汽车被当作移动的智能终端，用户体验的需求被重构。传统座舱对 " 可用 " 的要求，已进化到 " 好用 " 乃至 " 更懂用户 " 的更深层次。德赛西威认为，原生 AI 的特性主要体现在两点：一是可持续学习，能够自我优化迭代进化，这需要通过底层的记忆模块来实现；二是从被动的单点功能执行，进化到主动的服务。

Agent 运行时底座：构建安全高效的端侧中枢

在原生 AI 开发的技术层面，德赛西威认为有三个重要模块，首先是 Agent 运行时底座。考虑到新一代智能体拥有更强的权限范围和操作能力，若直接部署在域控或云端均存在一定限制，因此将其部署在 AI Box 上具备三大优势。第一，能够将座舱域控的关键信号、车控服务等能力进行 Skill 化集成，但其权限受到编排、审核与审计，不会对整车安全造成威胁。第二，将端侧模型以及舱外感知的能力进行 Skill 化。第三，AI Box 通常仅利用其 GPU 或 NPU 进行模型推理，将 Agent 运行时部署其中，也能充分利用其 CPU 资源。此外，它还能连接云端大模型进行复杂的任务规划，并将云端生态服务进行 Skill 化定制，从而起到整体中枢的作用。

在车端，Skill 化与 PC 端存在显著区别，车端有更强烈的安全审核需求。因此，Skill Contract 需要具备至少八个层面的协议能力，包括描述前置条件、执行策略以及日志审计，以确保权限审计管理协议在车端执行的安全性。以一个样板场景为例，当用户输入 " 洒水车过来后关窗 " 的指令时，云端规划会复用哨兵感知链路的摄像头和 AVM 输入链路，通过 Prompt 重配更改端侧感知模型的目标调整和触发条件配置，最终完成自动关窗的任务。整个过程涉及从 HMI 到 HAI 的授权与策略，并在确认权限审计与流程状态后，在车端完整执行。用户只需输出指令，系统便复用了哨兵链路和端侧模型的感知能力，实现了端侧模型作为云端模型触手和端侧模态感知补充的功能，同时规避了模型数据出舱的问题。

端侧模型推理框架：突破硬件限制的关键技术

第二个重要模块是端侧模型的推理框架。该框架旨在让模型在不同硬件平台和异构算力架构上稳定运行，并具备多平台多模型调度、上下文压缩编译、资源占用分段式服务化、高优先级任务打断等增强特性。模型层面支持 LLM 和 VLM。对于端侧模型而言，30B 参数量的模型是一个较为可用的门槛，其通常采用 MoE 架构，单次推理激活的参数可能在 3B 左右。

在一次完整的大模型推理流程中，从 Query 输入、Encoder 编码、Prefill 及 KV Cache 更新，到最终的 Decode 逐 Token 循环输出，德赛西威会进行 PD 计算图分离、KV Cache 全生命周期管理，以及在 Decode 层面采用投机采样等加速技术，以突破硬件带宽限制。该推理框架将大语言模型主干与其他多模态进行了解耦，多种模态实现 Token 统一后输入主干进行推理，这使得适配不同模态模型时，能够更快地使模型上车。在工程端，该框架能节省首响速度，提升受带宽限制影响的 Decode 速率，并降低内存占用。

在 KV Cache 层面，德赛西威主要进行了压缩和复用。压缩通过低比特量化减少 RAM 占用，这对于控制 AI Box 的 BOM 成本至关重要。KV Cache 的复用则主要在多轮对话及 Agent 编排的特定提示词场景下，对大量缓存进行复用和压缩。在多模态流式编码与填充方面，为了减少首响延迟，采用了分块输入的方式，有效降低了 TTFT。在上下文压缩方面，结合 Agent 开发链路，通过微调模型时使用 DSL 等技术，压缩输出长度和词表，使端侧模型构建 Agent 时的上下文长度得以精简。在大模型推理的解码阶段，德赛西威主要通过 SSD 自推理、传统投机解码和块级扩散解码三种方式来突破显存带宽限制。自推理对显存友好，落地成本较低；投机解码需训练好小模型以提高命中率，理论上限更高；块级扩散解码的理论提升范围更大，有望进一步提升吞吐量。

座舱世界模型：交互仿真的新范式

第三个重要模块是 Agent 开发完成后的交互仿真平台。类比智能辅助驾驶领域从分段式到端到端的技术演进，座舱的交互仿真也需要一种新的测试方法。对于一段式模型，无法像分段式那样在 ASR 后或 TTS 前进行文本校准和监测，因此需要一个 " 座舱世界模型 " 来模拟用户与座舱之间的交互。它的作用是进行闭环仿真座舱、生成长尾稀有数据以及自动化验证待测模型或 Agent。

其核心架构是一个因果 Agent，能够推理舱内的故事线并进行因果演化。系统使用多个 Text-to-Image 模型，多步可控地生成舱内和舱外的场景渲染图片和传感器输入数据，并通过因果推断 Agent 输入车身信号数据，不同类别的数据需做到模态对齐和时间同步。对于端到端方案，输入直接为音频，系统使用 TTS 模型模拟多麦克风输入、主驾多云区环境噪音等。因果 Agent 会接收反馈，闭环推进下一时间点的场景，完成整个闭环仿真链路。该平台的用途主要包括座舱场景测试，由因果 Agent 持续推进故事线，模拟用户口语化的打断与纠错；生成难以采集的长尾 Corner Case 数据；由于其生成式模型的特性，动作操作范式也是开集路线，覆盖率更广。整体生成链路从极简指令类别的补全，到多维度补全图像和故事线细节，再到任务生成，最后通过大模型驱动多轮交互和待测模型的模拟评估。在此过程中，会进行模型对齐人类偏好的工作，并通过保留口语化、倒装句、自我纠正等特征，使仿真环境更贴近真实座舱场景。

展望与挑战

德赛西威目前在智能座舱领域的产品矩阵较为全栈和丰富，通过 AI 大模型、用户交互设计以及 EEA 架构方案，依托座舱融合的计算方案，融合生态组合形成丰富的产品线。其价值主张是开放全栈、快速实现，旨在与业界同仁共同推动下一代 AI 座舱的发展。未来，如何在保证安全的前提下，进一步优化端侧模型的性能与效率，以及如何构建更逼真、更全面的座舱世界模型以应对日益复杂的交互场景，将是行业共同面对的挑战。

（以上内容来自德赛西威 AI 实验室负责人刘怡初于 2026 年 6 月 25 日 -26 日在第八届 AI 智能座舱大会暨 2026 第四届车载显示与感知技术革新峰会上发表《Native AI 开发新范式》主题演讲。）

宙世代

一起剪

相关标签