汽车头条 05-12
专访商汤绝影王晓刚:生成式智能驾驶与AI座舱的进化论​
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

随着辅助驾驶普及的不断深入,公众越来越关注驾驶系统的安全性,期待辅助驾驶带来更安全也更流畅的智慧出行体验。只是许多辅助驾驶方案在遇到新场景时难以妥善处理,事故时有发生,暴露出当前技术方案的诸多瓶颈。然而,人工智能技术的发展和进步推动着智能驾驶的演进。例如,商汤绝影 2022 年发布了行业首个感知决策一体化的智驾通用模型 UniAD,并荣获 CVPR 2023 最佳论文,引领了智能驾驶行业的创新潮流,智驾进入到端到端时代,模型学会类人交互,性能表现大幅提升。那么人工智能技术是否未来还会对智驾的进步起到什么决定性作用,我们对商汤绝影创始人王晓刚先生进行了专访。

智驾革命:从模仿人类到超越人类的 " 世界模型 "

在智能驾驶的深水区竞赛中,行业正面临根本性范式转移。商汤科技联合创始人、绝影智能汽车事业群总裁王晓刚在接受专访时指出:" 自动驾驶正从端到端的 ' 模仿学习 ' 迈入 ' 生成式智能驾驶 ' 时代,其颠覆性不亚于 GPT 对自然语言处理的革新。"

这一判断直击行业两大核心痛点:数据质量瓶颈与安全确定性难题。当前主流的端到端模型,本质上是通过海量人类驾驶数据 " 模仿 " 驾驶员行为,但王晓刚揭示了致命缺陷:" 我们收集的 90% 数据,恰恰是普通司机在复杂场景中的犹豫或错误决策。当系统学习的是人类的 ' 平均分 ',就无法突破安全上限。"

这种困境在极端场景尤为突出。以无保护左转为例,传统模型需要收集数万个相似案例,但现实中危险场景不可复现,且人类处置方式参差不齐。商汤的破局之道来自其双料冠军技术——连续两年斩获 Waymo 挑战赛冠军的 " 开悟 " 世界模型。该技术通过物理引擎构建 3D 交通环境数字孪生,结合强化学习实现百万次虚拟试错。" 就像 AlphaZero 自创围棋定式,我们的系统能在虚拟世界中探索出人类从未设想过的安全策略。" 王晓刚以某量产项目为例:在夜间暴雨场景中,世界模型生成的 1.2 万种变道策略,使得自动紧急避让成功率提升 47%,决策延迟降低至 83 毫秒。

对于小鹏汽车提出的 " 云端大模型 + 车端蒸馏 " 方案,王晓刚认为这印证了行业共识:" 未来智能驾驶研发将呈现 ' 云端重投入、车端轻量化 ' 趋势。但真正的技术制高点在于世界模型的精确度——它必须像物理定律般严谨,又能像生物进化般自适应。" 商汤的解决方案中,每 1 个真实场景可生成 8000 个衍生场景,模型迭代效率提升 400 倍,云端训练成本降低 60%。

智舱进化:从工具到家庭成员的 " 灵魂革命 "

当行业热议大模型上车时,王晓刚犀利指出症结所在:" 简单移植云端大模型,只会让车机变成话痨。真正的突破在于重构多模态交互逻辑,实现 ' 一句顶万句 ' 的情感穿透力。"

在商汤新一代 SenseAuto-Chat 系统中,三个技术支点正在重塑体验范式:

无痕身份认知系统:通过动态人脸识别与声纹融合,无需用户注册即可构建 " 数字身份画像 "。当某车企高管首次进入测试车时,系统自动关联其公开演讲内容,主动探讨 " 舱驾融合的技术边界 ",展现出堪比私人助理的认知深度。

群体智慧交互引擎:支持 8 人实时自然对话,能理解座舱内碎片化讨论并智能介入。在家庭出行场景中,系统可捕捉儿童 " 想看熊猫 " 的随意对话,自动规划成都大熊猫基地路线,同步推送科普视频到后排屏幕。

3D 视线元宇宙:通过亚毫米级眼球追踪与场景语义理解,驾驶员注视充电桩 2 秒即可触发自动泊入,凝视广告牌 3 秒自动推送品牌信息。更革命性的是,该技术与智驾系统深度耦合——当系统检测到驾驶员持续关注右侧来车时,会主动增强该方向传感器权重,实现人机协同决策。

" 真正的智能座舱要像家人一样 ' 懂得 ' 与 ' 记得 '。" 王晓刚演示了记忆系统的进化:系统将日常对话转化为 2048 维记忆向量,当用户某次抱怨 " 加班头痛 " 后,再次夜间行车时会主动调暗灯光、播放白噪音,并在地图标注 " 途经三甲医院 "。这种 " 润物细无声 " 的共情能力,正在重构人车关系。某新势力品牌的用户调研显示,搭载该系统的车主平均每日主动唤醒车机 23 次,较传统系统提升 5 倍,情感依赖度评分达 8.7 分(满分 10)。

数据博弈:99% 人类数据该被抛弃吗?

针对地平线余凯 " 人类驾驶数据价值有限 " 的观点,王晓刚给出了辩证解读:" 在 L2 向 L3 跃迁阶段,高风险场景的优质数据依然珍贵。但世界模型的价值在于,它能像驾校教练般无限复现危险场景,通过强化学习探索比人类更优的通过策略。"

商汤构建了独特的数据飞轮:量产车收集的真实问题场景,经过世界模型生成百万级衍生场景,再通过云端训练反哺车端模型。在与某车企合作的自动泊车项目中,该系统将 " 狭窄车位泊入 " 场景扩展出 12 万种变体(包括购物车碰撞、儿童突然出现等),使得泊车成功率从 87% 提升至 99.3%,回退率下降 90%。

更具战略意义的是数据安全机制的突破。通过联邦学习框架,商汤实现了 " 数据可用不可见 ":车企数据不出本地,通过加密通道提取特征值参与模型训练。这种模式已吸引 3 家跨国车企加入生态,其中某欧洲品牌借此快速适配中国复杂路况,研发周期缩短 11 个月。

生态布局:AI OS 重构汽车产业价值链

面对 " 软件不赚钱 " 的行业魔咒,商汤亮出了 " 驾舱云三位一体 " 的破局之策。最新发布的行业首个车载 AI OS(千机系统),将大模型能力下沉至车机内核:

MOE 架构革命:在 10TOPS 算力芯片上流畅运行 70 亿参数模型,通过专家网络动态分配,语音交互能耗降低 67%;

智能体商店:开放 300 个 API 接口,第三方开发者可开发 " 旅游达人 "" 健康管家 " 等场景化智能体,某母婴品牌借此推出 " 儿童情绪安抚 " 应用,上车首周使用率达 38%;

混合现实引擎:结合 AR-HUD 与 SLAM 定位,在挡风玻璃投射虚拟导游形象,某文旅集团测试显示,游客停留时间延长 22 分钟,二次消费提升 130%。

在出海战略中,商汤的技术正成为破局关键。针对 2026 版 ENCAP 新规,其 3D 视线追踪方案帮助某国产车型在 Euro NCAP 测评中斩获历史最高分。更巧妙的是文化适配能力:在中东市场,系统会自动规避女性语音指令;在东南亚则强化雨季路况预警。某自主品牌借助该体系,在泰国市场首月订单突破 5000 辆,溢价能力比竞品高 8%。

未来之战:L3 落地与责任重构

当被问及 L3 落地前景时,王晓刚展现了技术乐观主义:" 世界模型解决的不仅是技术问题,更是责任划分难题。当系统能明确告知 ' 我能处理哪些场景,何时需要接管 ',法律与商业的齿轮才能真正咬合。"

商汤的解决方案中引入 " 数字黑匣子 " 概念:系统实时记录驾驶决策链,包括世界模型生成的 128 种备选方案及其概率分布。在某个高速公路案例中,这套机制成功证明系统提前 1.2 秒发出接管请求,帮助车企规避了巨额赔偿风险。

更深远的影响在于产业价值重构。某分析师测算,商汤的技术体系可使车企软件毛利率提升至 68%,是硬件业务的 2.3 倍。这种改变正引发链式反应:某传统车企将电子电气架构研发团队削减 60%,转而投向 AI 模型训练;某电池巨头则跨界投资虚拟场景生成工具,寻求供应链协同创新。

汽车产业的 " 寒武纪大爆发 "

在这场生成式 AI 引发的智驾革命中,王晓刚勾勒出清晰的演进路径:2024 年是 " 世界模型验证年 ",2025 年进入 " 场景生成工业化阶段 ",2026 年或将迎来 L3 级商业落地潮。但比技术突破更深刻的,是对汽车本质的重新定义——从 " 载具 " 进化为 " 有记忆、会思考的移动生命体 "。

当被问及终极愿景时,王晓刚给出诗意回答:" 未来的汽车会像老友般理解你的沉默,像导师般弥补你的疏忽,像家人般守护你的脆弱。这不是科幻,而是正在发生的现实。" 在这场重构人车关系的史诗级变革中,中国科技公司正站在浪潮之巅。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

王晓 智能驾驶 商汤 人工智能技术 物理
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论