雷锋网 05-29
KAN We Flow?(机器人控制)
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

原文作者:用户 " 多多的贾维斯 "

原文链接:https://www.xiaohongshu.com/

KAN We Flow? Advancing Robotic Manipulation with 3D Flow Matching via KAN & RWKV

一、整体概述

1. 本文提出 KAN-We-Flow,一种用于机器人三维操作的高效流匹配策略模型。

2. 核心贡献在于用 RWKV 与 KAN 替代传统大规模 UNet 骨干,在保持甚至提升成功率的同时,大幅降低参数量与推理延迟。

3. 方法在 Adroit、Meta-World、DexArt 三大基准上取得当前最优或并列最优性能,参数量减少约 86.8%,支持实时控制。

二、研究背景

1、扩散式策略

① 优点是动作分布建模能力强

② 缺点是需要多步去噪,推理慢、模型重,不利于真实机器人部署

2、流匹配策略

① 通过学习一步向量场实现快速生成

② 但现有方法仍大量依赖 UNet,计算与存储开销依旧偏大

3、核心问题

如何在保证精度的前提下,进一步压缩模型规模并提升实时性

三、动机直觉

1、RWKV 具备线性复杂度的时序建模能力,适合长时序动作预测

2、KAN 基于可学习的一维函数逼近,能以更少参数表达复杂非线性映射

3、将二者结合,有望同时解决 " 长时序依赖 " 和 " 参数效率 " 问题

四、技术路线

1、整体框架

① 采用一致性流匹配,实现一步动作生成

② 输入为点云感知、机器人状态与时间编码

2、核心网络

① RWKV-KAN 骨干网络

* RWKV 负责时间与通道混合,建模动作序列上下文

* GroupKAN 对特征通道进行分组的非线性函数校准,替代传统 MLP

② Action Consistency Regularization(ACR)

* 通过欧拉外推,将一步预测动作与专家轨迹在末端对齐

* 提供额外监督,稳定训练,不增加推理成本

3、学习目标

联合一致性流匹配损失与 ACR 正则项进行端到端训练

五、实验结果

1、性能表现

① 在 Adroit、Meta-World、DexArt 上整体成功率优于 FlowPolicy 与 DP3

② 在高难度、长时序任务中优势更明显

2、效率对比

① 参数量约 33.6M,相比 DP3 减少 86.8%

② 推理时间约 8 – 11ms,满足 100Hz 实时控制

3、消融实验

① RWKV、GroupKAN 与 ACR 均对性能有稳定增益

② ACR 在长预测窗口下显著降低动作漂移

雷峰网

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

机器人 欧拉 雷峰网
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论