港中文高源、林天麟团队提出自发共适应策略：基于元学习赋能异构多机器人系统协同进化

来源：公众号 " 香港中文大学通信工程硕士 "

原文链接：https://mp.weixin.qq.com/s/sOd2aYDff6OcDRWX4Z5p9g

论文第一作者：王浩丞

合作作者：林天麟

通讯作者：高源

近日，IEEE 国际机器人与自动化会议（IEEE International Conference on Robotics and Automation，ICRA 2026）公布论文接收结果，香港中文大学（深圳）理工学院高源教授、林天麟教授团队的论文 "Emergent Co-Adaptive Strategies in Heterogeneous Multi-Robot Systems via Meta-Learning（基于元学习的异构多机器人系统自发共适应策略）" 被大会收录。

论文简介：

该论文提出了一种面向异构多机器人系统的社会化共适应框架，旨在应对真实人群环境中动态变化的挑战。在该框架下，不同类型的机器人（如任务执行机器人、补给站机器人和社交交互机器人）能够根据人群状态自主调整行为，实现人与机器人之间的双向适应。核心技术包括元学习驱动的策略快速调整、多机器人协作机制以及社会行为建模，使系统在不同人群状态下能够自发生成合理的协作策略。通过在真实机器人平台上开展大规模人机实验，结果表明该方法能够显著提升任务完成效率与人群引导效果：在紧张与放松两种人群状态下，人群引导成功率提升约 21%，人类参与者的物理和时间负担分别降低约 39%，人类对机器人的信任度和拟人化感知分别提升约 16% 和 21%，有效增强了人机互动体验，为未来社会化多机器人系统在复杂环境中的应用提供了新的实践路径。

图 1：异构多机器人系统在协同适应框架下的适应性行为

该异构多机器人系统（HMRS）由具有不同功能的机器人组成：包括负责区域覆盖的工作机器人、提供实时能源补给的站点机器人，以及用于与人类进行交互的社交机器人。整个团队通过统一的策略结构进行协调，实现多机器人间的高效协作与任务分配。为了增强系统在动态社会环境中的适应能力，文章中设计了双通道适应架构。一方面，元策略通过基于模型无关元学习（MAML）的方法，结合人类行为轨迹进行实时调整，使机器人能够快速适应不同人群状态。另一方面，大语言模型（LLM）实时评估人群的心理紧迫性，提供行为引导的认知信息。这两条通道协同工作，使异构机器人能够在复杂多变的社会场景中自发生成合理协作策略，并实现人与机器人之间的双向适应。该架构不仅保证了多机器人系统的任务性能和安全性，也为机器人在真实社会环境中的高效部署和人机协作提供了坚实的技术基础。

图 2：方法架构

为了验证文章提出的社会化共适应策略，研究团队在实验室中构建了模拟机场人流环境。首先在 Unity 中设计了复杂的训练场景和简化的实验场景，并将实验场景部署在受控实验室中。志愿者被引导进入 " 紧张赶往航班 " 或 " 轻松漫步 " 的行为状态，以模拟真实机场的多样人群行为。在第一轮实验中，参与者与统一的元策略系统进行互动，其行为数据被记录并用于生成状态特定的自适应策略。在第二轮实验中，既有新志愿者，也包括第一轮参与者，都在对应的 " 紧张适应 " 或 " 轻松适应 " 系统中进行测试，从而验证了人群与异构多机器人系统之间的双向共适应能力。

图 3：实验设置

在实验中，该研究从三个维度对系统进行了全面评估。首先，在任务执行方面，机器人团队实现了对目标区域的全覆盖，保证了高效完成任务；其次，在行为指标方面，系统能够根据人群状态在自我导向（egoistic）与利他导向（altruistic）策略之间灵活切换，使人群引导成功率提升了约 21%；最后，在用户体验方面，该系统显著降低了参与者的身体和时间负担，分别减少约 39%，同时显著提升了对机器人的信任度和拟人化感知，信任度提高约 32%，拟人化感知提高约 21%。这些实验结果充分证明了异构多机器人系统在人群环境中的双向共适应能力是可行的，为未来能够在复杂、人类中心化场景中高效运行的社会化智能机器人系统奠定了坚实基础。

图 4：实验结果

雷峰网

宙世代

一起剪

相关标签