Skip to content

人形机器人论文精选 - 2026-03-22

本期收录 4 篇论文(HuggingFace 热门 + Semantic Scholar 精选 + arXiv 最新)。

1. ADMM-Based Distributed MPC with Control Barrier Functions for Safe Multi-Robot Quadrupedal Locomotion

来源: 📄 arXiv 作者: Yicheng Zeng, Ruturaj S. Sambhus, Basit Muhammad Imran等 发布日期: 2026-03-19 arXiv: 2603.19170v1

一句话摘要

论文提出基于ADMM的分布式MPC框架,通过节点-边分裂 formulation 将CBF安全约束引入的多机器人四足运动规划问题分解为可并行求解的子问题,实现完全去中心化的实时安全控制。

现状痛点

现有分布式MPC难以处理安全约束,因为CBF等约束显式耦合多代理状态,导致问题无法直接分解,计算复杂度高,难以满足多机器人实时安全控制的需求。

解决方案与技术亮点

提出节点-边分裂 formulation 配合ADMM共识约束,将全局问题分解为独立的节点本地和边本地二次规划,仅需邻居间通信即可并行求解,保持对称计算负载。

效果与应用场景

在两台Unitree Go2四足机器人上验证,可处理粗糙地形和外部扰动,四机器人场景下平均规划时间减少51%,适用于安全关键的多机器人协同运动场景。


2. PRIOR: Perceptive Learning for Humanoid Locomotion with Reference Gait Priors

来源: 📄 arXiv 作者: Chenxi Han, Shilu He, Yi Cheng等 发布日期: 2026-03-19 arXiv: 2603.18979v1

一句话摘要

PRIOR提出基于Isaac Lab的高效人形机器人感知 locomotion 框架,通过参数化步态生成器、GRU状态估计器和地形自适应脚步奖励三大组件,实现了无需对抗训练即可在复杂地形上达到100%成功率的自然步态穿越。

现状痛点

现有感知型人形机器人 locomotion 训练通常需要多阶段复杂流程、对抗性目标函数或大量真实世界校准,训练过程不稳定且难以复现,同时深度图像感知开销大、实时性差。

解决方案与技术亮点

论文提出三大创新:(1)参数化步态生成器利用运动捕捉数据提供稳定参考轨迹,摆脱对抗训练;(2)GRU状态估计器通过自监督高度图重建从深度图像推断地形几何;(3)地形自适应脚步奖励引导脚部放置于可穿越区域;并系统分析了深度图像分辨率对性能与实时性的权衡。

效果与应用场景

在楼梯、箱子、缝隙等难度递增的地形上验证,各组件贡献互补且必要,最终实现100%穿越成功率;该框架可用于复杂室内外环境中的人形机器人自主导航,如家务服务、灾难救援、工业检测等场景。


3. Empathetic Motion Generation for Humanoid Educational Robots via Reasoning-Guided Vision--Language--Motion Diffusion Architecture

来源: 📄 arXiv 作者: Fuze Sun, Lingyu Li, Lekan Dai等 发布日期: 2026-03-19 arXiv: 2603.18771v1

一句话摘要

本文提出RG-VLMD框架,通过融合多模态情感估计、教学推理和扩散模型动作合成,为教育类人机器人生成具备同理心且与指令一致的手势动作,实现自适应且语义连贯的机器人行为。

现状痛点

现有机器人动作生成缺乏情感意识和教学适应性,难以整合文本、视觉、语音等多模态输入;动作可控性差且无法保证教育场景下的语义一致性,传统方法未充分考虑教学行为和指令调度。

解决方案与技术亮点

提出门控混合专家模型预测多模态情感valence/arousal,通过情感驱动策略映射到离散教学行为类别;采用带附加潜在约束和辅助动作组监督的扩散模型,结合片段级意图和帧级教学计划进行动作生成。

效果与应用场景

实验表明生成的动作模式更结构化且独特,动作统计和成对距离分析验证了效果,动作序列物理可信并可实时迁移到NAO机器人执行,适用于教育人机交互场景。


4. RoboForge: Physically Optimized Text-guided Whole-Body Locomotion for Humanoids

来源: 📄 arXiv 作者: Xichen Yuan, Zhe Li, Bofan Lyu等 发布日期: 2026-03-18 arXiv: 2603.17927v2

一句话摘要

提出RoboForge框架,通过Physical Plausibility Optimization(PP-Opt)模块实现扩散运动生成与物理优化的双向耦合,构建自改进循环,使运动生成器学习物理可行的潜在空间,控制器学习动态完整性的潜在条件行为。

现状痛点

现有文本驱动人形机器人运动方法依赖重定向技术,导致运动质量下降、物理不可行(浮空、穿模)、接触转换错误,且获取真实世界动态数据成本高昂,难以实现物理可执行的运动。

解决方案与技术亮点

核心创新包括:(1)无重定向的潜在驱动框架,直接连接自然语言与全身运动;(2)PP-Opt模块实现双向优化——前向用物理合理性奖励精炼策略,后向将仿真 rollout转化为高质量运动数据微调生成器;(3)自改进循环机制使生成器与控制器协同进化。

效果与应用场景

在Unitree G1人形机器人上验证,IsaacLab和MuJoCo仿真环境中测试结果显示:跟踪精度和成功率显著提升,隐式潜在驱动pipeline在精度和稳定性上优于传统显式重定向基线。适用于文本引导的类人机器人智能部署。


最后更新:

Powered by Claude & VitePress