Skip to content

人形机器人论文精选 - 2026-03-21

本期收录 8 篇论文(HuggingFace 热门 + Semantic Scholar 精选 + arXiv 最新)。

1. ADMM-Based Distributed MPC with Control Barrier Functions for Safe Multi-Robot Quadrupedal Locomotion

来源: 📄 arXiv 作者: Yicheng Zeng, Ruturaj S. Sambhus, Basit Muhammad Imran等 发布日期: 2026-03-19 arXiv: 2603.19170v1

一句话摘要

论文提出基于ADMM的分布式MPC框架,通过控制屏障函数(CBF)确保多足机器人安全协同,利用节点-边分裂技术实现去中心化优化分解,在保持安全性的同时实现实时计算。

现状痛点

多机器人协同运动中,控制屏障函数引入的显式耦合使得优化问题无法直接分解,现有分布式方法难以处理复杂的安全约束和动态交互。

解决方案与技术亮点

创新性地提出节点-边分裂 formulation结合ADMM框架,将全局MPC问题分解为独立的节点本地和边本地二次规划问题,通过共识约束实现并行求解,仅需邻居间通信即可完成分布式优化。

效果与应用场景

硬件实验验证两台Unitree Go2四足机器人协同任务,仿真测试四机器人复杂地形导航,实现与集中式MPC相当的轨迹跟踪性能,四智能体场景规划时间降低51%,适用于搜救、勘探等需要多机器人安全协同的应用。


2. PRIOR: Perceptive Learning for Humanoid Locomotion with Reference Gait Priors

来源: 📄 arXiv 作者: Chenxi Han, Shilu He, Yi Cheng等 发布日期: 2026-03-19 arXiv: 2603.18979v1

一句话摘要

PRIOR提出基于Isaac Lab的人形机器人感知 locomotion框架,通过参数化步态生成器提供运动捕捉参考轨迹、GRU状态估计器从深度图像重建地形高度图、地形自适应足部奖励引导可穿越区域放置,实现无需对抗训练的100%地形穿越成功率。

现状痛点

现有感知人形机器人 locomotion方法需多阶段训练pipeline、依赖对抗性训练目标、需大量真实世界校准,且在复杂地形(楼梯、箱子、间隙)上训练自然步态策略仍面临鲁棒性和效率瓶颈。

解决方案与技术亮点

论文提出三大创新:(1)参数化步态生成器从运动捕捉数据提取稳定参考轨迹,替代对抗训练;(2)GRU状态估计器通过自监督高度图重建直接从自我中心深度图像推断地形几何;(3)地形自适应足部奖励引导足部向可穿越区域放置,同时分析深度图像分辨率权衡以降低感知开销。

效果与应用场景

在Isaac Lab上实现楼梯、箱子、间隙等多难度地形100%穿越成功率,各组件产生互补性能提升,为人形机器人 locomotion研究提供可复现基础,适用于复杂环境导航、双足平衡控制等领域。


3. Empathetic Motion Generation for Humanoid Educational Robots via Reasoning-Guided Vision--Language--Motion Diffusion Architecture

来源: 📄 arXiv 作者: Fuze Sun, Lingyu Li, Lekan Dai等 发布日期: 2026-03-19 arXiv: 2603.18771v1

一句话摘要

本文提出RG-VLMD框架,通过融合多模态情感估计、教学推理和教学动作条件运动合成,为教育场景中的人形机器人生成具有同理心的协同手势。

现状痛点

现有机器人手势生成缺乏情感理解、教学推理和细粒度可控性,难以产生适配教育场景的语义一致、指令自适应的手势动作。

解决方案与技术亮点

提出门控混合专家模型预测情感效价/唤醒度,通过情感驱动策略映射到离散教学动作类别;采用clip级意图和帧级教学计划的扩散运动生成器,结合加性潜在约束和辅助动作组监督。

效果与应用场景

生成更结构化、更独特的手势模式,保持物理可实现性,可重定向到NAO机器人实时执行。适用于教育人机交互中自适应且具有教学表达力的机器人行为。


4. RoboForge: Physically Optimized Text-guided Whole-Body Locomotion for Humanoids

来源: 📄 arXiv 作者: Xichen Yuan, Zhe Li, Bofan Lyu等 发布日期: 2026-03-18 arXiv: 2603.17927v2

一句话摘要

提出RoboForge框架,通过物理可行性优化模块(PP-Opt)实现文本驱动的人形机器人全身运动生成与控制的 bidirectional coupling,形成自优化循环

现状痛点

现有运动生成管线受限于重定向技术,导致运动学质量下降、存在物理不可行性、接触转换错误,且真实世界动态数据获取成本高昂

解决方案与技术亮点

核心创新为PP-Opt模块,前向方向通过物理可行性奖励抑制漂浮、滑冰等现象,后向方向将优化后的仿真 rollout 转化为高质量运动数据微调生成器,形成生成与控制的自改进循环

效果与应用场景

在Unitree G1人形机器人上验证,IsaacLab和MuJoCo环境中跟踪精度和成功率均显著提升,优于传统显式重定向基线方法,具有实际部署潜力


5. Learning Whole-Body Control for a Salamander Robot

来源: 📄 arXiv 作者: Mengze Tian, Qiyuan Fu, Chuanfang Ning等 发布日期: 2026-03-17 arXiv: 2603.16683v1

一句话摘要

本文提出基于强化学习的蝾螈机器人全身控制方法,实现从仿真到真实硬件的迁移,完成稳定行走和水中游动两种运动模式的协调控制。

现状痛点

现有蝾螈机器人多依赖中央模式发生器或模型控制,学习型统一关节级全身控制器研究不足,从仿真到高自由度实体机器人的迁移面临挑战,且少有足式机器人尝试两栖环境下的学习控制。

解决方案与技术亮点

采用深度强化学习将本体感知观测和指令速度直接映射为关节动作,通过系统级真到仿真匹配与仿真到真实迁移策略,习得统一的全身控制策略,实现行走与游泳模式间的自发转换。

效果与应用场景

在真实世界平坦和不平整地形上实现稳定协调的行走,在仿真中成功完成行走与游泳模式切换,适用于复杂两栖环境探测、搜索救援及生物运动学研究等场景。


6. ADAPT: Adaptive Dual-projection Architecture for Perceptive Traversal

来源: 📄 arXiv 作者: Shuo Shao, Tianchen Huang, Wei Gao等 发布日期: 2026-03-17 arXiv: 2603.16328v1

一句话摘要

提出ADAPT架构,通过水平高程图和垂直距离图的双投影表示,将感知范围作为可学习参数,实现自适应动态调整感知范围,显著提升人形机器人在复杂3D环境中的穿越能力。

现状痛点

现有方法依赖固定感知配置,难以平衡感知保真度与计算效率;体素基方法观测维度高、计算开销大、训练缓慢,且无法适应不同场景的感知需求变化。

解决方案与技术亮点

创新采用水平高程图表示地形几何、垂直距离图表示可穿越空间约束的双投影架构;将感知范围作为可学习动作策略,使机器人能动态扩展或收缩感知范围,在高速运动时获取更大视野,在复杂环境中聚焦局部细节。

效果与应用场景

成功实现到Unitree G1人形机器人的零样本迁移,在多样化的3D环境挑战中展现出高度鲁棒的性能,大幅超越固定范围基线方法,适用于复杂地形行走、障碍穿越等实际场景。


7. ECHO: Edge-Cloud Humanoid Orchestration for Language-to-Motion Control

来源: 📄 arXiv 作者: Haozhe Jia, Jianfei Song, Yuan Zhang等 发布日期: 2026-03-17 arXiv: 2603.16188v1

一句话摘要

ECHO提出边缘-云协同架构,云端扩散模型根据自然语言指令生成运动参考,边缘端强化学习追踪器闭环执行,实现人形机器人的语言到全身运动实时控制。

现状痛点

现有方法推理时需从人体模型retarget到机器人效率低下;sim-to-real迁移困难;缺乏统一的机器人领域评估标准;实时性与计算资源的矛盾。

解决方案与技术亮点

提出38维机器人原生运动表示直接兼容PD控制;云端1D UNet+CLIP扩散模型,DDIM 10步采样约1秒生成;Teacher-Student强化学习+evidential adaptation模块+形态对称约束+领域随机化实现零真机微调;IMU检测跌倒并从运动库检索恢复轨迹。

效果与应用场景

HumanML3D基准测试FID 0.029、R-Precision Top-1 0.686;Unitree G1真机验证 diverse 语言命令执行;适用于服务机器人、家庭护理、危险环境作业等需自然语言交互的全身控制场景。


8. Enforcing Task-Specified Compliance Bounds for Humanoids via Anisotropic Lipschitz-Constrained Policies

来源: 📄 arXiv 作者: Zewen He, Yoshihiko Nakamura 发布日期: 2026-03-17 arXiv: 2603.16180v1

一句话摘要

该论文提出各向异性Lipschitz约束策略(ALCP),将任务空间刚度上限映射为状态依赖的策略Jacobian约束,通过hinge-squared谱范数惩罚实现方向依赖的柔顺控制,提升人形机器人步态稳定性和冲击鲁棒性。

现状痛点

现有强化学习方法缺乏对任务指定、可定量验证的柔顺目标施加手段,经典基于模型的刚度设计不适用于无模型RL;现有LCP方法使用单一标量Lipschitz预算,无法体现真实物理系统的方向依赖性柔顺特性。

解决方案与技术亮点

提出各向异性Lipschitz约束策略(ALCP),建立任务空间刚度上限与策略Jacobian状态依赖约束的显式映射;采用hinge-squared谱范数惩罚在训练中强制执行约束,保持物理可解释性并实现方向依赖柔顺。

效果与应用场景

在人形机器人上验证实验,显示ALCP提升步态稳定性和冲击鲁棒性,减少振荡和能量消耗;适用于双足步态、复杂运动控制及人机交互场景中的柔顺行为实现。


最后更新:

Powered by Claude & VitePress