人形机器人论文精选 - 2026-03-19
本期收录 12 篇论文(HuggingFace 热门 + Semantic Scholar 精选 + arXiv 最新)。
1. RoboForge: Physically Optimized Text-guided Whole-Body Locomotion for Humanoids
来源: 📄 arXiv 作者: Xichen Yuan, Zhe Li, Bofan Lyu等 发布日期: 2026-03-18 arXiv: 2603.17927v1
一句话摘要
提出物理可行性优化(PP-Opt)模块实现生成与控制的双向耦合,构建自改进循环,在Unitree G1人形机器人上将扩散模型运动生成与物理约束结合,显著提升跟踪精度和成功率。
现状痛点
现有重定向方法存在运动质量下降、物理不可行(漂浮/滑移/穿透)、接触转换错误等问题,且真实世界动态数据获取成本高,难以实现物理可执行的文本引导运动。
解决方案与技术亮点
提出PP-Opt模块作为双向耦合接口:前向用物理奖励精炼教师-学生策略抑制伪影,后向将优化后的仿真 rollout 转化为高质量运动数据反哺生成器,实现无重定向的物理优化管道。
效果与应用场景
在Unitree G1上实验表明双向优化提升跟踪精度和成功率,IsaacLab和MuJoCo环境均超越传统重定向基线,适用于全身运动控制、人形机器人智能和复杂地形导航等场景。
2. Learning Whole-Body Control for a Salamander Robot
来源: 📄 arXiv 作者: Mengze Tian, Qiyuan Fu, Chuanfang Ning等 发布日期: 2026-03-17 arXiv: 2603.16683v1
一句话摘要
本文提出利用强化学习训练蝾螈机器人整体式关节控制策略,实现水陆两栖运动控制,并通过模拟到真实迁移在真实机器人上实现稳定行走。
现状痛点
现有蝾螈机器人主要依赖中枢模式发生器(CPG)和基于模型的控制方法,缺乏统一的基于学习全身控制框架,且两栖环境下的强化学习控制研究较少。
解决方案与技术亮点
采用深度强化学习将本体感知观测和指令速度映射到关节动作,构建实时模拟匹配与模拟到真实迁移策略,实现从仿真到硬件的可靠部署。
效果与应用场景
在真实机器人上实现平坦和不平地形稳定行走,在仿真中展示行走与游泳模式转换,为两栖机器人复杂环境应用提供新思路。
3. ADAPT: Adaptive Dual-projection Architecture for Perceptive Traversal
来源: 📄 arXiv 作者: Shuo Shao, Tianchen Huang, Wei Gao等 发布日期: 2026-03-17 arXiv: 2603.16328v1
一句话摘要
论文提出ADAPT自适应双投影架构,将3D环境表示为水平高程图和垂直距离图,并将感知范围作为可学习动作,实现动态调整感知视野,在保证感知质量的同时大幅降低计算开销。
现状痛点
现有方法依赖刚性传感配置,在复杂3D环境中难以平衡感知保真度与计算效率,voxel-based方法观测维度极高,导致计算开销大、训练速度慢,且无法适应不同场景的感知需求。
解决方案与技术亮点
ADAPT采用双投影策略:用水平高程图编码地形几何信息,垂直距离图编码可穿越空间约束;创新性地将感知范围作为策略的可学习动作参数,使机器人能在高速运动时扩展感知视野,在复杂场景中收缩以获得更精细的局部分辨率。
效果与应用场景
实验实现对Unitree G1人形机器人的成功零样本迁移,在多样化的3D环境挑战中展现出高度 robust 的穿越能力,显著优于固定感知范围的基线方法,适用于复杂地形行走、障碍物避让等实际场景。
4. ECHO: Edge-Cloud Humanoid Orchestration for Language-to-Motion Control
来源: 📄 arXiv 作者: Haozhe Jia, Jianfei Song, Yuan Zhang等 发布日期: 2026-03-17 arXiv: 2603.16188v1
一句话摘要
ECHO提出边缘-云协同框架,云端扩散模型根据文本指令生成运动,边缘端强化学习策略执行闭环控制,实现人形机器人全身运动控制。
现状痛点
现有方法需要从人体模型推理时重定向,不够直接兼容机器人;sim-to-real迁移困难;全身协调控制复杂;跌倒安全处理不足。
解决方案与技术亮点
提出38维机器人原生运动表示(关节角+根部速度/高度+6D方向);1D卷积UNet+CLIP条件扩散模型(10步DDIM);教师-学生蒸馏+证据适应模块+形态对称约束+领域随机化;IMU跌倒检测+运动库恢复。
效果与应用场景
HumanML3D基准FID=0.029、R-Precision Top-1=0.686;Unitree G1真机验证多种文本命令执行稳定,无需硬件微调。适用于服务机器人、人机交互、危险环境作业等全身运动控制场景。
5. Enforcing Task-Specified Compliance Bounds for Humanoids via Anisotropic Lipschitz-Constrained Policies
来源: 📄 arXiv 作者: Zewen He, Yoshihiko Nakamura 发布日期: 2026-03-17 arXiv: 2603.16180v1
一句话摘要
提出各向异性Lipschitz约束策略(ALCP),将任务空间刚度上界映射为策略Jacobian的状态依赖Lipschitz约束,实现可解释的方向相关柔顺性控制。
现状痛点
强化学习的无模型特性难以实现可量化的柔顺性目标,传统LCP方法使用单一标量Lipschitz预算,缺乏物理可解释性,无法与实际系统建立明确联系。
解决方案与技术亮点
提出ALCP框架,通过 hinge-squared 谱范数惩罚在训练中强制执行约束,将任务指定的刚度上界转化为策略Jacobian的各向异性Lipschitz约束。
效果与应用场景
在人形机器人上提升运动稳定性、冲击鲁棒性,显著减少振荡和能耗,适用于双足 locomotion 和复杂动作控制的实际场景。
6. The Era of End-to-End Autonomy: Transitioning from Rule-Based Driving to Large Driving Models
来源: 📄 arXiv 作者: Eduardo Nebot, Julie Stephany Berrio Perez 发布日期: 2026-03-17 arXiv: 2603.16050v1
一句话摘要
该论文分析了自动驾驶从模块化规则系统向端到端大驾驶模型(LDM)的技术转型,探讨了特斯拉FSD、 Rivian等商业部署案例及L2++监督驾驶系统的安全性和行业影响。
现状痛点
现有模块化架构难以处理真实驾驶场景的长尾分布问题,规则系统扩展性受限,感知-规划-控制各模块间的信息传递存在累积误差,且难以应对复杂动态驾驶环境。
解决方案与技术亮点
提出大驾驶模型(LDM)架构,直接将原始传感器数据映射为驾驶动作;引入监督式端到端驾驶(FSD Supervised),在复杂环境中执行动态驾驶任务的同时保留人类监督机制。
效果与应用场景
早期运营证据表明端到端学习能有效处理长尾场景,计划2026年起部署L2++系统;应用场景涵盖Robotaxi、消费级自动驾驶及人形机器人等具身AI系统。
7. HSImul3R: Physics-in-the-Loop Reconstruction of Simulation-Ready Human-Scene Interactions
来源: 📄 arXiv 作者: Yukang Cao, Haozhe Xie, Fangzhou Hong等 发布日期: 2026-03-16 arXiv: 2603.15612v1
一句话摘要
本文提出HSImul3R框架,通过物理仿真作为主动监督器,利用双向优化管道联合细化人体动态和场景几何,实现从稀疏视图或单目视频重建物理稳定的仿真就绪型人-场景交互。
现状痛点
现有方法存在感知-仿真差距:视觉上合理的重建结果往往违反物理约束,导致物理引擎不稳定,在具身AI应用中失败,无法直接部署到真实人形机器人。
解决方案与技术亮点
提出物理驱动的双向优化管道:前向采用场景导向强化学习优化人体运动,反向使用直接仿真奖励优化细化场景几何;并构建HSIBench基准数据集。
效果与应用场景
首次实现稳定、仿真就绪的人-场景交互重建,可直接部署到真实世界人形机器人,适用于具身AI、虚拟现实和人机交互等场景。
8. HALO:Closing Sim-to-Real Gap for Heavy-loaded Humanoid Agile Motion Skills via Differentiable Simulation
来源: 📄 arXiv 作者: Xingyi Wang, Chenyun Zhang, Weiji Xie等 发布日期: 2026-03-16 arXiv: 2603.15084v1
一句话摘要
论文提出基于可微分模拟器MuJoCo XLA的两阶段梯度系统识别框架,先校准标称机器人模型减少sim-to-real差距,再识别未知载荷质量分布,实现重载条件下人形机器人运动技能的零样本迁移。
现状痛点
人形机器人在实际场景中需携带未知载荷,导致仿真训练策略与真实硬件之间存在显著模型偏差,传统sim-to-real强化学习方法在重载条件下性能严重下降甚至失效。
解决方案与技术亮点
构建两阶段梯度系统识别框架:第一阶段利用真实数据校准标称机器人模型参数以减少内在sim-to-real差异;第二阶段通过梯度优化识别未知载荷的质量分布,通过显式减少结构化模型偏差实现零样本策略迁移。
效果与应用场景
仿真和真实实验表明,该方法实现了更精确的参数识别,显著提升了运动跟踪精度,大幅增强了重载条件下人形机器人的敏捷性和鲁棒性,可应用于物流、救援等需要搬运重物的实际场景。
9. Exploring the dynamic properties and motion reproducibility of a small upper-body humanoid robot with 13-DOF pneumatic actuation for data-driven control
来源: 📄 arXiv 作者: Hiroshi Atsuta, Hisashi Ishihara, Minoru Asada 发布日期: 2026-03-16 arXiv: 2603.14787v1
一句话摘要
本文开发了一款13-DOF紧凑型上半身气动人形机器人,通过研究其动态特性(尤其是执行时间延迟)并验证系统的高度可重复性,提出基于多层感知器带显式时间延迟补偿的数据驱动控制器,在4-DOF手臂子系统上实现了优于传统PID控制器的轨迹跟踪性能。
现状痛点
气动驱动的高自由度人形机器人虽适用于物理人机交互,但气动执行器本身的非线性特性导致精确控制极为困难,传统控制方法难以应对系统的时间延迟和非线性动态。
解决方案与技术亮点
论文首先系统研究机器人关键动态特性( actuation time delays),确认系统具有高度可重复性;然后提出基于多层感知器(MLP)的数据驱动控制器,并创新性地引入显式时间延迟补偿机制,使用随机运动数据训练网络生成压力命令。
效果与应用场景
实验结果表明,该数据驱动控制器在轨迹跟踪方面显著优于传统PID控制器,可应用于需要安全物理交互的服务机器人、康复辅助机器人及工业协作场景中精确控制气动驱动的多自由度机械臂。
10. CyboRacket: A Perception-to-Action Framework for Humanoid Racket Sports
来源: 📄 arXiv 作者: Peng Ren, Chuan Qi, Haoyang Ge等 发布日期: 2026-03-15 arXiv: 2603.14605v1
一句话摘要
本文提出CyboRacket层级感知-动作框架,整合 onboard 视觉追踪、物理轨迹预测和预训练全身控制,实现仅靠机载传感器的人形机器人网球击球任务。
现状痛点
动态球类交互任务需要在有限反应时间内实现紧密的感知-动作耦合,现有系统依赖外部运动捕捉设备,且低层次控制器缺乏跨任务和跨平台的泛化能力。
解决方案与技术亮点
提出层级框架包含三部分: onboard 摄像头视觉追踪模块、基于物理的球体轨迹预测模块、以及将拦截状态转换为全身运动命令的控制模块,在 Unitree G1 机器人上验证。
效果与应用场景
实验实现了实时视觉追踪、轨迹预测和成功击球,验证了纯机载传感的可行性,为家庭服务机器人、竞技训练陪练等场景提供技术基础。
11. OmniClone: Engineering a Robust, All-Rounder Whole-Body Humanoid Teleoperation System
来源: 📄 arXiv 作者: Yixuan Li, Le Ma, Yutang Lin等 发布日期: 2026-03-15 arXiv: 2603.14327v1
一句话摘要
论文提出OmniClone全身人形机器人遥操作系统,通过OmniBench诊断基准识别现有系统问题,优化训练数据配方并集成主体无关重定向等技术,在消费级GPU上实现高保真多技能控制,MPJPE降低超66%且支持控制源无关的统一策略。
现状痛点
现有遥操作系统使用聚合指标混淆不同运动模式,掩盖关键故障模式;缺乏诊断粒度;系统配置紧密耦合且劳动密集;无法同时满足稳健性、多功能性和 affordability(经济可承受性)要求。
解决方案与技术亮点
提出OmniBench诊断基准按运动类别和难度分层评估策略;优化训练数据配方;集成主体无关重定向和健壮通信模块;构建控制源无关的统一策略,同时支持实时遥操作、运动播放和VLA模型。
效果与应用场景
在单GPU上实现高效部署,MPJPE降低66%以上,泛化到不同身体比例的操作者;适用于远程操控、数据采集、 autonomous learning演示生成等场景,为可扩展人形机器人遥操作和自主学习提供基础。
12. Load-Aware Locomotion Control for Humanoid Robots in Industrial Transportation Tasks
来源: 📄 arXiv 作者: Lequn Fu, Yijun Zhong, Xiao Li等 发布日期: 2026-03-15 arXiv: 2603.14308v1
一句话摘要
该论文提出一种面向工业人形机器人的负载感知运动控制框架,通过强化学习结合运动学参考和潜在扰动编码实现稳定的人机协作运输。
现状痛点
工业环境中人形机器人执行负载运输任务时,运动与操作紧密耦合,动态干扰和部分可观测性导致稳定步态控制困难,且 payloads变化和上肢运动进一步加剧挑战。
解决方案与技术亮点
提出解耦但协调的局部运动架构:下层运动由强化学习策略控制,基于运动学导出的名义配置生成残差关节动作;引入高度条件化关节空间偏移的运动学参考;基于历史状态估计器推断基座线速度和高度,并将负载和操作引起的扰动编码为紧凑潜在表示。
效果与应用场景
仿真和实际部署实验表明训练速度快、高度跟踪准确、局部运动稳定。该框架适用于工业物流场景中的人形机器人货物运输,无需微调即可从仿真迁移到真实机器人。