人形机器人论文精选 - 2026-03-18
本期收录 11 篇论文(HuggingFace 热门 + Semantic Scholar 精选 + arXiv 最新)。
1. Learning Whole-Body Control for a Salamander Robot
来源: 📄 arXiv 作者: Mengze Tian, Qiyuan Fu, Chuanfang Ning等 发布日期: 2026-03-17 arXiv: 2603.16683v1
一句话摘要
该论文提出使用强化学习训练蝾螈机器人的全身关节控制器,实现从仿真到真实硬件的稳定迁移,并能在仿真中完成行走与游泳模式切换。
现状痛点
现有蝾螈机器人主要依赖CPG和模型-based控制方法,缺乏统一的学习型全身控制器;学习-based控制在两栖环境应用不足;从高自由度仿真到真实硬件的迁移面临挑战。
解决方案与技术亮点
采用强化学习将本体感受观测和命令速度直接映射到关节动作;设计系统级real-to-sim匹配和sim-to-real迁移策略;学习统一策略实现多种运动模式。
效果与应用场景
在仿真和真实硬件上实现平坦及不平坦地形的稳定行走;仿真中展示行走与游泳模式切换;适用于复杂两栖环境探测与作业。
2. ADAPT: Adaptive Dual-projection Architecture for Perceptive Traversal
来源: 📄 arXiv 作者: Shuo Shao, Tianchen Huang, Wei Gao等 发布日期: 2026-03-17 arXiv: 2603.16328v1
一句话摘要
提出ADAPT自适应双投影架构,通过水平高程图和垂直距离图表示环境,并将感知范围作为可学习动作,实现人形机器人在复杂3D环境中的高效感知与敏捷运动。
现状痛点
现有方法依赖固定感知配置,在感知保真度与计算效率间难以平衡;voxel-based方法观测维度高、计算开销大,且无法根据运动状态自适应调整感知范围。
解决方案与技术亮点
采用水平高程图表示地形几何、垂直距离图表示可穿越空间约束的双投影架构;将感知范围作为策略的可学习动作参数,实现运动时的动态范围调整,显著降低观测维度。
效果与应用场景
在Unitree G1人形机器人上实现零样本迁移,在多样化的3D环境挑战中展现高度鲁棒性,适用于复杂地形行走、障碍物穿越等敏捷运动场景。
3. ECHO: Edge-Cloud Humanoid Orchestration for Language-to-Motion Control
来源: 📄 arXiv 作者: Haozhe Jia, Jianfei Song, Yuan Zhang等 发布日期: 2026-03-17 arXiv: 2603.16188v1
一句话摘要
ECHO提出边缘-云协同框架,云端扩散模型将自然语言指令生成运动序列,边缘端强化学习跟踪器在人形机器人上闭环执行,实现零真机微调的文本驱动全身控制。
现状痛点
现有方法依赖复杂的人体模型重定向导致推理延迟,且难以直接适配机器人低层PD控制; sim-to-real迁移存在显著性能差距; 缺乏自主跌倒恢复能力影响安全性。
解决方案与技术亮点
设计了38维机器人原生运动表示消除重定向; 教师-学生蒸馏结合证据适应模块和形态对称约束提升迁移鲁棒性; DDIM 10步采样实现云端秒级生成; IMU跌倒检测+预建库恢复保障安全。
效果与应用场景
HumanML3D基准达FID 0.029/R-Precision Top-1 0.686; Unitree G1真机验证 Diverse语言命令执行; 适用于服务机器人、家庭护理、工业协作等场景的实时语言交互控制。
4. Enforcing Task-Specified Compliance Bounds for Humanoids via Anisotropic Lipschitz-Constrained Policies
来源: 📄 arXiv 作者: Zewen He, Yoshihiko Nakamura 发布日期: 2026-03-17 arXiv: 2603.16180v1
一句话摘要
该论文提出各向异性Lipschitz约束策略(ALCP),将任务空间刚度上界映射为策略雅可比矩阵的状态依赖Lipschitz约束,通过 hinge-squared 谱范数惩罚实现方向依赖的柔顺性控制。
现状痛点
现有RL方法难以施加可量化验证的柔顺性目标,经典基于模型的刚度设计不适用于无模型RL系统,且现有LCP方法仅使用单一标量Lipschitz预算,缺乏与物理可解释的柔顺性规范的明确关联。
解决方案与技术亮点
论文提出ALCP方法,将任务空间刚度上界映射为策略雅可比矩阵的状态依赖Lipschitz-style约束,在RL训练中通过 hinge-squared 谱范数惩罚强制执行约束,保留物理可解释性的同时实现方向依赖的柔顺控制。
效果与应用场景
在人形机器人上的实验表明,ALCP提升了 locomotion 稳定性和抗冲击鲁棒性,显著减少振荡和能量消耗,适用于需要复杂柔顺控制的人形机器人运动任务及人机交互场景。
5. The Era of End-to-End Autonomy: Transitioning from Rule-Based Driving to Large Driving Models
来源: 📄 arXiv 作者: Eduardo Nebot, Julie Stephany Berrio Perez 发布日期: 2026-03-17 arXiv: 2603.16050v1
一句话摘要
该论文系统性分析了自动驾驶从传统模块化规则架构向端到端大型驾驶模型(LDM)的演进趋势,涵盖特斯拉FSD、Rivian、NVIDIA等主流技术路线,并探讨了监督式E2E驾驶(L2++)的商业化前景。
现状痛点
传统基于规则的模块化系统存在模块间误差累积、泛化能力不足、难以处理长尾场景、系统集成复杂且扩展性差等问题,无法满足复杂动态驾驶环境的需求。
解决方案与技术亮点
论文提出采用端到端大型驾驶模型(LDM)架构,直接将原始传感器数据映射为驾驶动作,实现了从感知到控制的无缝学习,并引入监督式E2E驾驶模式作为过渡方案。
效果与应用场景
该技术可应用于城市道路辅助驾驶、高速公路自动驾驶、Robotaxi商业运营及人形机器人等具身AI系统,预计2026年起多家厂商将部署L2++级别产品。
6. HSImul3R: Physics-in-the-Loop Reconstruction of Simulation-Ready Human-Scene Interactions
来源: 📄 arXiv 作者: Yukang Cao, Haozhe Xie, Fangzhou Hong等 发布日期: 2026-03-16 arXiv: 2603.15612v1
一句话摘要
提出物理内循环的双向优化框架,通过场景目标强化学习和直接模拟奖励优化弥合人类-场景交互3D重建中的感知-模拟差距,实现物理稳定、可直接部署到人形机器人的可模拟重建。
现状痛点
现有方法的视觉重建结果与物理模拟要求存在巨大差距,生成的重建违反物理约束(如穿透、不稳定接触),导致物理引擎模拟失败,无法应用于embodied AI和机器人任务。
解决方案与技术亮点
提出物理基础的双向优化管道:前向采用Scene-targeted RL在运动保真度和接触稳定性双重监督下优化人体动作;反向通过Direct Simulation Reward Optimization利用重力稳定性和交互成功反馈优化场景几何。将物理模拟器作为主动监督器实现joint refinement。
效果与应用场景
实验表明该方法首次实现稳定、可模拟的HSI重建,能直接部署到真实世界人形机器人。发布HSIBench基准测试涵盖多样物体和交互场景,适用于机器人操作、动作生成、虚拟现实等应用。
7. HALO:Closing Sim-to-Real Gap for Heavy-loaded Humanoid Agile Motion Skills via Differentiable Simulation
来源: 📄 arXiv 作者: Xingyi Wang, Chenyun Zhang, Weiji Xie等 发布日期: 2026-03-16 arXiv: 2603.15084v1
一句话摘要
本文提出两阶段梯度-based系统辨识框架,利用可微分MuJoCo XLA仿真器,先校准机器人模型减少sim-to-real差异,再识别未知载荷质量分布,实现重载人形机器人零样本策略迁移。
现状痛点
真实场景中人形机器人需携带未知载荷,导致仿真训练策略与实际部署严重不匹配,传统sim-to-real方法在重载条件下效果显著下降,是制约敏捷运动技能部署的关键瓶颈。
解决方案与技术亮点
创新性地构建两阶段梯度优化pipeline:第一阶段通过真实数据校准标称模型消除固有sim-to-real偏差,第二阶段利用可微仿真器反向传播识别未知payload质量分布,显著降低结构化模型误差。
效果与应用场景
仿真和真实硬件实验表明,该方法参数辨识精度更高,运动跟踪误差降低30%以上,敏捷性和鲁棒性显著提升,无需微调即可实现重载条件下的零样本迁移,适用于复杂环境作业机器人。
8. Exploring the dynamic properties and motion reproducibility of a small upper-body humanoid robot with 13-DOF pneumatic actuation for data-driven control
来源: 📄 arXiv 作者: Hiroshi Atsuta, Hisashi Ishihara, Minoru Asada 发布日期: 2026-03-16 arXiv: 2603.14787v1
一句话摘要
该论文开发了一款13-DOF气动驱动上半身人形机器人,通过实验验证其动态特性和运动可重复性,并提出基于多层感知器(MLP)带时间延迟补偿的数据驱动控制器,实现了对4-DOF臂子系统轨迹跟踪的有效控制。
现状痛点
气动驱动的人形机器人存在控制精度低的问题,主要瓶颈在于气动执行器本身的强非线性特性、显著的actuation time delays( actuation延迟)以及缺乏有效的控制策略来实现高精度轨迹跟踪。
解决方案与技术亮点
论文提出了三大技术亮点:1)系统性地分析了13-DOF机器人的关键动态特性(尤其是actuation time delays);2)验证了系统的高度运动可重复性;3)设计了一种基于MLP的数据驱动控制器,显式补偿时间延迟,使用随机运动数据进行训练生成压力命令。
效果与应用场景
实验结果显示,所提出的MLP控制器在轨迹跟踪性能上显著优于传统PID控制器,验证了数据驱动方法在复杂高-DOF气动机器人控制中的潜力。该机器人适用于物理人机交互场景。
9. CyboRacket: A Perception-to-Action Framework for Humanoid Racket Sports
来源: 📄 arXiv 作者: Peng Ren, Chuan Qi, Haoyang Ge等 发布日期: 2026-03-15 arXiv: 2603.14605v1
一句话摘要
本文提出CyboRacket分层感知-动作框架,整合车载视觉感知、物理轨迹预测和预训练全身控制,实现人形机器人仅凭自身传感器完成网球击打任务。
现状痛点
现有机器人球拍运动系统依赖外部运动捕捉设备,且任务特定控制器需跨平台重新训练,难以在有限反应时间内实现紧密的感知-动作耦合。
解决方案与技术亮点
框架采用分层架构:车载相机实时追踪来球,经物理模型预测落点,将拦截状态转换为末端执行器和基座运动命令,由SONIC控制器驱动Unitree G1全身执行。
效果与应用场景
实验验证了纯车载感知下的实时视觉跟踪、轨迹预测和成功击球能力,为家庭服务机器人、竞技机器人及通用动态交互任务提供技术基础。
10. OmniClone: Engineering a Robust, All-Rounder Whole-Body Humanoid Teleoperation System
来源: 📄 arXiv 作者: Yixuan Li, Le Ma, Yutang Lin等 发布日期: 2026-03-15 arXiv: 2603.14327v1
一句话摘要
OmniClone是一个面向消费级GPU的高保真全身人形机器人遥操作系统,通过引入OmniBench诊断基准和优化训练配方,实现了在极低计算资源下66%以上的位置误差降低,同时支持多种控制源和不同操作员。
现状痛点
现有遥操作系统使用聚合指标掩盖关键故障模式,缺乏诊断粒度;系统紧耦合、配置劳动密集;先验方法仅在特定运动模式下有效,缺乏鲁棒性、通用性和可负担性的平衡。
解决方案与技术亮点
论文提出OmniBench分层诊断基准识别系统弱点,采用主体无关的重定向和鲁棒通信优化,研发优化的训练数据配方,最终实现控制源无关的统一策略,支持实时遥操作、运动回放和VLA模型。
效果与应用场景
实现66%以上MPJPE降低,计算资源比同类方法减少数个量级。可应用于实时遥操作示范收集、运动生成回放、VLA模型训练,支持不同体型操作员,在消费级硬件上运行。
11. Load-Aware Locomotion Control for Humanoid Robots in Industrial Transportation Tasks
来源: 📄 arXiv 作者: Lequn Fu, Yijun Zhong, Xiao Li等 发布日期: 2026-03-15 arXiv: 2603.14308v1
一句话摘要
论文提出一种基于强化学习的负载感知运动控制框架,通过解耦的loc-manipulation架构和历史状态估计器,使全尺寸人形机器人在变负载和上半身操作干扰下实现稳定运动控制。
现状痛点
现有方法在处理工业运输任务中运动与操作紧密耦合时面临动态耦合和部分可观测性挑战,难以在变负载和上半身运动下保持稳定稳健的运动控制。
解决方案与技术亮点
论文提出三大创新点:1) 解耦但协调的loc-manipulation架构;2) 强化学习策略产生运动学名义配置上的残余关节动作;3) 高度条件化关节空间偏移和基于历史的状态估计器推断基座速度并编码干扰的潜在表示。
效果与应用场景
模拟和真实世界实验表明该框架训练速度快、高度跟踪准确、loc-manipulation稳定。适用于工业环境中全尺寸人形机器人的负载搬运运输任务,可直接部署无需微调。