Skip to content

人形机器人论文精选 - 2026-03-17

本期收录 7 篇论文(HuggingFace 热门 + Semantic Scholar 精选 + arXiv 最新)。

1. Exploring the dynamic properties and motion reproducibility of a small upper-body humanoid robot with 13-DOF pneumatic actuation for data-driven control

来源: 📄 arXiv 作者: Hiroshi Atsuta, Hisashi Ishihara, Minoru Asada 发布日期: 2026-03-16 arXiv: 2603.14787v1

一句话摘要

该论文开发了一款13自由度气动驱动上半身类人机器人,通过验证系统动态特性和可重复性,采用带显式时间延迟补偿的多层感知器数据驱动控制器,在4-DOF手臂上实现优于传统PID控制的轨迹跟踪性能。

现状痛点

气动执行器存在固有非线性特性,导致精确控制困难;高自由度气动类人机器人缺乏有效的控制策略,特别是时间延迟带来的挑战。

解决方案与技术亮点

论文提出基于多层感知器(MLP)的数据驱动控制器,包含显式时间延迟补偿机制;利用系统可重复性特征,使用随机运动数据训练网络生成压力命令,实现任意轨迹跟踪。

效果与应用场景

实验表明数据驱动控制器在轨迹跟踪精度上显著优于传统PID控制器,适用于物理人机交互、康复机器人、服务机器人等需要安全柔顺接触的应用场景。


2. CyboRacket: A Perception-to-Action Framework for Humanoid Racket Sports

来源: 📄 arXiv 作者: Peng Ren, Chuan Qi, Haoyang Ge等 发布日期: 2026-03-15 arXiv: 2603.14605v1

一句话摘要

本文提出CyboRacket层级感知-行动框架,整合 onboard 视觉感知、物理轨迹预测与大规模预训练全身控制,实现仅依赖机载传感器的类人网球击打任务。

现状痛点

动态球拍交互任务对机器人反应时间要求极高,现有系统依赖外部运动捕捉设备缺乏自主性,且任务专用控制器需跨平台重新训练,类人网球运动面临视觉追踪、轨迹预测、步态协调与稳定击球等多重挑战。

解决方案与技术亮点

提出层级感知-行动框架,包含 onboard 相机视觉追踪、基于物理的落点预测、拦截状态到末端执行器与基座运动命令的转换,由 SONIC 控制器在 Unitree G1 人形机器人上执行全身击球动作。

效果与应用场景

在视觉类人网球击打任务中验证,实现实时视觉追踪、轨迹预测与成功击球,展示了纯机载感知下的动态球类交互能力,可应用于体育训练、赛事裁判及服务机器人场景。


3. OmniClone: Engineering a Robust, All-Rounder Whole-Body Humanoid Teleoperation System

来源: 📄 arXiv 作者: Yixuan Li, Le Ma, Yutang Lin等 发布日期: 2026-03-15 arXiv: 2603.14327v1

一句话摘要

OmniClone是一个全人形机器人遥操作系统,通过OmniBench诊断基准和优化训练策略,在消费级GPU上实现高保真全身控制,MPJPE降低66%以上。

现状痛点

现有系统使用聚合指标掩盖关键失败模式,缺乏诊断粒度;系统紧耦合、配置劳动密集,且无法同时满足鲁棒性、多功能性和低成本需求。

解决方案与技术亮点

提出OmniBench分层诊断基准,优化训练数据配方,集成主体无关重定向和鲁棒通信技术,开发控制源无关的统一策略支持实时遥操作、运动回放和VLA模型。

效果与应用场景

MPJPE降低超66%,计算资源需求降低数个数量级;支持实时遥操作、演示数据收集和VLA模型训练,泛化到不同身材操作员,应用前景广阔。


4. Load-Aware Locomotion Control for Humanoid Robots in Industrial Transportation Tasks

来源: 📄 arXiv 作者: Lequn Fu, Yijun Zhong, Xiao Li等 发布日期: 2026-03-15 arXiv: 2603.14308v1

一句话摘要

该论文提出了一种基于强化学习的负载感知运动控制框架,通过解耦的运动-操作架构和历史状态估计器,实现人形机器人在工业运输任务中携带不同负载时的稳定运动控制,且可无微调地从仿真部署到真实机器人。

现状痛点

工业环境中的人形机器人执行负载搬运任务时,有效载荷变化和上半身操作动作会导致动态耦合,引发运动不稳定;部分可观测性使得在未知负载条件下实现稳健运动控制成为技术瓶颈。

解决方案与技术亮点

论文提出解耦的局部操作架构:下半身由强化学习策略控制,在运动学推导的基准构型上生成残留关节动作;引入高度条件化的关节空间偏移指导学习;设计基于历史的状态估计器推断基线速度和高度,并编码负载与操作干扰的潜在表示。

效果与应用场景

仿真和真实实验表明该框架训练速度快、高度跟踪准确、局部操作稳定,可直接部署到全尺寸人形机器人进行工业运输任务,适合物流仓储、制造业等需要机器人搬运重物的场景。


5. REFINE-DP: Diffusion Policy Fine-tuning for Humanoid Loco-manipulation via Reinforcement Learning

来源: 📄 arXiv 作者: Zhaoyuan Gu, Yipu Chen, Zimeng Chai等 发布日期: 2026-03-14 arXiv: 2603.13707v1

一句话摘要

提出REFINE-DP框架,通过PPO扩散策略梯度联合微调高层扩散策略规划器和低层RL控制器,解决人形机器人locomanipulation中规划与控制解耦导致的命令跟踪差和分布偏移问题。

现状痛点

现有方法中离线训练的motion planner与低层控制器解耦,导致命令跟踪差、分布偏移累积和任务失败;而且扩展人形机器人的演示数据成本极高,难以实现。

解决方案与技术亮点

提出层次化REFINE-DP框架,采用PPO-based diffusion policy gradient微调扩散策略;同时联合优化低层控制器以准确跟踪规划器的命令分布,减少分布 mismatch,提升运动质量。

效果与应用场景

在模拟中实现>90%成功率的门穿越和长程物体运输任务,即使在分布外场景也有效;可推广至真实世界动态环境中的人形机器人自主locomanipulation任务执行。


6. PhysMoDPO: Physically-Plausible Humanoid Motion with Preference Optimization

来源: 📄 arXiv 作者: Yangsong Zhang, Anujith Muraleedharan, Rikhat Akizhanov等 发布日期: 2026-03-13 arXiv: 2603.13228v1

一句话摘要

PhysMoDPO提出将全身控制器(WBC)集成到扩散模型的训练管道中,通过直接偏好优化使生成的运动在经过WBC转换后既保持物理真实性又符合文本指令,实现了文本到物理可行的人形运动生成。

现状痛点

现有方法使用WBC将扩散模型生成的运动转换为物理可执行轨迹时,WBC输出虽符合物理约束,但可能严重偏离原始运动意图,导致运动失真和任务执行失败。

解决方案与技术亮点

论文提出直接偏好优化框架PhysMoDPO,将WBC引入训练管道构建闭环系统,基于物理奖励和任务奖励计算偏好分数,优化扩散模型使WBC输出同时满足物理约束和文本指令,并采用合成轨迹进行偏好标注。

效果与应用场景

在文本到运动和空间控制任务中,PhysMoDPO在物理真实性和任务相关指标上均取得显著提升,成功实现了模拟环境中的零样本运动迁移,并在G1人形机器人上完成真实世界部署验证。


7. Learning Athletic Humanoid Tennis Skills from Imperfect Human Motion Data

来源: 📄 arXiv 作者: Zhikai Zhang, Haofei Lu, Yunrui Lian等 发布日期: 2026-03-13 arXiv: 2603.12686v1

一句话摘要

论文提出LATENT系统,利用不完美的碎片化人类运动数据学习类人机器人的网球运动技能,通过纠正与组合策略实现稳定的真实世界多拍对打。

现状痛点

现有类人机器人难以复制人类运动员的高动态网球技能,主要瓶颈在于缺乏精确完整的人类网球动作数据,高速网球与复杂动态运动的协调控制极具挑战。

解决方案与技术亮点

核心创新在于利用碎片化运动数据中仍保留的人类原始技能先验知识,提出纠正与组合机制学习策略,设计robust sim-to-real迁移方案,在Unitree G1机器人上实现部署。

效果与应用场景

在真实环境中可稳定与人类玩家进行多拍网球对打,保持自然运动风格,适用于体育竞技机器人、家庭陪练机器人及类人机器人运动技能迁移研究。


最后更新:

Powered by Claude & VitePress