Skip to content

人形机器人论文精选 - 2026-03-16

本期收录 4 篇论文(HuggingFace 热门 + Semantic Scholar 精选 + arXiv 最新)。

1. PhysMoDPO: Physically-Plausible Humanoid Motion with Preference Optimization

来源: 📄 arXiv 作者: Yangsong Zhang, Anujith Muraleedharan, Rikhat Akizhanov等 发布日期: 2026-03-13 arXiv: 2603.13228v1

一句话摘要

PhysMoDPO提出一种直接偏好优化框架,将全身控制器集成到扩散模型的训练流程中,确保生成的运动既符合物理约束又忠实于文本指令。

现状痛点

现有方法使用全身控制器将扩散模型生成的运动转换为可执行轨迹时,常导致运动严重偏离原始意图,且依赖手工设计的物理惩罚项,效果有限。

解决方案与技术亮点

PhysMoDPO创新性地将全身控制器纳入训练pipeline,基于物理和任务特定奖励构建偏好数据集,通过直接偏好优化算法微调扩散模型,实现物理合规性与文本对齐的联合优化。

效果与应用场景

在模拟机器人上实现物理真实性和任务相关指标的一致提升,成功应用于G1人形机器人的零样本运动迁移和真实世界部署,验证了方法的实际可行性。


2. Learning Athletic Humanoid Tennis Skills from Imperfect Human Motion Data

来源: 📄 arXiv 作者: Zhikai Zhang, Haofei Lu, Yunrui Lian等 发布日期: 2026-03-13 arXiv: 2603.12686v1

一句话摘要

提出LATENT系统,利用不完美的人类运动片段数据学习人形机器人网球技能,通过校正与组合策略实现鲁棒的sim-to-real迁移。

现状痛点

现有方法缺乏精确完整的人类网球运动数据作为参考,难以采集真实比赛中的精准动作序列,导致人形机器人难以复现高动态网球行为。

解决方案与技术亮点

利用包含原始技能的不完美运动片段作为先验,提出校正与组合策略学习策略网络,设计鲁棒的sim-to-real迁移方案,部署于Unitree G1人形机器人。

效果与应用场景

在真实环境中实现稳定的多拍对打,可应对多种来球条件并将球返回目标位置,展现出令人惊讶的泛化能力和自然运动风格。


3. $Ψ_0$: An Open Foundation Model Towards Universal Humanoid Loco-Manipulation

来源: 📄 arXiv 作者: Songlin Wei, Hongyi Jing, Boqian Li等 发布日期: 2026-03-12 arXiv: 2603.12263v1

一句话摘要

Ψ_0是一个开放的人形机器人基础模型,通过分阶段训练策略(先在人类 egocentric 视频上预训练视觉-动作表示,再在机器人数据上微调),用800小时人类视频+30小时机器人数据的规模,实现了超越使用10倍以上数据的基线方法40%以上成功率的效果。

现状痛点

现有方法试图通过联合训练大规模人类和类人机器人数据解决 loco-manipulation 问题,但人类与类人机器人存在根本的运动学差异,导致数据量虽大但数据效率和模型性能仍不理想。

解决方案与技术亮点

论文提出解耦学习策略:阶段一在大量 egocentric 人类视频上自回归预训练 VLM backbone 获取通用视觉-动作表示;阶段二在高质量类人机器人数据上后训练 flow-based 动作专家学习精确关节控制,形成数据效率最优的高质量数据配方。

效果与应用场景

仅用约800小时人类视频和30小时真实机器人数据,即在多个任务上取得最高成功率,比使用超过10倍数据的基线方法提升40%以上。适用于类人机器人的通用 loco-manipulation 任务,论文将开源完整生态系统包括训练管道、基础模型和推理引擎。


4. SPARK: Skeleton-Parameter Aligned Retargeting on Humanoid Robots with Kinodynamic Trajectory Optimization

来源: 📄 arXiv 作者: Hanwen Wang, Qiayuan Liao, Bike Zhang等 发布日期: 2026-03-12 arXiv: 2603.11480v1

一句话摘要

SPARK提出两阶段管道,通过骨骼参数对齐将人体运动转换为机器人兼容的运动表示,并使用渐进式运动动力学轨迹优化生成自然且物理可行的运动参考。

现状痛点

人体运动演示与机器人运动学和动力学不兼容,现有线跟踪方法需要大量人工调参,且难以产生动态一致的轨迹,限制了直接应用。

解决方案与技术亮点

将人体运动转换为URDF骨骼表示并校准目标人形机器人尺寸,通过三级渐进式轨迹优化(运动学TO、逆动力学、完整动力学TO)逐步精化轨迹,每阶段从前一阶段解热启动。

效果与应用场景

生成动态一致的状态轨迹和关节力矩 profiles,为学习控制器提供高质量参考,适用于训练通用人形机器人控制策略,可应用于多种人形机器人平台。


最后更新:

Powered by Claude & VitePress