Bridge the Sim2Real Gap with Neural Actuator

Kingsley Liu, DevTech | AI Open Day 5/30/2025

议程 (Agenda)

背景 (Background)

人形机器人任务 (Humanoid Tasks)

Page 3: 人形机器人任务流程图
Page 3: 人形机器人任务流程图

Sim2Real 差距 (Sim2Real Gap)

Page 4: Sim2Real 差距的图表和指标
Page 4: Sim2Real 差距的图表和指标

Sim2Real 对齐 (Sim2Real Alignment)

Page 5: 神经执行器在模拟流程中的作用
Page 5: 神经执行器在模拟流程中的作用

技术方法 (Technical Approach)

整体工作流程 (Overall Workflow)

Page 6: 整体工作流程图
Page 6: 整体工作流程图
  1. 在真实世界中收集运动数据 (Collect Motion Data in Real)

    • 17 个重定向的 AMASS 运动序列。
    • 使用 Unitree H1_2 机器人。
    • 关节位置指令以 50 Hz 的频率应用。
    • 关节位置和速度以 200Hz 的频率记录。
  2. 使用强化学习训练神经执行器 (Train Neural Actuator with RL)

    • 15 个重定向的 AMASS 运动序列。
    • 2048 个并行环境。
    • 1500 次迭代,每次迭代包含 20 个物理步骤。
    • 使用 IsaacLab 2.1.0。
  3. 在模拟中评估神经执行器 (Eval Neural Actuator in Sim)

    • 2 个重定向的 AMASS 运动序列。
    • 测量关节位置误差和速度误差。
    • 使用 IsaacLab 2.1.0。

系统架构 (System Architecture)

该系统包含两个主要部分:Rollout(执行/推理)和 Training(训练)。

Page 7: 系统架构图,展示了 Rollout 和 Training 流程
Page 7: 系统架构图,展示了 Rollout 和 Training 流程

算法设计 1/2 (Algorithm Design - 1/2)

算法设计 2/2 (Algorithm Design - 2/2)

Page 9: PPO 代理目标函数公式
Page 9: PPO 代理目标函数公式

实现细节 (Implementation Details)

Page 10: 关节超参数、奖励尺度和网络架构的详细信息
Page 10: 关节超参数、奖励尺度和网络架构的详细信息

实验结果 (Experiment Results)

训练曲线 (Training Curves)

Page 11: 训练过程中的损失和奖励曲线图
Page 11: 训练过程中的损失和奖励曲线图

评估指标 - 所有关节 (Evaluation Metrics – All Joints)

Page 12: 所有关节的平均位置误差和平均速度误差随训练迭代的变化
Page 12: 所有关节的平均位置误差和平均速度误差随训练迭代的变化

评估指标 - 每个关节 (Evaluation Metrics – Per-Joint)

此页面展示了每个被控制的关节(左肩、左肘、右肩、右肘的 pitch, roll, yaw 关节)的平均位置误差和平均速度误差随训练迭代次数的变化。

Page 13: 每个关节的评估指标图表
Page 13: 每个关节的评估指标图表

视频演示 (Video Demo)

(此页包含一个视频占位符)

总结 (Summary)

IsaacSim/Lab 基准测试

Hui Kang, DevTech | AI Open Day 5/30/2025

IsaacSim 基准测试

基准测试介绍

不同计算机配置下的性能

Page 21
Page 21

不同任务的可扩展性

Page 22
Page 22
Page 23
Page 23

线程数影响

Page 24
Page 24
Page 25
Page 25
--/plugins/carb.tasking.plugin/threadCount=32
--/plugins/omni.tbb.globalcontrol/maxThreadCount=32
export PXR_WORK_THREAD_LIMIT=32
export OPENBLAS_NUM_THREADS=32

总结

IsaacLab 基准测试

任务介绍

IsaacLab 基准测试: Isaac-Velocity-Flat-Unitree-Go2-v0

Page 30
Page 30

Isaac-Navigation-Flat-Obstacle-Anymal-C-v0

Page 31
Page 31

结论 (Takeaway)

Page 32
Page 32

致谢 (Acknowledgements)

演示以致谢结尾。

Page 33
Page 33