背景
MuJoCo 后端在不同任务、不同本地 CPU/GPU 设备、不同 num_envs 下,最优 env stepping chunk-size 可能不同。固定或手工配置 chunk-size 难以适配所有任务和机器,容易导致 CPU 侧仿真吞吐不足。
目标
为 MuJoCo 后端增加针对任务和本地设备的自适应最优 chunk-size 功能,在不破坏 backend/env contract 的前提下自动选择更合适的 chunk-size。
设计约束
- 只作用于 MuJoCo backend owner layer,不扩散到训练脚本或算法 runner。
- 遵守 cold-path asset access:调参/探测只能发生在初始化、materialization、cache 或显式 benchmark 阶段。
- 配置优先:允许用户显式 override chunk-size;自适应模式可通过 Hydra 启用/禁用。
- 结果按任务、后端、设备信息和关键 env 参数缓存,避免每次训练重复 benchmark。
- 不要求
num_envs 随 GPU 数增加。
验收标准
- 新增配置项支持关闭自适应、启用自适应、手动指定 chunk-size。
- 测试覆盖配置解析、cache hit/miss、manual override 优先级、候选过滤。
- 验证 step/reset 热路径不会做 asset/XML 解析。
- 给出至少一个任务如
g1_walk_flat 的本地 benchmark 输出示例。
背景
MuJoCo 后端在不同任务、不同本地 CPU/GPU 设备、不同
num_envs下,最优 env stepping chunk-size 可能不同。固定或手工配置 chunk-size 难以适配所有任务和机器,容易导致 CPU 侧仿真吞吐不足。目标
为 MuJoCo 后端增加针对任务和本地设备的自适应最优 chunk-size 功能,在不破坏 backend/env contract 的前提下自动选择更合适的 chunk-size。
设计约束
num_envs随 GPU 数增加。验收标准
g1_walk_flat的本地 benchmark 输出示例。