Skip to content

Work: MuJoCo 后端增加按任务和本地设备自适应最优 chunk-size #634

Description

@TATP-233

背景

MuJoCo 后端在不同任务、不同本地 CPU/GPU 设备、不同 num_envs 下,最优 env stepping chunk-size 可能不同。固定或手工配置 chunk-size 难以适配所有任务和机器,容易导致 CPU 侧仿真吞吐不足。

目标

为 MuJoCo 后端增加针对任务和本地设备的自适应最优 chunk-size 功能,在不破坏 backend/env contract 的前提下自动选择更合适的 chunk-size。

设计约束

  • 只作用于 MuJoCo backend owner layer,不扩散到训练脚本或算法 runner。
  • 遵守 cold-path asset access:调参/探测只能发生在初始化、materialization、cache 或显式 benchmark 阶段。
  • 配置优先:允许用户显式 override chunk-size;自适应模式可通过 Hydra 启用/禁用。
  • 结果按任务、后端、设备信息和关键 env 参数缓存,避免每次训练重复 benchmark。
  • 不要求 num_envs 随 GPU 数增加。

验收标准

  • 新增配置项支持关闭自适应、启用自适应、手动指定 chunk-size。
  • 测试覆盖配置解析、cache hit/miss、manual override 优先级、候选过滤。
  • 验证 step/reset 热路径不会做 asset/XML 解析。
  • 给出至少一个任务如 g1_walk_flat 的本地 benchmark 输出示例。

Metadata

Metadata

Assignees

Labels

enhancementNew feature or request

Type

No type
No fields configured for issues without a type.

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions