| 模型 | 总参数量 | 激活参数量 | 激活比例 | 相对标准模型 | 激活策略 |
|---|---|---|---|---|---|
| YOLOv5s (标准) | 6,765,056 | 6,765,056 | 100.0% | 1.00x | 全部参数激活 |
| YOLOv5s-MoE-Lite | 12,093,417 | 8,118,832 | 67.1% | 1.20x | 选择性MoE激活 |
| YOLOv5s-MoE | 20,966,602 | 20,489,018 | 97.7% | 3.03x | 全面MoE激活 |
| YOLOv5s-Adaptive-MoE | 18,772,129 | 9,713,728 | 51.7% | 1.44x | 自适应MoE激活 |
- 标准YOLOv5s: 6.77M激活参数,100%激活率
- 轻量级MoE: 8.12M激活参数,仅增加20%,但总参数增加79%
- 完整MoE: 20.49M激活参数,增加203%,几乎所有参数都激活
- 自适应MoE: 9.71M激活参数,增加44%,激活率最低(51.7%)
- MoE层数量: 6个
- 专家配置: 4-8个专家,激活2-3个
- 激活比例: 33.3%-50.0%
- 设计理念: 在关键位置使用MoE,平衡性能和效率
- MoE层数量: 16个
- 专家配置: 4-8个专家,激活2-4个
- 激活比例: 25%-50%
- 设计理念: 全面使用MoE,追求最大模型容量
- MoE层数量: 7个
- 专家配置: 4-8个专家,动态激活1-4个
- 平均激活比例: 33.3%-37.5%
- 设计理念: 根据输入复杂度智能调整激活专家数量
- YOLOv5s (标准) - 基准模型,100%效率
- YOLOv5s-MoE-Lite - 最佳平衡,仅增加20%激活参数
- YOLOv5s-Adaptive-MoE - 智能激活,增加44%激活参数
- YOLOv5s-MoE - 最大容量,增加203%激活参数
- 轻量级MoE: 高效率,适合资源受限环境
- 自适应MoE: 智能化,适合复杂度变化大的场景
- 完整MoE: 最大容量,适合追求极致性能的场景
对于MoE层:
激活参数 = 门控网络参数 + (激活专家数 × 单个专家参数)
对于自适应MoE:
激活参数 = 门控网络参数 + 复杂度评估网络参数 + (平均激活专家数 × 单个专家参数)
- 固定激活: MoE和MoE-Lite使用固定的top-k选择
- 动态激活: Adaptive-MoE根据输入复杂度动态调整激活数量
- 负载均衡: 所有MoE变体都包含负载均衡机制
- 计算资源有限 → YOLOv5s-MoE-Lite
- 输入复杂度变化大 → YOLOv5s-Adaptive-MoE
- 追求最大性能 → YOLOv5s-MoE
- 基础应用 → YOLOv5s (标准)
- 边缘设备: 标准版本或轻量级MoE
- 服务器端: 自适应MoE或完整MoE
- 实时应用: 考虑激活参数数量对推理速度的影响
注: 激活参数是指在前向传播过程中实际参与计算的参数数量,对于MoE模型来说,这个数量远小于总参数数量,这正是MoE架构的核心优势。