KeyError: 'loss_cls' #9

Feeeeeel · 2024-11-17T06:29:36Z

when i run the command：python tools/train.py configs/visdrone_step1_base.py
it got an error：

11/17 14:19:53 - mmengine - INFO - Iter(train) [ 450/80000] lr: 8.9990e-03 eta: 17:22:39 time: 0.7945 data_time: 0.0204 memory: 17784 loss: 0.9282 sup_loss_rpn_cls: 0.2866 sup_loss_rpn_bbox: 0.0894 sup_loss_cls: 0.3180 sup_acc: 95.3125 sup_loss_bbox: 0.1006 unsup_loss_rpn_cls: 0.0831 unsup_loss_rpn_bbox: 0.0000 unsup_loss_cls: 0.0505 unsup_acc: 100.0000 unsup_loss_bbox: 0.0000
File "tools/train.py", line 122, in
main()
File "tools/train.py", line 118, in main
runner.train()
File "/home/zwh/.conda/envs/castdet/lib/python3.8/site-packages/mmengine/runner/runner.py", line 1777, in train
model = self.train_loop.run() # type: ignore
File "/home/zwh/.conda/envs/castdet/lib/python3.8/site-packages/mmengine/runner/loops.py", line 289, in run
self.run_iter(data_batch)
File "/home/zwh/.conda/envs/castdet/lib/python3.8/site-packages/mmengine/runner/loops.py", line 313, in run_iter
outputs = self.runner.model.train_step(
File "/home/zwh/.conda/envs/castdet/lib/python3.8/site-packages/mmengine/model/base_model/base_model.py", line 114, in train_step
losses = self._run_forward(data, mode='loss') # type: ignore
File "/home/zwh/.conda/envs/castdet/lib/python3.8/site-packages/mmengine/model/base_model/base_model.py", line 361, in _run_forward
results = self(**data, mode=mode)
File "/home/zwh/.conda/envs/castdet/lib/python3.8/site-packages/torch/nn/modules/module.py", line 1130, in _call_impl
return forward_call(*input, **kwargs)
File "/home/zwh/.conda/envs/castdet/lib/python3.8/site-packages/mmdet/models/detectors/base.py", line 92, in forward
return self.loss(inputs, data_samples)
File "/home/zwh/.conda/envs/castdet/lib/python3.8/site-packages/mmdet/models/detectors/semi_base.py", line 87, in loss
losses.update(**self.loss_by_pseudo_instances(
File "/home/zwh/.conda/envs/castdet/lib/python3.8/site-packages/mmdet/models/detectors/soft_teacher.py", line 78, in loss_by_pseudo_instances
losses.update(**self.rcnn_cls_loss_by_pseudo_instances(
File "/home/zwh/.conda/envs/castdet/lib/python3.8/site-packages/mmdet/models/detectors/soft_teacher.py", line 255, in rcnn_cls_loss_by_pseudo_instances
losses['loss_cls'] = losses['loss_cls'] * len(
KeyError: 'loss_cls'

Can you solve this problem？Thanks！

UnchangedOriInten · 2024-12-05T11:09:21Z

You can modify the learning rate to make it smaller, but it will affect the detection accuracy later on. It is recommended to continue training with the original configuration.

lili196 · 2025-01-15T03:04:40Z

I meet the same error,do you solve it?I want to konw how to solve it.Thanks

lizzy8587 · 2025-02-08T05:09:56Z

when i run the command：python tools/train.py configs/visdrone_step1_base.py it got an error：

11/17 14:19:53 - mmengine - INFO - Iter(train) [ 450/80000] lr: 8.9990e-03 eta: 17:22:39 time: 0.7945 data_time: 0.0204 memory: 17784 loss: 0.9282 sup_loss_rpn_cls: 0.2866 sup_loss_rpn_bbox: 0.0894 sup_loss_cls: 0.3180 sup_acc: 95.3125 sup_loss_bbox: 0.1006 unsup_loss_rpn_cls: 0.0831 unsup_loss_rpn_bbox: 0.0000 unsup_loss_cls: 0.0505 unsup_acc: 100.0000 unsup_loss_bbox: 0.0000 File "tools/train.py", line 122, in main() File "tools/train.py", line 118, in main runner.train() File "/home/zwh/.conda/envs/castdet/lib/python3.8/site-packages/mmengine/runner/runner.py", line 1777, in train model = self.train_loop.run() # type: ignore File "/home/zwh/.conda/envs/castdet/lib/python3.8/site-packages/mmengine/runner/loops.py", line 289, in run self.run_iter(data_batch) File "/home/zwh/.conda/envs/castdet/lib/python3.8/site-packages/mmengine/runner/loops.py", line 313, in run_iter outputs = self.runner.model.train_step( File "/home/zwh/.conda/envs/castdet/lib/python3.8/site-packages/mmengine/model/base_model/base_model.py", line 114, in train_step losses = self._run_forward(data, mode='loss') # type: ignore File "/home/zwh/.conda/envs/castdet/lib/python3.8/site-packages/mmengine/model/base_model/base_model.py", line 361, in _run_forward results = self(**data, mode=mode) File "/home/zwh/.conda/envs/castdet/lib/python3.8/site-packages/torch/nn/modules/module.py", line 1130, in _call_impl return forward_call(*input, **kwargs) File "/home/zwh/.conda/envs/castdet/lib/python3.8/site-packages/mmdet/models/detectors/base.py", line 92, in forward return self.loss(inputs, data_samples) File "/home/zwh/.conda/envs/castdet/lib/python3.8/site-packages/mmdet/models/detectors/semi_base.py", line 87, in loss losses.update(**self.loss_by_pseudo_instances( File "/home/zwh/.conda/envs/castdet/lib/python3.8/site-packages/mmdet/models/detectors/soft_teacher.py", line 78, in loss_by_pseudo_instances losses.update(**self.rcnn_cls_loss_by_pseudo_instances( File "/home/zwh/.conda/envs/castdet/lib/python3.8/site-packages/mmdet/models/detectors/soft_teacher.py", line 255, in rcnn_cls_loss_by_pseudo_instances losses['loss_cls'] = losses['loss_cls'] * len( KeyError: 'loss_cls'

Can you solve this problem？Thanks！

You can try slightly reducing the learning rate or increasing the batch size.
Alternatively, the rcnn_cls_loss_by_pseudo_instances function has been rewritten in castdet/castdet.py. You can follow this function to rewrite it in mmdet/models/detectors/soft_teacher.py.

lili196 · 2025-02-08T12:30:14Z

thank you very much.I have been solve the loss_cls question.but when I run the command:CUDA_VISIBLE_DEVICES=3 python /data2/llj/Research-lw/CastDet-main/tools/test.py /data2/llj/Research-lw/CastDet-main/configs/visdrone_step2_castdet_12b_10k.py /home/llj/work_dirs/init_80k.pth.The result:Loads checkpoint by local backend from path: /home/llj/work_dirs/init_80k.pth The model and loaded state dict do not match exactly unexpected key in source state_dict: student.roi_head.bbox_head.fc_cls.weight, student.roi_head.bbox_head.fc_cls.bias, teacher.roi_head.bbox_head.fc_cls.weight, teacher.roi_head.bbox_head.fc_cls.bias missing keys in source state_dict: words, student.roi_head.bbox_head.fc_cls.words, student.roi_head.bbox_head.fc_cls.bg, student.roi_head.bbox_head.fc_cls.logit_scale, student.roi_head.bbox_head.fc_cls.fc_proj.weight, student.roi_head.bbox_head.fc_cls.fc_proj.bias, teacher.roi_head.bbox_head.fc_cls.words, teacher.roi_head.bbox_head.fc_cls.bg, teacher.roi_head.bbox_head.fc_cls.logit_scale, teacher.roi_head.bbox_head.fc_cls.fc_proj.weight, teacher.roi_head.bbox_head.fc_cls.fc_proj.bias 02/08 19:50:09 - mmengine - INFO - Load checkpoint from /home/llj/work_dirs/init_80k.pth 02/08 19:50:17 - mmengine - INFO - Iter(test) [  20/1669]    eta: 0:11:24  time: 0.4153  data_time: 0.0222  memory: 901 02/08 19:50:20 - mmengine - INFO - Iter(test) [  40/1669]    eta: 0:07:19  time: 0.2698  data_time: 0.0133  memory: 900 02/08 19:50:22 - mmengine - INFO - Iter(test) [  60/1669]    eta: 0:05:54  time: 0.1246  data_time: 0.0051  memory: 900 02/08 19:50:25 - mmengine - INFO - Iter(test) [  80/1669]    eta: 0:05:12  time: 0.1230  data_time: 0.0051  memory: 900 02/08 19:50:27 - mmengine - INFO - Iter(test) [ 100/1669]    eta: 0:04:43  time: 0.1204  data_time: 0.0045  memory: 900 02/08 19:50:30 - mmengine - INFO - Iter(test) [ 120/1669]    eta: 0:04:24  time: 0.1210  data_time: 0.0046  memory: 900 02/08 19:50:32 - mmengine - INFO - Iter(test) [ 140/1669]    eta: 0:04:10  time: 0.1196  data_time: 0.0049  memory: 900 02/08 19:50:34 - mmengine - INFO - Iter(test) [ 160/1669]    eta: 0:04:00  time: 0.1232  data_time: 0.0054  memory: 900 02/08 19:50:37 - mmengine - INFO - Iter(test) [ 180/1669]    eta: 0:03:50  time: 0.1237  data_time: 0.0051  memory: 900 02/08 19:50:39 - mmengine - INFO - Iter(test) [ 200/1669]    eta: 0:03:42  time: 0.1205  data_time: 0.0045  memory: 900 02/08 19:50:42 - mmengine - INFO - Iter(test) [ 220/1669]    eta: 0:03:36  time: 0.1237  data_time: 0.0048  memory: 900 02/08 19:50:44 - mmengine - INFO - Iter(test) [ 240/1669]    eta: 0:03:29  time: 0.1208  data_time: 0.0047  memory: 900 02/08 19:50:47 - mmengine - INFO - Iter(test) [ 260/1669]    eta: 0:03:23  time: 0.1197  data_time: 0.0043  memory: 900 02/08 19:50:49 - mmengine - INFO - Iter(test) [ 280/1669]    eta: 0:03:18  time: 0.1216  data_time: 0.0048  memory: 900 02/08 19:50:52 - mmengine - INFO - Iter(test) [ 300/1669]    eta: 0:03:13  time: 0.1220  data_time: 0.0048  memory: 900 02/08 19:50:54 - mmengine - INFO - Iter(test) [ 320/1669]    eta: 0:03:09  time: 0.1233  data_time: 0.0047  memory: 900 02/08 19:50:56 - mmengine - INFO - Iter(test) [ 340/1669]    eta: 0:03:05  time: 0.1225  data_time: 0.0045  memory: 900 02/08 19:50:59 - mmengine - INFO - Iter(test) [ 360/1669]    eta: 0:03:01  time: 0.1215  data_time: 0.0043  memory: 900 02/08 19:51:01 - mmengine - INFO - Iter(test) [ 380/1669]    eta: 0:02:57  time: 0.1210  data_time: 0.0047  memory: 900 02/08 19:51:04 - mmengine - INFO - Iter(test) [ 400/1669]    eta: 0:02:53  time: 0.1210  data_time: 0.0047  memory: 900 02/08 19:51:06 - mmengine - INFO - Iter(test) [ 420/1669]    eta: 0:02:50  time: 0.1254  data_time: 0.0056  memory: 900 02/08 19:51:09 - mmengine - INFO - Iter(test) [ 440/1669]    eta: 0:02:46  time: 0.1259  data_time: 0.0057  memory: 900 02/08 19:51:11 - mmengine - INFO - Iter(test) [ 460/1669]    eta: 0:02:43  time: 0.1271  data_time: 0.0058  memory: 900 02/08 19:51:14 - mmengine - INFO - Iter(test) [ 480/1669]    eta: 0:02:40  time: 0.1219  data_time: 0.0046  memory: 900 02/08 19:51:16 - mmengine - INFO - Iter(test) [ 500/1669]    eta: 0:02:36  time: 0.1207  data_time: 0.0042  memory: 900 02/08 19:51:19 - mmengine - INFO - Iter(test) [ 520/1669]    eta: 0:02:33  time: 0.1206  data_time: 0.0042  memory: 900 02/08 19:51:21 - mmengine - INFO - Iter(test) [ 540/1669]    eta: 0:02:30  time: 0.1219  data_time: 0.0043  memory: 900 02/08 19:51:23 - mmengine - INFO - Iter(test) [ 560/1669]    eta: 0:02:27  time: 0.1222  data_time: 0.0045  memory: 900 02/08 19:51:26 - mmengine - INFO - Iter(test) [ 580/1669]    eta: 0:02:24  time: 0.1210  data_time: 0.0045  memory: 900 02/08 19:51:28 - mmengine - INFO - Iter(test) [ 600/1669]    eta: 0:02:21  time: 0.1236  data_time: 0.0048  memory: 900 02/08 19:51:31 - mmengine - INFO - Iter(test) [ 620/1669]    eta: 0:02:18  time: 0.1217  data_time: 0.0047  memory: 900 02/08 19:51:33 - mmengine - INFO - Iter(test) [ 640/1669]    eta: 0:02:15  time: 0.1224  data_time: 0.0049  memory: 900 02/08 19:51:36 - mmengine - INFO - Iter(test) [ 660/1669]    eta: 0:02:12  time: 0.1203  data_time: 0.0045  memory: 900 02/08 19:51:38 - mmengine - INFO - Iter(test) [ 680/1669]    eta: 0:02:09  time: 0.1229  data_time: 0.0045  memory: 900 02/08 19:51:41 - mmengine - INFO - Iter(test) [ 700/1669]    eta: 0:02:06  time: 0.1239  data_time: 0.0047  memory: 900 02/08 19:51:43 - mmengine - INFO - Iter(test) [ 720/1669]    eta: 0:02:03  time: 0.1250  data_time: 0.0048  memory: 900 02/08 19:51:45 - mmengine - INFO - Iter(test) [ 740/1669]    eta: 0:02:01  time: 0.1221  data_time: 0.0046  memory: 900 02/08 19:51:48 - mmengine - INFO - Iter(test) [ 760/1669]    eta: 0:01:58  time: 0.1222  data_time: 0.0047  memory: 900 02/08 19:51:50 - mmengine - INFO - Iter(test) [ 780/1669]    eta: 0:01:55  time: 0.1230  data_time: 0.0046  memory: 900 02/08 19:51:53 - mmengine - INFO - Iter(test) [ 800/1669]    eta: 0:01:52  time: 0.1218  data_time: 0.0042  memory: 900 02/08 19:51:55 - mmengine - INFO - Iter(test) [ 820/1669]    eta: 0:01:49  time: 0.1229  data_time: 0.0045  memory: 900 02/08 19:51:58 - mmengine - INFO - Iter(test) [ 840/1669]    eta: 0:01:47  time: 0.1208  data_time: 0.0044  memory: 900 02/08 19:52:00 - mmengine - INFO - Iter(test) [ 860/1669]    eta: 0:01:44  time: 0.1217  data_time: 0.0044  memory: 900 02/08 19:52:03 - mmengine - INFO - Iter(test) [ 880/1669]    eta: 0:01:41  time: 0.1219  data_time: 0.0046  memory: 900 02/08 19:52:05 - mmengine - INFO - Iter(test) [ 900/1669]    eta: 0:01:39  time: 0.1215  data_time: 0.0044  memory: 900 02/08 19:52:08 - mmengine - INFO - Iter(test) [ 920/1669]    eta: 0:01:36  time: 0.1228  data_time: 0.0047  memory: 900 02/08 19:52:10 - mmengine - INFO - Iter(test) [ 940/1669]    eta: 0:01:33  time: 0.1251  data_time: 0.0046  memory: 900 02/08 19:52:12 - mmengine - INFO - Iter(test) [ 960/1669]    eta: 0:01:31  time: 0.1236  data_time: 0.0044  memory: 900 02/08 19:52:15 - mmengine - INFO - Iter(test) [ 980/1669]    eta: 0:01:28  time: 0.1218  data_time: 0.0042  memory: 900 02/08 19:52:17 - mmengine - INFO - Iter(test) [1000/1669]    eta: 0:01:25  time: 0.1221  data_time: 0.0041  memory: 900 02/08 19:52:20 - mmengine - INFO - Iter(test) [1020/1669]    eta: 0:01:23  time: 0.1225  data_time: 0.0047  memory: 900 02/08 19:52:22 - mmengine - INFO - Iter(test) [1040/1669]    eta: 0:01:20  time: 0.1243  data_time: 0.0048  memory: 900 02/08 19:52:25 - mmengine - INFO - Iter(test) [1060/1669]    eta: 0:01:17  time: 0.1244  data_time: 0.0047  memory: 900 02/08 19:52:27 - mmengine - INFO - Iter(test) [1080/1669]    eta: 0:01:15  time: 0.1227  data_time: 0.0045  memory: 900 02/08 19:52:30 - mmengine - INFO - Iter(test) [1100/1669]    eta: 0:01:12  time: 0.1232  data_time: 0.0045  memory: 900 02/08 19:52:32 - mmengine - INFO - Iter(test) [1120/1669]    eta: 0:01:10  time: 0.1211  data_time: 0.0046  memory: 900 02/08 19:52:35 - mmengine - INFO - Iter(test) [1140/1669]    eta: 0:01:07  time: 0.1223  data_time: 0.0046  memory: 900 02/08 19:52:37 - mmengine - INFO - Iter(test) [1160/1669]    eta: 0:01:04  time: 0.1195  data_time: 0.0040  memory: 900 02/08 19:52:39 - mmengine - INFO - Iter(test) [1180/1669]    eta: 0:01:02  time: 0.1204  data_time: 0.0046  memory: 900 02/08 19:52:42 - mmengine - INFO - Iter(test) [1200/1669]    eta: 0:00:59  time: 0.1240  data_time: 0.0054  memory: 900 02/08 19:52:44 - mmengine - INFO - Iter(test) [1220/1669]    eta: 0:00:57  time: 0.1228  data_time: 0.0050  memory: 900 02/08 19:52:47 - mmengine - INFO - Iter(test) [1240/1669]    eta: 0:00:54  time: 0.1240  data_time: 0.0048  memory: 900 02/08 19:52:49 - mmengine - INFO - Iter(test) [1260/1669]    eta: 0:00:52  time: 0.1256  data_time: 0.0044  memory: 900 02/08 19:52:52 - mmengine - INFO - Iter(test) [1280/1669]    eta: 0:00:49  time: 0.1260  data_time: 0.0046  memory: 900 02/08 19:52:54 - mmengine - INFO - Iter(test) [1300/1669]    eta: 0:00:46  time: 0.1255  data_time: 0.0044  memory: 900 02/08 19:52:57 - mmengine - INFO - Iter(test) [1320/1669]    eta: 0:00:44  time: 0.1257  data_time: 0.0046  memory: 900 02/08 19:52:59 - mmengine - INFO - Iter(test) [1340/1669]    eta: 0:00:41  time: 0.1252  data_time: 0.0048  memory: 900 02/08 19:53:02 - mmengine - INFO - Iter(test) [1360/1669]    eta: 0:00:39  time: 0.1267  data_time: 0.0052  memory: 900 02/08 19:53:04 - mmengine - INFO - Iter(test) [1380/1669]    eta: 0:00:36  time: 0.1246  data_time: 0.0057  memory: 900 02/08 19:53:07 - mmengine - INFO - Iter(test) [1400/1669]    eta: 0:00:34  time: 0.1237  data_time: 0.0059  memory: 900 02/08 19:53:09 - mmengine - INFO - Iter(test) [1420/1669]    eta: 0:00:31  time: 0.1231  data_time: 0.0054  memory: 900 02/08 19:53:12 - mmengine - INFO - Iter(test) [1440/1669]    eta: 0:00:29  time: 0.1227  data_time: 0.0047  memory: 900 02/08 19:53:14 - mmengine - INFO - Iter(test) [1460/1669]    eta: 0:00:26  time: 0.1250  data_time: 0.0047  memory: 900 02/08 19:53:17 - mmengine - INFO - Iter(test) [1480/1669]    eta: 0:00:23  time: 0.1243  data_time: 0.0042  memory: 900 02/08 19:53:19 - mmengine - INFO - Iter(test) [1500/1669]    eta: 0:00:21  time: 0.1248  data_time: 0.0045  memory: 900 02/08 19:53:22 - mmengine - INFO - Iter(test) [1520/1669]    eta: 0:00:18  time: 0.1257  data_time: 0.0047  memory: 900 02/08 19:53:24 - mmengine - INFO - Iter(test) [1540/1669]    eta: 0:00:16  time: 0.1240  data_time: 0.0049  memory: 900 02/08 19:53:27 - mmengine - INFO - Iter(test) [1560/1669]    eta: 0:00:13  time: 0.1253  data_time: 0.0054  memory: 900 02/08 19:53:29 - mmengine - INFO - Iter(test) [1580/1669]    eta: 0:00:11  time: 0.1247  data_time: 0.0056  memory: 900 02/08 19:53:32 - mmengine - INFO - Iter(test) [1600/1669]    eta: 0:00:08  time: 0.1255  data_time: 0.0050  memory: 900 02/08 19:53:34 - mmengine - INFO - Iter(test) [1620/1669]    eta: 0:00:06  time: 0.1267  data_time: 0.0048  memory: 900 02/08 19:53:37 - mmengine - INFO - Iter(test) [1640/1669]    eta: 0:00:03  time: 0.1260  data_time: 0.0043  memory: 900 02/08 19:53:39 - mmengine - INFO - Iter(test) [1660/1669]    eta: 0:00:01  time: 0.1246  data_time: 0.0046  memory: 900 02/08 19:53:40 - mmengine - INFO - ---------------iou_thr: 0.5--------------- 02/08 19:53:43 - mmengine - INFO - +-------------------------+------+------+--------+-------+ | class                   | gts  | dets | recall | ap    | +-------------------------+------+------+--------+-------+ | airplane                | 128  | 0    | 0.000  | 0.000 | | baseballfield           | 1400 | 0    | 0.000  | 0.000 | | bridge                  | 916  | 0    | 0.000  | 0.000 | | chimney                 | 13   | 0    | 0.000  | 0.000 | | dam                     | 11   | 0    | 0.000  | 0.000 | | Expressway-Service-area | 36   | 0    | 0.000  | 0.000 | | Expressway-toll-station | 80   | 0    | 0.000  | 0.000 | | golffield               | 136  | 0    | 0.000  | 0.000 | | harbor                  | 95   | 0    | 0.000  | 0.000 | | overpass                | 286  | 0    | 0.000  | 0.000 | | ship                    | 304  | 0    | 0.000  | 0.000 | | stadium                 | 331  | 0    | 0.000  | 0.000 | | storagetank             | 325  | 0    | 0.000  | 0.000 | | tenniscourt             | 2776 | 0    | 0.000  | 0.000 | | trainstation            | 42   | 0    | 0.000  | 0.000 | | vehicle                 | 3675 | 0    | 0.000  | 0.000 | | airport                 | 666  | 0    | 0.000  | 0.000 | | basketballcourt         | 2145 | 0    | 0.000  | 0.000 | | groundtrackfield        | 1882 | 0    | 0.000  | 0.000 | | windmill                | 2998 | 0    | 0.000  | 0.000 | +-------------------------+------+------+--------+-------+ | mAP                     |      |      |        | 0.000 | +-------------------------+------+------+--------+-------+ 02/08 19:53:43 - mmengine - INFO - Iter(test) [1669/1669]    pascal_voc/mAP: 0.0000  pascal_voc/AP50: 0.0000  data_time: 0.0049  time: 0.1266 Successfully save queue in work_dirs/visdrone_step2_castdet_12b_10k/0_save_queue_samples.npz What is the problem? Is it the problem when combining weights?My command to merge weights is python /data2/llj/Research-lw/CastDet-main/tools/merge_weights.py --clip_path /data2/llj/Research-lw/CastDet-main/RemoteCLIP-checkpoint/checkpoints/models--chendelong--RemoteCLIP/snapshots/bf1d8a3ccf2ddbf7c875705e46373bfe542bce38/RemoteCLIP-RN50.pt --base_path /home/llj/work_dirs/visdrone_step1_base/iter_80000.pth --save_path /home/llj/work_dirs/init_80k.pth --base_model soft-teacher The result isdict_keys(['student.backbone.conv1.weight', 'student.backbone.bn1.weight', 'student.backbone.bn1.bias', 'student.backbone.bn1.running_mean', 'student.backbone.bn1.running_var', 'student.backbone.bn1.num_batches_tracked', 'student.backbone.layer1.0.conv1.weight', 'student.backbone.layer1.0.bn1.weight', 'student.backbone.layer1.0.bn1.bias', 'student.backbone.layer1.0.bn1.running_mean', 'student.backbone.layer1.0.bn1.running_var', 'student.backbone.layer1.0.bn1.num_batches_tracked', 'student.backbone.layer1.0.conv2.weight', 'student.backbone.layer1.0.bn2.weight', 'student.backbone.layer1.0.bn2.bias', 'student.backbone.layer1.0.bn2.running_mean', 'student.backbone.layer1.0.bn2.running_var', 'student.backbone.layer1.0.bn2.num_batches_tracked', 'student.backbone.layer1.0.conv3.weight', 'student.backbone.layer1.0.bn3.weight', 'student.backbone.layer1.0.bn3.bias', 'student.backbone.layer1.0.bn3.running_mean', 'student.backbone.layer1.0.bn3.running_var', 'student.backbone.layer1.0.bn3.num_batches_tracked', 'student.backbone.layer1.0.downsample.0.weight', 'student.backbone.layer1.0.downsample.1.weight', 'student.backbone.layer1.0.downsample.1.bias', 'student.backbone.layer1.0.downsample.1.running_mean', 'student.backbone.layer1.0.downsample.1.running_var', 'student.backbone.layer1.0.downsample.1.num_batches_tracked', 'student.backbone.layer1.1.conv1.weight', 'student.backbone.layer1.1.bn1.weight', 'student.backbone.layer1.1.bn1.bias', 'student.backbone.layer1.1.bn1.running_mean', 'student.backbone.layer1.1.bn1.running_var', 'student.backbone.layer1.1.bn1.num_batches_tracked', 'student.backbone.layer1.1.conv2.weight', 'student.backbone.layer1.1.bn2.weight', 'student.backbone.layer1.1.bn2.bias', 'student.backbone.layer1.1.bn2.running_mean', 'student.backbone.layer1.1.bn2.running_var', 'student.backbone.layer1.1.bn2.num_batches_tracked', 'student.backbone.layer1.1.conv3.weight', 'student.backbone.layer1.1.bn3.weight', 'student.backbone.layer1.1.bn3.bias', 'student.backbone.layer1.1.bn3.running_mean', 'student.backbone.layer1.1.bn3.running_var', 'student.backbone.layer1.1.bn3.num_batches_tracked', 'student.backbone.layer1.2.conv1.weight', 'student.backbone.layer1.2.bn1.weight', 'student.backbone.layer1.2.bn1.bias', 'student.backbone.layer1.2.bn1.running_mean', 'student.backbone.layer1.2.bn1.running_var', 'student.backbone.layer1.2.bn1.num_batches_tracked', 'student.backbone.layer1.2.conv2.weight', 'student.backbone.layer1.2.bn2.weight', 'student.backbone.layer1.2.bn2.bias', 'student.backbone.layer1.2.bn2.running_mean', 'student.backbone.layer1.2.bn2.running_var', 'student.backbone.layer1.2.bn2.num_batches_tracked', 'student.backbone.layer1.2.conv3.weight', 'student.backbone.layer1.2.bn3.weight', 'student.backbone.layer1.2.bn3.bias', 'student.backbone.layer1.2.bn3.running_mean', 'student.backbone.layer1.2.bn3.running_var', 'student.backbone.layer1.2.bn3.num_batches_tracked', 'student.backbone.layer2.0.conv1.weight', 'student.backbone.layer2.0.bn1.weight', 'student.backbone.layer2.0.bn1.bias', 'student.backbone.layer2.0.bn1.running_mean', 'student.backbone.layer2.0.bn1.running_var', 'student.backbone.layer2.0.bn1.num_batches_tracked', 'student.backbone.layer2.0.conv2.weight', 'student.backbone.layer2.0.bn2.weight', 'student.backbone.layer2.0.bn2.bias', 'student.backbone.layer2.0.bn2.running_mean', 'student.backbone.layer2.0.bn2.running_var', 'student.backbone.layer2.0.bn2.num_batches_tracked', 'student.backbone.layer2.0.conv3.weight', 'student.backbone.layer2.0.bn3.weight', 'student.backbone.layer2.0.bn3.bias', 'student.backbone.layer2.0.bn3.running_mean', 'student.backbone.layer2.0.bn3.running_var', 'student.backbone.layer2.0.bn3.num_batches_tracked', 'student.backbone.layer2.0.downsample.0.weight', 'student.backbone.layer2.0.downsample.1.weight', 'student.backbone.layer2.0.downsample.1.bias', 'student.backbone.layer2.0.downsample.1.running_mean', 'student.backbone.layer2.0.downsample.1.running_var', 'student.backbone.layer2.0.downsample.1.num_batches_tracked', 'student.backbone.layer2.1.conv1.weight', 'student.backbone.layer2.1.bn1.weight', 'student.backbone.layer2.1.bn1.bias', 'student.backbone.layer2.1.bn1.running_mean', 'student.backbone.layer2.1.bn1.running_var', 'student.backbone.layer2.1.bn1.num_batches_tracked', 'student.backbone.layer2.1.conv2.weight', 'student.backbone.layer2.1.bn2.weight', 'student.backbone.layer2.1.bn2.bias', 'student.backbone.layer2.1.bn2.running_mean', 'student.backbone.layer2.1.bn2.running_var', 'student.backbone.layer2.1.bn2.num_batches_tracked', 'student.backbone.layer2.1.conv3.weight', 'student.backbone.layer2.1.bn3.weight', 'student.backbone.layer2.1.bn3.bias', 'student.backbone.layer2.1.bn3.running_mean', 'student.backbone.layer2.1.bn3.running_var', 'student.backbone.layer2.1.bn3.num_batches_tracked', 'student.backbone.layer2.2.conv1.weight', 'student.backbone.layer2.2.bn1.weight', 'student.backbone.layer2.2.bn1.bias', 'student.backbone.layer2.2.bn1.running_mean', 'student.backbone.layer2.2.bn1.running_var', 'student.backbone.layer2.2.bn1.num_batches_tracked', 'student.backbone.layer2.2.conv2.weight', 'student.backbone.layer2.2.bn2.weight', 'student.backbone.layer2.2.bn2.bias', 'student.backbone.layer2.2.bn2.running_mean', 'student.backbone.layer2.2.bn2.running_var', 'student.backbone.layer2.2.bn2.num_batches_tracked', 'student.backbone.layer2.2.conv3.weight', 'student.backbone.layer2.2.bn3.weight', 'student.backbone.layer2.2.bn3.bias', 'student.backbone.layer2.2.bn3.running_mean', 'student.backbone.layer2.2.bn3.running_var', 'student.backbone.layer2.2.bn3.num_batches_tracked', 'student.backbone.layer2.3.conv1.weight', 'student.backbone.layer2.3.bn1.weight', 'student.backbone.layer2.3.bn1.bias', 'student.backbone.layer2.3.bn1.running_mean', 'student.backbone.layer2.3.bn1.running_var', 'student.backbone.layer2.3.bn1.num_batches_tracked', 'student.backbone.layer2.3.conv2.weight', 'student.backbone.layer2.3.bn2.weight', 'student.backbone.layer2.3.bn2.bias', 'student.backbone.layer2.3.bn2.running_mean', 'student.backbone.layer2.3.bn2.running_var', 'student.backbone.layer2.3.bn2.num_batches_tracked', 'student.backbone.layer2.3.conv3.weight', 'student.backbone.layer2.3.bn3.weight', 'student.backbone.layer2.3.bn3.bias', 'student.backbone.layer2.3.bn3.running_mean', 'student.backbone.layer2.3.bn3.running_var', 'student.backbone.layer2.3.bn3.num_batches_tracked', 'student.backbone.layer3.0.conv1.weight', 'student.backbone.layer3.0.bn1.weight', 'student.backbone.layer3.0.bn1.bias', 'student.backbone.layer3.0.bn1.running_mean', 'student.backbone.layer3.0.bn1.running_var', 'student.backbone.layer3.0.bn1.num_batches_tracked', 'student.backbone.layer3.0.conv2.weight', 'student.backbone.layer3.0.bn2.weight', 'student.backbone.layer3.0.bn2.bias', 'student.backbone.layer3.0.bn2.running_mean', 'student.backbone.layer3.0.bn2.running_var', 'student.backbone.layer3.0.bn2.num_batches_tracked', 'student.backbone.layer3.0.conv3.weight', 'student.backbone.layer3.0.bn3.weight', 'student.backbone.layer3.0.bn3.bias', 'student.backbone.layer3.0.bn3.running_mean', 'student.backbone.layer3.0.bn3.running_var', 'student.backbone.layer3.0.bn3.num_batches_tracked', 'student.backbone.layer3.0.downsample.0.weight', 'student.backbone.layer3.0.downsample.1.weight', 'student.backbone.layer3.0.downsample.1.bias', 'student.backbone.layer3.0.downsample.1.running_mean', 'student.backbone.layer3.0.downsample.1.running_var', 'student.backbone.layer3.0.downsample.1.num_batches_tracked', 'student.backbone.layer3.1.conv1.weight', 'student.backbone.layer3.1.bn1.weight', 'student.backbone.layer3.1.bn1.bias', 'student.backbone.layer3.1.bn1.running_mean', 'student.backbone.layer3.1.bn1.running_var', 'student.backbone.layer3.1.bn1.num_batches_tracked', 'student.backbone.layer3.1.conv2.weight', 'student.backbone.layer3.1.bn2.weight', 'student.backbone.layer3.1.bn2.bias', 'student.backbone.layer3.1.bn2.running_mean', 'student.backbone.layer3.1.bn2.running_var', 'student.backbone.layer3.1.bn2.num_batches_tracked', 'student.backbone.layer3.1.conv3.weight', 'student.backbone.layer3.1.bn3.weight', 'student.backbone.layer3.1.bn3.bias', 'student.backbone.layer3.1.bn3.running_mean', 'student.backbone.layer3.1.bn3.running_var', 'student.backbone.layer3.1.bn3.num_batches_tracked', 'student.backbone.layer3.2.conv1.weight', 'student.backbone.layer3.2.bn1.weight', 'student.backbone.layer3.2.bn1.bias', 'student.backbone.layer3.2.bn1.running_mean', 'student.backbone.layer3.2.bn1.running_var', 'student.backbone.layer3.2.bn1.num_batches_tracked', 'student.backbone.layer3.2.conv2.weight', 'student.backbone.layer3.2.bn2.weight', 'student.backbone.layer3.2.bn2.bias', 'student.backbone.layer3.2.bn2.running_mean', 'student.backbone.layer3.2.bn2.running_var', 'student.backbone.layer3.2.bn2.num_batches_tracked', 'student.backbone.layer3.2.conv3.weight', 'student.backbone.layer3.2.bn3.weight', 'student.backbone.layer3.2.bn3.bias', 'student.backbone.layer3.2.bn3.running_mean', 'student.backbone.layer3.2.bn3.running_var', 'student.backbone.layer3.2.bn3.num_batches_tracked', 'student.backbone.layer3.3.conv1.weight', 'student.backbone.layer3.3.bn1.weight', 'student.backbone.layer3.3.bn1.bias', 'student.backbone.layer3.3.bn1.running_mean', 'student.backbone.layer3.3.bn1.running_var', 'student.backbone.layer3.3.bn1.num_batches_tracked', 'student.backbone.layer3.3.conv2.weight', 'student.backbone.layer3.3.bn2.weight', 'student.backbone.layer3.3.bn2.bias', 'student.backbone.layer3.3.bn2.running_mean', 'student.backbone.layer3.3.bn2.running_var', 'student.backbone.layer3.3.bn2.num_batches_tracked', 'student.backbone.layer3.3.conv3.weight', 'student.backbone.layer3.3.bn3.weight', 'student.backbone.layer3.3.bn3.bias', 'student.backbone.layer3.3.bn3.running_mean', 'student.backbone.layer3.3.bn3.running_var', 'student.backbone.layer3.3.bn3.num_batches_tracked', 'student.backbone.layer3.4.conv1.weight', 'student.backbone.layer3.4.bn1.weight', 'student.backbone.layer3.4.bn1.bias', 'student.backbone.layer3.4.bn1.running_mean', 'student.backbone.layer3.4.bn1.running_var', 'student.backbone.layer3.4.bn1.num_batches_tracked', 'student.backbone.layer3.4.conv2.weight', 'student.backbone.layer3.4.bn2.weight', 'student.backbone.layer3.4.bn2.bias', 'student.backbone.layer3.4.bn2.running_mean', 'student.backbone.layer3.4.bn2.running_var', 'student.backbone.layer3.4.bn2.num_batches_tracked', 'student.backbone.layer3.4.conv3.weight', 'student.backbone.layer3.4.bn3.weight', 'student.backbone.layer3.4.bn3.bias', 'student.backbone.layer3.4.bn3.running_mean', 'student.backbone.layer3.4.bn3.running_var', 'student.backbone.layer3.4.bn3.num_batches_tracked', 'student.backbone.layer3.5.conv1.weight', 'student.backbone.layer3.5.bn1.weight', 'student.backbone.layer3.5.bn1.bias', 'student.backbone.layer3.5.bn1.running_mean', 'student.backbone.layer3.5.bn1.running_var', 'student.backbone.layer3.5.bn1.num_batches_tracked', 'student.backbone.layer3.5.conv2.weight', 'student.backbone.layer3.5.bn2.weight', 'student.backbone.layer3.5.bn2.bias', 'student.backbone.layer3.5.bn2.running_mean', 'student.backbone.layer3.5.bn2.running_var', 'student.backbone.layer3.5.bn2.num_batches_tracked', 'student.backbone.layer3.5.conv3.weight', 'student.backbone.layer3.5.bn3.weight', 'student.backbone.layer3.5.bn3.bias', 'student.backbone.layer3.5.bn3.running_mean', 'student.backbone.layer3.5.bn3.running_var', 'student.backbone.layer3.5.bn3.num_batches_tracked', 'student.backbone.layer4.0.conv1.weight', 'student.backbone.layer4.0.bn1.weight', 'student.backbone.layer4.0.bn1.bias', 'student.backbone.layer4.0.bn1.running_mean', 'student.backbone.layer4.0.bn1.running_var', 'student.backbone.layer4.0.bn1.num_batches_tracked', 'student.backbone.layer4.0.conv2.weight', 'student.backbone.layer4.0.bn2.weight', 'student.backbone.layer4.0.bn2.bias', 'student.backbone.layer4.0.bn2.running_mean', 'student.backbone.layer4.0.bn2.running_var', 'student.backbone.layer4.0.bn2.num_batches_tracked', 'student.backbone.layer4.0.conv3.weight', 'student.backbone.layer4.0.bn3.weight', 'student.backbone.layer4.0.bn3.bias', 'student.backbone.layer4.0.bn3.running_mean', 'student.backbone.layer4.0.bn3.running_var', 'student.backbone.layer4.0.bn3.num_batches_tracked', 'student.backbone.layer4.0.downsample.0.weight', 'student.backbone.layer4.0.downsample.1.weight', 'student.backbone.layer4.0.downsample.1.bias', 'student.backbone.layer4.0.downsample.1.running_mean', 'student.backbone.layer4.0.downsample.1.running_var', 'student.backbone.layer4.0.downsample.1.num_batches_tracked', 'student.backbone.layer4.1.conv1.weight', 'student.backbone.layer4.1.bn1.weight', 'student.backbone.layer4.1.bn1.bias', 'student.backbone.layer4.1.bn1.running_mean', 'student.backbone.layer4.1.bn1.running_var', 'student.backbone.layer4.1.bn1.num_batches_tracked', 'student.backbone.layer4.1.conv2.weight', 'student.backbone.layer4.1.bn2.weight', 'student.backbone.layer4.1.bn2.bias', 'student.backbone.layer4.1.bn2.running_mean', 'student.backbone.layer4.1.bn2.running_var', 'student.backbone.layer4.1.bn2.num_batches_tracked', 'student.backbone.layer4.1.conv3.weight', 'student.backbone.layer4.1.bn3.weight', 'student.backbone.layer4.1.bn3.bias', 'student.backbone.layer4.1.bn3.running_mean', 'student.backbone.layer4.1.bn3.running_var', 'student.backbone.layer4.1.bn3.num_batches_tracked', 'student.backbone.layer4.2.conv1.weight', 'student.backbone.layer4.2.bn1.weight', 'student.backbone.layer4.2.bn1.bias', 'student.backbone.layer4.2.bn1.running_mean', 'student.backbone.layer4.2.bn1.running_var', 'student.backbone.layer4.2.bn1.num_batches_tracked', 'student.backbone.layer4.2.conv2.weight', 'student.backbone.layer4.2.bn2.weight', 'student.backbone.layer4.2.bn2.bias', 'student.backbone.layer4.2.bn2.running_mean', 'student.backbone.layer4.2.bn2.running_var', 'student.backbone.layer4.2.bn2.num_batches_tracked', 'student.backbone.layer4.2.conv3.weight', 'student.backbone.layer4.2.bn3.weight', 'student.backbone.layer4.2.bn3.bias', 'student.backbone.layer4.2.bn3.running_mean', 'student.backbone.layer4.2.bn3.running_var', 'student.backbone.layer4.2.bn3.num_batches_tracked', 'student.neck.lateral_convs.0.conv.weight', 'student.neck.lateral_convs.0.conv.bias', 'student.neck.lateral_convs.1.conv.weight', 'student.neck.lateral_convs.1.conv.bias', 'student.neck.lateral_convs.2.conv.weight', 'student.neck.lateral_convs.2.conv.bias', 'student.neck.lateral_convs.3.conv.weight', 'student.neck.lateral_convs.3.conv.bias', 'student.neck.fpn_convs.0.conv.weight', 'student.neck.fpn_convs.0.conv.bias', 'student.neck.fpn_convs.1.conv.weight', 'student.neck.fpn_convs.1.conv.bias', 'student.neck.fpn_convs.2.conv.weight', 'student.neck.fpn_convs.2.conv.bias', 'student.neck.fpn_convs.3.conv.weight', 'student.neck.fpn_convs.3.conv.bias', 'student.rpn_head.rpn_conv.weight', 'student.rpn_head.rpn_conv.bias', 'student.rpn_head.rpn_cls.weight', 'student.rpn_head.rpn_cls.bias', 'student.rpn_head.rpn_reg.weight', 'student.rpn_head.rpn_reg.bias', 'student.roi_head.bbox_head.fc_cls.weight', 'student.roi_head.bbox_head.fc_cls.bias', 'student.roi_head.bbox_head.fc_reg.weight', 'student.roi_head.bbox_head.fc_reg.bias', 'student.roi_head.bbox_head.shared_fcs.0.weight', 'student.roi_head.bbox_head.shared_fcs.0.bias', 'student.roi_head.bbox_head.shared_fcs.1.weight', 'student.roi_head.bbox_head.shared_fcs.1.bias', 'teacher.backbone.conv1.weight', 'teacher.backbone.bn1.weight', 'teacher.backbone.bn1.bias', 'teacher.backbone.bn1.running_mean', 'teacher.backbone.bn1.running_var', 'teacher.backbone.bn1.num_batches_tracked', 'teacher.backbone.layer1.0.conv1.weight', 'teacher.backbone.layer1.0.bn1.weight', 'teacher.backbone.layer1.0.bn1.bias', 'teacher.backbone.layer1.0.bn1.running_mean', 'teacher.backbone.layer1.0.bn1.running_var', 'teacher.backbone.layer1.0.bn1.num_batches_tracked', 'teacher.backbone.layer1.0.conv2.weight', 'teacher.backbone.layer1.0.bn2.weight', 'teacher.backbone.layer1.0.bn2.bias', 'teacher.backbone.layer1.0.bn2.running_mean', 'teacher.backbone.layer1.0.bn2.running_var', 'teacher.backbone.layer1.0.bn2.num_batches_tracked', 'teacher.backbone.layer1.0.conv3.weight', 'teacher.backbone.layer1.0.bn3.weight', 'teacher.backbone.layer1.0.bn3.bias', 'teacher.backbone.layer1.0.bn3.running_mean', 'teacher.backbone.layer1.0.bn3.running_var', 'teacher.backbone.layer1.0.bn3.num_batches_tracked', 'teacher.backbone.layer1.0.downsample.0.weight', 'teacher.backbone.layer1.0.downsample.1.weight', 'teacher.backbone.layer1.0.downsample.1.bias', 'teacher.backbone.layer1.0.downsample.1.running_mean', 'teacher.backbone.layer1.0.downsample.1.running_var', 'teacher.backbone.layer1.0.downsample.1.num_batches_tracked', 'teacher.backbone.layer1.1.conv1.weight', 'teacher.backbone.layer1.1.bn1.weight', 'teacher.backbone.layer1.1.bn1.bias', 'teacher.backbone.layer1.1.bn1.running_mean', 'teacher.backbone.layer1.1.bn1.running_var', 'teacher.backbone.layer1.1.bn1.num_batches_tracked', 'teacher.backbone.layer1.1.conv2.weight', 'teacher.backbone.layer1.1.bn2.weight', 'teacher.backbone.layer1.1.bn2.bias', 'teacher.backbone.layer1.1.bn2.running_mean', 'teacher.backbone.layer1.1.bn2.running_var', 'teacher.backbone.layer1.1.bn2.num_batches_tracked', 'teacher.backbone.layer1.1.conv3.weight', 'teacher.backbone.layer1.1.bn3.weight', 'teacher.backbone.layer1.1.bn3.bias', 'teacher.backbone.layer1.1.bn3.running_mean', 'teacher.backbone.layer1.1.bn3.running_var', 'teacher.backbone.layer1.1.bn3.num_batches_tracked', 'teacher.backbone.layer1.2.conv1.weight', 'teacher.backbone.layer1.2.bn1.weight', 'teacher.backbone.layer1.2.bn1.bias', 'teacher.backbone.layer1.2.bn1.running_mean', 'teacher.backbone.layer1.2.bn1.running_var', 'teacher.backbone.layer1.2.bn1.num_batches_tracked', 'teacher.backbone.layer1.2.conv2.weight', 'teacher.backbone.layer1.2.bn2.weight', 'teacher.backbone.layer1.2.bn2.bias', 'teacher.backbone.layer1.2.bn2.running_mean', 'teacher.backbone.layer1.2.bn2.running_var', 'teacher.backbone.layer1.2.bn2.num_batches_tracked', 'teacher.backbone.layer1.2.conv3.weight', 'teacher.backbone.layer1.2.bn3.weight', 'teacher.backbone.layer1.2.bn3.bias', 'teacher.backbone.layer1.2.bn3.running_mean', 'teacher.backbone.layer1.2.bn3.running_var', 'teacher.backbone.layer1.2.bn3.num_batches_tracked', 'teacher.backbone.layer2.0.conv1.weight', 'teacher.backbone.layer2.0.bn1.weight', 'teacher.backbone.layer2.0.bn1.bias', 'teacher.backbone.layer2.0.bn1.running_mean', 'teacher.backbone.layer2.0.bn1.running_var', 'teacher.backbone.layer2.0.bn1.num_batches_tracked', 'teacher.backbone.layer2.0.conv2.weight', 'teacher.backbone.layer2.0.bn2.weight', 'teacher.backbone.layer2.0.bn2.bias', 'teacher.backbone.layer2.0.bn2.running_mean', 'teacher.backbone.layer2.0.bn2.running_var', 'teacher.backbone.layer2.0.bn2.num_batches_tracked', 'teacher.backbone.layer2.0.conv3.weight', 'teacher.backbone.layer2.0.bn3.weight', 'teacher.backbone.layer2.0.bn3.bias', 'teacher.backbone.layer2.0.bn3.running_mean', 'teacher.backbone.layer2.0.bn3.running_var', 'teacher.backbone.layer2.0.bn3.num_batches_tracked', 'teacher.backbone.layer2.0.downsample.0.weight', 'teacher.backbone.layer2.0.downsample.1.weight', 'teacher.backbone.layer2.0.downsample.1.bias', 'teacher.backbone.layer2.0.downsample.1.running_mean', 'teacher.backbone.layer2.0.downsample.1.running_var', 'teacher.backbone.layer2.0.downsample.1.num_batches_tracked', 'teacher.backbone.layer2.1.conv1.weight', 'teacher.backbone.layer2.1.bn1.weight', 'teacher.backbone.layer2.1.bn1.bias', 'teacher.backbone.layer2.1.bn1.running_mean', 'teacher.backbone.layer2.1.bn1.running_var', 'teacher.backbone.layer2.1.bn1.num_batches_tracked', 'teacher.backbone.layer2.1.conv2.weight', 'teacher.backbone.layer2.1.bn2.weight', 'teacher.backbone.layer2.1.bn2.bias', 'teacher.backbone.layer2.1.bn2.running_mean', 'teacher.backbone.layer2.1.bn2.running_var', 'teacher.backbone.layer2.1.bn2.num_batches_tracked', 'teacher.backbone.layer2.1.conv3.weight', 'teacher.backbone.layer2.1.bn3.weight', 'teacher.backbone.layer2.1.bn3.bias', 'teacher.backbone.layer2.1.bn3.running_mean', 'teacher.backbone.layer2.1.bn3.running_var', 'teacher.backbone.layer2.1.bn3.num_batches_tracked', 'teacher.backbone.layer2.2.conv1.weight', 'teacher.backbone.layer2.2.bn1.weight', 'teacher.backbone.layer2.2.bn1.bias', 'teacher.backbone.layer2.2.bn1.running_mean', 'teacher.backbone.layer2.2.bn1.running_var', 'teacher.backbone.layer2.2.bn1.num_batches_tracked', 'teacher.backbone.layer2.2.conv2.weight', 'teacher.backbone.layer2.2.bn2.weight', 'teacher.backbone.layer2.2.bn2.bias', 'teacher.backbone.layer2.2.bn2.running_mean', 'teacher.backbone.layer2.2.bn2.running_var', 'teacher.backbone.layer2.2.bn2.num_batches_tracked', 'teacher.backbone.layer2.2.conv3.weight', 'teacher.backbone.layer2.2.bn3.weight', 'teacher.backbone.layer2.2.bn3.bias', 'teacher.backbone.layer2.2.bn3.running_mean', 'teacher.backbone.layer2.2.bn3.running_var', 'teacher.backbone.layer2.2.bn3.num_batches_tracked', 'teacher.backbone.layer2.3.conv1.weight', 'teacher.backbone.layer2.3.bn1.weight', 'teacher.backbone.layer2.3.bn1.bias', 'teacher.backbone.layer2.3.bn1.running_mean', 'teacher.backbone.layer2.3.bn1.running_var', 'teacher.backbone.layer2.3.bn1.num_batches_tracked', 'teacher.backbone.layer2.3.conv2.weight', 'teacher.backbone.layer2.3.bn2.weight', 'teacher.backbone.layer2.3.bn2.bias', 'teacher.backbone.layer2.3.bn2.running_mean', 'teacher.backbone.layer2.3.bn2.running_var', 'teacher.backbone.layer2.3.bn2.num_batches_tracked', 'teacher.backbone.layer2.3.conv3.weight', 'teacher.backbone.layer2.3.bn3.weight', 'teacher.backbone.layer2.3.bn3.bias', 'teacher.backbone.layer2.3.bn3.running_mean', 'teacher.backbone.layer2.3.bn3.running_var', 'teacher.backbone.layer2.3.bn3.num_batches_tracked', 'teacher.backbone.layer3.0.conv1.weight', 'teacher.backbone.layer3.0.bn1.weight', 'teacher.backbone.layer3.0.bn1.bias', 'teacher.backbone.layer3.0.bn1.running_mean', 'teacher.backbone.layer3.0.bn1.running_var', 'teacher.backbone.layer3.0.bn1.num_batches_tracked', 'teacher.backbone.layer3.0.conv2.weight', 'teacher.backbone.layer3.0.bn2.weight', 'teacher.backbone.layer3.0.bn2.bias', 'teacher.backbone.layer3.0.bn2.running_mean', 'teacher.backbone.layer3.0.bn2.running_var', 'teacher.backbone.layer3.0.bn2.num_batches_tracked', 'teacher.backbone.layer3.0.conv3.weight', 'teacher.backbone.layer3.0.bn3.weight', 'teacher.backbone.layer3.0.bn3.bias', 'teacher.backbone.layer3.0.bn3.running_mean', 'teacher.backbone.layer3.0.bn3.running_var', 'teacher.backbone.layer3.0.bn3.num_batches_tracked', 'teacher.backbone.layer3.0.downsample.0.weight', 'teacher.backbone.layer3.0.downsample.1.weight', 'teacher.backbone.layer3.0.downsample.1.bias', 'teacher.backbone.layer3.0.downsample.1.running_mean', 'teacher.backbone.layer3.0.downsample.1.running_var', 'teacher.backbone.layer3.0.downsample.1.num_batches_tracked', 'teacher.backbone.layer3.1.conv1.weight', 'teacher.backbone.layer3.1.bn1.weight', 'teacher.backbone.layer3.1.bn1.bias', 'teacher.backbone.layer3.1.bn1.running_mean', 'teacher.backbone.layer3.1.bn1.running_var', 'teacher.backbone.layer3.1.bn1.num_batches_tracked', 'teacher.backbone.layer3.1.conv2.weight', 'teacher.backbone.layer3.1.bn2.weight', 'teacher.backbone.layer3.1.bn2.bias', 'teacher.backbone.layer3.1.bn2.running_mean', 'teacher.backbone.layer3.1.bn2.running_var', 'teacher.backbone.layer3.1.bn2.num_batches_tracked', 'teacher.backbone.layer3.1.conv3.weight', 'teacher.backbone.layer3.1.bn3.weight', 'teacher.backbone.layer3.1.bn3.bias', 'teacher.backbone.layer3.1.bn3.running_mean', 'teacher.backbone.layer3.1.bn3.running_var', 'teacher.backbone.layer3.1.bn3.num_batches_tracked', 'teacher.backbone.layer3.2.conv1.weight', 'teacher.backbone.layer3.2.bn1.weight', 'teacher.backbone.layer3.2.bn1.bias', 'teacher.backbone.layer3.2.bn1.running_mean', 'teacher.backbone.layer3.2.bn1.running_var', 'teacher.backbone.layer3.2.bn1.num_batches_tracked', 'teacher.backbone.layer3.2.conv2.weight', 'teacher.backbone.layer3.2.bn2.weight', 'teacher.backbone.layer3.2.bn2.bias', 'teacher.backbone.layer3.2.bn2.running_mean', 'teacher.backbone.layer3.2.bn2.running_var', 'teacher.backbone.layer3.2.bn2.num_batches_tracked', 'teacher.backbone.layer3.2.conv3.weight', 'teacher.backbone.layer3.2.bn3.weight', 'teacher.backbone.layer3.2.bn3.bias', 'teacher.backbone.layer3.2.bn3.running_mean', 'teacher.backbone.layer3.2.bn3.running_var', 'teacher.backbone.layer3.2.bn3.num_batches_tracked', 'teacher.backbone.layer3.3.conv1.weight', 'teacher.backbone.layer3.3.bn1.weight', 'teacher.backbone.layer3.3.bn1.bias', 'teacher.backbone.layer3.3.bn1.running_mean', 'teacher.backbone.layer3.3.bn1.running_var', 'teacher.backbone.layer3.3.bn1.num_batches_tracked', 'teacher.backbone.layer3.3.conv2.weight', 'teacher.backbone.layer3.3.bn2.weight', 'teacher.backbone.layer3.3.bn2.bias', 'teacher.backbone.layer3.3.bn2.running_mean', 'teacher.backbone.layer3.3.bn2.running_var', 'teacher.backbone.layer3.3.bn2.num_batches_tracked', 'teacher.backbone.layer3.3.conv3.weight', 'teacher.backbone.layer3.3.bn3.weight', 'teacher.backbone.layer3.3.bn3.bias', 'teacher.backbone.layer3.3.bn3.running_mean', 'teacher.backbone.layer3.3.bn3.running_var', 'teacher.backbone.layer3.3.bn3.num_batches_tracked', 'teacher.backbone.layer3.4.conv1.weight', 'teacher.backbone.layer3.4.bn1.weight', 'teacher.backbone.layer3.4.bn1.bias', 'teacher.backbone.layer3.4.bn1.running_mean', 'teacher.backbone.layer3.4.bn1.running_var', 'teacher.backbone.layer3.4.bn1.num_batches_tracked', 'teacher.backbone.layer3.4.conv2.weight', 'teacher.backbone.layer3.4.bn2.weight', 'teacher.backbone.layer3.4.bn2.bias', 'teacher.backbone.layer3.4.bn2.running_mean', 'teacher.backbone.layer3.4.bn2.running_var', 'teacher.backbone.layer3.4.bn2.num_batches_tracked', 'teacher.backbone.layer3.4.conv3.weight', 'teacher.backbone.layer3.4.bn3.weight', 'teacher.backbone.layer3.4.bn3.bias', 'teacher.backbone.layer3.4.bn3.running_mean', 'teacher.backbone.layer3.4.bn3.running_var', 'teacher.backbone.layer3.4.bn3.num_batches_tracked', 'teacher.backbone.layer3.5.conv1.weight', 'teacher.backbone.layer3.5.bn1.weight', 'teacher.backbone.layer3.5.bn1.bias', 'teacher.backbone.layer3.5.bn1.running_mean', 'teacher.backbone.layer3.5.bn1.running_var', 'teacher.backbone.layer3.5.bn1.num_batches_tracked', 'teacher.backbone.layer3.5.conv2.weight', 'teacher.backbone.layer3.5.bn2.weight', 'teacher.backbone.layer3.5.bn2.bias', 'teacher.backbone.layer3.5.bn2.running_mean', 'teacher.backbone.layer3.5.bn2.running_var', 'teacher.backbone.layer3.5.bn2.num_batches_tracked', 'teacher.backbone.layer3.5.conv3.weight', 'teacher.backbone.layer3.5.bn3.weight', 'teacher.backbone.layer3.5.bn3.bias', 'teacher.backbone.layer3.5.bn3.running_mean', 'teacher.backbone.layer3.5.bn3.running_var', 'teacher.backbone.layer3.5.bn3.num_batches_tracked', 'teacher.backbone.layer4.0.conv1.weight', 'teacher.backbone.layer4.0.bn1.weight', 'teacher.backbone.layer4.0.bn1.bias', 'teacher.backbone.layer4.0.bn1.running_mean', 'teacher.backbone.layer4.0.bn1.running_var', 'teacher.backbone.layer4.0.bn1.num_batches_tracked', 'teacher.backbone.layer4.0.conv2.weight', 'teacher.backbone.layer4.0.bn2.weight', 'teacher.backbone.layer4.0.bn2.bias', 'teacher.backbone.layer4.0.bn2.running_mean', 'teacher.backbone.layer4.0.bn2.running_var', 'teacher.backbone.layer4.0.bn2.num_batches_tracked', 'teacher.backbone.layer4.0.conv3.weight', 'teacher.backbone.layer4.0.bn3.weight', 'teacher.backbone.layer4.0.bn3.bias', 'teacher.backbone.layer4.0.bn3.running_mean', 'teacher.backbone.layer4.0.bn3.running_var', 'teacher.backbone.layer4.0.bn3.num_batches_tracked', 'teacher.backbone.layer4.0.downsample.0.weight', 'teacher.backbone.layer4.0.downsample.1.weight', 'teacher.backbone.layer4.0.downsample.1.bias', 'teacher.backbone.layer4.0.downsample.1.running_mean', 'teacher.backbone.layer4.0.downsample.1.running_var', 'teacher.backbone.layer4.0.downsample.1.num_batches_tracked', 'teacher.backbone.layer4.1.conv1.weight', 'teacher.backbone.layer4.1.bn1.weight', 'teacher.backbone.layer4.1.bn1.bias', 'teacher.backbone.layer4.1.bn1.running_mean', 'teacher.backbone.layer4.1.bn1.running_var', 'teacher.backbone.layer4.1.bn1.num_batches_tracked', 'teacher.backbone.layer4.1.conv2.weight', 'teacher.backbone.layer4.1.bn2.weight', 'teacher.backbone.layer4.1.bn2.bias', 'teacher.backbone.layer4.1.bn2.running_mean', 'teacher.backbone.layer4.1.bn2.running_var', 'teacher.backbone.layer4.1.bn2.num_batches_tracked', 'teacher.backbone.layer4.1.conv3.weight', 'teacher.backbone.layer4.1.bn3.weight', 'teacher.backbone.layer4.1.bn3.bias', 'teacher.backbone.layer4.1.bn3.running_mean', 'teacher.backbone.layer4.1.bn3.running_var', 'teacher.backbone.layer4.1.bn3.num_batches_tracked', 'teacher.backbone.layer4.2.conv1.weight', 'teacher.backbone.layer4.2.bn1.weight', 'teacher.backbone.layer4.2.bn1.bias', 'teacher.backbone.layer4.2.bn1.running_mean', 'teacher.backbone.layer4.2.bn1.running_var', 'teacher.backbone.layer4.2.bn1.num_batches_tracked', 'teacher.backbone.layer4.2.conv2.weight', 'teacher.backbone.layer4.2.bn2.weight', 'teacher.backbone.layer4.2.bn2.bias', 'teacher.backbone.layer4.2.bn2.running_mean', 'teacher.backbone.layer4.2.bn2.running_var', 'teacher.backbone.layer4.2.bn2.num_batches_tracked', 'teacher.backbone.layer4.2.conv3.weight', 'teacher.backbone.layer4.2.bn3.weight', 'teacher.backbone.layer4.2.bn3.bias', 'teacher.backbone.layer4.2.bn3.running_mean', 'teacher.backbone.layer4.2.bn3.running_var', 'teacher.backbone.layer4.2.bn3.num_batches_tracked', 'teacher.neck.lateral_convs.0.conv.weight', 'teacher.neck.lateral_convs.0.conv.bias', 'teacher.neck.lateral_convs.1.conv.weight', 'teacher.neck.lateral_convs.1.conv.bias', 'teacher.neck.lateral_convs.2.conv.weight', 'teacher.neck.lateral_convs.2.conv.bias', 'teacher.neck.lateral_convs.3.conv.weight', 'teacher.neck.lateral_convs.3.conv.bias', 'teacher.neck.fpn_convs.0.conv.weight', 'teacher.neck.fpn_convs.0.conv.bias', 'teacher.neck.fpn_convs.1.conv.weight', 'teacher.neck.fpn_convs.1.conv.bias', 'teacher.neck.fpn_convs.2.conv.weight', 'teacher.neck.fpn_convs.2.conv.bias', 'teacher.neck.fpn_convs.3.conv.weight', 'teacher.neck.fpn_convs.3.conv.bias', 'teacher.rpn_head.rpn_conv.weight', 'teacher.rpn_head.rpn_conv.bias', 'teacher.rpn_head.rpn_cls.weight', 'teacher.rpn_head.rpn_cls.bias', 'teacher.rpn_head.rpn_reg.weight', 'teacher.rpn_head.rpn_reg.bias', 'teacher.roi_head.bbox_head.fc_cls.weight', 'teacher.roi_head.bbox_head.fc_cls.bias', 'teacher.roi_head.bbox_head.fc_reg.weight', 'teacher.roi_head.bbox_head.fc_reg.bias', 'teacher.roi_head.bbox_head.shared_fcs.0.weight', 'teacher.roi_head.bbox_head.shared_fcs.0.bias', 'teacher.roi_head.bbox_head.shared_fcs.1.weight', 'teacher.roi_head.bbox_head.shared_fcs.1.bias', 'visual.conv1.weight', 'visual.bn1.weight', 'visual.bn1.bias', 'visual.bn1.running_mean', 'visual.bn1.running_var', 'visual.bn1.num_batches_tracked', 'visual.conv2.weight', 'visual.bn2.weight', 'visual.bn2.bias', 'visual.bn2.running_mean', 'visual.bn2.running_var', 'visual.bn2.num_batches_tracked', 'visual.conv3.weight', 'visual.bn3.weight', 'visual.bn3.bias', 'visual.bn3.running_mean', 'visual.bn3.running_var', 'visual.bn3.num_batches_tracked', 'visual.layer1.0.conv1.weight', 'visual.layer1.0.bn1.weight', 'visual.layer1.0.bn1.bias', 'visual.layer1.0.bn1.running_mean', 'visual.layer1.0.bn1.running_var', 'visual.layer1.0.bn1.num_batches_tracked', 'visual.layer1.0.conv2.weight', 'visual.layer1.0.bn2.weight', 'visual.layer1.0.bn2.bias', 'visual.layer1.0.bn2.running_mean', 'visual.layer1.0.bn2.running_var', 'visual.layer1.0.bn2.num_batches_tracked', 'visual.layer1.0.conv3.weight', 'visual.layer1.0.bn3.weight', 'visual.layer1.0.bn3.bias', 'visual.layer1.0.bn3.running_mean', 'visual.layer1.0.bn3.running_var', 'visual.layer1.0.bn3.num_batches_tracked', 'visual.layer1.0.downsample.0.weight', 'visual.layer1.0.downsample.1.weight', 'visual.layer1.0.downsample.1.bias', 'visual.layer1.0.downsample.1.running_mean', 'visual.layer1.0.downsample.1.running_var', 'visual.layer1.0.downsample.1.num_batches_tracked', 'visual.layer1.1.conv1.weight', 'visual.layer1.1.bn1.weight', 'visual.layer1.1.bn1.bias', 'visual.layer1.1.bn1.running_mean', 'visual.layer1.1.bn1.running_var', 'visual.layer1.1.bn1.num_batches_tracked', 'visual.layer1.1.conv2.weight', 'visual.layer1.1.bn2.weight', 'visual.layer1.1.bn2.bias', 'visual.layer1.1.bn2.running_mean', 'visual.layer1.1.bn2.running_var', 'visual.layer1.1.bn2.num_batches_tracked', 'visual.layer1.1.conv3.weight', 'visual.layer1.1.bn3.weight', 'visual.layer1.1.bn3.bias', 'visual.layer1.1.bn3.running_mean', 'visual.layer1.1.bn3.running_var', 'visual.layer1.1.bn3.num_batches_tracked', 'visual.layer1.2.conv1.weight', 'visual.layer1.2.bn1.weight', 'visual.layer1.2.bn1.bias', 'visual.layer1.2.bn1.running_mean', 'visual.layer1.2.bn1.running_var', 'visual.layer1.2.bn1.num_batches_tracked', 'visual.layer1.2.conv2.weight', 'visual.layer1.2.bn2.weight', 'visual.layer1.2.bn2.bias', 'visual.layer1.2.bn2.running_mean', 'visual.layer1.2.bn2.running_var', 'visual.layer1.2.bn2.num_batches_tracked', 'visual.layer1.2.conv3.weight', 'visual.layer1.2.bn3.weight', 'visual.layer1.2.bn3.bias', 'visual.layer1.2.bn3.running_mean', 'visual.layer1.2.bn3.running_var', 'visual.layer1.2.bn3.num_batches_tracked', 'visual.layer2.0.conv1.weight', 'visual.layer2.0.bn1.weight', 'visual.layer2.0.bn1.bias', 'visual.layer2.0.bn1.running_mean', 'visual.layer2.0.bn1.running_var', 'visual.layer2.0.bn1.num_batches_tracked', 'visual.layer2.0.conv2.weight', 'visual.layer2.0.bn2.weight', 'visual.layer2.0.bn2.bias', 'visual.layer2.0.bn2.running_mean', 'visual.layer2.0.bn2.running_var', 'visual.layer2.0.bn2.num_batches_tracked', 'visual.layer2.0.conv3.weight', 'visual.layer2.0.bn3.weight', 'visual.layer2.0.bn3.bias', 'visual.layer2.0.bn3.running_mean', 'visual.layer2.0.bn3.running_var', 'visual.layer2.0.bn3.num_batches_tracked', 'visual.layer2.0.downsample.0.weight', 'visual.layer2.0.downsample.1.weight', 'visual.layer2.0.downsample.1.bias', 'visual.layer2.0.downsample.1.running_mean', 'visual.layer2.0.downsample.1.running_var', 'visual.layer2.0.downsample.1.num_batches_tracked', 'visual.layer2.1.conv1.weight', 'visual.layer2.1.bn1.weight', 'visual.layer2.1.bn1.bias', 'visual.layer2.1.bn1.running_mean', 'visual.layer2.1.bn1.running_var', 'visual.layer2.1.bn1.num_batches_tracked', 'visual.layer2.1.conv2.weight', 'visual.layer2.1.bn2.weight', 'visual.layer2.1.bn2.bias', 'visual.layer2.1.bn2.running_mean', 'visual.layer2.1.bn2.running_var', 'visual.layer2.1.bn2.num_batches_tracked', 'visual.layer2.1.conv3.weight', 'visual.layer2.1.bn3.weight', 'visual.layer2.1.bn3.bias', 'visual.layer2.1.bn3.running_mean', 'visual.layer2.1.bn3.running_var', 'visual.layer2.1.bn3.num_batches_tracked', 'visual.layer2.2.conv1.weight', 'visual.layer2.2.bn1.weight', 'visual.layer2.2.bn1.bias', 'visual.layer2.2.bn1.running_mean', 'visual.layer2.2.bn1.running_var', 'visual.layer2.2.bn1.num_batches_tracked', 'visual.layer2.2.conv2.weight', 'visual.layer2.2.bn2.weight', 'visual.layer2.2.bn2.bias', 'visual.layer2.2.bn2.running_mean', 'visual.layer2.2.bn2.running_var', 'visual.layer2.2.bn2.num_batches_tracked', 'visual.layer2.2.conv3.weight', 'visual.layer2.2.bn3.weight', 'visual.layer2.2.bn3.bias', 'visual.layer2.2.bn3.running_mean', 'visual.layer2.2.bn3.running_var', 'visual.layer2.2.bn3.num_batches_tracked', 'visual.layer2.3.conv1.weight', 'visual.layer2.3.bn1.weight', 'visual.layer2.3.bn1.bias', 'visual.layer2.3.bn1.running_mean', 'visual.layer2.3.bn1.running_var', 'visual.layer2.3.bn1.num_batches_tracked', 'visual.layer2.3.conv2.weight', 'visual.layer2.3.bn2.weight', 'visual.layer2.3.bn2.bias', 'visual.layer2.3.bn2.running_mean', 'visual.layer2.3.bn2.running_var', 'visual.layer2.3.bn2.num_batches_tracked', 'visual.layer2.3.conv3.weight', 'visual.layer2.3.bn3.weight', 'visual.layer2.3.bn3.bias', 'visual.layer2.3.bn3.running_mean', 'visual.layer2.3.bn3.running_var', 'visual.layer2.3.bn3.num_batches_tracked', 'visual.layer3.0.conv1.weight', 'visual.layer3.0.bn1.weight', 'visual.layer3.0.bn1.bias', 'visual.layer3.0.bn1.running_mean', 'visual.layer3.0.bn1.running_var', 'visual.layer3.0.bn1.num_batches_tracked', 'visual.layer3.0.conv2.weight', 'visual.layer3.0.bn2.weight', 'visual.layer3.0.bn2.bias', 'visual.layer3.0.bn2.running_mean', 'visual.layer3.0.bn2.running_var', 'visual.layer3.0.bn2.num_batches_tracked', 'visual.layer3.0.conv3.weight', 'visual.layer3.0.bn3.weight', 'visual.layer3.0.bn3.bias', 'visual.layer3.0.bn3.running_mean', 'visual.layer3.0.bn3.running_var', 'visual.layer3.0.bn3.num_batches_tracked', 'visual.layer3.0.downsample.0.weight', 'visual.layer3.0.downsample.1.weight', 'visual.layer3.0.downsample.1.bias', 'visual.layer3.0.downsample.1.running_mean', 'visual.layer3.0.downsample.1.running_var', 'visual.layer3.0.downsample.1.num_batches_tracked', 'visual.layer3.1.conv1.weight', 'visual.layer3.1.bn1.weight', 'visual.layer3.1.bn1.bias', 'visual.layer3.1.bn1.running_mean', 'visual.layer3.1.bn1.running_var', 'visual.layer3.1.bn1.num_batches_tracked', 'visual.layer3.1.conv2.weight', 'visual.layer3.1.bn2.weight', 'visual.layer3.1.bn2.bias', 'visual.layer3.1.bn2.running_mean', 'visual.layer3.1.bn2.running_var', 'visual.layer3.1.bn2.num_batches_tracked', 'visual.layer3.1.conv3.weight', 'visual.layer3.1.bn3.weight', 'visual.layer3.1.bn3.bias', 'visual.layer3.1.bn3.running_mean', 'visual.layer3.1.bn3.running_var', 'visual.layer3.1.bn3.num_batches_tracked', 'visual.layer3.2.conv1.weight', 'visual.layer3.2.bn1.weight', 'visual.layer3.2.bn1.bias', 'visual.layer3.2.bn1.running_mean', 'visual.layer3.2.bn1.running_var', 'visual.layer3.2.bn1.num_batches_tracked', 'visual.layer3.2.conv2.weight', 'visual.layer3.2.bn2.weight', 'visual.layer3.2.bn2.bias', 'visual.layer3.2.bn2.running_mean', 'visual.layer3.2.bn2.running_var', 'visual.layer3.2.bn2.num_batches_tracked', 'visual.layer3.2.conv3.weight', 'visual.layer3.2.bn3.weight', 'visual.layer3.2.bn3.bias', 'visual.layer3.2.bn3.running_mean', 'visual.layer3.2.bn3.running_var', 'visual.layer3.2.bn3.num_batches_tracked', 'visual.layer3.3.conv1.weight', 'visual.layer3.3.bn1.weight', 'visual.layer3.3.bn1.bias', 'visual.layer3.3.bn1.running_mean', 'visual.layer3.3.bn1.running_var', 'visual.layer3.3.bn1.num_batches_tracked', 'visual.layer3.3.conv2.weight', 'visual.layer3.3.bn2.weight', 'visual.layer3.3.bn2.bias', 'visual.layer3.3.bn2.running_mean', 'visual.layer3.3.bn2.running_var', 'visual.layer3.3.bn2.num_batches_tracked', 'visual.layer3.3.conv3.weight', 'visual.layer3.3.bn3.weight', 'visual.layer3.3.bn3.bias', 'visual.layer3.3.bn3.running_mean', 'visual.layer3.3.bn3.running_var', 'visual.layer3.3.bn3.num_batches_tracked', 'visual.layer3.4.conv1.weight', 'visual.layer3.4.bn1.weight', 'visual.layer3.4.bn1.bias', 'visual.layer3.4.bn1.running_mean', 'visual.layer3.4.bn1.running_var', 'visual.layer3.4.bn1.num_batches_tracked', 'visual.layer3.4.conv2.weight', 'visual.layer3.4.bn2.weight', 'visual.layer3.4.bn2.bias', 'visual.layer3.4.bn2.running_mean', 'visual.layer3.4.bn2.running_var', 'visual.layer3.4.bn2.num_batches_tracked', 'visual.layer3.4.conv3.weight', 'visual.layer3.4.bn3.weight', 'visual.layer3.4.bn3.bias', 'visual.layer3.4.bn3.running_mean', 'visual.layer3.4.bn3.running_var', 'visual.layer3.4.bn3.num_batches_tracked', 'visual.layer3.5.conv1.weight', 'visual.layer3.5.bn1.weight', 'visual.layer3.5.bn1.bias', 'visual.layer3.5.bn1.running_mean', 'visual.layer3.5.bn1.running_var', 'visual.layer3.5.bn1.num_batches_tracked', 'visual.layer3.5.conv2.weight', 'visual.layer3.5.bn2.weight', 'visual.layer3.5.bn2.bias', 'visual.layer3.5.bn2.running_mean', 'visual.layer3.5.bn2.running_var', 'visual.layer3.5.bn2.num_batches_tracked', 'visual.layer3.5.conv3.weight', 'visual.layer3.5.bn3.weight', 'visual.layer3.5.bn3.bias', 'visual.layer3.5.bn3.running_mean', 'visual.layer3.5.bn3.running_var', 'visual.layer3.5.bn3.num_batches_tracked', 'visual.layer4.0.conv1.weight', 'visual.layer4.0.bn1.weight', 'visual.layer4.0.bn1.bias', 'visual.layer4.0.bn1.running_mean', 'visual.layer4.0.bn1.running_var', 'visual.layer4.0.bn1.num_batches_tracked', 'visual.layer4.0.conv2.weight', 'visual.layer4.0.bn2.weight', 'visual.layer4.0.bn2.bias', 'visual.layer4.0.bn2.running_mean', 'visual.layer4.0.bn2.running_var', 'visual.layer4.0.bn2.num_batches_tracked', 'visual.layer4.0.conv3.weight', 'visual.layer4.0.bn3.weight', 'visual.layer4.0.bn3.bias', 'visual.layer4.0.bn3.running_mean', 'visual.layer4.0.bn3.running_var', 'visual.layer4.0.bn3.num_batches_tracked', 'visual.layer4.0.downsample.0.weight', 'visual.layer4.0.downsample.1.weight', 'visual.layer4.0.downsample.1.bias', 'visual.layer4.0.downsample.1.running_mean', 'visual.layer4.0.downsample.1.running_var', 'visual.layer4.0.downsample.1.num_batches_tracked', 'visual.layer4.1.conv1.weight', 'visual.layer4.1.bn1.weight', 'visual.layer4.1.bn1.bias', 'visual.layer4.1.bn1.running_mean', 'visual.layer4.1.bn1.running_var', 'visual.layer4.1.bn1.num_batches_tracked', 'visual.layer4.1.conv2.weight', 'visual.layer4.1.bn2.weight', 'visual.layer4.1.bn2.bias', 'visual.layer4.1.bn2.running_mean', 'visual.layer4.1.bn2.running_var', 'visual.layer4.1.bn2.num_batches_tracked', 'visual.layer4.1.conv3.weight', 'visual.layer4.1.bn3.weight', 'visual.layer4.1.bn3.bias', 'visual.layer4.1.bn3.running_mean', 'visual.layer4.1.bn3.running_var', 'visual.layer4.1.bn3.num_batches_tracked', 'visual.layer4.2.conv1.weight', 'visual.layer4.2.bn1.weight', 'visual.layer4.2.bn1.bias', 'visual.layer4.2.bn1.running_mean', 'visual.layer4.2.bn1.running_var', 'visual.layer4.2.bn1.num_batches_tracked', 'visual.layer4.2.conv2.weight', 'visual.layer4.2.bn2.weight', 'visual.layer4.2.bn2.bias', 'visual.layer4.2.bn2.running_mean', 'visual.layer4.2.bn2.running_var', 'visual.layer4.2.bn2.num_batches_tracked', 'visual.layer4.2.conv3.weight', 'visual.layer4.2.bn3.weight', 'visual.layer4.2.bn3.bias', 'visual.layer4.2.bn3.running_mean', 'visual.layer4.2.bn3.running_var', 'visual.layer4.2.bn3.num_batches_tracked', 'visual.attnpool.positional_embedding', 'visual.attnpool.k_proj.weight', 'visual.attnpool.k_proj.bias', 'visual.attnpool.q_proj.weight', 'visual.attnpool.q_proj.bias', 'visual.attnpool.v_proj.weight', 'visual.attnpool.v_proj.bias', 'visual.attnpool.c_proj.weight', 'visual.attnpool.c_proj.bias']) Is the merger successful？？I need your help. Thank you very much. Looking forward to your reply dict_keys(['student.backbone.conv1.weight', 'student.backbone.bn1.weight', 'student.backbone.bn1.bias', 'student.backbone.bn1.running_mean', 'student.backbone.bn1.running_var', 'student.backbone.bn1.num_batches_tracked', 'student.backbone.layer1.0.conv1.weight', 'student.backbone.layer1.0.bn1.weight', 'student.backbone.layer1.0.bn1.bias', 'student.backbone.layer1.0.bn1.running_mean', 'student.backbone.layer1.0.bn1.running_var', 'student.backbone.layer1.0.bn1.num_batches_tracked', 'student.backbone.layer1.0.conv2.weight', 'student.backbone.layer1.0.bn2.weight', 'student.backbone.layer1.0.bn2.bias', 'student.backbone.layer1.0.bn2.running_mean', 'student.backbone.layer1.0.bn2.running_var', 'student.backbone.layer1.0.bn2.num_batches_tracked', 'student.backbone.layer1.0.conv3.weight', 'student.backbone.layer1.0.bn3.weight', 'student.backbone.layer1.0.bn3.bias', 'student.backbone.layer1.0.bn3.running_mean', 'student.backbone.layer1.0.bn3.running_var', 'student.backbone.layer1.0.bn3.num_batches_tracked', 'student.backbone.layer1.0.downsample.0.weight', 'student.backbone.layer1.0.downsample.1.weight', 'student.backbone.layer1.0.downsample.1.bias', 'student.backbone.layer1.0.downsample.1.running_mean', 'student.backbone.layer1.0.downsample.1.running_var', 'student.backbone.layer1.0.downsample.1.num_batches_tracked', 'student.backbone.layer1.1.conv1.weight', 'student.backbone.layer1.1.bn1.weight', 'student.backbone.layer1.1.bn1.bias', 'student.backbone.layer1.1.bn1.running_mean', 'student.backbone.layer1.1.bn1.running_var', 'student.backbone.layer1.1.bn1.num_batches_tracked', 'student.backbone.layer1.1.conv2.weight', 'student.backbone.layer1.1.bn2.weight', 'student.backbone.layer1.1.bn2.bias', 'student.backbone.layer1.1.bn2.running_mean', 'student.backbone.layer1.1.bn2.running_var', 'student.backbone.layer1.1.bn2.num_batches_tracked', 'student.backbone.layer1.1.conv3.weight', 'student.backbone.layer1.1.bn3.weight', 'student.backbone.layer1.1.bn3.bias', 'student.backbone.layer1.1.bn3.running_mean', 'student.backbone.layer1.1.bn3.running_var', 'student.backbone.layer1.1.bn3.num_batches_tracked', 'student.backbone.layer1.2.conv1.weight', 'student.backbone.layer1.2.bn1.weight', 'student.backbone.layer1.2.bn1.bias', 'student.backbone.layer1.2.bn1.running_mean', 'student.backbone.layer1.2.bn1.running_var', 'student.backbone.layer1.2.bn1.num_batches_tracked', 'student.backbone.layer1.2.conv2.weight', 'student.backbone.layer1.2.bn2.weight', 'student.backbone.layer1.2.bn2.bias', 'student.backbone.layer1.2.bn2.running_mean', 'student.backbone.layer1.2.bn2.running_var', 'student.backbone.layer1.2.bn2.num_batches_tracked', 'student.backbone.layer1.2.conv3.weight', 'student.backbone.layer1.2.bn3.weight', 'student.backbone.layer1.2.bn3.bias', 'student.backbone.layer1.2.bn3.running_mean', 'student.backbone.layer1.2.bn3.running_var', 'student.backbone.layer1.2.bn3.num_batches_tracked', 'student.backbone.layer2.0.conv1.weight', 'student.backbone.layer2.0.bn1.weight', 'student.backbone.layer2.0.bn1.bias', 'student.backbone.layer2.0.bn1.running_mean', 'student.backbone.layer2.0.bn1.running_var', 'student.backbone.layer2.0.bn1.num_batches_tracked', 'student.backbone.layer2.0.conv2.weight', 'student.backbone.layer2.0.bn2.weight', 'student.backbone.layer2.0.bn2.bias', 'student.backbone.layer2.0.bn2.running_mean', 'student.backbone.layer2.0.bn2.running_var', 'student.backbone.layer2.0.bn2.num_batches_tracked', 'student.backbone.layer2.0.conv3.weight', 'student.backbone.layer2.0.bn3.weight', 'student.backbone.layer2.0.bn3.bias', 'student.backbone.layer2.0.bn3.running_mean', 'student.backbone.layer2.0.bn3.running_var', 'student.backbone.layer2.0.bn3.num_batches_tracked', 'student.backbone.layer2.0.downsample.0.weight', 'student.backbone.layer2.0.downsample.1.weight', 'student.backbone.layer2.0.downsample.1.bias', 'student.backbone.layer2.0.downsample.1.running_mean', 'student.backbone.layer2.0.downsample.1.running_var', 'student.backbone.layer2.0.downsample.1.num_batches_tracked', 'student.backbone.layer2.1.conv1.weight', 'student.backbone.layer2.1.bn1.weight', 'student.backbone.layer2.1.bn1.bias', 'student.backbone.layer2.1.bn1.running_mean', 'student.backbone.layer2.1.bn1.running_var', 'student.backbone.layer2.1.bn1.num_batches_tracked', 'student.backbone.layer2.1.conv2.weight', 'student.backbone.layer2.1.bn2.weight', 'student.backbone.layer2.1.bn2.bias', 'student.backbone.layer2.1.bn2.running_mean', 'student.backbone.layer2.1.bn2.running_var', 'student.backbone.layer2.1.bn2.num_batches_tracked', 'student.backbone.layer2.1.conv3.weight', 'student.backbone.layer2.1.bn3.weight', 'student.backbone.layer2.1.bn3.bias', 'student.backbone.layer2.1.bn3.running_mean', 'student.backbone.layer2.1.bn3.running_var', 'student.backbone.layer2.1.bn3.num_batches_tracked', 'student.backbone.layer2.2.conv1.weight', 'student.backbone.layer2.2.bn1.weight', 'student.backbone.layer2.2.bn1.bias', 'student.backbone.layer2.2.bn1.running_mean', 'student.backbone.layer2.2.bn1.running_var', 'student.backbone.layer2.2.bn1.num_batches_tracked', 'student.backbone.layer2.2.conv2.weight', 'student.backbone.layer2.2.bn2.weight', 'student.backbone.layer2.2.bn2.bias', 'student.backbone.layer2.2.bn2.running_mean', 'student.backbone.layer2.2.bn2.running_var', 'student.backbone.layer2.2.bn2.num_batches_tracked', 'student.backbone.layer2.2.conv3.weight', 'student.backbone.layer2.2.bn3.weight', 'student.backbone.layer2.2.bn3.bias', 'student.backbone.layer2.2.bn3.running_mean', 'student.backbone.layer2.2.bn3.running_var', 'student.backbone.layer2.2.bn3.num_batches_tracked', 'student.backbone.layer2.3.conv1.weight', 'student.backbone.layer2.3.bn1.weight', 'student.backbone.layer2.3.bn1.bias', 'student.backbone.layer2.3.bn1.running_mean', 'student.backbone.layer2.3.bn1.running_var', 'student.backbone.layer2.3.bn1.num_batches_tracked', 'student.backbone.layer2.3.conv2.weight', 'student.backbone.layer2.3.bn2.weight', 'student.backbone.layer2.3.bn2.bias', 'student.backbone.layer2.3.bn2.run

Andrew0425 · 2025-03-21T03:48:10Z

after i modify the $rcnn_cls_loss_by_pseudo_instances$ function in the $soft_teacher.py$, it goes on training while the loss and accuracy goes gradually to nan/100

how can i solve this problem?

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

KeyError: 'loss_cls' #9

KeyError: 'loss_cls' #9

Feeeeeel commented Nov 17, 2024

UnchangedOriInten commented Dec 5, 2024

lili196 commented Jan 15, 2025

lizzy8587 commented Feb 8, 2025 •

edited

Loading

lili196 commented Feb 8, 2025 via email

Andrew0425 commented Mar 21, 2025

KeyError: 'loss_cls' #9

KeyError: 'loss_cls' #9

Comments

Feeeeeel commented Nov 17, 2024

UnchangedOriInten commented Dec 5, 2024

lili196 commented Jan 15, 2025

lizzy8587 commented Feb 8, 2025 • edited Loading

lili196 commented Feb 8, 2025 via email

Andrew0425 commented Mar 21, 2025

lizzy8587 commented Feb 8, 2025 •

edited

Loading