apm for cqu_bpdd

LiAo365 · LiAo365 · commit 46cced46ed49 · 2022-07-17T15:59:12.000+08:00
diff --git a/bpdd_apm_run.py b/bpdd_apm_run.py
@@ -3,7 +3,7 @@
 '''
 Author       : LiAo
 Date         : 2022-07-12 21:55:46
-LastEditTime : 2022-07-16 23:38:18
+LastEditTime : 2022-07-17 15:39:52
 LastAuthor   : LiAo
 Description  : Please add file description
 '''
@@ -18,7 +18,7 @@
     utils.setup_seed(123)
     parser = argparse.ArgumentParser()
     # 网络模型参数
-    parser.add_argument('--backbone', type=str, default='tf_efficientnetv2_b3')
+    parser.add_argument('--backbone', type=str, default='tf_efficientnet_b3')
     parser.add_argument('--backbone_pretrain', type=bool, default=True)
     parser.add_argument('--pool', type=bool, default=True)
     parser.add_argument('--pool_size', type=tuple, default=(300, 300))
@@ -29,13 +29,13 @@
     parser.add_argument('--num_classes', type=int, default=7)
 
     # 训练epoch
-    parser.add_argument('--epoch', type=int, default=300)
+    parser.add_argument('--epoch', type=int, default=200)
     parser.add_argument('--epoch_offset', type=int, default=0)
     # 超参数, 依据显存设置
     parser.add_argument('--batch_size', type=int,
                         default=32, help='decide by GPU RAM')
     # 学习率参数
-    parser.add_argument('--lr', type=float, default=0.01)
+    parser.add_argument('--lr', type=float, default=0.005)
     # used for RangeLars
     parser.add_argument('--lrf', type=float, default=0.005)
     parser.add_argument('--ann_start', type=float, default=0.5)
diff --git a/bpdd_src/apm.py b/bpdd_src/apm.py
@@ -3,7 +3,7 @@
 '''
 Author       : LiAo
 Date         : 2022-07-05 19:45:12
-LastEditTime : 2022-07-16 23:41:05
+LastEditTime : 2022-07-17 15:55:17
 LastAuthor   : LiAo
 Description  : Please add file description
 '''
@@ -189,21 +189,22 @@ class APM(nn.Module):
 
     def __init__(self, in_chs: int, out_chs: int):
         super(APM, self).__init__()
-        self.conv_blocks_1 = ConvBlock(in_chs, 8, kernel_size=13, stride=3, padding=1, dilation=1,
+        self.conv_blocks_1 = ConvBlock(in_chs, 4, kernel_size=13, stride=2, padding=1, dilation=1,
                                        norm_layer=nn.BatchNorm2d, act_layer=nn.SiLU, pool_layer=nn.MaxPool2d(3, stride=1))
-        self.conv_blocks_2 = ConvBlock(8, 32, kernel_size=3, stride=1, padding=1, dilation=1,
-                                       norm_layer=nn.BatchNorm2d, act_layer=nn.SiLU, pool_layer=nn.AvgPool2d(3, stride=1))
-        self.conv_blocks_3 = ConvBlock(32, 64, kernel_size=3, stride=1, padding=1, dilation=1,
+        self.conv_blocks_2 = ConvBlock(4, 16, kernel_size=5, stride=2, padding=1, dilation=1,
                                        norm_layer=nn.BatchNorm2d, act_layer=nn.SiLU, pool_layer=nn.MaxPool2d(3, stride=1))
-        self.res_blocks_1 = Residual(64, 64, kernel_size=[3, 3], stride=[1, 1], padding=[1, 1],
+        self.conv_blocks_3 = ConvBlock(16, 32, kernel_size=3, stride=1, padding=1, dilation=1,
+                                       norm_layer=nn.BatchNorm2d, act_layer=nn.SiLU, pool_layer=nn.MaxPool2d(3, stride=1))
+        self.res_blocks_1 = Residual(32, 32, kernel_size=[3, 3], stride=[1, 1], padding=[1, 1],
                                      downsample=False)
-        self.res_blocks_2 = Residual(64, 64, kernel_size=[3, 3], stride=[1, 1], padding=[1, 1],
+        self.res_blocks_2 = Residual(32, 32, kernel_size=[3, 3], stride=[1, 1], padding=[1, 1],
                                      downsample=False)
-        self.cbam_blocks = CBAM(64)
-        self.conv_blocks_4 = ConvBlock(64, 16, kernel_size=3, stride=1, padding=1, dilation=1,
-                                       norm_layer=nn.BatchNorm2d, act_layer=nn.SiLU, pool_layer=None)
-        self.conv_blocks_5 = ConvBlock(16, out_chs, kernel_size=3, stride=1, padding=1, dilation=1,
-                                       norm_layer=nn.BatchNorm2d, act_layer=nn.SiLU, pool_layer=None)
+        # self.res_blocks_2 = nn.Identity()
+        self.cbam_blocks = CBAM(32)
+        self.conv_blocks_4 = ConvBlock(32, 8, kernel_size=3, stride=1, padding=1, dilation=1,
+                                       norm_layer=nn.BatchNorm2d, act_layer=nn.SiLU, pool_layer=nn.MaxPool2d(3, stride=1))
+        self.conv_blocks_5 = ConvBlock(8, out_chs, kernel_size=3, stride=1, padding=1, dilation=1,
+                                       norm_layer=nn.BatchNorm2d, act_layer=nn.SiLU, pool_layer=nn.MaxPool2d(3, stride=1))
 
     def forward(self, x):
         x = self.conv_blocks_1(x)
@@ -241,10 +242,10 @@ def __init__(self, backbone='tf_efficientnetv2_b0', pretrain=True, num_classes=7
         self.pool_upsample = nn.Upsample(size=pool_size, mode=pool_type)
 
     def forward(self, x):
-        x = self.apm(x)
+        apm_x = self.apm(x)
         x_upsample = self.pool_upsample(x)
-        x_max = self.max_pool(x)
-        x_avg = self.avg_pool(x)
+        x_max = self.max_pool(apm_x)
+        x_avg = self.avg_pool(apm_x)
         x = torch.concat([x_upsample, x_avg, x_max], dim=1)
         x = self.backbone(x)
         x = self.dropout(self.classifier(x))
@@ -264,6 +265,27 @@ def test_apm():
 
 
 def test_model_modify():
-    net = MultiClassification(backbone='tf_efficientnetv2_b3',
+    net = MultiClassification(backbone='tf_efficientnet_b3',
                               pretrain=True, num_classes=3)
     print(net)
+
+
+def test_model_repvgg():
+    input = torch.randn(1, 3, 224, 224)
+    from thop import profile, clever_format
+    net = timm.create_model(model_name='repvgg_b0',
+                            pretrained=True, num_classes=3)
+    print(net)
+    macs, params = profile(net, inputs=(input, ))
+    macs, params = clever_format([macs, params], "%.4f")
+    print(macs)
+    print(params)
+    # repvgg_b0
+    # 3.3960G
+    # 14.5056M
+    # tf_efficientnetv2_b3
+    # 1.5538G
+    # 12.7488M
+    # tf_efficientnet_b3
+    # 990.3157M
+    # 10.6707M
diff --git a/bpdd_src/apm_train.py b/bpdd_src/apm_train.py
@@ -3,7 +3,7 @@
 '''
 Author       : LiAo
 Date         : 2022-07-05 20:08:25
-LastEditTime : 2022-07-16 23:37:58
+LastEditTime : 2022-07-17 15:23:13
 LastAuthor   : LiAo
 Description  : Please add file description
 '''
@@ -29,14 +29,25 @@
 def main(args):
     device = torch.device(args.device if torch.cuda.is_available() else 'cpu')
     # 定义数据预处理
-    data_transform = transforms.Compose([
-        utils.SelfCLAHE(clip_limit=2.0, tile_grid_size=(32, 32)),
-        transforms.RandomHorizontalFlip(),
-        transforms.RandomVerticalFlip(),
-        transforms.RandomPerspective(),
-        transforms.ToTensor()
-        # transforms.Normalize([0.414289], [0.215069])
-    ])
+    # data_transform = transforms.Compose([
+    #     # utils.SelfCLAHE(clip_limit=2.0, tile_grid_size=(32, 32)),
+    #     transforms.RandomHorizontalFlip(),
+    #     transforms.RandomVerticalFlip(),
+    #     transforms.RandomPerspective(),
+    #     transforms.ToTensor(),
+    #     transforms.Normalize([0.414289], [0.215069])
+    # ])
+    data_transform = {
+        'train': transforms.Compose([
+            transforms.RandomHorizontalFlip(),
+            transforms.RandomVerticalFlip(),
+            transforms.ToTensor(),
+            transforms.Normalize([0.414289], [0.215069])
+        ]),
+        'test': transforms.Compose([
+            transforms.ToTensor(),
+            transforms.Normalize([0.414289], [0.215069])
+        ])}
     # log是tensorboard的记录路径
     utils.path_exist(args.log_path)
     writer = SummaryWriter(log_dir=args.log_path)
@@ -53,12 +64,12 @@ def main(args):
     test_result_pd = pd.read_csv(test_result_path) if os.path.exists(
         test_result_path) else pd.DataFrame()
     # 训练集和测试集的路径
-    trian_path = os.path.join(args.dataset, 'train')
-    test_path = os.path.join(args.dataset, 'test')
+    trian_path = os.path.join(args.dataset, 'test')
+    test_path = os.path.join(args.dataset, 'train')
     trainset = torchvision.datasets.ImageFolder(
-        root=trian_path, transform=data_transform, loader=utils.gray_loader)
+        root=trian_path, transform=data_transform['train'], loader=utils.gray_loader)
     testset = torchvision.datasets.ImageFolder(
-        root=test_path, transform=data_transform, loader=utils.gray_loader)
+        root=test_path, transform=data_transform['test'], loader=utils.gray_loader)
     # 类别的标签, test时保存结果需要对应各个类别
     classes = trainset.classes
     train_loader = DataLoader(dataset=trainset, batch_size=batch_size, shuffle=True,
@@ -103,7 +114,7 @@ def new_module():
     #         (1 - args.lrf) + args.lrf  # cosine
     # scheduler = lr_scheduler.LambdaLR(optimizer, lr_lambda=lf)
     scheduler = lr_scheduler.CosineAnnealingLR(
-        optimizer, T_max=args.epoch)
+        optimizer, T_max=int(1.5 * args.epoch))
     # scheduler = lr_scheduler.StepLR(
     #     optimizer=optimizer, step_size=20, gamma=0.5)
     # def lf(x):
@@ -115,8 +126,8 @@ def new_module():
     # 设置loss function
     # loss_function = nn.CrossEntropyLoss() if loss_weights is None else nn.CrossEntropyLoss(
     #     weight=torch.tensor(loss_weights))
-    # loss_function = utils.FocalLoss(gamma=8, reduction='sum')
-    loss_function = torch.nn.CrossEntropyLoss()
+    loss_function = utils.FocalLoss(gamma=8, reduction='mean')
+    # loss_function = torch.nn.CrossEntropyLoss()
     for epoch in range(epoch_offset, epoch_offset + args.epoch):
         # train
         train_loss, train_acc = train_utils.train_one_epoch(
@@ -135,7 +146,7 @@ def new_module():
             loss_function=loss_function)
         # 学习率的调整
         # scheduler.step(test_loss)
-        if (epoch * 1.0 - epoch_offset) / args.epoch > 0.5:
+        if (epoch * 1.0 - epoch_offset) / args.epoch > 0.25:
             scheduler.step()
 
         # 保存测试集的测试结果