finall for master

msinamsina · Feb 26, 2023 · 83eca35 · 83eca35
1 parent d696b49
commit 83eca35
Show file tree

Hide file tree

Showing 10 changed files with 337 additions and 24 deletions.
diff --git a/adet/config/defaults.py b/adet/config/defaults.py
@@ -356,8 +356,8 @@
 _C.MODEL.POLO.TYPE_DCN = 'DCN'
 _C.MODEL.POLO.NUM_GRIDS = [40, 36, 24, 16, 12]
 # Number of foreground classes.
-_C.MODEL.POLO.NUM_CLASSES = 80
-_C.MODEL.POLO.NUM_KERNELS = 32
+_C.MODEL.POLO.NUM_CLASSES = 7
+_C.MODEL.POLO.NUM_KERNELS = 200
 _C.MODEL.POLO.NORM = "GN"
 _C.MODEL.POLO.USE_COORD_CONV = True
 _C.MODEL.POLO.PRIOR_PROB = 0.01
@@ -366,13 +366,13 @@
 # Channel size for the mask tower.
 _C.MODEL.POLO.MASK_IN_FEATURES = ["p2", "p3", "p4", "p5"]
 _C.MODEL.POLO.MASK_IN_CHANNELS = 256
-_C.MODEL.POLO.MASK_CHANNELS = 512 #256 #128
-_C.MODEL.POLO.NUM_MASKS = 32
+_C.MODEL.POLO.MASK_CHANNELS = 512#256 #128
+_C.MODEL.POLO.NUM_MASKS = 200
 
 # Test cfg.
 _C.MODEL.POLO.NMS_PRE = 500
-_C.MODEL.POLO.SCORE_THR = 0.0005
-_C.MODEL.POLO.UPDATE_THR = 0.0005
+_C.MODEL.POLO.SCORE_THR = 0.5
+_C.MODEL.POLO.UPDATE_THR = 0.5
 _C.MODEL.POLO.MASK_THR = 0.5
 _C.MODEL.POLO.MAX_PER_IMG = 100
 # NMS type: matrix OR mask.

diff --git a/adet/data/builtin.py b/adet/data/builtin.py
@@ -85,8 +85,10 @@ def register_all_coco(root="datasets"):
 MetadataCatalog.get('CIHP_val').set(thing_classes=thing_classes, stuff_classes=stuff_classes, evaluator_type="coco")
 MetadataCatalog.get('CIHP_train_v2').set(thing_classes=thing_classes[1:], stuff_classes=stuff_classes, evaluator_type="parsing")
 MetadataCatalog.get('CIHP_val_v2').set(thing_classes=thing_classes[1:], stuff_classes=stuff_classes, evaluator_type="parsing")
-MetadataCatalog.get('PPP_train').set(thing_classes=thing_classes, stuff_classes=stuff_classes, evaluator_type="parsing")
-MetadataCatalog.get('PPP_val').set(thing_classes=thing_classes, stuff_classes=stuff_classes, evaluator_type="parsing")
+
+ppp_thing_classes = ['bg' , 'head', 'upper', 'upper-hand', 'lower-hand', 'upper-leg', 'lower-leg']
+MetadataCatalog.get('PPP_train').set(thing_classes=ppp_thing_classes, stuff_classes=ppp_thing_classes, evaluator_type="parsing")
+MetadataCatalog.get('PPP_val').set(thing_classes=ppp_thing_classes, stuff_classes=ppp_thing_classes, evaluator_type="parsing")
 MetadataCatalog.get('CIHP_train_person').set(thing_classes=['Person'], evaluator_type="coco")
 MetadataCatalog.get('CIHP_val_person').set(thing_classes=['Person'], evaluator_type="coco")
 MetadataCatalog.get('CIHP_train_person').set(thing_classes=['Person'], evaluator_type="coco")

diff --git a/adet/data/datasets/pascal_person_part.py b/adet/data/datasets/pascal_person_part.py
@@ -14,9 +14,8 @@ def __init__(self, root, train=False):
         self.train = train
 
         # Loading the Colormap
-        colormap = loadmat(os.path.join(root, 'CIHP/human_colormap.mat')
-        )["colormap"]
-        colormap = colormap * 100
+        colormap = np.array([[0, 0, 0], [0, 0, 255], [0, 255, 0], [0, 255, 255], [255, 0, 0], [255, 0, 255], [255, 255, 0]])
+        #colormap = colormap * 100
         self.colormap = colormap.astype(np.uint8)
         self.root = os.path.join(root, 'VOCdevkit/VOC2010/')
         if train:
@@ -116,7 +115,7 @@ def create_annotations(self, pictur_id):
         return objs
 
     def __len__(self):
-        # return 1
+        # return 100
         return len(self.anno_ids)
 
     def get_dicts(self):

diff --git a/adet/evaluation/__init__.py b/adet/evaluation/__init__.py
@@ -3,4 +3,5 @@
 from .text_eval_script_ic15 import text_eval_main_ic15
 from . import rrc_evaluation_funcs
 from . import rrc_evaluation_funcs_ic15
-from .parsing_evaluation import ParsingEval
+from .parsing_evaluation import ParsingEval
+from .mhp_evalauation import MHPDatasetEvaluator
diff --git a/adet/evaluation/mhp_evalauation.py b/adet/evaluation/mhp_evalauation.py
@@ -0,0 +1,203 @@
+import os.path
+
+from detectron2.data import DatasetCatalog, MetadataCatalog
+from detectron2.evaluation import COCOEvaluator, inference_on_dataset, DatasetEvaluator
+import matplotlib.pyplot as plt
+import torch
+
+import numpy as np
+from PIL import Image, ImageDraw
+import time
+from .utils import poly_to_mask, plot_mask, voc_ap, cal_one_mean_iou
+
+
+class APEvaluator:
+
+    def __init__(self):
+        self.tp = []
+        self.fp = []
+
+        self.precision = []
+        self.recall = []
+        self.ap = []
+
+    def add_tp(self):
+        self.tp.append(1)
+        self.fp.append(0)
+
+    def add_fp(self):
+        self.tp.append(0)
+        self.fp.append(1)
+
+    def eval(self, npos):
+        tp = np.array(self.tp)
+        fp = np.array(self.fp)
+        tp = np.cumsum(tp)
+        fp = np.cumsum(fp)
+        rec = tp / npos
+        prec = tp / np.maximum(tp + fp, np.finfo(np.float64).eps)
+
+        ap = voc_ap(rec, prec)
+        self.precision = prec
+        self.recall = rec
+        self.ap = ap
+        return ap
+
+
+
+
+class MHPDatasetEvaluator(DatasetEvaluator):
+
+    def __init__(self, dataset_name, cfg, distributed, output_dir=None):
+        super().__init__()
+        self._cfg = cfg.clone()
+        self._dataset_name = dataset_name
+        self._distributed = distributed
+        self._output_dir = output_dir
+        self.dataset_dicts = DatasetCatalog.get(dataset_name)
+        self.metadata = MetadataCatalog.get(dataset_name)
+        self.num_classes = len(self.metadata.thing_classes)
+        self.ovthresh_seg = [0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9]
+        # if not os.path.exists(output_dir):
+        try:
+            os.makedirs(output_dir)
+        except OSError:
+            pass
+
+    def reset(self):
+        self.apr = {}
+        self.app = {}
+        for i in self.ovthresh_seg:
+            self.app[i] = APEvaluator()
+            self.apr[i] = APEvaluator()
+        self.npos = 0
+        self.npart = 0
+        self.total_time = 0
+        self.delta_time = time.time()
+        self.num_images = 0
+
+    def process(self, inputs, outputs):
+        self.num_images += len(inputs)
+        self.total_time += (time.time() - self.delta_time)
+        for input, output in zip(inputs, outputs):
+            if len(output["instances"]) == 0:
+                seg_gt = self.mix_parts_of_instance(self.dataset_dicts[input['image_id']]['annotations'], (100, 100))
+                self.npos += seg_gt.shape[0]
+                for i in range(seg_gt.shape[0]):
+                    self.npart += len(np.unique(seg_gt[i]))
+                continue
+            w, h = output["instances"].pred_masks.size(1), output["instances"].pred_masks.size(2)
+            seg_gt = self.mix_parts_of_instance(self.dataset_dicts[input['image_id']]['annotations'], (w, h))
+            self.npos += seg_gt.size(0)
+            for i in range(seg_gt.size(0)):
+                self.npart += len(np.unique(seg_gt[i]))
+
+            seg_pred = output["instances"].pred_masks
+
+            list_mious = []
+            list_ious = []
+            for i in range(seg_pred.size(0)):
+                max_miou = 0
+                max_iou = []
+                max_iou_id = -1
+                a = seg_pred[i].clone().to('cpu')
+                for j in range(seg_gt.size(0)):
+                    b = seg_gt[j].clone().to('cpu')
+                    b[b >= self.num_classes] = 0
+
+                    seg_iou = cal_one_mean_iou(a.numpy().astype(np.uint8), b.numpy().astype(np.uint8), 7)
+                    # print(seg_iou)
+                    # seg_iou = seg_iou[b.unique().cpu().numpy().astype(np.uint8)]
+                    # seg_iou[seg_iou == 0] = np.nan
+                    mean_seg_iou = np.nanmean(seg_iou[0:])
+                    # print(mean_seg_iou)
+                    if mean_seg_iou > max_miou:
+                        max_miou = mean_seg_iou
+                        max_iou = seg_iou
+                        max_iou_id = j
+                # print(len(max_iou))
+                list_mious.append({"id": max_iou_id, "iou": max_miou, "iou_list": max_iou})
+
+            list_mious = sorted(list_mious, key=lambda x: x["iou"], reverse=True)
+            # print([f"{x['id']}:{x['iou']:.3f}" for x in list_mious])
+            for j in self.ovthresh_seg:
+                id_list = []
+                for i in list_mious:
+                    if i['id'] not in id_list:
+                        # print("aa", len(i['iou_list']))
+                        for k in range(len(i['iou_list'])):
+                            if i['iou_list'][k] == np.nan:
+                                continue
+                            if i['iou_list'][k] >= j:
+                                self.apr[j].add_tp()
+                            else:
+                                self.apr[j].add_fp()
+                        if i["iou"] >= j:
+                            id_list.append(i['id'])
+                            self.app[j].add_tp()
+                        else:
+                            self.app[j].add_fp()
+                    else:
+                        self.app[j].add_fp()
+
+
+            # plot_mask(seg_gt, self.dataset_dicts.colormap, 20, 2, os.path.join(self._output_dir, str(input['image_id']) + "_gt.png"))
+            # plot_mask(seg_pred, self.dataset_dicts.colormap, 20, 2, os.path.join(self._output_dir, str(input['image_id']) + "_pred.png"))
+            # img = input["image"].permute(1, 2, 0).cpu().numpy()
+            # img = (img * 255).astype(np.uint8)
+            # Image.fromarray(img).save(os.path.join(self._output_dir, str(input['image_id']) + ".png"))
+            # plt.show()
+        # self.evaluate()
+        self.delta_time = time.time()
+        # return self.evaluate()
+
+    def mix_parts_of_instance(self, instances, size):
+        person_ids = set()
+        for i in instances:
+            person_ids.add(i['parent_id'])
+
+        h, w = size
+        seg_mask = torch.zeros((len(person_ids), h, w))
+        # print(person_ids)
+        for i in person_ids:
+            for j in instances:
+                if j['parent_id'] == i:
+                    mask = poly_to_mask(j['segmentation'], w, h)
+                    mask = torch.from_numpy(mask)
+                    seg_mask[i] = torch.add(seg_mask[i], mask * (j['category_id'] + 0))
+
+        return seg_mask
+
+    def evaluate(self):
+        result = {}
+        app = []
+        apr = []
+        for i in self.ovthresh_seg:
+
+            result[f"APr_{i}"] = self.apr[i].eval(self.npart)
+            result[f"APp_{i}"] = self.app[i].eval(self.npos)
+            print(f"APr_{i} = {result[f'APr_{i}']:.3f}")
+            print(f"APp_{i} = {result[f'APp_{i}']:.3f}")
+            app.append(result[f"APp_{i}"])
+            apr.append(result[f"APr_{i}"])
+
+            # tp = np.array(self.tp[i])
+            # fp = np.array(self.fp[i])
+            # tp = np.cumsum(tp)
+            # fp = np.cumsum(fp)
+            # rec = tp / self.npos
+            # prec = tp / np.maximum(tp + fp, np.finfo(np.float64).eps)
+            #
+            # ap = voc_ap(rec, prec)
+            # print(f"APp@{i}: {ap:.3f}, {self.npos}, {tp[-1]}, {fp[-1]}")
+            # result[f"APp@{i}"] = ap
+
+        #result["APpvol"] = sum(result.values()) / len(result)
+        result["APpvol"] = sum(app) / len(app)
+        result["APrvol"] = sum(apr) / len(apr)
+        result["total_time"] = self.total_time
+        result["fps"] = self.num_images / self.total_time
+        # print(f"APpvol: {result['APpvol']:.3f}")
+        print(f"total_time: {result['total_time']:.2f}")
+        print(f"fps: {result['fps']:.2f}")
+        return result
diff --git a/adet/evaluation/parsing_evaluation.py b/adet/evaluation/parsing_evaluation.py
@@ -10,6 +10,7 @@
 import time
 
 
+
 def poly_to_mask(polygon, width, height):
     img = Image.new('L', (width, height), 0)
     for poly in polygon:
@@ -35,8 +36,11 @@ def plot_mask(mask, colormap, classes=20, row=1, mask_name=None):
     col = ((mask.size(0)) // row) + 2
     fig, ax = plt.subplots(col, row, figsize=(10, 10))
     for i in range(mask.size(0)):
-        prediction_colormap = decode_segmentation_masks(mask[i].squeeze().cpu().numpy(), colormap, classes)
-
+        mask[mask >= 7 ] = 0
+        prediction_colormap = decode_segmentation_masks(mask[i].squeeze().cpu().numpy(), colormap, 7)
+        #save the mask
+        if mask_name is not None:
+            Image.fromarray(prediction_colormap).save(mask_name+'_'+str(i)+'.png')
         ax[i // row, i % row].imshow(prediction_colormap)
     if mask_name is not None:
         plt.savefig(mask_name)
@@ -121,6 +125,10 @@ def process(self, inputs, outputs):
         self.num_images += len(inputs)
         self.total_time += (time.time() - self.delta_time)
         for input, output in zip(inputs, outputs):
+            # save input image
+
+
+
             # self.npos += len(self.dataset_dicts[input['image_id']]['annotations'])
             if len(output["instances"]) == 0:
                 seg_gt = self.mix_parts_of_instance(self.dataset_dicts[input['image_id']]['annotations'], (100, 100))
@@ -164,7 +172,7 @@ def process(self, inputs, outputs):
                     # print(seg_iou)
                     # seg_iou = seg_iou[b.unique().cpu().numpy().astype(np.uint8)]
                     # seg_iou[seg_iou == 0] = np.nan
-                    mean_seg_iou = np.nanmean(seg_iou[0:])
+                    mean_seg_iou = np.nanmean(seg_iou[1:])
                     # print(mean_seg_iou)
                     if mean_seg_iou > max_iou:
                         max_iou = mean_seg_iou
@@ -192,6 +200,9 @@ def process(self, inputs, outputs):
 
             # plot_mask(seg_gt, self.dataset_dicts.colormap, 20, 2, os.path.join(self._output_dir, str(input['image_id']) + "_gt.png"))
             # plot_mask(seg_pred, self.dataset_dicts.colormap, 20, 2, os.path.join(self._output_dir, str(input['image_id']) + "_pred.png"))
+            # img = input["image"].permute(1, 2, 0).cpu().numpy()
+            # img = (img * 255).astype(np.uint8)
+            # Image.fromarray(img).save(os.path.join(self._output_dir, str(input['image_id']) + ".png"))
             # plt.show()
         # self.evaluate()
         self.delta_time = time.time()