minor changes

ktzsh · ktzsh · commit 486ab8cb4baa · 2018-06-03T03:26:08.000-04:00
diff --git a/models_detection/KerasYOLO.py b/models_detection/KerasYOLO.py
@@ -49,7 +49,7 @@ class KerasYOLO:
     COORD_SCALE      = 1.0
     CLASS_SCALE      = 1.0
 
-    BATCH_SIZE       = 1
+    BATCH_SIZE       = 32
     WARM_UP_BATCHES  = 0
     TRUE_BOX_BUFFER  = 50
 
diff --git a/models_tracking/MultiObjDetTracker.py b/models_tracking/MultiObjDetTracker.py
@@ -12,7 +12,7 @@
 from keras.models import Sequential, Model
 from keras.layers import Reshape, Activation, Conv2D, Input, MaxPooling2D, BatchNormalization, Flatten, Dense, Lambda, ConvLSTM2D
 from keras.layers.advanced_activations import LeakyReLU
-from keras.callbacks import EarlyStopping, ModelCheckpoint, TensorBoard
+from keras.callbacks import EarlyStopping, ModelCheckpoint, TensorBoard, ReduceLROnPlateau
 from keras.optimizers import SGD, Adam, RMSprop
 from keras.layers.wrappers import TimeDistributed
 from keras.layers.merge import concatenate
@@ -80,8 +80,8 @@ class MultiObjDetTracker:
                     ]
 
     LABELS           = LABELS_MOT17
-    IMAGE_H, IMAGE_W = 608, 608 # 416
-    GRID_H,  GRID_W  = 19 , 19  # 13
+    IMAGE_H, IMAGE_W = 416, 416 # 416
+    GRID_H,  GRID_W  = 13 , 13  # 13
     BOX              = 5
     CLASS            = len(LABELS)
     CLASS_WEIGHTS    = np.ones(CLASS, dtype='float32')
@@ -101,6 +101,10 @@ class MultiObjDetTracker:
     SEQUENCE_LENGTH   = 4
     MAX_BOX_PER_IMAGE = 50
 
+    LOAD_MODEL        = True
+    INITIAL_EPOCH     = 0
+    SAVED_MODEL_PATH  = 'models/MultiObjDetTracker-CHKPNT-03-0.55.hdf5'
+
     # train_image_folder = 'data/ImageNet-ObjectDetection/ILSVRC2015Train/Data/VID/train/'
     # train_annot_folder = 'data/ImageNet-ObjectDetection/ILSVRC2015Train/Annotations/VID/train/'
     # valid_image_folder = 'data/ImageNet-ObjectDetection/ILSVRC2015Train/Data/VID/val/'
@@ -117,14 +121,16 @@ class MultiObjDetTracker:
 
     def __init__(self, argv={}):
         argv['LABELS']        = self.LABELS
-        argv['BATCH_SIZE']    = self.BATCH_SIZE
+        argv['BATCH_SIZE']    = self.BATCH_SIZE * self.SEQUENCE_LENGTH
         argv['IMAGE_H']       = self.IMAGE_H
         argv['IMAGE_W']       = self.IMAGE_W
         argv['GRID_H']        = self.GRID_H
         argv['GRID_W']        = self.GRID_W
 
         self.detector = KerasYOLO(argv)
         self.load_model()
+        if self.LOAD_MODEL:
+            self.load_weights()
 
     def loss_fxn(self, y_true, y_pred, tboxes, message=''):
         return self.detector.loss_fxn(y_true, y_pred, tboxes, message=message)
@@ -167,7 +173,7 @@ def load_model(self):
         output_det = TimeDistributed(Reshape((self.GRID_H, self.GRID_W, self.BOX, 4 + 1 + self.CLASS)), name='detection')(x_bbox)
 
         z = concatenate([x_bbox, x_vis])
-        z_vis = ConvLSTM2D(1024, (3,3), strides=(1,1), padding='same', return_sequences=True, name='tconv_lstm')(z)
+        z_vis = ConvLSTM2D(512, (3,3), strides=(1,1), padding='same', return_sequences=True, name='tconv_lstm')(z)
 
         # z = TimeDistributed(Conv2D(1024, (3,3), strides=(1,1), padding='same', use_bias=False, name='tconv_1'), name='timedist_tconv1')(z)
         # z = TimeDistributed(BatchNormalization(name='tnorm_1'), name='timedist_tnorm')(z)
@@ -207,7 +213,7 @@ def load_data_generators(self, generator_config):
                pickle.dump(valid_imgs, fp)
 
 
-        train_batch = BatchSequenceGenerator1(train_imgs, generator_config, norm=normalize, shuffle=True, augment=False)
+        train_batch = BatchSequenceGenerator1(train_imgs, generator_config, norm=normalize, shuffle=True, augment=True)
         valid_batch = BatchSequenceGenerator1(valid_imgs, generator_config, norm=normalize, augment=False)
 
         return train_batch, valid_batch
@@ -244,38 +250,47 @@ def train(self):
                                    mode      = 'min',
                                    verbose   = 1)
 
-        checkpoint = ModelCheckpoint('weights/WEIGHTS_MultiObjDetTracker.h5',
+        checkpoint = ModelCheckpoint('models/MultiObjDetTracker-CHKPNT-{epoch:02d}-{val_loss:.2f}.hdf5',
                                      monitor        = 'val_loss',
                                      verbose        = 1,
-                                     save_best_only = True,
+                                     save_best_only = False,
                                      # save_weights_only = True,
                                      mode           = 'min',
                                      period         = 1)
 
+        reduce_lr = ReduceLROnPlateau(monitor  = 'val_loss',
+                                      factor   = 0.5,
+                                      patience = 2,
+                                      verbose  = 1,
+                                      mode     = 'auto',
+                                      min_lr   = 1e-5)
+
         tb_counter  = len([log for log in os.listdir(os.path.expanduser('./logs/')) if 'MultiObjDetTracker_' in log]) + 1
         tensorboard = TensorBoard(log_dir        = os.path.expanduser('./logs/') + 'MultiObjDetTracker_' + str(tb_counter),
                                   histogram_freq = 0,
                                   write_graph    = True,
                                   write_images   = False)
 
-        optimizer = Adam(lr=1e-5, beta_1=0.9, beta_2=0.999, epsilon=1e-08, decay=0.0)
+        optimizer = Adam(lr=1e-4, beta_1=0.9, beta_2=0.999, epsilon=1e-08, decay=0.0)
         #optimizer = SGD(lr=1e-4, decay=0.0005, momentum=0.9)
         #optimizer = RMSprop(lr=1e-4, rho=0.9, epsilon=1e-08, decay=0.0)
 
-        self.model.compile(loss=[self.custom_loss_ttrack, self.custom_loss_dtrack], loss_weights=[1.5, 1.0], optimizer=optimizer)
+        self.model.compile(loss=[self.custom_loss_ttrack, self.custom_loss_dtrack], loss_weights=[0.7, 0.3], optimizer=optimizer)
         self.model.fit_generator(
                     generator        = train_batch,
                     steps_per_epoch  = len(train_batch),
                     epochs           = 100,
                     verbose          = 1,
                     validation_data  = valid_batch,
                     validation_steps = len(valid_batch),
-                    callbacks        = [early_stop, checkpoint, tensorboard],
-                    max_queue_size   = 3)
+                    callbacks        = [early_stop, checkpoint, tensorboard, reduce_lr],
+                    max_queue_size   = 3,
+                    initial_epoch    = self.INITIAL_EPOCH)
 
 
-    def load_weights(self, weight_path):
-        self.model.load_weights(weight_path)
+    def load_weights(self):
+        self.model.load_weights(self.SAVED_MODEL_PATH)
+        self.INITIAL_EPOCH = int(self.SAVED_MODEL_PATH.split('-')[2])
 
     def predict(self, input_paths, output_paths):
         assert len(input_paths)==self.SEQUENCE_LENGTH
diff --git a/utility/motd_to_pascal.py b/utility/motd_to_pascal.py
@@ -59,60 +59,67 @@ def instance_to_xml(obj):
 
 def create_annotations(validation_split):
     anns = []
-    ann_dir = 'data/MOT17/MOT17DetLabels/train/'
-    for (dirpath, dirnames, filenames) in os.walk(ann_dir):
-        if len(filenames)==0:
-            continue
-        for filename in sorted(filenames):
-            if filename.endswith('.ini')==True:
-                ann      = {}
-                seq_info = dirpath + '/' + filename
-                with open(seq_info) as f:
-                    lines         = f.readlines()
-                    ann['folder'] = lines[1].rstrip('\n').split('=')[-1]
-                    ann['imdir']  = lines[2].rstrip('\n').split('=')[-1]
-                    ann['length'] = lines[4].rstrip('\n').split('=')[-1]
-                    ann['width']  = lines[5].rstrip('\n').split('=')[-1]
-                    ann['height'] = lines[6].rstrip('\n').split('=')[-1]
-                    ann['imext']  = lines[7].rstrip('\n').split('=')[-1]
-                anns.append(ann)
+    ann_dirs = ['data/MOT17/MOT17DetLabels/train/', 'data/MOT17/MOT17DetLabels/test/']
+    for ann_dir in ann_dirs:
+        for (dirpath, dirnames, filenames) in os.walk(ann_dir):
+            if len(filenames)==0:
+                continue
+            for filename in sorted(filenames):
+                if filename.endswith('.ini')==True:
+                    ann      = {}
+                    seq_info = dirpath + '/' + filename
+                    with open(seq_info) as f:
+                        lines         = f.readlines()
+                        ann['folder'] = lines[1].rstrip('\n').split('=')[-1]
+                        ann['imdir']  = lines[2].rstrip('\n').split('=')[-1]
+                        ann['length'] = lines[4].rstrip('\n').split('=')[-1]
+                        ann['width']  = lines[5].rstrip('\n').split('=')[-1]
+                        ann['height'] = lines[6].rstrip('\n').split('=')[-1]
+                        ann['imext']  = lines[7].rstrip('\n').split('=')[-1]
+                    anns.append(ann)
 
-    for ann in anns:
-        xml_data = {}
-        gt_path  = 'data/MOT17/MOT17DetLabels/train/' + ann['folder'] + '/gt/gt.txt'
-        with open(gt_path) as f:
-            lines = f.readlines()
-            for line in lines:
-                frame, tid, xmin, ymin, width, height, score, class_id, visibility = line.rstrip('\n').split(',')
-                if frame not in xml_data:
-                    xml_data[frame] = []
-                obj = {}
-                obj['trackid'] = tid
-                obj['xmin']    = xmin
-                obj['ymin']    = ymin
-                obj['xmax']    = str(int(xmin) + int(width))
-                obj['ymax']    = str(int(ymin) + int(height))
-                obj['name']    = class_id
-                xml_data[frame].append(obj)
+        for ann in anns:
+            xml_data = {}
+            gt_path  = ann_dir + ann['folder'] + '/gt/gt.txt'
+            with open(gt_path) as f:
+                lines = f.readlines()
+                for line in lines:
+                    frame, tid, xmin, ymin, width, height, score, class_id, visibility = line.rstrip('\n').split(',')
+                    if frame not in xml_data:
+                        xml_data[frame] = []
+                    obj = {}
+                    obj['trackid'] = tid
+                    obj['xmin']    = xmin
+                    obj['ymin']    = ymin
+                    obj['xmax']    = str(int(xmin) + int(width))
+                    obj['ymax']    = str(int(ymin) + int(height))
+                    obj['name']    = class_id
+                    xml_data[frame].append(obj)
 
-        count  = 1
-        length = len(xml_data)
-        for frame in sorted(xml_data.keys(), key = lambda x: int(x)):
-            annotation = root(ann['folder'] + '/' + ann['imdir'], frame.zfill(6) + ann['imext'], ann['width'], ann['height'])
-            for instance in xml_data[frame]:
-                annotation.append(instance_to_xml(instance))
+            count  = 1
+            length = len(xml_data)
+            for frame in sorted(xml_data.keys(), key = lambda x: int(x)):
+                annotation = root(ann['folder'] + '/' + ann['imdir'], frame.zfill(6) + ann['imext'], ann['width'], ann['height'])
+                for instance in xml_data[frame]:
+                    annotation.append(instance_to_xml(instance))
 
-            if count<=((1-validation_split)*length):
-                if not os.path.isdir('data/MOT17Ann/train/' + ann['folder']):
-                    os.makedirs('data/MOT17Ann/train/' + ann['folder'])
-                outfile = 'data/MOT17Ann/train/' + ann['folder'] + '/{}.xml'.format(frame.zfill(6))
-                etree.ElementTree(annotation).write(outfile, pretty_print=True)
-            else:
-                if not os.path.isdir('data/MOT17Ann/val/' + ann['folder']):
-                    os.makedirs('data/MOT17Ann/val/' + ann['folder'])
-                outfile = 'data/MOT17Ann/val/' + ann['folder'] + '/{}.xml'.format(frame.zfill(6))
-                etree.ElementTree(annotation).write(outfile, pretty_print=True)
-            count += 1
+                if ann_dir.split('/')[-2] == 'train':
+                    if count<=((1-validation_split)*length):
+                        if not os.path.isdir('data/MOT17Ann/train/' + ann['folder']):
+                            os.makedirs('data/MOT17Ann/train/' + ann['folder'])
+                        outfile = 'data/MOT17Ann/train/' + ann['folder'] + '/{}.xml'.format(frame.zfill(6))
+                        etree.ElementTree(annotation).write(outfile, pretty_print=True)
+                    else:
+                        if not os.path.isdir('data/MOT17Ann/val/' + ann['folder']):
+                            os.makedirs('data/MOT17Ann/val/' + ann['folder'])
+                        outfile = 'data/MOT17Ann/val/' + ann['folder'] + '/{}.xml'.format(frame.zfill(6))
+                        etree.ElementTree(annotation).write(outfile, pretty_print=True)
+                    count += 1
+                else:
+                    if not os.path.isdir('data/MOT17Ann/test/' + ann['folder']):
+                        os.makedirs('data/MOT17Ann/test/' + ann['folder'])
+                    outfile = 'data/MOT17Ann/test/' + ann['folder'] + '/{}.xml'.format(frame.zfill(6))
+                    etree.ElementTree(annotation).write(outfile, pretty_print=True)
 
 if __name__=="__main__":
 
diff --git a/utility/preprocessing.py b/utility/preprocessing.py
@@ -279,9 +279,9 @@ def output_from_instance(self, train_instance, idx):
                                 0, 1.2e-3 * img.shape[0],
                                 (0,255,0), 2)
 
-            if not os.path.isdir('data/self.debug/' + str(idx)):
-                os.makedirs('data/self.debug/' + str(idx))
-            file_path = 'data/self.debug/' + str(idx) + '/' + train_instance['filename'].split('/')[-1]
+            if not os.path.isdir('data/debug/' + str(idx)):
+                os.makedirs('data/debug/' + str(idx))
+            file_path = 'data/debug/' + str(idx) + '/' + train_instance['filename'].split('/')[-1]
             cv2.imwrite(file_path, img)
 
         # assign input image to x
@@ -466,9 +466,9 @@ def output_from_instance(self, train_instance, idx):
                                 0, 1.2e-3 * img.shape[0],
                                 (0,255,0), 2)
 
-            if not os.path.isdir('data/self.debug/' + str(idx)):
-                os.makedirs('data/self.debug/' + str(idx))
-            file_path = 'data/self.debug/' + str(idx) + '/' + train_instance['filename'].split('/')[-1]
+            if not os.path.isdir('data/debug/' + str(idx)):
+                os.makedirs('data/debug/' + str(idx))
+            file_path = 'data/debug/' + str(idx) + '/' + train_instance['filename'].split('/')[-1]
             cv2.imwrite(file_path, img)
 
         # assign input to x
@@ -504,5 +504,5 @@ def __getitem__(self, idx):
 
     def on_epoch_end(self):
         os.rmdir('data/tmp/')
-        os.rmdir('data/self.debug/')
+        os.rmdir('data/debug/')
         super(BatchSequenceGenerator2, self).on_epoch_end()