Update YOLO-augmentation

koba-jon · koba-jon · commit bf7d49cffa41 · 2021-03-08T01:29:29.000+09:00
diff --git a/Object_Detection/YOLOv1/CMakeLists.txt b/Object_Detection/YOLOv1/CMakeLists.txt
@@ -19,7 +19,7 @@ set(SRCS
     ${SRC_DIR}/loss.cpp
     ${SRC_DIR}/networks.cpp
     ${SRC_DIR}/detector.cpp
-    ${SRC_DIR}/preprocess.cpp
+    ${SRC_DIR}/augmentation.cpp
 )
 
 add_subdirectory(${SUB_DIR} build)
diff --git a/Object_Detection/YOLOv1/src/augmentation.cpp b/Object_Detection/YOLOv1/src/augmentation.cpp
@@ -8,14 +8,15 @@
 #include <opencv2/opencv.hpp>
 #include <omp.h>
 // For Original Header
-#include "preprocess.hpp"
+#include "augmentation.hpp"
 #include "transforms.hpp"
 
 
 // ------------------------------------------------------------------
-// class{YOLOPreprocessImpl}(transforms::ComposeImpl) -> constructor
+// class{YOLOAugmentationImpl}(transforms::ComposeImpl) -> constructor
 // ------------------------------------------------------------------
-YOLOPreprocessImpl::YOLOPreprocessImpl(const double flip_rate_, const double scale_rate_, const double blur_rate_, const double brightness_rate_, const double hue_rate_, const double saturation_rate_, const double shift_rate_, const double crop_rate_){
+YOLOAugmentationImpl::YOLOAugmentationImpl(const double jitter_, const double flip_rate_, const double scale_rate_, const double blur_rate_, const double brightness_rate_, const double hue_rate_, const double saturation_rate_, const double shift_rate_, const double crop_rate_){
+    this->jitter = jitter_;
     this->flip_rate = flip_rate_;
     this->scale_rate = scale_rate_;
     this->blur_rate = blur_rate_;
@@ -29,9 +30,9 @@ YOLOPreprocessImpl::YOLOPreprocessImpl(const double flip_rate_, const double sca
 
 
 // --------------------------------------------------------------------------
-// class{YOLOPreprocessImpl}(transforms::ComposeImpl) -> function{deepcopy}
+// class{YOLOAugmentationImpl}(transforms::ComposeImpl) -> function{deepcopy}
 // --------------------------------------------------------------------------
-void YOLOPreprocessImpl::deepcopy(cv::Mat &data_in1, std::tuple<torch::Tensor, torch::Tensor> &data_in2, cv::Mat &data_out1, std::tuple<torch::Tensor, torch::Tensor> &data_out2){
+void YOLOAugmentationImpl::deepcopy(cv::Mat &data_in1, std::tuple<torch::Tensor, torch::Tensor> &data_in2, cv::Mat &data_out1, std::tuple<torch::Tensor, torch::Tensor> &data_out2){
     data_in1.copyTo(data_out1);
     if (std::get<0>(data_in2).numel() > 0){
         data_out2 = {std::get<0>(data_in2).clone(), std::get<1>(data_in2).clone()};
@@ -44,9 +45,9 @@ void YOLOPreprocessImpl::deepcopy(cv::Mat &data_in1, std::tuple<torch::Tensor, t
 
 
 // --------------------------------------------------------------------------
-// class{YOLOPreprocessImpl}(transforms::ComposeImpl) -> function{random_flip}
+// class{YOLOAugmentationImpl}(transforms::ComposeImpl) -> function{random_flip}
 // --------------------------------------------------------------------------
-void YOLOPreprocessImpl::random_flip(cv::Mat &data_in1, std::tuple<torch::Tensor, torch::Tensor> &data_in2, cv::Mat &data_out1, std::tuple<torch::Tensor, torch::Tensor> &data_out2){
+void YOLOAugmentationImpl::random_flip(cv::Mat &data_in1, std::tuple<torch::Tensor, torch::Tensor> &data_in2, cv::Mat &data_out1, std::tuple<torch::Tensor, torch::Tensor> &data_out2){
 
     size_t i, j, k;
     size_t i_flip;
@@ -88,9 +89,9 @@ void YOLOPreprocessImpl::random_flip(cv::Mat &data_in1, std::tuple<torch::Tensor
 
 
 // --------------------------------------------------------------------------
-// class{YOLOPreprocessImpl}(transforms::ComposeImpl) -> function{random_scale}
+// class{YOLOAugmentationImpl}(transforms::ComposeImpl) -> function{random_scale}
 // --------------------------------------------------------------------------
-void YOLOPreprocessImpl::random_scale(cv::Mat &data_in1, std::tuple<torch::Tensor, torch::Tensor> &data_in2, cv::Mat &data_out1, std::tuple<torch::Tensor, torch::Tensor> &data_out2){
+void YOLOAugmentationImpl::random_scale(cv::Mat &data_in1, std::tuple<torch::Tensor, torch::Tensor> &data_in2, cv::Mat &data_out1, std::tuple<torch::Tensor, torch::Tensor> &data_out2){
 
     size_t width, height;
     std::uniform_real_distribution<double> urand(0.8, 1.2);
@@ -115,9 +116,9 @@ void YOLOPreprocessImpl::random_scale(cv::Mat &data_in1, std::tuple<torch::Tenso
 
 
 // --------------------------------------------------------------------------
-// class{YOLOPreprocessImpl}(transforms::ComposeImpl) -> function{random_blur}
+// class{YOLOAugmentationImpl}(transforms::ComposeImpl) -> function{random_blur}
 // --------------------------------------------------------------------------
-void YOLOPreprocessImpl::random_blur(cv::Mat &data_in1, std::tuple<torch::Tensor, torch::Tensor> &data_in2, cv::Mat &data_out1, std::tuple<torch::Tensor, torch::Tensor> &data_out2){
+void YOLOAugmentationImpl::random_blur(cv::Mat &data_in1, std::tuple<torch::Tensor, torch::Tensor> &data_in2, cv::Mat &data_out1, std::tuple<torch::Tensor, torch::Tensor> &data_out2){
 
     size_t ksize;
     std::uniform_int_distribution<int> urand(2, 5);
@@ -141,9 +142,9 @@ void YOLOPreprocessImpl::random_blur(cv::Mat &data_in1, std::tuple<torch::Tensor
 
 
 // --------------------------------------------------------------------------
-// class{YOLOPreprocessImpl}(transforms::ComposeImpl) -> function{random_brightness}
+// class{YOLOAugmentationImpl}(transforms::ComposeImpl) -> function{random_brightness}
 // --------------------------------------------------------------------------
-void YOLOPreprocessImpl::random_brightness(cv::Mat &data_in1, std::tuple<torch::Tensor, torch::Tensor> &data_in2, cv::Mat &data_out1, std::tuple<torch::Tensor, torch::Tensor> &data_out2){
+void YOLOAugmentationImpl::random_brightness(cv::Mat &data_in1, std::tuple<torch::Tensor, torch::Tensor> &data_in2, cv::Mat &data_out1, std::tuple<torch::Tensor, torch::Tensor> &data_out2){
 
     cv::Mat data_mid1, HSV, V;
     std::vector<cv::Mat> HSV_vec;
@@ -173,9 +174,9 @@ void YOLOPreprocessImpl::random_brightness(cv::Mat &data_in1, std::tuple<torch::
 
 
 // --------------------------------------------------------------------------
-// class{YOLOPreprocessImpl}(transforms::ComposeImpl) -> function{random_hue}
+// class{YOLOAugmentationImpl}(transforms::ComposeImpl) -> function{random_hue}
 // --------------------------------------------------------------------------
-void YOLOPreprocessImpl::random_hue(cv::Mat &data_in1, std::tuple<torch::Tensor, torch::Tensor> &data_in2, cv::Mat &data_out1, std::tuple<torch::Tensor, torch::Tensor> &data_out2){
+void YOLOAugmentationImpl::random_hue(cv::Mat &data_in1, std::tuple<torch::Tensor, torch::Tensor> &data_in2, cv::Mat &data_out1, std::tuple<torch::Tensor, torch::Tensor> &data_out2){
 
     cv::Mat data_mid1, HSV, H;
     std::vector<cv::Mat> HSV_vec;
@@ -205,9 +206,9 @@ void YOLOPreprocessImpl::random_hue(cv::Mat &data_in1, std::tuple<torch::Tensor,
 
 
 // --------------------------------------------------------------------------
-// class{YOLOPreprocessImpl}(transforms::ComposeImpl) -> function{random_saturation}
+// class{YOLOAugmentationImpl}(transforms::ComposeImpl) -> function{random_saturation}
 // --------------------------------------------------------------------------
-void YOLOPreprocessImpl::random_saturation(cv::Mat &data_in1, std::tuple<torch::Tensor, torch::Tensor> &data_in2, cv::Mat &data_out1, std::tuple<torch::Tensor, torch::Tensor> &data_out2){
+void YOLOAugmentationImpl::random_saturation(cv::Mat &data_in1, std::tuple<torch::Tensor, torch::Tensor> &data_in2, cv::Mat &data_out1, std::tuple<torch::Tensor, torch::Tensor> &data_out2){
 
     cv::Mat data_mid1, HSV, S;
     std::vector<cv::Mat> HSV_vec;
@@ -237,9 +238,9 @@ void YOLOPreprocessImpl::random_saturation(cv::Mat &data_in1, std::tuple<torch::
 
 
 // --------------------------------------------------------------------------
-// class{YOLOPreprocessImpl}(transforms::ComposeImpl) -> function{random_shift}
+// class{YOLOAugmentationImpl}(transforms::ComposeImpl) -> function{random_shift}
 // --------------------------------------------------------------------------
-void YOLOPreprocessImpl::random_shift(cv::Mat &data_in1, std::tuple<torch::Tensor, torch::Tensor> &data_in2, cv::Mat &data_out1, std::tuple<torch::Tensor, torch::Tensor> &data_out2){
+void YOLOAugmentationImpl::random_shift(cv::Mat &data_in1, std::tuple<torch::Tensor, torch::Tensor> &data_in2, cv::Mat &data_out1, std::tuple<torch::Tensor, torch::Tensor> &data_out2){
 
     int i, j, k, i_in, j_in;
     int dx, dy;
@@ -259,8 +260,8 @@ void YOLOPreprocessImpl::random_shift(cv::Mat &data_in1, std::tuple<torch::Tenso
     width = data_in1.cols;
     height = data_in1.rows;
     channels = data_in1.channels();
-    dx = (int)(urand1(this->mt.at(thread_num)) * (double)width * 0.2);
-    dy = (int)(urand1(this->mt.at(thread_num)) * (double)height * 0.2);
+    dx = (int)(urand1(this->mt.at(thread_num)) * (double)width * this->jitter);
+    dy = (int)(urand1(this->mt.at(thread_num)) * (double)height * this->jitter);
 
     // (1) Shifting of Image
     data_out1 = cv::Mat(cv::Size(width, height), data_in1.type());
@@ -343,9 +344,9 @@ void YOLOPreprocessImpl::random_shift(cv::Mat &data_in1, std::tuple<torch::Tenso
 
 
 // --------------------------------------------------------------------------
-// class{YOLOPreprocessImpl}(transforms::ComposeImpl) -> function{random_crop}
+// class{YOLOAugmentationImpl}(transforms::ComposeImpl) -> function{random_crop}
 // --------------------------------------------------------------------------
-void YOLOPreprocessImpl::random_crop(cv::Mat &data_in1, std::tuple<torch::Tensor, torch::Tensor> &data_in2, cv::Mat &data_out1, std::tuple<torch::Tensor, torch::Tensor> &data_out2){
+void YOLOAugmentationImpl::random_crop(cv::Mat &data_in1, std::tuple<torch::Tensor, torch::Tensor> &data_in2, cv::Mat &data_out1, std::tuple<torch::Tensor, torch::Tensor> &data_out2){
 
     int i, j, k, i_in, j_in;
     int dx, dy;
@@ -447,9 +448,9 @@ void YOLOPreprocessImpl::random_crop(cv::Mat &data_in1, std::tuple<torch::Tensor
 
 
 // -----------------------------------------------------------------
-// class{YOLOPreprocessImpl}(transforms::ComposeImpl) -> function{forward}
+// class{YOLOAugmentationImpl}(transforms::ComposeImpl) -> function{forward}
 // -----------------------------------------------------------------
-void YOLOPreprocessImpl::forward(cv::Mat &data_in1, std::tuple<torch::Tensor, torch::Tensor> &data_in2, cv::Mat &data_out1, std::tuple<torch::Tensor, torch::Tensor> &data_out2){
+void YOLOAugmentationImpl::forward(cv::Mat &data_in1, std::tuple<torch::Tensor, torch::Tensor> &data_in2, cv::Mat &data_out1, std::tuple<torch::Tensor, torch::Tensor> &data_out2){
 
     // --------------------------------------
     // 1. Parallel Processing Settings
@@ -468,7 +469,7 @@ void YOLOPreprocessImpl::forward(cv::Mat &data_in1, std::tuple<torch::Tensor, to
     size_t thread_num = omp_get_thread_num();
 
     // --------------------------------------
-    // 2. Pre-processing (Data Augmentation)
+    // 2. Data Augmentation
     // --------------------------------------
 
     cv::Mat data_mid1;
diff --git a/Object_Detection/YOLOv1/src/augmentation.hpp b/Object_Detection/YOLOv1/src/augmentation.hpp
@@ -1,5 +1,5 @@
-#ifndef PREPROCESS_HPP
-#define PREPROCESS_HPP
+#ifndef AUGMENTATION_HPP
+#define AUGMENTATION_HPP
 
 #include <tuple>
 #include <vector>
@@ -13,11 +13,12 @@
 
 
 // ----------------------------------------------------
-// class{YOLOPreprocessImpl}(transforms::ComposeImpl)
+// class{YOLOAugmentationImpl}(transforms::ComposeImpl)
 // ----------------------------------------------------
-#define YOLOPreprocess std::make_shared<YOLOPreprocessImpl>
-class YOLOPreprocessImpl : public transforms::ComposeImpl{
+#define YOLOAugmentation std::make_shared<YOLOAugmentationImpl>
+class YOLOAugmentationImpl : public transforms::ComposeImpl{
 private:
+    double jitter;
     double flip_rate, scale_rate, blur_rate, brightness_rate, hue_rate, saturation_rate, shift_rate, crop_rate;
     std::vector<std::mt19937> mt;
     void deepcopy(cv::Mat &data_in1, std::tuple<torch::Tensor, torch::Tensor> &data_in2, cv::Mat &data_out1, std::tuple<torch::Tensor, torch::Tensor> &data_out2);
@@ -30,7 +31,7 @@ class YOLOPreprocessImpl : public transforms::ComposeImpl{
     void random_shift(cv::Mat &data_in1, std::tuple<torch::Tensor, torch::Tensor> &data_in2, cv::Mat &data_out1, std::tuple<torch::Tensor, torch::Tensor> &data_out2);
     void random_crop(cv::Mat &data_in1, std::tuple<torch::Tensor, torch::Tensor> &data_in2, cv::Mat &data_out1, std::tuple<torch::Tensor, torch::Tensor> &data_out2);
 public:
-    YOLOPreprocessImpl(const double flip_rate_=0.5, const double scale_rate_=0.5, const double blur_rate_=0.5, const double brightness_rate_=0.5, const double hue_rate_=0.5, const double saturation_rate_=0.5, const double shift_rate_=0.5, const double crop_rate_=0.5);
+    YOLOAugmentationImpl(const double jitter_=0.2, const double flip_rate_=0.5, const double scale_rate_=0.5, const double blur_rate_=0.5, const double brightness_rate_=0.5, const double hue_rate_=0.5, const double saturation_rate_=0.5, const double shift_rate_=0.5, const double crop_rate_=0.5);
     bool type() override{return CV_MAT;}
     void forward(cv::Mat &data_in1, std::tuple<torch::Tensor, torch::Tensor> &data_in2, cv::Mat &data_out1, std::tuple<torch::Tensor, torch::Tensor> &data_out2) override;
 };
diff --git a/Object_Detection/YOLOv1/src/main.cpp b/Object_Detection/YOLOv1/src/main.cpp
@@ -11,7 +11,7 @@
 #include <boost/program_options.hpp>   // boost::program_options
 // For Original Header
 #include "networks.hpp"                // YOLOv1
-#include "preprocess.hpp"              // YOLOPreprocess
+#include "augmentation.hpp"            // YOLOAugmentation
 #include "transforms.hpp"              // transforms
 
 // Define Namespace
@@ -61,6 +61,16 @@ po::options_description parse_arguments(){
         ("batch_size", po::value<size_t>()->default_value(32), "training batch size")
         ("train_load_epoch", po::value<std::string>()->default_value(""), "epoch of model to resume learning")
         ("save_epoch", po::value<size_t>()->default_value(20), "frequency of epoch to save model and optimizer")
+        /*************************** Data Augmentation ***************************/
+        ("jitter", po::value<double>()->default_value(0.2), "the distortion of image shifting")
+        ("flip_rate", po::value<double>()->default_value(0.5), "frequency to flip")
+        ("scale_rate", po::value<double>()->default_value(0.5), "frequency to scale")
+        ("blur_rate", po::value<double>()->default_value(0.5), "frequency to blur")
+        ("brightness_rate", po::value<double>()->default_value(0.5), "frequency to change brightness")
+        ("hue_rate", po::value<double>()->default_value(0.5), "frequency to change hue")
+        ("saturation_rate", po::value<double>()->default_value(0.5), "frequency to change saturation")
+        ("shift_rate", po::value<double>()->default_value(0.5), "frequency to shift")
+        ("crop_rate", po::value<double>()->default_value(0.5), "frequency to crop")
 
         // (3) Define for Validation
         ("valid", po::value<bool>()->default_value(false), "validation mode on/off")
@@ -145,7 +155,17 @@ int main(int argc, const char *argv[]){
 
     // (4) Set Transforms
     std::vector<transforms_Compose> transformBB{
-        YOLOPreprocess()  // apply "flip", "scale", "blur", "brightness", "hue", "saturation", "shift", "crop"
+        YOLOAugmentation(  // apply "flip", "scale", "blur", "brightness", "hue", "saturation", "shift", "crop"
+            vm["jitter"].as<double>(),
+            vm["flip_rate"].as<double>(),
+            vm["scale_rate"].as<double>(),
+            vm["blur_rate"].as<double>(),
+            vm["brightness_rate"].as<double>(),
+            vm["hue_rate"].as<double>(),
+            vm["saturation_rate"].as<double>(),
+            vm["shift_rate"].as<double>(),
+            vm["crop_rate"].as<double>()
+        )
     };
     std::vector<transforms_Compose> transformI{
         transforms_Resize(cv::Size(vm["size"].as<size_t>(), vm["size"].as<size_t>()), cv::INTER_LINEAR),  // {IH,IW,C} ===method{OW,OH}===> {OH,OW,C}

Original file line number	Diff line number	Diff line change
`@@ -19,7 +19,7 @@ set(SRCS`
`19`	`19`	`${SRC_DIR}/loss.cpp`
`20`	`20`	`${SRC_DIR}/networks.cpp`
`21`	`21`	`${SRC_DIR}/detector.cpp`
`22`		`- ${SRC_DIR}/preprocess.cpp`
	`22`	`+ ${SRC_DIR}/augmentation.cpp`
`23`	`23`	`)`
`24`	`24`
`25`	`25`	`add_subdirectory(${SUB_DIR} build)`