Merge pull request #49 from naseemap47/qat

Qat
naseemap47 · Jan 19, 2024 · 1685fe2 · 1685fe2
2 parents 3e17b96 + 332942e
commit 1685fe2
Show file tree

Hide file tree

Showing 5 changed files with 277 additions and 25 deletions.
diff --git a/Dockerfile b/Dockerfile
@@ -9,4 +9,6 @@ RUN apt-get update && \
     libsm6 \
     libxext6
 WORKDIR /home
-RUN pip install super-gradients
+RUN pip install torch==1.11.0+cu113 torchvision==0.12.0+cu113 torchaudio==0.11.0 --extra-index-url https://download.pytorch.org/whl/cu113
+RUN pip install pytorch-quantization==2.1.2 --extra-index-url https://pypi.ngc.nvidia.com
+RUN pip install super-gradients==3.1.3
diff --git a/README.md b/README.md
@@ -40,10 +40,10 @@ cd YOLO-NAS
 ```
 conda create -n yolo-nas python=3.9 -y
 conda activate yolo-nas
-pip install torch==1.11.0+cu113 torchvision==0.12.0+cu113 torchaudio==0.11.0 --extra-index-url https://download.pytorch.org/whl/cu113
+conda install pytorch==1.12.1 torchvision==0.13.1 torchaudio==0.12.1 cudatoolkit=11.3 -c pytorch -y
+# For Quantization Aware Training
 pip install pytorch-quantization==2.1.2 --extra-index-url https://pypi.ngc.nvidia.com
 pip install super-gradients==3.1.3
-pip install urllib3==1.25.9
 ```
 #### OR
 ```
@@ -102,7 +102,7 @@ You can train your **YOLO-NAS** model with **Single Command Line**
   `-s`, `--size`: Input image size <br>
   `-j`, `--worker`: Training number of workers <br>
   `-m`, `--model`: Model type (Choices: `yolo_nas_s`, `yolo_nas_m`, `yolo_nas_l`) <br>
-  `-w`, `--weight`: path to pre-trained model weight (default: `coco` weight) <br>
+  `-w`, `--weight`: path to pre-trained model weight (`ckpt_best.pth`) (default: `coco` weight) <br>
   `--gpus`: Train on multiple gpus <br>
   `--cpu`: Train on CPU <br>
   `--resume`: To resume model training <br>
@@ -122,6 +122,10 @@ You can train your **YOLO-NAS** model with **Single Command Line**
 **Example:**
 ```
 python3 train.py --data /dir/dataset/data.yaml --batch 6 --epoch 100 --model yolo_nas_m --size 640
+
+# From Pre-trained weight
+python3 train.py --data /dir/dataset/data.yaml --batch 6 --epoch 100 --model yolo_nas_m --size 640 \
+                 --weight runs/train2/ckpt_latest.pth
 ```
 ### If your training ends in 65th epoch (total 100 epochs), now you can start from 65th epoch and complete your 100 epochs training.
 **Example:**
@@ -130,6 +134,38 @@ python3 train.py --data /dir/dataset/data.yaml --batch 6 --epoch 100 --model yol
                  --weight runs/train2/ckpt_latest.pth --resume
 ```
 
+### Quantization Aware Training
+
+<details>
+  <summary>Args</summary>
+
+  `-i`, `--data`: path to data.yaml <br>
+  `-b`, `--batch`: Training batch size <br>
+  `-e`, `--epoch`: number of training epochs.<br>
+  `-s`, `--size`: Input image size <br>
+  `-j`, `--worker`: Training number of workers <br>
+  `-m`, `--model`: Model type (Choices: `yolo_nas_s`, `yolo_nas_m`, `yolo_nas_l`) <br>
+  `-w`, `--weight`: path to pre-trained model weight (`ckpt_best.pth`) <br>
+  `--gpus`: Train on multiple gpus <br>
+  `--cpu`: Train on CPU <br>
+
+  **Other Training Parameters:**<br>
+  `--warmup_mode`: Warmup Mode, eg: Linear Epoch Step <br>
+  `--warmup_initial_lr`: Warmup Initial LR <br>
+  `--lr_warmup_epochs`: LR Warmup Epochs <br>
+  `--initial_lr`: Inital LR <br>
+  `--lr_mode`: LR Mode, eg: cosine <br>
+  `--cosine_final_lr_ratio`: Cosine Final LR Ratio <br>
+  `--optimizer`: Optimizer, eg: Adam <br>
+  `--weight_decay`: Weight Decay
+
+</details>
+
+**Example:**
+```
+python3 qat.py --data /dir/dataset/data.yaml --weight runs/train2/ckpt_best.pth --batch 6 --epoch 100 --model yolo_nas_m --size 640
+```
+
 ## 📺 Inference
 You can Inference your **YOLO-NAS** model with **Single Command Line**
 #### Support

diff --git a/qat.py b/qat.py
@@ -0,0 +1,205 @@
+from super_gradients.training.models.detection_models.pp_yolo_e import PPYoloEPostPredictionCallback
+from super_gradients.training.datasets.detection_datasets.coco_format_detection import COCOFormatDetectionDataset
+from super_gradients.training.transforms.transforms import DetectionMosaic, DetectionRandomAffine, DetectionHSV, \
+    DetectionHorizontalFlip, DetectionPaddedRescale, DetectionStandardize, DetectionTargetsFormatTransform
+from super_gradients.training.datasets.datasets_utils import worker_init_reset_seed
+from super_gradients.training.utils.detection_utils import CrowdDetectionCollateFN
+from super_gradients.training.pre_launch_callbacks import modify_params_for_qat
+from super_gradients.training.metrics import DetectionMetrics_050
+from super_gradients.training.losses import PPYoloELoss
+from super_gradients.training import dataloaders
+from super_gradients.training import Trainer
+from super_gradients.training import models
+import argparse
+import torch
+import time
+import yaml
+import json
+import os
+
+
+
+if __name__ == '__main__':
+
+    ap = argparse.ArgumentParser()
+    ap.add_argument("-i", "--data", type=str, required=True,
+                    help="path to data.yaml")
+    ap.add_argument("-b", "--batch", type=int, default=6,
+                    help="Training batch size")
+    ap.add_argument("-e", "--epoch", type=int, default=100,
+                    help="Training number of epochs")
+    ap.add_argument("-j", "--worker", type=int, default=2,
+                    help="Training number of workers")
+    ap.add_argument("-m", "--model", type=str, default='yolo_nas_s',
+                choices=['yolo_nas_s', 'yolo_nas_m', 'yolo_nas_l'],
+                help="Model type (eg: yolo_nas_s)")
+    ap.add_argument("-w", "--weight", type=str, required=True,
+                    help="path to pre-trained model weight [ckpt_best.pth]")
+    ap.add_argument("-s", "--size", type=int, default=640,
+                    help="input image size")
+    ap.add_argument("--gpus", action='store_true',
+                help="Run on all gpus")
+    ap.add_argument("--cpu", action='store_true',
+                help="Run on CPU")
+
+    # train_params
+    ap.add_argument("--warmup_mode", type=str, default='linear_epoch_step',
+                    help="Warmup Mode")
+    ap.add_argument("--warmup_initial_lr", type=float, default=1e-6,
+                    help="Warmup Initial LR")
+    ap.add_argument("--lr_warmup_epochs", type=int, default=3,
+                    help="LR Warmup Epochs")
+    ap.add_argument("--initial_lr", type=float, default=5e-4,
+                    help="Inital LR")
+    ap.add_argument("--lr_mode", type=str, default='cosine',
+                    help="LR Mode")
+    ap.add_argument("--cosine_final_lr_ratio", type=float, default=0.1,
+                    help="Cosine Final LR Ratio")
+    ap.add_argument("--optimizer", type=str, default='AdamW',
+                    help="Optimizer")
+    ap.add_argument("--weight_decay", type=float, default=0.0001,
+                    help="Weight Decay")
+    args = vars(ap.parse_args())
+
+    # Quantization Aware Training INFO
+    print("\x1b[6;37;41m [INFO] Quantization Aware Training \x1b[0m")
+    print("\x1b[1;37;41m [WARNING]: Quantization Aware Training Requires a Large Amount of System RAM \x1b[0m")
+
+    # Start Time
+    s_time = time.time()
+
+    # Load Path Params
+    yaml_params = yaml.safe_load(open(args['data'], 'r'))
+    with open(os.path.join(yaml_params['Dir'], yaml_params['labels']['train'])) as f:
+        no_class = len(json.load(f)['categories'])
+        f.close()
+    print(f"\033[1m[INFO] Number of Classes: {no_class}\033[0m")
+
+    # Training on GPU or CPU    
+    name, ckpt_dir = args['weight'].split('/')[-3:-1]
+    if args['cpu']:
+        print('[INFO] Training on \033[1mCPU\033[0m')
+        trainer = Trainer(experiment_name=name, ckpt_root_dir=ckpt_dir, device='cpu')
+    elif args['gpus']:
+        print(f'[INFO] Training on GPU: \033[1m{torch.cuda.get_device_name()}\033[0m')
+        trainer = Trainer(experiment_name=name, ckpt_root_dir=ckpt_dir, multi_gpu=args['gpus'])
+    else:
+        print(f'[INFO] Training on GPU: \033[1m{torch.cuda.get_device_name()}\033[0m')
+        trainer = Trainer(experiment_name=name, ckpt_root_dir=ckpt_dir)
+
+    # Load best model
+    best_model = models.get(args['model'],
+                            num_classes=no_class,
+                            checkpoint_path=args['weight'])
+
+    # Reain Dataset
+    trainset = COCOFormatDetectionDataset(data_dir=yaml_params['Dir'],
+                                      images_dir=yaml_params['images']['train'],
+                                      json_annotation_file=yaml_params['labels']['train'],
+                                      input_dim=(args['size'], args['size']),
+                                      ignore_empty_annotations=False,
+                                      transforms=[
+                                          DetectionMosaic(prob=1., input_dim=(args['size'], args['size'])),
+                                          DetectionRandomAffine(degrees=0., scales=(0.5, 1.5), shear=0.,
+                                                                target_size=(args['size'], args['size']),
+                                                                filter_box_candidates=False, border_value=128),
+                                          DetectionHSV(prob=1., hgain=5, vgain=30, sgain=30),
+                                          DetectionHorizontalFlip(prob=0.5),
+                                          DetectionPaddedRescale(input_dim=(args['size'], args['size']), max_targets=300),
+                                          DetectionStandardize(max_value=255),
+                                          DetectionTargetsFormatTransform(max_targets=300, input_dim=(args['size'], args['size']),
+                                                                          output_format="LABEL_CXCYWH")
+                                      ])
+    train_dataloader_params = {
+                                "shuffle": True,
+                                "batch_size": args['batch'],
+                                "drop_last": False,
+                                "pin_memory": True,
+                                "collate_fn": CrowdDetectionCollateFN(),
+                                "worker_init_fn": worker_init_reset_seed,
+                                "min_samples": 512
+                                }
+    # Valid Data
+    valset = COCOFormatDetectionDataset(data_dir=yaml_params['Dir'],
+                                    images_dir=yaml_params['images']['val'],
+                                    json_annotation_file=yaml_params['labels']['val'],
+                                    input_dim=(args['size'], args['size']),
+                                    ignore_empty_annotations=False,
+                                    transforms=[
+                                        DetectionPaddedRescale(input_dim=(args['size'], args['size']), max_targets=300),
+                                        DetectionStandardize(max_value=255),
+                                        DetectionTargetsFormatTransform(max_targets=300, input_dim=(args['size'], args['size']),
+                                                                        output_format="LABEL_CXCYWH")
+                                    ])
+    val_dataloader_params = {
+                            "shuffle": False,
+                            "batch_size": int(args['batch']*2),
+                            "num_workers": args['worker'],
+                            "drop_last": False,
+                            "pin_memory": True,
+                            "collate_fn": CrowdDetectionCollateFN(),
+                            "worker_init_fn": worker_init_reset_seed
+                            }
+
+    train_params = {
+        'silent_mode': False,
+        "average_best_models":True,
+        "warmup_mode": args['warmup_mode'],
+        "warmup_initial_lr": args['warmup_initial_lr'],
+        "lr_warmup_epochs": args['lr_warmup_epochs'],
+        "initial_lr": args['initial_lr'],
+        "lr_mode": args['lr_mode'],
+        "cosine_final_lr_ratio": args['cosine_final_lr_ratio'],
+        "optimizer": args['optimizer'],
+        "optimizer_params": {"weight_decay": args['weight_decay']},
+        "zero_weight_decay_on_bias_and_bn": True,
+        "ema": True,
+        "ema_params": {"decay": 0.9, "decay_type": "threshold"},
+        "max_epochs": args['epoch'],
+        "mixed_precision": True,
+        "loss": PPYoloELoss(
+            use_static_assigner=False,
+            num_classes=no_class,
+            reg_max=16
+        ),
+        "valid_metrics_list": [
+            DetectionMetrics_050(
+                score_thres=0.1,
+                top_k_predictions=300,
+                num_cls=no_class,
+                normalize_targets=True,
+                post_prediction_callback=PPYoloEPostPredictionCallback(
+                    score_threshold=0.01,
+                    nms_top_k=1000,
+                    max_predictions=300,
+                    nms_threshold=0.7
+                )
+            )
+        ],
+        "metric_to_watch": '[email protected]'
+    }
+
+    # Quantization Aware Training
+    print("\x1b[1;37;41m [INFO]: Launching Quantization Aware Training \x1b[0m")
+    train_params, trainset, valset, train_dataloader_params, val_dataloader_params = modify_params_for_qat(
+        train_params, trainset, valset, train_dataloader_params, val_dataloader_params
+    )
+
+    # Print Training Params
+    print('[INFO] Training Params:\n', train_params)
+
+    train_loader = dataloaders.get(dataset=trainset,
+                                dataloader_params=train_dataloader_params)
+    valid_loader = dataloaders.get(dataset=valset,
+                                dataloader_params=val_dataloader_params)
+
+    # Quantization Aware Training
+    trainer.qat(
+        model=best_model, 
+        training_params=train_params, 
+        train_loader=train_loader, 
+        valid_loader=valid_loader, 
+        calib_loader=train_loader
+    )
+    print(f'[INFO] Training Completed in \033[1m{(time.time()-s_time)/3600} Hours\033[0m')
+    print("\x1b[1;37;42m [SUCCESS]: Quantization Aware Training Completed \x1b[0m")
diff --git a/requirements.txt b/requirements.txt
@@ -1 +1,2 @@
-super-gradients==3.1.3
+super-gradients==3.1.3
+# urllib3==1.25.9
diff --git a/train.py b/train.py
@@ -4,6 +4,7 @@
     DetectionHorizontalFlip, DetectionPaddedRescale, DetectionStandardize, DetectionTargetsFormatTransform
 from super_gradients.training.datasets.datasets_utils import worker_init_reset_seed
 from super_gradients.training.utils.detection_utils import CrowdDetectionCollateFN
+from super_gradients.training.pre_launch_callbacks import modify_params_for_qat
 from super_gradients.training.metrics import DetectionMetrics_050
 from super_gradients.training.losses import PPYoloELoss
 from super_gradients.training import dataloaders
@@ -44,6 +45,8 @@
                 help="Run on all gpus")
     ap.add_argument("--cpu", action='store_true',
                 help="Run on CPU")
+    ap.add_argument("--qat", action='store_true',
+                help="Quantization Aware Training")
 
 
     # train_params
@@ -122,15 +125,15 @@
                                           DetectionTargetsFormatTransform(max_targets=300, input_dim=(args['size'], args['size']),
                                                                           output_format="LABEL_CXCYWH")
                                       ])
-    train_loader = dataloaders.get(dataset=trainset, dataloader_params={
-                                    "shuffle": True,
-                                    "batch_size": args['batch'],
-                                    "drop_last": False,
-                                    "pin_memory": True,
-                                    "collate_fn": CrowdDetectionCollateFN(),
-                                    "worker_init_fn": worker_init_reset_seed,
-                                    "min_samples": 512
-                                })
+    train_dataloader_params = {
+                                "shuffle": True,
+                                "batch_size": args['batch'],
+                                "drop_last": False,
+                                "pin_memory": True,
+                                "collate_fn": CrowdDetectionCollateFN(),
+                                "worker_init_fn": worker_init_reset_seed,
+                                "min_samples": 512
+                                }
     # Valid Data
     valset = COCOFormatDetectionDataset(data_dir=yaml_params['Dir'],
                                     images_dir=yaml_params['images']['val'],
@@ -143,15 +146,15 @@
                                         DetectionTargetsFormatTransform(max_targets=300, input_dim=(args['size'], args['size']),
                                                                         output_format="LABEL_CXCYWH")
                                     ])
-    valid_loader = dataloaders.get(dataset=valset, dataloader_params={
-                                    "shuffle": False,
-                                    "batch_size": int(args['batch']*2),
-                                    "num_workers": args['worker'],
-                                    "drop_last": False,
-                                    "pin_memory": True,
-                                    "collate_fn": CrowdDetectionCollateFN(),
-                                    "worker_init_fn": worker_init_reset_seed
-                                })
+    val_dataloader_params = {
+                            "shuffle": False,
+                            "batch_size": int(args['batch']*2),
+                            "num_workers": args['worker'],
+                            "drop_last": False,
+                            "pin_memory": True,
+                            "collate_fn": CrowdDetectionCollateFN(),
+                            "worker_init_fn": worker_init_reset_seed
+                            }
 
     # Test Data
     if 'test' in (yaml_params['images'].keys() or yaml_params['labels'].keys()):
@@ -176,8 +179,8 @@
                                         "worker_init_fn": worker_init_reset_seed
                                     })
 
-    # To Resume Training
-    if args['resume']:
+    # To Resume Training or re-train
+    if args['resume'] or args["weight"].endswith('.pth'):
         model = models.get(
             args['model'],
             num_classes=no_class,
@@ -235,6 +238,11 @@
     # Print Training Params
     print('[INFO] Training Params:\n', train_params)
 
+    train_loader = dataloaders.get(dataset=trainset,
+                                dataloader_params=train_dataloader_params)
+    valid_loader = dataloaders.get(dataset=valset,
+                                dataloader_params=val_dataloader_params)
+
     # Model Training...
     trainer.train(
         model=model,