training model

zhangrong1722 · zhangrong1722 · commit 5b376a604f5b · 2018-07-05T21:03:33.000+08:00
diff --git a/main.py b/main.py
@@ -0,0 +1,276 @@
+import os
+import shutil
+import sys
+import argparse
+import time
+import itertools
+
+import numpy as np
+import torch
+import torch.nn as nn
+import warnings
+import matplotlib.pyplot as plt
+import torch.optim as optim
+import torch.nn.functional as F
+from sklearn.metrics import confusion_matrix
+import scikitplot as skplt
+from torch.autograd import Variable
+from torch.backends import cudnn
+from torch.nn import DataParallel
+import torchvision.transforms as transforms
+import torchvision.models as models
+from torch.optim import lr_scheduler
+from torch.utils.data import DataLoader
+from torchvision.datasets import ImageFolder
+
+sys.path.append('./')
+from utils.util import set_prefix, write, add_prefix
+from utils.FocalLoss import FocalLoss
+
+plt.switch_backend('agg')
+
+parser = argparse.ArgumentParser(description='Training on Diabetic Retinopathy Dataset')
+parser.add_argument('--batch_size', '-b', default=90, type=int, help='batch size')
+parser.add_argument('--epochs', '-e', default=90, type=int, help='training epochs')
+parser.add_argument('--lr', default=1e-3, type=float, help='learning rate')
+parser.add_argument('--cuda', default=torch.cuda.is_available(), type=bool, help='use gpu or not')
+parser.add_argument('--step_size', default=30, type=int, help='learning rate decay interval')
+parser.add_argument('--gamma', default=0.1, type=float, help='learning rate decay scope')
+parser.add_argument('--interval_freq', '-i', default=12, type=int, help='printing log frequence')
+parser.add_argument('--data', '-d', default='./data/data_augu', help='path to dataset')
+parser.add_argument('--prefix', '-p', default='classifier', type=str, help='folder prefix')
+parser.add_argument('--best_model_path', default='model_best.pth.tar', help='best model saved path')
+parser.add_argument('--is_focal_loss', '-f', action='store_false',
+                    help='use focal loss or common loss(i.e. cross ectropy loss)(default: true)')
+
+best_acc = 0.0
+
+
+def main():
+    global args, best_acc
+    args = parser.parse_args()
+    # save source script
+    set_prefix(args.prefix, __file__)
+    model = models.densenet121(pretrained=False, num_classes=2)
+    if args.cuda:
+        model = DataParallel(model).cuda()
+    else:
+        warnings.warn('there is no gpu')
+
+    optimizer = optim.Adam(model.parameters(), lr=args.lr)
+    # accelerate the speed of training
+    cudnn.benchmark = True
+
+    train_loader, val_loader = load_dataset()
+    # class_names=['LESION', 'NORMAL']
+    class_names = train_loader.dataset.classes
+    print(class_names)
+    if args.is_focal_loss:
+        print('try focal loss!!')
+        criterion = FocalLoss().cuda()
+    else:
+        criterion = nn.CrossEntropyLoss().cuda()
+
+    # learning rate decay per epochs
+    exp_lr_scheduler = lr_scheduler.StepLR(optimizer, step_size=args.step_size, gamma=args.gamma)
+    since = time.time()
+    print('-' * 10)
+    for epoch in range(args.epochs):
+        exp_lr_scheduler.step()
+        train(train_loader, model, optimizer, criterion, epoch)
+        cur_accuracy = validate(model, val_loader, criterion)
+        is_best = cur_accuracy > best_acc
+        best_acc = max(cur_accuracy, best_acc)
+        save_checkpoint({
+            'epoch': epoch + 1,
+            'arch': 'resnet18',
+            'state_dict': model.state_dict(),
+            'best_accuracy': best_acc,
+            'optimizer': optimizer.state_dict(),
+        }, is_best)
+    time_elapsed = time.time() - since
+    print('Training complete in {:.0f}m {:.0f}s'.format(
+        time_elapsed // 60, time_elapsed % 60))
+    # compute validate meter such as confusion matrix
+    compute_validate_meter(model, add_prefix(args.prefix, args.best_model_path), val_loader)
+    # save running parameter setting to json
+    write(vars(args), add_prefix(args.prefix, 'paras.txt'))
+
+
+def compute_validate_meter(model, best_model_path, val_loader):
+    checkpoint = torch.load(best_model_path)
+    model.load_state_dict(checkpoint['state_dict'])
+    best_acc = checkpoint['best_accuracy']
+    print('best accuracy={:.4f}'.format(best_acc))
+    pred_y = list()
+    test_y = list()
+    probas_y = list()
+    for data, target in val_loader:
+        if args.cuda:
+            data, target = data.cuda(), target.cuda()
+        data, target = Variable(data, volatile=True), Variable(target)
+        output = model(data)
+        probas_y.extend(output.data.cpu().numpy().tolist())
+        pred_y.extend(output.data.cpu().max(1, keepdim=True)[1].numpy().flatten().tolist())
+        test_y.extend(target.data.cpu().numpy().flatten().tolist())
+
+    confusion = confusion_matrix(pred_y, test_y)
+    plot_confusion_matrix(confusion,
+                          classes=val_loader.dataset.classes,
+                          title='Confusion matrix')
+    plt_roc(test_y, probas_y)
+
+
+def plt_roc(test_y, probas_y, plot_micro=False, plot_macro=False):
+    assert isinstance(test_y, list) and isinstance(probas_y, list), 'the type of input must be list'
+    skplt.metrics.plot_roc(test_y, probas_y, plot_micro=plot_micro, plot_macro=plot_macro)
+    plt.savefig(add_prefix(args.prefix, 'roc_auc_curve.png'))
+    plt.close()
+
+
+def plot_confusion_matrix(cm, classes, normalize=False, title='Confusion matrix', cmap=plt.cm.Blues):
+    """
+    This function prints and plots the confusion matrix.
+    Normalization can be applied by setting `normalize=True`.
+    refence:
+        http://scikit-learn.org/stable/auto_examples/model_selection/plot_confusion_matrix.html
+    """
+    if normalize:
+        cm = cm.astype('float') / cm.sum(axis=1)[:, np.newaxis]
+        print("Normalized confusion matrix")
+    else:
+        print('Confusion matrix, without normalization')
+
+    print(cm)
+
+    plt.imshow(cm, interpolation='nearest', cmap=cmap)
+    plt.title(title)
+    plt.colorbar()
+    tick_marks = np.arange(len(classes))
+    plt.xticks(tick_marks, classes, rotation=45)
+    plt.yticks(tick_marks, classes)
+
+    fmt = '.2f' if normalize else 'd'
+    thresh = cm.max() / 2.
+    for i, j in itertools.product(range(cm.shape[0]), range(cm.shape[1])):
+        plt.text(j, i, format(cm[i, j], fmt),
+                 horizontalalignment="center",
+                 color="white" if cm[i, j] > thresh else "black")
+
+    plt.tight_layout()
+    plt.ylabel('True label')
+    plt.xlabel('Predicted label')
+    plt.savefig(add_prefix(args.prefix, 'confusion_matrix.png'))
+    plt.close()
+
+
+def save_checkpoint(state, is_best, filename='checkpoint.pth.tar'):
+    # save training state after each epoch
+    torch.save(state, add_prefix(args.prefix, filename))
+    if is_best:
+        shutil.copyfile(add_prefix(args.prefix, filename),
+                        add_prefix(args.prefix, args.best_model_path))
+
+
+def load_dataset():
+    if args.data == './data/data_augu':
+        traindir = os.path.join(args.data, 'train')
+        valdir = os.path.join(args.data, 'val')
+        mean = [0.5186, 0.5186, 0.5186]
+        std = [0.1968, 0.1968, 0.1968]
+        normalize = transforms.Normalize(mean, std)
+        train_transforms = transforms.Compose([
+            transforms.CenterCrop(224),
+            transforms.RandomHorizontalFlip(),
+            transforms.ToTensor(),
+            normalize,
+        ])
+        val_transforms = transforms.Compose([
+            transforms.CenterCrop(224),
+            transforms.ToTensor(),
+            normalize,
+        ])
+        train_dataset = ImageFolder(traindir, train_transforms)
+        val_dataset = ImageFolder(valdir, val_transforms)
+        print('load data-augumentation dataset successfully!!!')
+    else:
+        raise ValueError("parameter 'data' that means path to dataset must be in "
+                         "['./data/data_augu']")
+
+    train_loader = DataLoader(train_dataset,
+                              batch_size=args.batch_size,
+                              shuffle=True,
+                              num_workers=4,
+                              pin_memory=True if args.cuda else False)
+    val_loader = DataLoader(val_dataset,
+                            batch_size=args.batch_size,
+                            shuffle=False,
+                            num_workers=1,
+                            pin_memory=True if args.cuda else False)
+    return train_loader, val_loader
+
+
+def train(train_loader, model, optimizer, criterion, epoch):
+    model.train(True)
+    print('Epoch {}/{}'.format(epoch + 1, args.epochs))
+    print('-' * 10)
+    running_loss = 0.0
+    running_corrects = 0
+
+    # Iterate over data.
+    for idx, (inputs, labels) in enumerate(train_loader):
+        # wrap them in Variable
+        if args.cuda:
+            inputs, labels = Variable(inputs.cuda()), Variable(labels.cuda())
+        else:
+            inputs, labels = Variable(inputs), Variable(labels)
+
+        # zero the parameter gradients
+        optimizer.zero_grad()
+
+        # forward
+        outputs = model(inputs)
+
+        _, preds = torch.max(outputs.data, 1)
+
+        loss = criterion(outputs, labels)
+        loss.backward()
+        optimizer.step()
+        if idx % args.interval_freq == 0:
+            print('Train Epoch: {} [{}/{} ({:.0f}%)]\tLoss: {:.6f}'.format(
+                epoch + 1, idx * len(inputs), len(train_loader.dataset),
+                100. * idx / len(train_loader), loss.data[0]))
+
+        # statistics
+        running_loss += loss.data[0] * inputs.size(0)
+        running_corrects += torch.sum(preds == labels.data)
+
+    epoch_loss = running_loss / len(train_loader.dataset)
+    epoch_acc = running_corrects / len(train_loader.dataset)
+
+    print('Training Loss: {:.4f} Acc: {:.4f}'.format(epoch_loss, epoch_acc))
+
+
+def validate(model, val_loader, criterion):
+    model.eval()
+    test_loss = 0
+    correct = 0
+    for data, target in val_loader:
+        if args.cuda:
+            data, target = data.cuda(), target.cuda()
+        data, target = Variable(data, volatile=True), Variable(target)
+        output = model(data)
+        test_loss += criterion(output, target).data[0]
+        # get the index of the max log-probability
+        pred = output.data.max(1, keepdim=True)[1]
+        correct += pred.eq(target.data.view_as(pred)).long().cpu().sum()
+
+    test_loss /= len(val_loader.dataset)
+    test_acc = 100. * correct / len(val_loader.dataset)
+    print('\nTest set: Average loss: {:.4f}, Accuracy: {}/{} ({:.3f}%)\n'.format(
+        test_loss, correct, len(val_loader.dataset), test_acc))
+    return test_acc
+
+
+if __name__ == '__main__':
+    main()