wang-zy
diff --git a/Diff for: ‎CompareModels.py
+122 b/Diff for: ‎CompareModels.py
+122
diff --git a/Diff for: ‎DataPreProc.py
+8-84 b/Diff for: ‎DataPreProc.py
+8-84
@@ -0,0 +1,122 @@
+import torch
+import torchvision.models as models
+from torch.autograd import Variable
+import numpy as np
+import torch.nn as nn
+import torch.nn.functional as F
+from PIL import Image
+from torchvision import transforms
+import glob
+from torch.utils.data.dataset import Dataset
+
+
+def normalize(x):
+    y = x.div(255)
+    mean = [0.485, 0.456, 0.406]
+    std = [0.229, 0.224, 0.225]
+    y[:, 0, :, :] = (y[:, 0, :, :] - mean[0]) / std[0]
+    y[:, 1, :, :] = (y[:, 1, :, :] - mean[1]) / std[1]
+    y[:, 2, :, :] = (y[:, 2, :, :] - mean[2]) / std[2]
+    return y
+
+
+class Conv(nn.Module):
+    def __init__(self, in_channels, out_channels, kernel_size, stride=1):
+        super(Conv, self).__init__()
+        reflection_padding = kernel_size // 2
+        self.reflection_pad = nn.ReflectionPad2d(reflection_padding)
+        self.conv2d = nn.Conv2d(in_channels, out_channels, kernel_size, stride=stride)
+
+    def forward(self, x):
+        return self.conv2d(self.reflection_pad(x))
+
+
+class Res(nn.Module):
+    def __init__(self, numChannels):
+        super(Res, self).__init__()
+        bn_flag = True
+        self.conv1 = Conv(numChannels, numChannels, 3, stride=1)
+        self.in1 = nn.InstanceNorm2d(numChannels, affine=bn_flag)
+        self.relu = nn.ReLU()
+        self.conv2 = Conv(numChannels, numChannels, 3, stride=1)
+        self.in2 = nn.InstanceNorm2d(numChannels, affine=bn_flag)
+    def forward(self, x):
+        residual = x
+        output = self.in2(self.conv2(self.relu(self.in1(self.conv1(x)))))
+        return residual + output
+
+
+class DeConv(nn.Module):
+    def __init__(self, in_channels, out_channels, kernel_size=3, stride=1, upsample=2):
+        super(DeConv, self).__init__()
+        self.upsample = nn.Upsample(scale_factor=upsample)
+        self.conv = Conv(in_channels, out_channels, kernel_size, stride=stride)
+
+    def forward(self, x):
+        return self.conv(self.upsample(x))
+
+
+class StyleNet(nn.Module):
+    def __init__(self):
+        super(StyleNet, self).__init__()
+        bn_flag = True
+        self.relu = nn.ReLU()
+        self.conv1 = Conv(3, 32, 9, stride=1)
+        self.in1 = nn.InstanceNorm2d(32, affine=bn_flag)
+        self.conv2 = Conv(32, 64, 3, stride=2)
+        self.in2 = nn.InstanceNorm2d(64, affine=bn_flag)
+        self.conv3 = Conv(64, 128, 3, stride=2)
+        self.in3 = nn.InstanceNorm2d(128, affine=bn_flag)
+        self.res1 = Res(128)
+        self.res2 = Res(128)
+        self.res3 = Res(128)
+        self.res4 = Res(128)
+        self.res5 = Res(128)
+        self.deconv1 = DeConv(128, 64, kernel_size=3, stride=1, upsample=2)
+        self.in4 = nn.InstanceNorm2d(64, affine=bn_flag)
+        self.deconv2 = DeConv(64, 32, kernel_size=3, stride=1, upsample=2)
+        self.in5 = nn.InstanceNorm2d(32, affine=bn_flag)
+        self.conv4 = Conv(32, 3, 9, stride=1)
+
+    def forward(self, x):
+        x = self.relu(self.in1(self.conv1(x)))
+        x = self.relu(self.in2(self.conv2(x)))
+        x = self.relu(self.in3(self.conv3(x)))
+        x = self.res5(self.res4(self.res3(self.res2(self.res1(x)))))
+        x = self.relu(self.in4(self.deconv1(x)))
+        x = self.relu(self.in5(self.deconv2(x)))
+        return self.conv4(x)
+
+def LoadImage(fname, scale=False):
+    # load image and convert to tensor wrapped in a variable
+    if scale is True:
+        loader = transforms.Compose([transforms.Scale((imsize, imsize)),
+                                     transforms.CenterCrop(imsize),
+                                     transforms.ToTensor(),
+                                     transforms.Lambda(lambda x: x.mul(255))])
+    else:
+        loader = transforms.Compose([transforms.Scale((imsize, imsize)),
+                                     transforms.CenterCrop(imsize),
+                                     transforms.ToTensor()])
+    image = Image.open(fname).convert('RGB')
+    data = loader(image)
+    data = Variable(data.cuda(), volatile=True)
+    data = data.unsqueeze(0)
+    return data
+
+
+def SaveImage(tensor_transformed, fname, factor=255):
+    def RGB(image):
+        return (image.transpose(0, 2, 3, 1)*factor).clip(0, 255).astype(np.uint8)
+    result = Image.fromarray(RGB(tensor_transformed.data.cpu().numpy())[0])
+    result.save(fname)
+
+
+imsize = 256
+
+gen = glob.glob('SavedModels/*.model')
+s = torch.load(gen[0])
+print(gen[0])
+image = LoadImage('amber.jpg', scale=True)
+SaveImage(s(image), 'SavedImages/candy2.png', factor=1)
+
@@ -6,93 +6,17 @@
 import torch
 from os import listdir
 
-##############################################
-#
-# Preprecess the COCO dataset
-# (run different section separately)
-# 1. Resize to 256x256
-# 2. Remove all grey scale images
-# 3. Calculate mean values for each channel
-# 4. Calculate std for each channel
-#
-##############################################
 
-
-# # resize COCO dataset
-# dir = 'Dataset/train2014/'
-# gen = listdir(dir)
-
-# for i in range(len(gen)):
-#     fname = dir + gen[i]
-#     im = Image.open(fname)
-#     img = im.resize((256, 256), Image.ANTIALIAS)
-#     img.save('Dataset/PreData/'+str(i)+'.jpg', 'JPEG')
-
-# get mean value of all samples
-gen = glob.glob('Dataset/PreData/*.jpg')
-
-loader = transforms.ToTensor()
-
-# # remove grey scale images
-# for i in range(len(gen)):
-#     fname = gen[i]
-#     im = Image.open(fname)
-#     data = loader(im)
-#
-#     if data.shape[0] != 3:
-#         print i, gen[i]
-#         os.remove(gen[i])
-
-# r_mean = 0.0
-# g_mean = 0.0
-# b_mean = 0.0
-#
-# for i in range(len(gen)):
-#     if i % 1000 == 0:
-#         print i
-#     fname = gen[i]
-#     im = Image.open(fname)
-#     data = loader(im)
-#
-#     size = data.shape[1] * data.shape[2] * 1.0
-#     r_mean += torch.sum(data[0, :, :]) / size
-#     g_mean += torch.sum(data[1, :, :]) / size
-#     b_mean += torch.sum(data[2, :, :]) / size
-#
-# r_mean /= len(gen)
-# g_mean /= len(gen)
-# b_mean /= len(gen)
-#
-# print r_mean
-# print g_mean
-# print b_mean
-
-# calculate std for each dimension for all samples
-r_mean = 0.471116568055
-g_mean = 0.446522854439
-b_mean = 0.406828638561
-
-r_var = 0.0
-g_var = 0.0
-b_var = 0.0
+# resize COCO dataset
+gen = glob.glob('Dataset/train2014/*.jpg')
+loader = transforms.Compose([transforms.Scale(256), transforms.CenterCrop(256), transforms.ToTensor()])
+f = transforms.ToPILImage()
 
 for i in range(len(gen)):
     if i % 1000 == 0:
-        print i
-    im = Image.open(gen[i])
+        print(i)
+    im = Image.open(gen[i]).convert('RGB')
     data = loader(im)
-    r_var += torch.var(data[0, :, :] - r_mean)
-    g_var += torch.var(data[1, :, :] - g_mean)
-    b_var += torch.var(data[2, :, :] - b_mean)
-
-r_var /= len(gen)
-g_var /= len(gen)
-b_var /= len(gen)
-
-print np.sqrt(r_var)
-print np.sqrt(g_var)
-print np.sqrt(b_var)
+    img = f(data)
+    img.save('Dataset/CropData/'+str(i)+'.jpg', 'JPEG')
 
-r_std = 0.244088944037
-g_std = 0.239412672854
-b_std = 0.243587113539