add conditional gan

xiecong · xiecong · commit aaa55530053c · 2022-05-06T13:46:16.000-04:00
diff --git a/README.md b/README.md
@@ -62,9 +62,8 @@
         * Deep Belief Network (DBN) `deep_belief_network.py`
         * Variational autoencoder (VAE) `variational_autoencoder.py`
         * Generative Adversarial Network (GAN) `generative_adversarial_network.py`
-            * Vanilla GAN
             * Deep Convolutional GAN (DCGAN)
-            * discriminator vs generator
+            * Conditional GAN
     * Transfer Learning `transfer_learning.py`
             * CNN on MNIST - freeze convolutional and fine tune dense layers
 * Layers `nn_layers.py` / `simple_cnn_layers.py`
diff --git a/dc_gan.png b/dc_gan.png
diff --git a/generative_adversarial_network.py b/generative_adversarial_network.py
@@ -49,47 +49,27 @@ def backward(self):
 
 class GAN(object):
 
-    def __init__(self):
-        self.n_epochs, self.batch_size = 3, 64
+    def __init__(self, conditioned=True):
+        self.n_epochs, self.batch_size = 1, 64
         self.gen_input = 100
+        self.n_classes = 10
+        self.conditioned = conditioned
         self.dc_gan()
 
-    def vanilla_gan(self):
-        gen_lr, dis_lr = 2e-3, 5e-4
-        self.generator = NN([
-            FullyConnect([self.gen_input], [256], lr=gen_lr),
-            BatchNormalization([256], lr=gen_lr),
-            Activation(act_type='ReLU'),
-            FullyConnect([256], [512], lr=gen_lr),
-            BatchNormalization([512], lr=gen_lr),
-            Activation(act_type='ReLU'),
-            FullyConnect([512], [1024], lr=gen_lr),
-            BatchNormalization([1024], lr=gen_lr),
-            Activation(act_type='ReLU'),
-            FullyConnect([1024], [1, 28, 28], lr=gen_lr),
-            Activation(act_type='Tanh')
-        ])
-        self.discriminator = NN([
-            FullyConnect([1, 28, 28], [1024], lr=dis_lr),
-            Activation(act_type='LeakyReLU'),
-            FullyConnect([1024], [512], lr=dis_lr),
-            Activation(act_type='LeakyReLU'),
-            FullyConnect([512], [256], lr=dis_lr),
-            Activation(act_type='LeakyReLU'),
-            FullyConnect([256], [1], lr=dis_lr),
-            Activation(act_type='Sigmoid')
-        ])
-
     def dc_gan(self):
-        gen_lr, dis_lr = 2e-3, 1e-3
-        tconv1 = TrasposedConv((128, 7, 7), k_size=4,
+        gen_lr, dis_lr = 4e-3, 1e-3
+        dense = FullyConnect(
+            [self.gen_input + self.n_classes if self.conditioned else self.gen_input],
+            (128, 7, 7), lr=gen_lr, optimizer='RMSProp'
+        )
+        tconv1 = TrasposedConv(dense.out_shape, k_size=4,
                                k_num=128, stride=2, padding=1, lr=gen_lr, optimizer='RMSProp')
         tconv2 = TrasposedConv(tconv1.out_shape, k_size=4,
                                k_num=128, stride=2, padding=1, lr=gen_lr, optimizer='RMSProp')
         tconv3 = TrasposedConv(tconv2.out_shape, k_size=7,
                                k_num=1, stride=1, padding=3, lr=gen_lr, optimizer='RMSProp')
         self.generator = NN([
-            FullyConnect([self.gen_input], tconv1.in_shape, lr=gen_lr, optimizer='RMSProp'),
+            dense,
             BatchNormalization(tconv1.in_shape, lr=gen_lr, optimizer='RMSProp'),
             Activation(act_type='ReLU'),
             tconv1,
@@ -102,8 +82,10 @@ def dc_gan(self):
             BatchNormalization(tconv3.out_shape, lr=gen_lr, optimizer='RMSProp'),
             Activation(act_type='Tanh')
         ])
-        conv1 = Conv((1, 28, 28), k_size=7, k_num=128,
-                     stride=1, padding=3, lr=dis_lr, optimizer='RMSProp')
+        conv1 = Conv(
+            (1 + self.n_classes if self.conditioned else 1, 28, 28),
+            k_size=7, k_num=128, stride=1, padding=3, lr=dis_lr, optimizer='RMSProp'
+        )
         conv2 = Conv(conv1.out_shape, k_size=4, k_num=128,
                      stride=2, padding=1, lr=dis_lr, optimizer='RMSProp')
         conv3 = Conv(conv2.out_shape, k_size=4, k_num=128,
@@ -121,47 +103,67 @@ def dc_gan(self):
             Activation(act_type='Sigmoid')
         ])
 
-    def fit(self, x):
+    def fit(self, x, labels):
         y_true = np.ones((self.batch_size, 1))
         y_false = np.zeros((self.batch_size, 1))
         y_dis = np.concatenate([y_true, y_false], axis=0)
-        generated_img = []
+        label_channels = np.repeat(labels, 28*28, axis=1).reshape(labels.shape[0], self.n_classes, 28, 28)
 
         for epoch in range(self.n_epochs):
             permut = np.random.permutation(
                 x.shape[0] // self.batch_size * self.batch_size).reshape([-1, self.batch_size])
             for b_idx in range(permut.shape[0]):
-                x_true = x[permut[b_idx, :]]
+                batch_label_channels = label_channels[permut[b_idx, :]]
+                if self.conditioned:
+                    x_true = np.concatenate((x[permut[b_idx, :]], batch_label_channels), axis=1)
+                else:
+                    x_true = x[permut[b_idx, :]]
                 pred_dis_true = self.discriminator.forward(x_true)
                 self.discriminator.gradient(bce_grad(pred_dis_true, y_true))
                 self.discriminator.backward()
-
-                x_gen = self.generator.forward(
-                    noise(self.batch_size, self.gen_input))
+                
+                if self.conditioned:
+                    x_gen = self.generator.forward(
+                        np.concatenate((noise(self.batch_size, self.gen_input), labels[permut[b_idx, :]]), axis=1)
+                    )
+                    x_gen = np.concatenate((x_gen, batch_label_channels), axis=1)
+                else:
+                    x_gen = self.generator.forward(noise(self.batch_size, self.gen_input))
                 pred_dis_gen = self.discriminator.forward(x_gen)
                 self.discriminator.gradient(bce_grad(pred_dis_gen, y_false))
                 self.discriminator.backward()
 
                 pred_gen = self.discriminator.forward(x_gen)
                 grad = self.discriminator.gradient(bce_grad(pred_gen, y_true))
-                self.generator.gradient(grad)
+                if self.conditioned:
+                    self.generator.gradient(grad[:,:1,:,:])
+                else: 
+                    self.generator.gradient(grad)
                 self.generator.backward()
                 print(
                     f'Epoch {epoch} batch {b_idx} discriminator:',
-                    bce_loss(np.concatenate(
-                        [pred_dis_true, pred_dis_gen], axis=0), y_dis),
+                    bce_loss(np.concatenate((pred_dis_true, pred_dis_gen)), y_dis),
                     'generator:', bce_loss(pred_gen, y_true)
                 )
-            generated_img.append(
-                self.generator.predict(noise(10, self.gen_input)))
-        return generated_img
 
 
 def main():
-    x, _ = fetch_openml('mnist_784', return_X_y=True, data_home='data', as_frame=False)
+    x, y = fetch_openml('mnist_784', return_X_y=True, data_home='data', as_frame=False)
     x = 2 * (x / x.max()) - 1
-    gan = GAN()
-    images = gan.fit(x.reshape((-1, 1, 28, 28)))
+    labels = np.zeros((y.shape[0], 10))
+    labels[range(y.shape[0]), y.astype(np.int_)] = 1
+    gan = GAN(conditioned=True)
+    gan.fit(x.reshape((-1, 1, 28, 28)), labels)
+
+    if gan.conditioned:
+        onehot = np.zeros((30, 10))
+        onehot[range(30), np.arange(30)%10] = 1
+        images = gan.generator.predict(
+            np.concatenate((noise(30, gan.gen_input), onehot), axis=1)
+        )
+    else:
+        images = gan.generator.predict(noise(30, gan.gen_input))
+
     for i, img in enumerate(np.array(images).reshape(-1, 784)):
         plt.subplot(len(images), 10, i + 1)
         plt.imshow(img.reshape(28, 28), cmap='gray', vmin=-1, vmax=1)