CTGANs/GANs.py at master · sgh14/CTGANs · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
import tensorflow as tf
from tensorflow import keras


class GANs(keras.Model):
    def __init__(
        self,
        dataset, # TODO: model instantiation shouldn't need the dataset
        discriminator,
        generator,
        predictor,
        discriminator_steps=1,
        generator_steps=1,
        gp_weight=10
    ):
        super(GANs, self).__init__()
        # Find the image and label shapes (TODO: this should be unnecessary)
        features, labels = dataset.__getitem__(0)
        self.img_shape = (dataset.batch_size, *dataset.img_shape)
        self.labels_shape = {task: labels[task].shape for task in labels.keys()}

        self.discriminator = discriminator
        self.generator = generator
        self.predictor = predictor
        self.d_steps = discriminator_steps
        self.g_steps = generator_steps
        self.gp_weight = gp_weight


    def compile(self, d_optimizer, g_optimizer, d_loss_fn, g_loss_fn):
        super(GANs, self).compile()
        self.d_optimizer = d_optimizer
        self.g_optimizer = g_optimizer
        self.d_loss_fn = d_loss_fn
        self.g_loss_fn = g_loss_fn


    def _gradient_penalty(self, batch_size, real_images, generated_images):
        # Get the interpolated images
        alpha = tf.random.normal([batch_size, 1, 1, 1], 0.0, 1.0)
        diff = generated_images - real_images
        interpolated = real_images + alpha * diff

        with tf.GradientTape() as gp_tape:
            gp_tape.watch(interpolated)
            # Get the discriminator output for the interpolated images
            pred = self.discriminator(interpolated, training=True)

        # Calculate the gradients with respect to the interpolated images
        grads = gp_tape.gradient(pred, [interpolated])[0]
        # Calculate the norm of the gradients.
        norm = tf.sqrt(tf.reduce_sum(tf.square(grads), axis=[1, 2, 3]))
        gp = tf.reduce_mean((norm - 1.0) ** 2)

        return gp


    def _get_g_loss_and_grads(self, batch_size, labels):
        with tf.GradientTape() as tape:
            # Generate fake images using the generator
            generated_images = self.generator(labels, training=True)
            # Get the discriminator and predictor logits for fake images
            d_outputs = self.discriminator(generated_images, training=False)
            p_outputs = self.predictor(generated_images)
            # Calculate the generator loss
            # disc_labels now are ones (real), since the generator expects to fool the discriminator
            g_loss = self.g_loss_fn(d_outputs, p_outputs, tf.ones((batch_size, 1)), labels)

        # Get the gradients with respect to the generator loss
        g_gradient = tape.gradient(g_loss, self.generator.trainable_variables)

        return g_loss, g_gradient


    def _generator_train_step(self, real_images, labels):
        batch_size = tf.shape(real_images)[0]
        for _ in range(self.g_steps):
            # Compute the loss and the gradients for the generator
            g_loss, g_gradient = self._get_g_loss_and_grads(batch_size, labels)
            # Update the weights of the generator using the generator optimizer
            self.g_optimizer.apply_gradients(
                zip(g_gradient, self.generator.trainable_variables)
            )

        return g_loss


    def _get_d_loss_and_grads(self, batch_size, real_images, generated_images):
        with tf.GradientTape() as tape:
            # Get the logits for the images
            d_outputs_on_real = self.discriminator(real_images, training=True)
            d_outputs_on_generated = self.discriminator(generated_images, training=True)
            # Calculate the discriminator loss using the fake and real image logits
            d_loss = self.d_loss_fn(tf.ones((batch_size, 1)), d_outputs_on_real)\
                   + self.d_loss_fn(tf.zeros((batch_size, 1)), d_outputs_on_generated)
            # Apply gradient penalty if the weight for its contribution is not nule
            if self.gp_weight:
                # Calculate the gradient penalty
                gp = self._gradient_penalty(batch_size, real_images, generated_images)
                # Add the gradient penalty to the original discriminator loss
                d_loss += gp * self.gp_weight

        # Get the gradients with respect to the discriminator loss
        d_gradient = tape.gradient(d_loss, self.discriminator.trainable_variables)

        return d_loss, d_gradient


    def _discriminator_train_step(self, real_images, labels):
        batch_size = tf.shape(real_images)[0]
        for _ in range(self.d_steps):
            # Generate fake images
            generated_images = self.generator(labels, training=False)
            # Get discriminator loss and gradients
            d_loss, d_gradient = self._get_d_loss_and_grads(batch_size, real_images, generated_images)
            # Update the weights of the discriminator using the discriminator optimizer
            self.d_optimizer.apply_gradients(
                zip(d_gradient, self.discriminator.trainable_variables)
            )

        return d_loss


    def train_step(self, data):
        # Unpack the data
        features, labels = data
        # TODO: this should be unnecessary, but the value for all dimensions of images and labels is None
        real_images = tf.reshape(features['images'], self.img_shape)
        for task in labels.keys():
            labels[task] = tf.reshape(labels[task], self.labels_shape[task])

        # Discriminator train step
        d_loss = self._discriminator_train_step(real_images, labels)
        # Generator train step
        g_loss = self._generator_train_step(real_images, labels)

        return {"d_loss": d_loss, "g_loss": g_loss}