18 Families of Diffusion Models.py

import numpy as np
import matplotlib.pyplot as plt
from matplotlib.colors import ListedColormap
from operator import itemgetter
from scipy import stats
from IPython.display import display, clear_output

my_colormap_vals_hex =('2a0902', '2b0a03', '2c0b04', '2d0c05', '2e0c06', '2f0d07', '300d08', '310e09', '320f0a', '330f0b', '34100b', '35110c', '36110d', '37120e', '38120f', '39130f', '3a1410', '3b1411', '3c1511', '3d1612', '3e1613', '3f1713', '401714', '411814', '421915', '431915', '451a16', '461b16', '471b17', '481c17', '491d18', '4a1d18', '4b1e19', '4c1f19', '4d1f1a', '4e201b', '50211b', '51211c', '52221c', '53231d', '54231d', '55241e', '56251e', '57261f', '58261f', '592720', '5b2821', '5c2821', '5d2922', '5e2a22', '5f2b23', '602b23', '612c24', '622d25', '632e25', '652e26', '662f26', '673027', '683027', '693128', '6a3229', '6b3329', '6c342a', '6d342a', '6f352b', '70362c', '71372c', '72372d', '73382e', '74392e', '753a2f', '763a2f', '773b30', '783c31', '7a3d31', '7b3e32', '7c3e33', '7d3f33', '7e4034', '7f4134', '804235', '814236', '824336', '834437', '854538', '864638', '874739', '88473a', '89483a', '8a493b', '8b4a3c', '8c4b3c', '8d4c3d', '8e4c3e', '8f4d3f', '904e3f', '924f40', '935041', '945141', '955242', '965343', '975343', '985444', '995545', '9a5646', '9b5746', '9c5847', '9d5948', '9e5a49', '9f5a49', 'a05b4a', 'a15c4b', 'a35d4b', 'a45e4c', 'a55f4d', 'a6604e', 'a7614e', 'a8624f', 'a96350', 'aa6451', 'ab6552', 'ac6552', 'ad6653', 'ae6754', 'af6855', 'b06955', 'b16a56', 'b26b57', 'b36c58', 'b46d59', 'b56e59', 'b66f5a', 'b7705b', 'b8715c', 'b9725d', 'ba735d', 'bb745e', 'bc755f', 'bd7660', 'be7761', 'bf7862', 'c07962', 'c17a63', 'c27b64', 'c27c65', 'c37d66', 'c47e67', 'c57f68', 'c68068', 'c78169', 'c8826a', 'c9836b', 'ca846c', 'cb856d', 'cc866e', 'cd876f', 'ce886f', 'ce8970', 'cf8a71', 'd08b72', 'd18c73', 'd28d74', 'd38e75', 'd48f76', 'd59077', 'd59178', 'd69279', 'd7937a', 'd8957b', 'd9967b', 'da977c', 'da987d', 'db997e', 'dc9a7f', 'dd9b80', 'de9c81', 'de9d82', 'df9e83', 'e09f84', 'e1a185', 'e2a286', 'e2a387', 'e3a488', 'e4a589', 'e5a68a', 'e5a78b', 'e6a88c', 'e7aa8d', 'e7ab8e', 'e8ac8f', 'e9ad90', 'eaae91', 'eaaf92', 'ebb093', 'ecb295', 'ecb396', 'edb497', 'eeb598', 'eeb699', 'efb79a', 'efb99b', 'f0ba9c', 'f1bb9d', 'f1bc9e', 'f2bd9f', 'f2bfa1', 'f3c0a2', 'f3c1a3', 'f4c2a4', 'f5c3a5', 'f5c5a6', 'f6c6a7', 'f6c7a8', 'f7c8aa', 'f7c9ab', 'f8cbac', 'f8ccad', 'f8cdae', 'f9ceb0', 'f9d0b1', 'fad1b2', 'fad2b3', 'fbd3b4', 'fbd5b6', 'fbd6b7', 'fcd7b8', 'fcd8b9', 'fcdaba', 'fddbbc', 'fddcbd', 'fddebe', 'fddfbf', 'fee0c1', 'fee1c2', 'fee3c3', 'fee4c5', 'ffe5c6', 'ffe7c7', 'ffe8c9', 'ffe9ca', 'ffebcb', 'ffeccd', 'ffedce', 'ffefcf', 'fff0d1', 'fff2d2', 'fff3d3', 'fff4d5', 'fff6d6', 'fff7d8', 'fff8d9', 'fffada', 'fffbdc', 'fffcdd', 'fffedf', 'ffffe0')
my_colormap_vals_dec = np.array([int(element,base=16) for element in my_colormap_vals_hex])
r = np.floor(my_colormap_vals_dec/(256*256))
g = np.floor((my_colormap_vals_dec - r *256 *256)/256)
b = np.floor(my_colormap_vals_dec - r * 256 *256 - g * 256)
my_colormap_vals = np.vstack((r,g,b)).transpose()/255.0
my_colormap = ListedColormap(my_colormap_vals)

def norm_pdf(x, mu, sigma):
    y=np.exp(-0.5*(x-mu)*(x-mu)/(sigma*sigma))/np.sqrt(2*np.pi*sigma*sigma)
    return y

class TrueDataDistribution():
    def __init__(self):
        self.mu=[1.500,-0.216,0.450,-1.875]
        self.sigma=[0.30,0.15,0.525,0.075]
        self.w=[0.2,0.3,0.35,0.15]
    
    def pdf(self, x):
        y=(self.w[0]*norm_pdf(x, self.mu[0], self.sigma[0])+self.w[1]*norm_pdf(x, self.mu[1], self.sigma[1])+self.w[2]*norm_pdf(x, self.mu[2], self.sigma[2])+self.w[3]*norm_pdf(x, self.mu[3], self.sigma[3]))
        return y
    
    def sample(self, n):
        hidden=np.random.choice(4,n,p=self.w)
        epsilon=np.random.normal(size=(n))
        mu_list=list(itemgetter(*hidden)(self.sigma))
        sigma_list=list(itemgetter(*hidden)(self.sigma))
        return mu_list+sigma_list*epsilon

true_dist=TrueDataDistribution()
x_vals=np.arange(-3,3,0.01)
pr_x_true=true_dist.pdf(x_vals)
fig, ax=plt.subplots()
fig.set_size_inches(8,2.5)
ax.plot(x_vals, pr_x_true, 'r-')
ax.set_xlabel('$x$')
ax.set_ylabel('$Pr(x)$')
ax.set_ylim(0,1.0)
ax.set_xlim(-3,3)
plt.show()

def get_data_pairs(x_train, t, beta):
    epsilon=np.random.standard_normal(x_train.shape)
    alpha_t=np.power(1-beta, t)
    z_t=x_train*np.sqrt(alpha_t)+np.sqrt(1-alpha_t)*epsilon
    return z_t, epsilon

class NonParametricModel():
    def __init__(self):
        self.inc=0.01
        self.max_val=3.0
        self.model=[]
    
    def train(self, zt, epsilon):
        zt=np.clip(zt, -self.max_val, self.max_val)
        epsilon=np.clip(epsilon, -self.max_val, self.max_val)
        bins=np.arange(-self.max_val, self.max_val+self.inc, self.inc)
        numerator, *_ = stats.binned_statistic(zt, epsilon, statistic='sum',bins=bins)
        denominator, *_ = stats.binned_statistic(zt, epsilon, statistic='count',bins=bins)
        self.model = numerator / (denominator + 1)
    
    def predict(self, zt):
        bin_index = np.floor((zt+self.max_val)/self.inc)
        bin_index = np.clip(bin_index,0, len(self.model)-1).astype('uint32')
        return zt+self.model[bin_index]

n_sample=100000
x_train=true_dist.sample(n_sample)
T=100
beta=0.01511
all_models=[]
for t in range(0,T):
    clear_output(wait=True)
    display('Training Timestep %d'%(t))
    zt, epsilon=get_data_pairs(x_train, t, beta)
    all_models.append(NonParametricModel())
    all_models[t].train(zt, epsilon)

def sample_ddim(model, T, sigma_t, n_samples):
    samples=np.zeros((T+1, n_samples))
    samples[T,:]=np.random.standard_normal(n_samples)
    for t in range(T, 0, -1):
        clear_output(wait=True)
        display('Predicting z_{%d} from z_{%d}'%(t-1, t))
        alpha_t=np.power(1-beta, t+1)
        alpha_t_minus1=np.power(1-beta, t)
        gt=model[t-1].predict(samples[t,:])
        samples[t-1,:]=np.sqrt(alpha_t_minus1)*((samples[t,:]-np.sqrt(1-alpha_t)*gt)/np.sqrt(alpha_t))+np.sqrt(1-alpha_t_minus1-sigma_t**2)*gt+sigma_t*np.random.standard_normal(n_samples)
        if t>0:
            samples[t-1,:]=samples[t-1,:]+np.random.standard_normal(n_samples)*sigma_t
    return samples

sigma_t=0.001
n_samples = 100000
samples_low_noise = sample_ddim(all_models, T, sigma_t, n_samples)
sampled_data = samples_low_noise[0,:]
bins = np.arange(-3,3.05,0.05)

fig,ax = plt.subplots()
fig.set_size_inches(8,2.5)
ax.set_xlim([-3,3])
plt.hist(sampled_data, bins=bins, density =True)
ax.set_ylim(0, 0.8)
plt.show()

fig, ax = plt.subplots()
t_vals = np.arange(0,101,1)
ax.plot(samples_low_noise[:,0],t_vals,'r-')
ax.plot(samples_low_noise[:,1],t_vals,'g-')
ax.plot(samples_low_noise[:,2],t_vals,'b-')
ax.plot(samples_low_noise[:,3],t_vals,'c-')
ax.plot(samples_low_noise[:,4],t_vals,'m-')
ax.set_xlim([-3,3])
ax.set_ylim([101, 0])
ax.set_xlabel('value')
ax.set_ylabel('z_{t}')
plt.show()

def sample_accelerated(model, T, sigma_t, n_steps, n_samples):
    samples = np.zeros((n_steps+1,n_samples))
    samples[n_steps,:] = np.random.standard_normal(n_samples)
    for c_step in range(n_steps,0,-1):
        t=int(T * c_step/n_steps)
        tminus1 = int(T * (c_step-1)/n_steps)
        display("Predicting z_{%d} from z_{%d}"%(tminus1,t))
        alpha_t = np.power(1-beta,t+1)
        alpha_t_minus1 = np.power(1-beta,tminus1+1)
        epsilon_est = all_models[t-1].predict(samples[c_step,:])
        samples[c_step-1,:]=np.sqrt(alpha_t_minus1)*(samples[c_step,:]-np.sqrt(1-alpha_t) * epsilon_est)/np.sqrt(alpha_t) \
                                            + np.sqrt(1-alpha_t_minus1 - sigma_t*sigma_t) * epsilon_est
        if t>0:
            samples[c_step-1,:] = samples[c_step-1,:]+ np.random.standard_normal(n_samples) * sigma_t
    return samples

sigma_t=0.11
n_samples = 100000
n_steps = 20 # i.e. sample 5 times as fast as before -- should be a divisor of 100
samples_accelerated = sample_accelerated(all_models, T, sigma_t, n_steps, n_samples)
sampled_data = samples_accelerated[0,:]
bins = np.arange(-3,3.05,0.05)

fig,ax = plt.subplots()
fig.set_size_inches(8,2.5)
ax.set_xlim([-3,3])
plt.hist(sampled_data, bins=bins, density =True)
ax.set_ylim(0, 0.9)
plt.show()

fig, ax = plt.subplots()
step_increment = 100/ n_steps
t_vals = np.arange(0,101,5)

for i in range(len(t_vals)-1):
    ax.plot( (samples_accelerated[i,0],samples_accelerated[i+1,0]), (t_vals[i], t_vals[i+1]),'r.-')
    ax.plot( (samples_accelerated[i,1],samples_accelerated[i+1,1]), (t_vals[i], t_vals[i+1]),'g.-')
    ax.plot( (samples_accelerated[i,2],samples_accelerated[i+1,2]), (t_vals[i], t_vals[i+1]),'b.-')
    ax.plot( (samples_accelerated[i,3],samples_accelerated[i+1,3]), (t_vals[i], t_vals[i+1]),'c.-')
    ax.plot( (samples_accelerated[i,4],samples_accelerated[i+1,4]), (t_vals[i], t_vals[i+1]),'m.-')

ax.set_xlim([-3,3])
ax.set_ylim([101, 0])
ax.set_xlabel('value')
ax.set_ylabel('z_{t}')
plt.show()