DDPM（Diffusion Probabilistic Models）Pytorch core code analysis.

Loss function:

def diffusion_loss_fn(model,x_0,alphas_bar_sqrt,one_minus_alphas_bar_sqrt,n_steps):

"""t time loss"""

batch_size = x_0.shape[0]

#random t

t = torch.randint(0,n_steps,size=(batch_size//2,)).to(device)

t = torch.cat([t,n_steps-1-t],dim=0)

t = t.unsqueeze(-1)

#x0的系数

a = alphas_bar_sqrt[t]

#eps的系数

aml = one_minus_alphas_bar_sqrt[t]

#生成随机噪音eps

e = torch.randn_like(x_0).to(device)

#构造模型的输入

x = x_0 * a + e * aml

#送入模型，得到t时刻的随机噪声预测值

output = model(x,t.squeeze(-1))

#与真实噪声一起计算误差，求平均值

return (e - output).square().mean()

Diffusion Step Model

import torch

import torch.nn as nn

class MLPDiffusion(nn.Module):

def __init__(self,n_steps,num_units=128):

super(MLPDiffusion,self).__init__()

self.linears = nn.ModuleList(

[

nn.Linear(2,num_units),

nn.ReLU(),

nn.Linear(num_units,num_units),

nn.ReLU(),

nn.Linear(num_units,num_units),

nn.ReLU(),

nn.Linear(num_units,2),

]

)

self.step_embeddings = nn.ModuleList(

[

nn.Embedding(n_steps,num_units),

]

)

def forward(self,x,t):

# x = x_0

for idx,embedding_layer in enumerate(self.step_embeddings):

t_embedding = embedding_layer(t)

x = self.linears[2*idx](x)

x += t_embedding

x = self.linears[2*idx+1](x)

x = self.linears[-1](x)

return x

Sample Step

def p_sample_loop(model,shape,n_steps,betas,one_minus_alphas_bar_sqrt):

"""from x[T] recover x[T-1]、x[T-2]|...x[0]"""

cur_x = torch.randn(shape).to(device)

x_seq = [cur_x]

for i in reversed(range(n_steps)):

cur_x = p_sample(model,cur_x,i,betas,one_minus_alphas_bar_sqrt)

x_seq.append(cur_x)

return x_seq

def p_sample(model,x,t,betas,one_minus_alphas_bar_sqrt):

"""from x[T] sample t time value"""

t = torch.tensor([t]).to(device)

coeff = betas[t] / one_minus_alphas_bar_sqrt[t]

eps_theta = model(x,t)

mean = (1/(1-betas[t]).sqrt())*(x-(coeff*eps_theta))

z = torch.randn_like(x).to(device)

sigma_t = betas[t].sqrt()

sample = mean + sigma_t * z

return (sample)

Miles629

搜索此博客