Image AE encoder 把图像压缩成向量, decoder 把向量解码成图片, 学习目标就是让解码出的图片与原图片尽量相似 VAE AE 只有编码出的向量能被 decoder 识别, 随机向量不能识别; VAE 将 encoder 编码出的向量变成服从正态分布的向量, 训练好的 decoder 能够识别随机向量, 从而随机生成图片 2 VQ-VAE 3 diffusion model 4 latent diffusion model 5