看GAN如何一步步控制图像生成风格?详解StyleGAN进化过程
GAN 能够有条不紊地控制其生成图像的风格吗? 选自Medium,作者:Jonathan Hui,机器之心编译,参与:魔王、杜伟。 你了解自己的风格吗?大部分 GAN 模型并不了解。那么,GAN 能够有条不紊地控制其生成图像的风格吗? 原版 GAN 基于潜在因子(latent factor)z 生成图像。 通常,潜在因子 z 采样自正态或均匀分布,它们决定了生成内容的类型和风格。 基于此,我们需要解答以下两个重要问题: 为什么 z 是均匀或正态分布? 既然 z 包含元信息,那么它是否应在每个卷积层生成数据的过程中发挥更主要的作用?(而不是仅作为第一层的输入) 注意:本文将使用「风格」(style)来指代元信息,其包含类型信息和风格信息。 下图是 StyleGAN2 生成的图像: 潜在因子 z 机器学习中的潜在因子通常彼此独立,以简化模型训练过程。例如,身高和体重具备高度相关性(个子越高的人通常体重更大)。因此,基于身高、体重计算得到的身体质量指数(body mass index,BMI)较常用于衡量人体肥胖程度,其所需的训练模型复杂度较低。而彼此独立的因子使得模型更易于解释。 在 GAN 中,z 的分布应与真实图像的潜在因子分布类似。如果我们从正态或均匀分布中采样 z,则优化后的模型可能需要 z 来嵌入类型和风格以外的信息。例如,我们为军人生成图像