logo资料库

生成对抗网络(GAN).pdf

第1页 / 共23页
第2页 / 共23页
第3页 / 共23页
第4页 / 共23页
第5页 / 共23页
第6页 / 共23页
第7页 / 共23页
第8页 / 共23页
资料共23页,剩余部分请下载后查看
Author
TODO
7 生成对抗网络
7.1 GAN基本概念
7.1.1 什么是生成对抗网络?
如何通俗理解GAN?
GAN的形式化表达
GAN的目标函数是什么?
GAN的目标函数和交叉熵有什么区别?
7.1.2 GAN的Loss为什么降不下去?
7.1.3 生成式模型、判别式模型的区别?
7.1.4 什么是mode collapsing?
什么是mode collapsing?
如何解决mode collapsing?
7.1.5 如何客观评价GAN的生成能力?
Inception Score
Mode Score
Kernel MMD (Maximum Mean Discrepancy)
Wasserstein distance
Fréchet Inception Distance (FID)
1-Nearest Neighbor classifier
其他评价方法
7.1.6 其他常见的生成式模型有哪些?
什么是自回归模型:pixelRNN与pixelCNN?
什么是VAE?
7.2 GAN的改进
7.2.1 如何生成指定类型的图像——条件GAN
7.2.3 CNN与GAN——DCGAN
如何理解GAN中的输入随机噪声?
7.2.4 如何度量GAN的收敛程度?——WGAN/WGAN-GP
GAN为什么容易训练崩溃?
WGAN如何解决训练崩溃问题?
WGAN-GP:带有梯度正则的WGAN
7.2.5 LSGAN
7.2.6 如何尽量避免GAN的训练崩溃问题?
7.3 GAN的应用
7.3.1 什么是图像翻译?
7.3.2 有监督图像翻译:pix2pix
直观的想法?
如何解决生成图像的模糊问题?
其他图像翻译的tricks
如何生成高分辨率图像和高分辨率视频?
7.3.3 有监督的图像翻译的缺点?
7.3.4 无监督图像翻译:CycleGAN
模型结构
Loss设计
多领域的无监督图像翻译:StarGAN
7.3.5 GAN在文本生成领域中的应用:SeqGAN
GAN为什么不适合文本任务?
seqGAN用于文本生成
7.3.6 GAN在其他领域的应用
数据增广
图像超分辨与图像补全
语音领域
GAN GAN GAN GAN 7.1.2 GANLoss 7.1.3 7.1.4 mode collapsing? mode collapsing mode collapsing 7.1.5 GAN Inception Score Mode Score Kernel MMD (Maximum Mean Discrepancy) Wasserstein distance Fréchet Inception Distance (FID) 1-Nearest Neighbor classifier 7.1.6 pixelRNNpixelCNN VAE 7.2 GAN 7.2.1 ——GAN 7.2.3 CNNGAN——DCGAN GAN 7.2.4 GAN——WGAN/WGAN-GP Author TODO 7 7.1 GAN 7.1.1 GAN WGAN WGAN-GPWGAN 7.2.5 LSGAN 7.2.6 GAN 7.3 GAN 7.3.1 7.3.2 pix2pix tricks 7.3.3 7.3.4 CycleGAN Loss StarGAN 7.3.5 GANSeqGAN
GAN seqGAN 7.3.6 GAN Author @- TODO √ √ GAN SeqGAN √ GAN √ github √ GAN √ √ GAN √ GANInsight √ 7 7.1 GAN 7.1.1 GAN
(GAN, Generative adversarial network)2014Ian GoodfellowGAN GAN[1] GAN GANGAN G GAN D “” GAN GAN
, 1 P_z(z) 0 JS()JS JS GAN : JS [1]: Goodfellow, Ian, et al. "Generative adversarial nets." Advances in neural information processing systems. 2014. 7.1.2 GANLoss GANGANLoss GANGANLoss GAN WGANLoss GANLoss GANLoss Loss Loss "" Loss Loss
loss GANGAN Loss WGANloss 7.1.3 P(X,Y), P(Y|X)=P(X,Y)/P(X)P(Y|X) XY Y=f(X)P(Y|X) X Y 1XY Y | 0 1 X | 0 1/4 3/4 | 1 3/4 1/4 X=0,1….Y=0,1 P(X, Y) XY X 2X Y P(Y|X)XY
XY X,Y, PX,Y outlier detection 7.1.4 mode collapsing? mode collapsing (mode) mode collapsing maxminmode UnrolledGANlossUnrolledGAN kLosslossk losskloss kmode k1 [8]DRAGANlossmode collapse[9]EBGANVAEmode collapse
Multi agent diverse GAN(MAD-GAN) GANloss MRGANmode collapse Encoder Generator Loss real-like fake samples mode collapse Mini-batch Discrimination
Mini-batch discriminationmini-batch layer L1batch 7.1.5 GAN GAN bad case GAN GAN GAN Inception Score ImageNetGANInception mode dropping GAN KLInception ScoreInception ScoreIS M Mode ScoreImageNet Mode Score Mode ScoreInception Score Kernel MMD (Maximum Mean Discrepancy)
分享到:
收藏