
TL;DR
- task : unsupervised learning
- problem : unsupervised manner๋ก representation learning์ ํ๊ณ ์ถ์๋ฐ, ์ด ๋ ์ค์ํ ํน์ฑ๋ค(์ซ์, ๋์ ์)์ disentangle์ ํ๊ณ ์ถ๋ค. generative model์ ๊ฒฝ์ฐ ์๋ฒฝํ ์์ฑ์ ํ์ง๋ง representation์ ์๋ง์ธ ๊ฒฝ์ฐ๊ฐ ๋ง๋ค.
- idea : ์ด๋ค structured latent variable $c$์ generator distribution $G(z, c)$์ mutual information(=MI)์ด ๋๋๋ก loss์ ์ถ๊ฐ. MI๋ ELBO์ฒ๋ผ lower bound๊ฐ ์๊ธฐ๊ณ ์ด๋ posterior๋ neural network๋ก ๊ทผ์ฌํจ.
- architecture : generative model์ DCGAN, CNN์ shareํ๋๋ฐ ์์ FCN ํ๋ ๋ ๋ถ์ฌ์ $Q(c|x)$๊ฐ ๋์ค๋๋ก ํจ.
- objective : GAN loss - mutual information loss
- baseline : vanilla GAN
- data : MNIST, DC-IGN, Street View House Number(SVHN), CelebA
- result : code๋ฅผ ๋ฐ๊ฟ๊ฐ๋ฉด ์์ฑ๋ฌผ๋ ํด์๊ฐ๋ฅํ๊ฒ ๋ฐ๋๋๊ฒ์ ํ์ธ. ๊ทธ๋ฅ GAN์ c์ ๋ํด ํ์ตํ๋๋ก ํ๋ฉด mutual information์ด InfoGAN๋งํผ ์ต๋ํ๋์ง๋ ์์.
- contribution : GAN with interpretable latent vector!
- limitation or ์ดํด ์๋๋ ๋ถ๋ถ :
- category c๋ฅผ ๋ฃ์ด์ค ๋ ๋๋ค์ผ๋ก ํ๋๋ฐ ์ด๋ป๊ฒ ํ๋์ ์ธ๋ฑ์ค๊ฐ ํ๋์ digit๊ณผ ๊ด๋ จ์ ๊ฐ์ง ์ ์๋๊ฑธ๊น? ์๋ฅผ ๋ค์ด์ 1 ์ด๋ฏธ์ง ๋ค์ด์์ ๋ c๊ฐ 3๋ฒ์ผ๋๋ 5๋ฒ์ผ๋๋ ๋๊ฐ์ด ๊ทธ๊ฑธ ๋ณต์ํ๊ณ , ๋ฐ๋๋ก 1์ด ๋ค์ด์ฌ ๋๋ 2๊ฐ ๋ค์ด์ฌ๋๋ c๊ฐ 5๋ฒ์ผ์๋ ์์์ด.. ์ด์จ๋ c๋ฅผ ๊ณ ๋ คํ generation์ด ๋๋ฉด์ ๊ฐ๋ฅํ๊ฑด๊ฐ?
-> GAN์ด๋ผ ์ด๋ฏธ์ง๊ฐ ‘1’๋ก ๋ค์ด๊ฐ๋ค๋๊ฑด ์์! ์ฆ, VAE ์ฒ๋ผ Reconstructํ๋๊ฒ ์๋๋ผ ์ฃผ์ด์ง ์ด๋ฏธ์ง๊ฐ fake์ธ์ง real์ธ์ง ๊ตฌ๋ถํ๋ฉด์ ํ์ต๋๋๊ฑฐ์! ๊ทธ๋ฌ๋ฏ๋ก ์ด๋ค latent code c๊ฐ 3์ผ๋ก ๋ค์ด๊ฐ์ผ๋ฉด 3๊ฐ์ ๊ทธ๋ฆผ์ด ๋์ค๋๋ก mutual information์ ๋ฃ์ด์ฃผ๋ ๋ฏ. ์ฆ ๊ฑฑ์ ํ๋ ์ํฉ์ ์๋๋ฏ.
- c๋ก ๋ค์ด๊ฐ๋ category์ continuous์ ๊ฐ์๋ฅผ ์ ํ ์๋ ์์ง๋ง ์ ์ด์ ๊ฐ๊ฐ์ด ๋ญ ๋ฐฐ์ธ์ง๋ ์ ํ ์ ์๋๊ฑฐ ์๋๊ฐ?? ์ ์ ํ ์ ์๋๊ฒ์ฒ๋ผ ํด๋จ์ง?? ์ฌํ์ ์ผ๋ก ์๊ฒ๋๋๊ฒ ์๋์ง.โฆ
-> ์ ํ ์ ์๋๊ฒ ๋ง๋๋ฏ. ๊ฒฐ๊ณผ๋ก ์ ์ผ๋ก ํด์ํ์ ๋ ์ฐ๋ฆฌ๊ฐ ์๊ฐํ๋ feature๋ค์ code๋ค์ด ์ ๋ด๊ณ ์๋ค๊ณ ์ฐ์ ํผ๊ฑฐ ์ธ๋ฏ.
Details
mutual information

X์ Y๊ฐ ๋
๋ฆฝ์ด์ด์ $P_{X,Y}(x,y)=P_X(x)P_Y(y)$๋ฉด,

์ํธ๋กํผ์ ๋ํ ์์ผ๋ก ์ฐ๋ฉด

Variatitonal Mutual Information Maximization

์ฌ๊ธฐ์ posterior Q์ ๋ํด sample์ ๋ฝ์์ผ ํ๋ ๋ถ๋ถ์ด ์๋๋ฐ ์๋ lemma๋ฅผ ํตํด sample๋ ์ํด๋ ๋จ.

ํด์ํ์๋ฉด ์ด๋ค ํจ์ f(x, y)๋ฅผ x์ x๊ฐ ์ฃผ์ด์ก์ ๋์ y์ ๋ํด ๊ธฐ๋๊ฐ์ ๊ตฌํ๋ฉด x์ x๊ฐ ์ฃผ์ด์ก์๋ y์, x’(y๊ฐ ์ฃผ์ด์ก์ ๋์ x)์ ๋ํด f(x’ y)๊ธฐ๋๊ฐ์ ๊ตฌํ ๊ฒ๊ณผ ๊ฐ๋ค.
์ฐ๋ฆฌ์ lower bound๋ ์๋์ ๊ฐ์ด ์ ์๋จ

์ต์ข
์ ์ธ loss๋ GAN loss์ mutual information lower bound๋ฅผ ๋บ ๊ฒ! (MI๋ ๋์ ์๋ก ์ข์)
