
paper
TL;DR#
- task : generative model
- problem : generative model์ ๋ฐ์ดํฐ ๋ถํฌ๋ฅผ ์ถ์ ํด์ sampling์ ํตํด ๋ฐ์ดํฐ๋ฅผ ์์ฑํ๋ ๊ฒ. ์ด๋ pdf๋ ์ ๋ถ์ด 1์ด ๋์ด์ผํ๋ค๋ ๊ฒ ๋๋ฌธ์ ๊ตฌํ๊ธฐ๊ฐ ์ด๋ ค์. ๊ทธ๋์ pdf์ ์ถ์ ์์ด ๋ฐ๋ก log p(x)๋ฅผ x๋ก ๋ฏธ๋ถํ score๋ฅผ ์ถ์ ํ๋ ๊ฒ์ด score matching ๋ฐฉ๋ฒ! ์ด๋ score matching ๋ฐฉ๋ฒ์ low-dimensional manifold์์ score๊ฐ ์ ์๋์ง ์๋ ๊ฒ์ด ๋ฌธ์ ์.
- idea : gaussian noise๋ฅผ ํฌ๊ธฐ์ ๋ฐ๋ผ ์ฌ๋ฌ๋ฒ ์ถ๊ฐํ๊ณ ๊ฐ noise level์ ํ๋์ conditional score network๋ก ํ์ตํ์. sampling์ langevin dynamic sampling(x์ ๋ฏธ๋ถ๊ฐ์ iterativeํ๊ฒ ํ๋ฉด ์๋ x๋ฅผ ์ป์ ์ ์๋ค)์ ํตํด ํ ์ ์๋ค.
- architecture : U-Net
- objective : ์ฐ๋ฆฌ๊ฐ ์ถ์ ํ score network $s_\theta$์ x์ ๊ฐ์ฐ์์ noise๋ฅผ ์ถ๊ฐํ $\tilde x$๋ฅผ ๋ฃ์์ ๋์ output๊ณผ ์ฐ๋ฆฌ๊ฐ ์ถ๊ฐํ noise distribution์ score ์ฐจ์ด
- baseline : PixelCNN, WGAN, BigGAN
- data : CIFAR10, MNIST, CelebA
- result : InCeption, FID์์ ์ค์ํ ์ฑ์ .(BigGAN, MoLM ๋ณด๋ค ์กฐ๊ธ ๋ฎ์)
- contribution : score based model w/o any sampling or adversarial training
- limitation or ์ดํด ์๋๋ ๋ถ๋ถ : sliced score matching
Details#