
TL;DR
- task : stochastic DNN => image classification, reinforcement learning, adversarial example
- idea : ํ๊ท ์ด ์๋๋ผ ๋ถ์ฐ๋ง ํ์ต๋๋ stochastic layer๋ฅผ ๋ง๋ค์ด๋ณผ๊น?
- architecture : LeNet-5-Caffe
- objective : ๊ฐ ํ์คํฌ์ ๋ง๋ objective
- **baseline :**VGG-like architecture, Deterministic Policy
- data : CIFAR-10, CIFAR-100
- result : ?
- contribution : ?
- limitation or ์ดํด ์๋๋ ๋ถ๋ถ : ๋์ค์ ์๊ฐ ๋ง์ ๋ ๋ค์ ์ฝ์ด์ผ์ง
Details
DNN in stochastic setting
- stochastic layer, stochastic optimization texhinques ๋ฑ์ ๋ฐฉ๋ฒ์ด ์์
- reduce overfitting, estimate uncertainty, more efficient exploration for reinforcement learning์ ์ฐ์
- stochastic model์ ํ์ตํ๋๊ฑด ์ผ์ข ์ Bayesian model๋ก ํด์์ด ๊ฐ๋ฅํ๋ค
- ๊ทธ ์ค์ ํ ๊ฐ์ง ๋ฐฉ๋ฒ์ deterministic weight $w_{ij}$๋ฅผ $\hat w_{ij} \sim q(\hat w_{ij}|\phi_{ij})$๋ก ๋ฐ๊พธ๋ ๊ฒ์ด๋ค. ๊ทธ๋ผ ํ์ต ์ค์๋ ์ด weight์ ๋ํ single point estimation์ด ์๋๋ผ weight์ ๋ถํฌ์ ๋ํด ํ์ต์ ํ๋ ํํ์ด๋ค.
- ๊ทธ๋ฌ๋ test์๋ ๊ฒฐ๊ตญ ์ด weight์ ๋ถํฌ์ ๋ํ ํ๊ท ์ ๋ด์ ์ฐ๊ณ , ์ด ๊ณผ์ ์์ “mean propagation”, “weight scaling rule"๊ฐ์ ๊ฒ๋ค์ด ์ฐ์ธ๋ค.
Stochastic Neural Network
DNN์ ๊ฒฐ๊ตญ object x์ weights W๊ฐ ์ฃผ์ด์ก์ ๋ target T๋ฅผ ์์ธกํ๋ ๊ฒ.
์ฌ๊ธฐ์ stochastic neural network ์ค weight W๊ฐ parametric distribution $q(W|\phi)$๋ก๋ถํฐ sampling๋๋ ๋ชจ๋ธ์ ์์ ํด๋ณด์.
ํ์ต์ ์งํํ๋ฉด์ $\phi$๊ฐ training data (X, T)์ ์ํด ํ์ต๋๊ณ regularization term $R(\phi)$๋ ์ถ๊ฐ ๋๋ค. ์ฆ ์๋์ ๊ฐ์ด ์ธ ์ ์๋ค.
์ด ๋ชจ๋ธ์ ํ์ตํ๋ ๊ณผ์ ์์๋ binary dropout, variational dropout, dropout-connection ๊ฐ์ ๊ธฐ๋ฒ์ด ์ฐ์ด๋๋ฐ, ์ฌ๊ธฐ์ ์ ํํ $E_{q(W|\phi)}p(t|x,W)$๋ฅผ ๊ตฌํ๋ ๊ฒ์ด ๋ณดํต intractableํ๋ค. ๊ทธ๋์ ๋ณดํต K๊ฐ์ sample์ ๋ฝ์์ ํ๊ท ์ ๋ด๋ ๋ฐฉ์์ผ๋ก ๊ทผ์ฌํ๋๋ฐ ์ด๋ฅผ “test-time averaing"์ด๋ผ๊ณ ํ๋ค.
์กฐ๊ธ๋ ํจ์จ์ ์ผ๋ก ๊ณ์ฐํ๊ธฐ ์ํด์ $\hat W_k$๊ฐ ์๋๋ผ $E_qW$๋ฅผ ๊ตฌํ๋ ์์ผ๋ก ํ๋๋ฐ ์ด๋ฅผ “weight scaling rule"์ด๋ผ๊ณ ํ๋ค.
์ฌ๊ธฐ์ ๋ณธ ๋
ผ๋ฌธ์์๋ $E_qW=0$์ธ ๋ ์ด์ด๋ฅผ ์์ ํ๋ ค๊ณ ํ๋๋ฐ, ๊ทธ๋ ๊ฒ ๋๋ฉด p(t|x, EW=0)์ด๋ฏ๋ก ๋งค๋ฒ weight scaling rule์ ์ฐ๋ฉด random guessํ๋ ๊ผด์ด ๋๋ค(๊ทธ๋์ ์๋ค๋ weight scaling rule์ ์์ฐ๊ฒ ์ง?). ํ๊ท ๊ฐ์๋ ์ ๋ณด๊ฐ ์๊ณ ๋ถ์ฐ์๋ง ์ ๋ณด๊ฐ ์ ์ฅ๋๋ฏ๋ก ์ด๋ฌํ ๋ ์ด์ด๋ฅผ “variance layers"๋ก ํ๊ณ “variance network"๋ก ์ ์ํ๊ณ ์ ํ๋ค.
Variance Layer
activation๋๋๊ฒ $\mu_{ij}$์๋ ์์กดํ์ง ์๊ณ variance์๋ง ์์กดํ์ฌ ๋๋ค.

Result
classification / reinforcement learning / adversarial example์์ ์ข์ ๊ฒฐ๊ณผ
