TL;DR
- I read this because.. : meta-learning. NAS์ธ๋ฐ ํ์ต ์ํ๋ ๊ฑฐ?! ์ง๋๊ต์ํํ ์ถ์ฒ๋ฐ์
- task : Neural Architecture Search
- problem : ๋ฅ๋ฌ๋ ๋ชจ๋ธ ๋ง๋๋๋ฐ ๊ณต์๊ฐ ๋๋ฌด ๋ง์ด ๋ค๊ณ ๊ทธ๋์ ์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํ NAS๋ ๊ฒฐ๊ตญ ํ์ต์ ํด์ผํด์ search๊ฐ ๋๋ฌด ๋๋ฆฌ๋ค.
- idea : ํ์ต์ ํ์ง ์๊ณ initialized model์ ๊ฐ์ง๊ณ ์ต์ข ์ฑ๋ฅ์ ์์ธกํ ์ ์์๊น? -> mini batch N๊ฐ์ sample์์ activation๋๋ ์์ญ์ ๋๋์ด code book์ ๋ง๋ค๊ณ ์ด๊ฑธ ๋ฐ์ดํฐ๊ฐ hamming distance์ ํตํด N x N Matrix๋ฅผ ๋ง๋ฆ.
- input/output : model -> score(or rank)
- architecture : NAS-Bench-201 ์ด๊ฑด ๊ฒฐ๊ตญ CNN ๊ธฐ๋ฐ์ธ ๊ฒ ๊ฐ๊ธด ํ๋ค
- baseline : cell ์์ธก ๊ธฐ๋ฐ NAS(REINFORCE, BOHB), weight shareํด์ search ์๊ฐ ์ค์ธ NAS(RSPS, …)
- data : NAS-Bench-201, NDS-DARTS
- evaluation : best model์ CIFAR-10, CIFAR-100, ImageNet-16-120์ ์ฑ๋ฅ
- result : ํ์ต์ ์ํ๊ณ ์ฑ๋ฅ ์์ธก ๊ฐ๋ฅ. CIFAR-10์ ๋ํด์ ์ ํด์ง search space์์ 30์ด๋ง์ NAS-Bench-201 search space์ ์๋ ๊ฒ๋ค ์ค์ 92.81%์ ํ๋๋ฅผ ๊ฐ์ง์ ๋ฅผ ์ฐพ์ ์ ์์์
- contribution : ์ต์ด์ ํ์ต ์ํ๊ณ ์ฑ๋ฅ ์์ธก (?) ๊ฑฐ์ ์ด๊ฑด ์์ ์ ์์ญ์ธ๋ฐ..
- etc. :
Details
NAS-BENCH-201 : https://arxiv.org/abs/2001.00326 search space๋ฅผ ์์ ๋ฐ์๋๊ตฌ Rank๋ง ์ธก์ ํ๋๋ก ํ ๋ฒค์น๋งํฌ์ธ๋ฏ ํ๋ค
linear regions์์ binary activation codes
activation activation code๋ค ์๊ฐํ
correlation์ด ๋ฎ์์๋ก ์ฑ๋ฅ์ด ์ข์ ๊ฒ์ด๋ค ๋ผ๋ ๊ฐ์ -> ์ค์ ๋ก CIFAR-10 ์ ํ๋๊ฐ ๋์ ์ ์ผ ์๋ก ํ์ ์ฌ๊ธฐ์์ intuition์ ์ด๋ฌํจ ๋น์ทํ binary code๋ฅผ ๊ฐ์ง์ ๋ค์ sample๊ฐ ๋ linearํ๊ฒ ๊ตฌ๋ถํ๊ธฐ ์ด๋ ค์ธ ๊ฒ์ด๊ณ ๋ฐ๋๋ก input์ด ์ ๊ตฌ๋ถ์ด ๋๋ค๋ฉด ํ์ต์ด ๋ ์ฌ์ธ ๊ฒ์ด๋ค ๋ผ๊ณ ๊ฐ์ !
score๋ ์๋๊ณผ ๊ฐ์ด ์ธ ์์์
ablation
score์ ํ์ต ํ ์ ํ๋์ positive correlation
๋ค๋ฅธ measure๋ค๊ณผ์ ๋น๊ต. ์์ ์๊ด๊ณ์๊ฐ ๋๋ค.
- sample image 2) ์ด๊ธฐํ ๋ฐฉ๋ฒ 3) bs ์ ์๊ด์์ด ordinal์ด ๋์ผํ๊ฒ ์ ์ง๋จ์ ํ์ธ
- sample image 2) ์ด๊ธฐํ ๋ฐฉ๋ฒ 3) bs ์ ์๊ด์์ด ordinal์ด ๋์ผํ๊ฒ ์ ์ง๋จ์ ํ์ธ
ํ์ต ์ค์๋ rank๊ฐ ์ ์ง๋จ์ ํ์ธ
์์ score๋ฅผ ๊ฐ์ง๊ณ NAS๋ฅผ ํ๋ฉด ?
์ต์ข ์ฑ๋ฅ : sota๋ ์๋๋ค. search ์๊ฐ์ด ๋งค์ฐ ์๋ค!