
TL;DR
- task : long-tail visual recognition
- problem : ํ์ต ์์๋ ํด๋์ค๋น ๋ฐ์ดํฐ ๊ฐ์๊ฐ ๋ถ๊ท ํํ๊ณ test์์๋ ๊ท ํ์ธ ๊ฒฝ์ฐ์ ๋ฌธ์ ๊ฐ long-tail.
- idea : classifier์ margin์ด ํด๋์ค๋น ๊ฐ์๊ฐ ๋ง์ ๊ณณ์์ ๋ ์ปค์ง๋ค. margin์ ์กฐ์ ํด์ค์ ์๋๋ก beta๋ฅผ ๊ณฑํด์ฃผ๊ณ gamma๋ฅผ ๋ํด์ค๋ค. ์ด ๊ณผ์ ์ ๊ทธ๋ฅ ์ ์ฒด imbalance ๋ฐ์ดํฐ๋ก ํ์ต์ํจ ๋ค์์ beta์ gamma์ ๋ํด์๋ง ๋ค์ ํ์ตํ๋ค.
- architecture : ResNet32, ResNeXt50, ResNet152, ResNet50
- objective : cross entropy loss + loss re-weighting
- baseline : softmax, data re-sampling, loss function engineering, decision Boundary Adjustment …
- data : CIFAR-LT, ImageNet-LT, Places-LT, iNaturalist-LT
- result : SOTA!
- contribution : ์์ฃผ ๊ฐ๋จํ ๊ตฌํ์ผ๋ก SOTA!
- limitation or ์ดํด ์๋๋ ๋ถ๋ถ : test์์๋ train๊ณผ ๊ฐ์ ํด๋์ค ๋ถํฌ๋ฅผ ๊ฐ์ง ๋๋ ์ฑ๋ฅ์ด ์ข์์ง๋์ง ๋ชจ๋ฅด๊ฒ ์!
Details
Related Work
- data re-sampling head ํด๋์ค๋ฅผ undersampling, tail ํด๋์ค๋ฅผ oversampling
- loss function engineering ํด๋์ค๋ณ๋ก loss๊ฐ ๋ ๊ท ํ์๊ฒ ๋ถ๊ณผ๋๋๋ก loss re-weighting. ๋๋ logit์ ์กฐ์
- decision boundary adjustment ์๋ ๋ฐ์ดํฐ ๋ถํฌ๋๋ก ํ์ตํ๋ ๊ฒ์ด ์ข์ ํํ์ ๋ง๋ค์ง๋ง classifier ๋ถ๋ถ์ด ์ฑ๋ฅ์ ๋ณ๋ชฉ์ด๋ค๋ ๋ถ์์ด ์์. ํ์ต์ ์๋๋๋ก ํ๊ณ classifier๋ฅผ ์กฐ์ ํ๋ ๋ฐฉ๋ฒ๋ก ๋ค, Platt scaling ๊ฐ์ ๋ฐฉ๋ฒ์ ์ฐ๋ ๋ฐฉ๋ฒ๋ค์ด ์์.
Paper details
margin

margin์ ์๋์ ๊ฐ์ด ํํ ๊ฐ๋ฅ

logit์ margin์ ๋ํ ์์ผ๋ก ํํ ๊ฐ๋ฅ -> n์ด ์ปค์ง๋ฉด margin์ด ์ปค์ง๊ณ logit๋ ์ปค์ง

์ ์ํ๋ ๋ฐฉ๋ฒ๋ก (MARC)์ pseudo-code

loss re-weighting๋ ์ ์ฉํ๋ค๊ณ ํจ

์ ์ฒด ํ์ต ๊ณผ์ ์ ๋ํ pseudo-code

Result
