
TL;DR
- I read this because.. : ResNet50๊ณผ 101์ ์ฐจ์ด๋ฅผ ๋ชจ๋ฆ ^^
- task : image classification, object detection
- problem : ๋ ์ด์ด๊ฐ ๋ฎ์ ๋คํธ์ํฌ๊ฐ ์๊ณ ๊ฑฐ๊ธฐ์ identity mapping๋ง ์ถ๊ฐํ ๊น์ ๋คํธ์ํฌ๊ฐ ์์ ๋ ์ฌ์ค์ ๊ฐ์ ๋คํธ์ํฌ์ธ๋ฐ๋ ๋ถ๊ตฌํ๊ณ ๊น์ ๋คํธ์ํฌ์ training error๊ฐ ๋ ๋์ ํ์. ์ฆ ๊น์ ์๋ก ํ์ต์ด ๋ถ์์ ํ๊ฒ ์ต์ ํด๋ฅผ ์ฐพ์.
- idea : residual connection. f(x) + x๋ฅผ ํ์. ์ด๋ ๊ฒ ๋๋ฉด ๊น์ ๋ ์ด์ด๊ฐ ํ์์์ผ๋ฉด f(x)=0์ด ๋์ด์ identity mapping์ ํ๋ ๊ฒ๊ณผ ๊ฐ์ ์ญํ ์ ํ ๊ฒ.
- architecture : VGG์ ์์น์ ๋ฐ๋ผ 1) ๋งค ๋ ์ด์ด์ ํํฐ ๊ฐ์๋ฅผ ๊ฐ๊ฒ ์ค์ 2) feature mapํฌ๊ธฐ๊ฐ ๋ฐ์ผ๋ก ์ค๋ฉด filter ๊ฐ์๋ฅผ ๋๋ฐฐ๋ก ํ์ง๋ง ํํฐ ๊ฐ์๊ฐ VGG๋ณด๋ค ์์ ๋์ ๋ ๊น๊ฒ ์์์ ํ๋ผ๋ฏธํฐ์๋ FLOPS๋ VGG๋ณด๋ค ๋ฎ์.
- objective : CE loss for classification, object detection loss
- baseline : VGG-16, GoogLeNet, plain(ResNet์ residual connection ๋บ๊ฑฐ)
- data : CIFAR-10, COCO 2015m ILSVRC 2015
- evaluation : accuracy, mAP, # params, FLOPS
- result : ์ด๋ฏธ์ง ๋ถ๋ฅ์์ sota. object detection์์ ์ฑ๋ฅ 28% ๊ฐ์
- contribution : residual connection
Details
Motivation

degration์ด๋ผ๋ ํ์. ๊น์ผ๋ฉด training error๊ฐ ๋ ๋์. ์ฆ overfitting์ด ๋ฌธ์ ๊ฐ ์๋๋ผ ํ์ต ์์ฒด๊ฐ ์ ์๋ ์ํฉ
Residual learning

residualํ๋ block์ ์ต์ 2๊ฐ ์ด์์ด์ด์ผ(1๊ฐ๋ฉด ๊ทธ๋ฅ linearํ๋ ํจ๊ณผ), ์ฐจ์๋ ๊ฐ์์ผ ํจ.
Network architecture

Network variants

๊ถ๊ธ์ฆ ํด๊ฒฐ ^^ 101๊ฐ ๋ ์ด์ด ์์ ๊ฒ์
training error on ImageNet

๊ธฐํ
์ด๊ธฐ ๋ ผ๋ฌธ๋ค ์ฝ์ผ๋ฉด ์ฌ๋ฐ์ ๋ฏ
- Neural Networks: Tricks of the Trade
- Understanding the difficulty of training deep feedforward neural networks https://proceedings.mlr.press/v9/glorot10a/glorot10a.pdf