Problem : Swin Transformer์ Local Self-Attention(LSA)๋ฅผ Depthwise-Conv(DeConv) ํน์ Decoupled Dynamic Filter(DDF)๋ก ๋ฐ๊พธ์์ ๋ ์ฑ๋ฅ์ด ๋ ์ข์๋ค Solution : DeConv์ DDF์ LSA๋ฅผ attention ์์ผ๋ก ํํํ๊ณ ablation study๋ฅผ ํจ. head๋ฅผ ๋๋ฆฌ๋ ๊ฒ๊ณผ sliding ๋ฐฉ๋ฒ์ด ์ฑ๋ฅ์ ์ค์ํ๋ค๋ ๊ฒ์ ๋ฐํ๋๊ณ ์ด๋ฅผ ์ํด ghost-head, dot-product๋ณด๋ค ํจ์จ์ ์ธ hadamard attention์ ์ ์ํจ. Result : LSA์ ์ ์ฌํ ํ๋ผ๋ฏธํฐ๋ก ๋ ๋์ FLOPS, ๋ถ๋ฅํ์คํฌ์์ SwinTransformer์ ์ฑ๋ฅ ๊ฐ์ ๋๋ ์ : local window๋ณด๋ค๋ neighboring window(=sliding window)๊ฐ ์ฑ๋ฅ์ด ๋ ์ข๋ค.. ์ง๋ ๋ ผ๋ฌธ๋ ๋ค์๋ ๋๋์ฒ๋ผ ์ ์ CNN์ ๋ฐฉ๋ฒ๋ก ์ ๋ ์ ์ฉํ๋ฉด ์ ์ฉํ ์๋ก ์ข์์ง… details : paper summary