problem : Self-supervised-Learning์ด CLIP ๋ชจ๋ธ ๊ตฌ์กฐ์์๋ ์ ์๋ํ๋์ง ์คํ solution : ์ด๋ฏธ์ง์ ํ ์คํธ์ ๋ํด์๋ contrastive learning ์ ํ๊ณ , ์ด๋ฏธ์ง์ ๋ํด์๋ self-supervision learning ์ ํ์ฌ ๋ก์ค๋ฅผ ํฉํ์ฌ ํ์ต. result : linear prediction(=representation์ FCN ๋ถ์ฌ์ ๋ถ๋ฅํ๋๊ฒ. linear๋ง ํ์ตํจ. BERT์์ ์ธ๊ธํ๋ ‘feature-based learning’), zero-shot learning, end-to-end finetuning์์ SOTA
