
TL;DR
- I read this because.. : sgg ์ด๊ธฐ ๋ ผ๋ฌธ
- task : Scene Graph Generation
- problem : object ๋ฝ๊ณ quadraticํ relation์ ์ ๋ค๋ค๋ณด์. ๊ฐํ๋ ๊ทธ๋ํ ํํ์ ๋ง๋ค์ด๋ณด์.
- idea : object ๊ฐ์ relation์ pruningํ๋ ๋ชจ๋์ ์ค๊ฐ์ ๋ฃ์. attentional GCN์ ์ ์ฉํ์.
- architecture : 1) Faster RCNN์ผ๋ก Object ๋ฝ๊ณ 2) object cls logit ๊ฐ๋ค concatํด์ relation pruning 3) attentional GCN์ ์ ์ฉํด์ object, relation ๋ ธ๋์ ํํ์ ๊ฐํ -> ๊ฐ subject, object, relation ํํ์ classifier ๋ถ์ฌ์ ์์ธกํ๋ฏ?
- objective : 1) bbox loss + cls loss 2) bce for relationship score 3) ce for object cls and predicate cls
- baseline : IMP, MSDN, NeuralMotif
- data : Visual Genome
- evaluation : PredCls, PhrCls, SGGen, SGGen+(proposed in this paper)
- result : SOTA
- contribution : ์๋ง GCN์ ์ ์ฉํ ์ต์ด์ ๋ ผ๋ฌธ์ด ์๋๋ฐ์ง?
- limitation / things I cannot understand : SGG์ ์ ๋ง GCN์ ์ธ ์ ๋๋ก graph ์ ์ธ ํน์ฑ์ ๊ฐ์ง๊ณ ์๋๊ฐ?
Details
Architecture

3๋จ๊ณ๋ก ๋๋
- Object Region Proposal : image๊ฐ ์ฃผ์ด์ก์ ๋ node(=vertex, V)๋ค ๋ฝ๊ธฐ => Faster RCNN
- Relationship Proposal : image์ node๊ฐ ์ฃผ์ด์ก์ ๋ ๋ชจ๋ ๊ฒฝ์ฐ์ ์ n*(n-1)์์ ์์๋งํ relation pruning
- Graph Labeling : image, node, edge๊ฐ ์ฃผ์ด์ก์ ๋ relation๊ณผ object ์ฐพ๊ธฐ
Relation Proposal Network
object์ class logit์ ์ฌ์ฉํ์ฌ “relatedness"๋ฅผ ์ธก์ .
์ผ์ข
์ softํ prior๋ฅผ ์ฃผ๋ ํ์(๊ฐ๋ น, person-ride-chicken์ ๋ ์ ์์ผ๋?)

๊ตฌํ์ catํ ๋ค์ MLP ์์.
score๋ฅผ ๋งค๊ฒจ์ sorting์ ํ ๋ค์ K๊ฐ์ pair๋ฅผ ๋ฝ์. Faster RCNN์ด๊ธฐ ๋๋ฌธ์ ๋ง์ด ๋์ฌ๊ฑฐ๋ผ์ pair์ ๋ํ NMS๋ฅผ ํด์ top m๊ฐ์ pair๋ง ๋จ๊น

Attentional GCN
Vanilla GCN์ ์๋์ ๊ฐ์

- $z_i$ : i๋ฒ์งธ node์ ํํ
- $N(i)$ : i๋ฒ์งธ node์ neighbor๋ค
- $\alpha_{ij}$ : i์ j์ adjacency matrix์ ์ํด ๋ง๋ค์ด์ง๋ connection coefficient
์ด๋ฅผ $Z\in \mathbb{R}^{d\times T_n}$๋ผ๋ matrix๋ก ํํํ๋ฉด

์ฐ๋ฆฌ๋ ์ฌ๊ธฐ์ $\alpha_{ij}$๋ฅผ ์ฃผ์ด์ง๋๊ฒ ์๋๋ผ ํ์ตํ๋ ค๊ณ ํจ

2 layer MLP + softmax๋ก $\alpha_{ij}$๊ฐ ํ์ต
aGCN for SGG
N๊ฐ์ Object region๋ค๊ณผ m๊ฐ์ relationship์ ๊ฐ๊ฐ node๋ก ๋ง๋ค๊ณ ์์ ๋คํธ์ํฌ์์ ๋์จ๊ฑธ๋ก edge๋ค์ ์ฐ๊ฒฐํด์ค. ์ถ๊ฐ์ ์ผ๋ก object๊ฐ์๋ direct edge๋ค์ ์ถ๊ฐํด์ค.
object node์ ๋ํ ํํ์ ์๋์ ๊ฐ์

relation node์ ๋ํ ํํ์ ์๋์ ๊ฐ์.

Result

Ablation for modules

