[76] Long-tail Detection with Effective Class-Margins

TL;DR

task : long-tail object detection
problem : COCO 데이터는 long-tail로 annotation 되어있고 그에 맞게 학습하는데 평가 metric인 mAP는 AUC여서 간극이 있음
idea : mAP를 probabilistic하게 바꾸고 이를 detection에서의 class-margin bounds 하의 pairwise ranking error(=negative sample x’가 positive x 보다 더 높게 rank 되는 frequency를 측정)의 weighted version으로 bound해서 이를 최적화.
architecture : Mask R-CNN, Cascade Mask R-CNN
objective : ECM loss
baseline : CE Loss, Federated Loss, Seesaw Loss, LOCE loss
data : LVIS v1, Open Images
result : SOTA
contribution : no hyper-parameter for long-tail problem
limitation or 이해 안되는 부분 : 수식식을 다 이해하진 못함. duplicate object에 대한 penalty 효과가 없다고 함. DETR류에는 못 쓰이려나?

대부분의 선행 연구가 loss를 implicit/explicit 하게 re-weighting하는 접근법.
Equalization loss : rare class의 negative gradient를 제거하는 방식
- 다른 클래스들의 negative gradient들에 의해 rare한 class가 discourage 된다는 가정
Balanced Group Softmax(BaGS) : training set에 나온 빈도별로 group을 나누고 거기서 softmax + cross-entropy 구함
federated loss : 이미지에서 나온 class의 negative gradient만 계산함
Equalization Loss V2 : 클래스별로 positive / negative의 누적 비율을 맞추려고 함
SeeSaw loss : rare class의 negative gradient에 대한 weight를 frequency가 높으면 줄여줌