[171] CLIP-DPO: Vision-Language Models as a Source of Preference for Fixing Hallucinations in LVLMs

2024년 8월 30일 · 2 분 · long8v · 

[77] Interpretable Image Classification with Differentiable Prototype Assignment

2022년 11월 9일 · 2 분 · long8v · 

[75] SESS: Saliency Enhancing with Scaling and Sliding

2022년 11월 8일 · 2 분 · long8v · 

[76] Long-tail Detection with Effective Class-Margins

2022년 11월 8일 · 2 분 · long8v · 

[74] “This is my unicorn, Fluffy”: Personalizing frozen vision-language representations

2022년 11월 4일 · 2 분 · long8v · 

[65] Margin Calibration for Long-Tailed Visual Recognition

2022년 9월 19일 · 1 분 · long8v · 

[62] What to Hide from Your Students: Attention-Guided Masked Image Modeling

2022년 9월 6일 · 1 분 · long8v · 

[37] Relationformer: A Unified Framework for Image-to-Graph Generation

2022년 7월 21일 · 2 분 · long8v ·