[162] CALIP: Zero-Shot Enhancement of CLIP with Parameter-free Attention

2024년 7월 11일 · 1 분 · long8v · 

[128] Pix2Struct: Screenshot Parsing as Pretraining for Visual Language Understanding

2023년 8월 21일 · 3 분 · long8v · 

[98] Bridging the Gap between Object and Image-level Representations for Open-Vocabulary Detection

2023년 1월 17일 · 1 분 · long8v · 

[77] Interpretable Image Classification with Differentiable Prototype Assignment

2022년 11월 9일 · 2 분 · long8v · 

[75] SESS: Saliency Enhancing with Scaling and Sliding

2022년 11월 8일 · 2 분 · long8v · 

[76] Long-tail Detection with Effective Class-Margins

2022년 11월 8일 · 2 분 · long8v · 

[74] “This is my unicorn, Fluffy”: Personalizing frozen vision-language representations

2022년 11월 4일 · 2 분 · long8v · 

[68] Iterative Scene Graph Generation

2022년 10월 5일 · 2 분 · long8v · 

[60] Efficient Sparsely Activated Transformers

2022년 9월 2일 · 1 분 · long8v · 

[54] Branch-Train-Merge: Embarrassingly Parallel Training of Expert Language Models

2022년 8월 25일 · 2 분 · long8v · 

[41] Panoptic Scene Graph Generation

2022년 8월 1일 · 1 분 · long8v ·