[189] Training Verifiers to Solve Math Word Problems

2024년 12월 9일 · 1 분 · long8v · 

[158] A Mathematical Framework for Transformer Circuits

2024년 5월 9일 · 3 분 · long8v · 

[124] LiT: Zero-Shot Transfer with Locked-image text Tuning

2023년 7월 6일 · 3 분 · long8v · 

[90] Neural Collaborative Graph Machines for Table Structure Recognition

2022년 12월 22일 · 1 분 · long8v · 

[87] Bipartite Graph Network with Adaptive Message Passing for Unbiased Scene Graph Generation

2022년 12월 8일 · 2 분 · long8v · 

[65] Margin Calibration for Long-Tailed Visual Recognition

2022년 9월 19일 · 1 분 · long8v · 

[63] Masked Autoencoders Are Scalable Vision Learners

2022년 9월 7일 · 1 분 · long8v · 

[58] MetaFormer Is Actually What You Need for Vision

2022년 8월 31일 · 1 분 · long8v · 

[45] BGT-Net: Bidirectional GRU Transformer Network for Scene Graph Generation

2022년 8월 3일 · 1 분 · long8v · 

[44] Context-Aware Scene Graph Generation With Seq2Seq Transformers

2022년 8월 2일 · 2 분 · long8v · 

[16] Counterfactual Memorization in Neural Language Models

2022년 3월 25일 · 3 분 · long8v · 

[7] SLIP: Self-supervision meets Language-Image Pre-training

2022년 1월 20일 · 1 분 · long8v · 

[6] Crossing the Format Boundary of Text and Boxes: Towards Unified Vision-Language Modeling

2022년 1월 18일 · 1 분 · long8v · 

[2] ELSA: Enhanced Local Self-Attention for Vision Transformer

2022년 1월 7일 · 1 분 · long8v · 

[1] Tokens-to-Token ViT: Training Vision Transformers from Scratch on ImageNet

2022년 1월 5일 · 1 분 · long8v ·