Document | 🍎 Paper Today I Read 🦔

[136] Visually-Situated Natural Language Understanding with Contrastive Reading Model and Frozen Large Language Models

multimodal naver 2021Q3 document emnlp

[128] Pix2Struct: Screenshot Parsing as Pretraining for Visual Language Understanding

ICML google 2022Q3 document

[90] Neural Collaborative Graph Machines for Table Structure Recognition

2021Q4 CVPR graph document