Evaluation | 🍎 Paper Today I Read 🦔

[174] Evaluations for Object Hallucinations

survey evaluation MLLM

[165] Rich Human Feedback for Text-to-Image Generation

CVPR 2023Q4 evaluation

[163] What You See is What You Read? Improving Text-Image Alignment Evaluation

google NeurIPS 2023Q2 evaluation

[164] TIFA: Accurate and Interpretable Text-to-Image Faithfulness Evaluation with Question Answering

ICCV evaluation 2023Q3

[160] ALOHa: A New Measure for Hallucination in Captioning Models

evaluation 2024Q2 NAACL

[155] Revisiting Text-to-Image Evaluation with Gecko: On Metrics, Prompts, and Human Ratings

google evaluation generation 2024Q2

[154] Mismatch Quest: Visual and Textual Feedback for Image-Text Misalignment

google XAI evaluation 2024Q2

[151] FOIL it! Find One mismatch between Image and Language caption

dataset 2017 XAI evaluation

[145] CLIPScore: A Reference-free Evaluation Metric for Image Captioning

2021Q2 CLIP emnlp evaluation AI2

[139] Davidsonian Scene Graph: Improving Reliability in Fine-Grained Evaluation for Text-to-Image Generation

google 2023Q4 evaluation generation