2024Q2 | 🍎 Paper Today I Read 🦔

[182] Calibrated Self-Rewarding Vision Language Models

NeurIPS 25min RL MLLM 2024Q2

[178] RLAIF-V: Aligning MLLMs through Open-Source AI Feedback for Super GPT-4V Trustworthiness

[172] RLHF-V: Towards Trustworthy MLLMs via Behavior Alignment from Fine-grained Correctional Human Feedback

CVPR RL MLLM 2024Q2

[170] Unpacking DPO and PPO: Disentangling Best Practices for Learning from Preference Feedback

[160] ALOHa: A New Measure for Hallucination in Captioning Models

evaluation 2024Q2 NAACL

[157] LeGrad: An Explainability Method for Vision Transformers via Feature Formation Sensitivity

CLIP XAI 2024Q2

feat: add LeGrad

[155] Revisiting Text-to-Image Evaluation with Gecko: On Metrics, Prompts, and Human Ratings

google evaluation generation 2024Q2

[154] Mismatch Quest: Visual and Textual Feedback for Image-Text Misalignment

google XAI evaluation 2024Q2