2025Q3 | 🍎 Paper Today I Read 🦔

[219] GLM-4.5V and GLM-4.1V-Thinking: Towards Versatile Multimodal Reasoning with Scalable Reinforcement Learning

[215] Group Sequence Policy Optimization

[213] Skywork-R1V3 Technical Report

MLLM reasoning 2025Q3