LM | 🍎 Paper Today I Read 🦔

[54] Branch-Train-Merge: Embarrassingly Parallel Training of Expert Language Models

LM MoE 2022Q3 25min

[16] Counterfactual Memorization in Neural Language Models

NLP 2021Q4 privacy LM

[15] Quantifying Memorization Across Neural Language Models

NLP 2022Q1 privacy LM