diff --git a/II-Developpements/1_Anatomie_LLM.qmd b/II-Developpements/1_Anatomie_LLM.qmd index bbafab0..b5c5015 100644 --- a/II-Developpements/1_Anatomie_LLM.qmd +++ b/II-Developpements/1_Anatomie_LLM.qmd @@ -251,5 +251,6 @@ L'algorithme de DPO (Direct Preference Optimization) permet de mettre à jour le - [Guide pratique / Implémentation HugginFace](https://huggingface.co/blog/dpo-trl) Liens des papiers originaux : + - [DPO](https://arxiv.org/abs/2305.18290) - [KTO](https://arxiv.org/abs/2402.01306)