Il est intéressant de constater que personne ne comprend que le pipeline RL est la partie la plus difficile de la construction d'un modèle sota de nos jours (du moins pour une taille de paramètre inférieure à 1T).