Intressant hur ingen förstår att RL-pipelinen är den svåraste delen av att bygga en SOTA-modell nuförtiden (åtminstone under 1T paramstorlek)