Hodnotili jsme mnoho základních modelů na základě perplexity a Kimi K2.5 se ukázal jako nejsilnější! Poté pokračujeme v předškolení a vysokovýpočetním RL (čtyřnásobné zvětšení). Kombinace silného základu, CPT a RL a inference a RL samplerů z Fireworks dělá z Composer-2 úroveň na hranici. Bylo chybou od začátku nezmínit základnu Kimi v našem blogu. To opravíme u dalšího modelu.