Avaliamos muitos modelos base em avaliações baseadas em perplexidade e o Kimi k2.5 provou ser o mais forte! Depois disso, continuamos o pré-treinamento e RL de alto nível de computação (um aumento de 4x). A combinação da base forte, CPT e RL, e dos samplers de inferência e RL da Fireworks faz do Composer-2 um nível de fronteira. Foi um erro não mencionar a base Kimi no nosso blog desde o início. Vamos consertar isso para o próximo modelo.