Мы оценили множество базовых моделей по оценкам на основе перплексии, и Kimi k2.5 оказалась самой сильной! После этого мы продолжаем предварительное обучение и высокопроизводительное RL (в 4 раза больше вычислений). Сочетание сильной базы, CPT и RL, а также инференс и RL-сэмплеры Fireworks делают Composer-2 на уровне передовых технологий. Мы упустили возможность упомянуть базу Kimi в нашем блоге с самого начала. Мы исправим это для следующей модели.