Бета-версия Grok 4.20 демонстрирует три основных улучшения по сравнению с Grok 4: ➤ Наша самая низкая когда-либо зафиксированная частота галлюцинаций в оценке AA-Omniscience. Когда Grok не знал ответа, он выдавал неправильный ответ 22% времени - это самая низкая частота галлюцинаций среди всех протестированных нами моделей, обогнав Claude Haiku 4.5 (25%) ➤ Высшие баллы за следование инструкциям и соблюдение подсказок. На IFBench Grok 4.20 занимает 1-е место с 82.9% - увеличение на 29.2 пункта по сравнению с Grok 4 ➤ Лидирующая скорость для своего интеллекта. При скорости вывода 265 токенов в секунду на API xAI, Grok 4.20 значительно быстрее своих аналогов и более чем в 2 раза быстрее, чем скорость вывода, наблюдаемая у Grok 4.1 Fast Поздравляем @xai и @elonmusk с запуском бета-версии 4.20 Beta 0309!
Дальнейший анализ Искусственного анализа:
31,91K