La Beta de Grok 4.20 muestra tres mejoras importantes respecto a Grok 4: ➤ Nuestra tasa de alucinaciones más baja en la evaluación de AA-Omnisciencia. Cuando Grok no sabía la respuesta, alucinó una respuesta incorrecta el 22% de las veces; esta es la tasa de alucinaciones más baja de todos los modelos que hemos probado, superando a Claude Haiku con 4,5 (25%) ➤ Mejores puntuaciones en seguimiento de instrucciones y adhesión rápida. En IFBench, Grok 4.20 ocupa el puesto #1 con un 82.9%, un aumento de +29.2 puntos respecto a Grok 4 ➤ Velocidad de avance por su inteligencia. Con una velocidad de salida de 265 tokens por segundo en la API de xAI, Grok 4.20 es significativamente más rápido que su homólogo y más del doble de velocidad de salida que Grok 4.1 Fast ¡Enhorabuena a @xai y @elonmusk por el lanzamiento de la Beta 4.20 0309!
Análisis adicional sobre análisis artificial:
31.88K