La version bêta 4.20 de Grok présente trois améliorations majeures par rapport à Grok 4 : ➤ Notre taux d'hallucination le plus bas jamais enregistré lors de l'évaluation AA-Omniscience. Lorsque Grok ne connaissait pas la réponse, il a halluciné une réponse incorrecte 22 % du temps - c'est le taux d'hallucination le plus bas de tous les modèles que nous avons testés, surpassant Claude Haiku 4.5 (25 %) ➤ Meilleurs scores pour le suivi des instructions et l'adhérence aux invites. Sur IFBench, Grok 4.20 occupe la première place avec 82,9 % - une augmentation de +29,2 points par rapport à Grok 4 ➤ Vitesse de pointe pour son intelligence. Avec une vitesse de sortie de 265 tokens par seconde sur l'API de xAI, Grok 4.20 est significativement plus rapide que ses pairs et plus de 2 fois la vitesse de sortie observée avec Grok 4.1 Fast Félicitations à @xai et @elonmusk pour le lancement de la version bêta 4.20 0309 !
Analyse approfondie sur l'Analyse Artificielle :
32K