Grok 4.20 Beta visar tre stora förbättringar jämfört med Grok 4: ➤ Vår lägsta hallucinationsfrekvens någonsin på AA-Allvetande-utvärderingen. När Grok inte visste svaret hallucinerade den ett felaktigt svar 22 % av gångerna – detta är den lägsta hallucinationsfrekvensen av alla modeller vi testat, och toppar Claude Haiku med 4,5 (25 %) ➤ Högsta poäng för instruktionsföljning och snabb följsamhet. På IFBench tar Grok 4,20 #1-platsen med 82,9 % – en +29,2 poängs ökning jämfört med Grok 4 ➤ Ledande hastighet för sin intelligens. Med 265 tokens per sekund i utmatningshastighet på xAI:s API är Grok 4.20 betydligt snabbare än sin motsvarighet och över dubbelt så snabb som Grok 4.1 Fast Grattis till @xai och @elonmusk till lanseringen av Beta 0309 i 4.20!
Ytterligare analys av artificiell analys:
31,88K