Grok 4.20 Beta sisältää kolme merkittävää parannusta Grok 4:ään verrattuna: ➤ Alhaisin hallusinaatioprosentti koskaan AA-Kaikkitietävyyden arvioinnissa. Kun Grok ei tiennyt vastausta, se hallusinoi väärän vastauksen 22 % ajasta – tämä on alhaisin hallusinaatioprosentti kaikista testaamistamme malleista, ylittäen Claude Haikun 4,5 % (25 %) ➤ Parhaat pisteet ohjeiden noudattamisesta ja nopeasta noudattamisesta. IFBenchissä Grok 4,20 ottaa #1 sijan 82,9 %:lla – +29,2 pisteen nousu verrattuna Grok 4:ään ➤ Johtava nopeus älykkyydellään. 265 tokenin sekunnissa lähtönopeudella xAI:n API:ssa Grok 4.20 on huomattavasti nopeampi kuin vertaisensa ja yli 2 kertaa Grok 4.1 Fastin lähtönopeuteen verrattuna Onnittelut @xai:lle ja @elonmusk:lle 4.20 Beta 0309 -julkaisusta!
Lisäanalyysi keinotekoisesta analyysistä:
31,88K