Grok 4.20 Beta, Grok 4'e göre üç büyük iyileştirme gösteriyor: ➤ AA-Everything Knowledge değerlendirmesinde şimdiye kadarki en düşük halüsinasyon oranımız. Grok cevabı bilmediğinde, %22 oranında yanlış cevap gördü - bu, test ettiğimiz modeller arasında en düşük halüsinasyon oranıdır ve Claude Haiku'yu 4.5 (%25) üstlenmiştir ➤ Talimatların takip edilmesi ve hızlı uyum için en yüksek puanlar. IFBench'te ise Grok 4.20, %82.9 ile #1 sırada yer alıyor - Grok 4'e göre +29.2 puan artış ➤ Zekası için önde gelen hız. xAI API'sinde saniyede 265 token çıkış hızıyla Grok 4.20, rakipinden önemli ölçüde daha hızlıdır ve Grok 4.1 Fast'tan gördüğü çıkış hızının 2 katından fazla 4.20 Beta 0309 çıkışı nedeniyle @xai ve @elonmusk'yi tebrik ederiz!
Yapay Analiz hakkında daha fazla analiz:
31,94K