تظهر نسخة Grok 4.20 Beta ثلاث تحسينات رئيسية مقارنة ب Grok 4: ➤ أدنى معدل هلوسة لدينا على الإطلاق في تقييم AA-العلم المطلق. عندما لم يكن جروك يعرف الإجابة، كان يهلوس إجابة خاطئة بنسبة 22٪ من الوقت - وهذا هو أدنى معدل هلوسة لأي نموذج اختبرناه، متفوقا على كلود هايكو بمقدار 4.5 (25٪) ➤ أعلى الدرجات في اتباع التعليمات والالتزام الفوري. في IFBench، يحتل Grok 4.20 المركز #1 بنسبة 82.9٪ - بزيادة +29.2 نقطة عن Grok 4 ➤ سرعة القيادة لذكائها. عند سرعة إخراج 265 رمزا في الثانية على واجهة برمجة تطبيقات xAI، فإن Grok 4.20 أسرع بكثير من نظيره وأكثر من ضعف سرعة الإخراج التي تظهرها Grok 4.1 Fast مبروك ل @xai @elonmusk على إطلاق النسخة التجريبية 0309 في 4.20!
مزيد من التحليل حول التحليل الاصطناعي:
‏‎31.88‏K