Grok 4.20:新的性能標準 來自 @xAI 的最新更新帶來了巨大的聲明,報導在 MMLU-Pro 基準測試中達到 95% 的準確率。這代表著推理能力相比於之前的版本如 Grok 3 有了重大飛躍。 主要改進包括增強的「回退推理」以解決複雜問題,以及在 STEM 和編碼領域的卓越表現。該模型還具備先進的多模態理解,以改善圖像和視頻處理。 速度已被優先考慮,響應時間比以前快了多達 10 倍。這些升級以一個名為「Alpha Arena」的精簡用戶界面包裝,以提高可用性。 來源:@MarsUniversityX