Grok 4.20 Beta cho thấy ba cải tiến lớn so với Grok 4: ➤ Tỷ lệ ảo tưởng thấp nhất từ trước đến nay trong đánh giá AA-Omniscience. Khi Grok không biết câu trả lời, nó đã ảo tưởng một câu trả lời sai 22% thời gian - đây là tỷ lệ ảo tưởng thấp nhất của bất kỳ mô hình nào mà chúng tôi đã thử nghiệm, vượt qua Claude Haiku 4.5 (25%) ➤ Điểm số hàng đầu cho việc tuân thủ hướng dẫn và tuân thủ yêu cầu. Trên IFBench, Grok 4.20 chiếm vị trí số 1 với 82.9% - tăng 29.2 điểm so với Grok 4 ➤ Tốc độ dẫn đầu cho trí thông minh của nó. Với tốc độ đầu ra 265 token mỗi giây trên API của xAI, Grok 4.20 nhanh hơn đáng kể so với các đồng nghiệp và nhanh hơn hơn 2 lần so với tốc độ đầu ra của Grok 4.1 Fast Chúc mừng @xai và @elonmusk về việc ra mắt 4.20 Beta 0309!
Phân tích thêm về Phân tích Nhân tạo:
31,95K