Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Artificial Analysis
Phân tích độc lập các mô hình AI và nhà cung cấp dịch vụ lưu trữ - chọn mô hình và nhà cung cấp API tốt nhất cho trường hợp sử dụng của bạn
Mistral đã phát hành Mistral Small 4, một mô hình trọng số mở với lý luận hỗn hợp và đầu vào hình ảnh, đạt 27 trên Chỉ số Trí tuệ Phân tích Nhân tạo
@MistralAI's Small 4 là một mô hình hỗn hợp chuyên gia 119B với 6.5B tham số hoạt động cho mỗi token, hỗ trợ cả chế độ lý luận và không lý luận.
Trong chế độ lý luận, Mistral Small 4 đạt 27 trên Chỉ số Trí tuệ Phân tích Nhân tạo, cải thiện 12 điểm so với Small 3.2 (15) và hiện nằm trong số những mô hình thông minh nhất mà Mistral đã phát hành, vượt qua Mistral Large 3 (23) và ngang bằng với Magistral Medium 1.2 (27). Tuy nhiên, nó vẫn thua kém các đồng nghiệp trọng số mở với số lượng tham số tổng tương tự như gpt-oss-120B (cao, 33), NVIDIA Nemotron 3 Super 120B A12B (Lý luận, 36), và Qwen3.5 122B A10B (Lý luận, 42).
Những điểm chính:
➤ Chế độ lý luận và không lý luận trong một mô hình duy nhất: Mistral Small 4 hỗ trợ lý luận hỗn hợp có thể cấu hình với chế độ lý luận và không lý luận, thay vì các biến thể lý luận riêng biệt mà Mistral đã phát hành trước đó với các mô hình Magistral của họ. Trong chế độ lý luận, mô hình đạt 27 trên Chỉ số Trí tuệ Phân tích Nhân tạo. Trong chế độ không lý luận, mô hình đạt 19, cải thiện 4 điểm so với người tiền nhiệm Mistral Small 3.2 (15)
➤ Hiệu quả token hơn so với các đồng nghiệp có kích thước tương tự: Với ~52M token đầu ra, Mistral Small 4 (Lý luận) sử dụng ít token hơn để chạy Chỉ số Trí tuệ Phân tích Nhân tạo so với các mô hình lý luận như gpt-oss-120B (cao, ~78M), NVIDIA Nemotron 3 Super 120B A12B (Lý luận, ~110M), và Qwen3.5 122B A10B (Lý luận, ~91M). Trong chế độ không lý luận, mô hình sử dụng ~4M token đầu ra
➤ Hỗ trợ đầu vào hình ảnh gốc: Mistral Small 4 là một mô hình đa phương thức, chấp nhận đầu vào hình ảnh cũng như văn bản. Trong đánh giá đa phương thức của chúng tôi, MMMU-Pro, Mistral Small 4 (Lý luận) đạt 57%, vượt qua Mistral Large 3 (56%) nhưng kém hơn Qwen3.5 122B A10B (Lý luận, 75%). Cả gpt-oss-120B và NVIDIA Nemotron 3 Super 120B A12B đều không hỗ trợ đầu vào hình ảnh. Tất cả các mô hình chỉ hỗ trợ đầu ra văn bản
➤ Cải thiện trong các nhiệm vụ tác nhân thực tế: Mistral Small 4 đạt Elo 871 trên GDPval-AA, đánh giá của chúng tôi dựa trên tập dữ liệu GDPval của OpenAI, kiểm tra các mô hình trên các nhiệm vụ thực tế trong 44 nghề nghiệp và 9 ngành công nghiệp lớn, với các mô hình sản xuất các sản phẩm như tài liệu, bảng tính và sơ đồ trong một vòng lặp tác nhân. Điều này gấp đôi Elo của Small 3.2 (339) và gần với Mistral Large 3 (880), nhưng kém hơn gpt-oss-120B (cao, 962), NVIDIA Nemotron 3 Super 120B A12B (Lý luận, 1021), và Qwen3.5 122B A10B (Lý luận, 1130)
➤ Tỷ lệ ảo tưởng thấp hơn so với các mô hình đồng nghiệp có kích thước tương tự: Mistral Small 4 đạt -30 trên AA-Omniscience, đánh giá của chúng tôi về độ tin cậy kiến thức và ảo tưởng, nơi điểm số dao động từ -100 đến 100 (cao hơn thì tốt hơn) và một điểm số âm cho thấy nhiều câu trả lời sai hơn đúng. Mistral Small 4 đạt điểm cao hơn gpt-oss-120B (cao, -50), Qwen3.5 122B A10B (Lý luận, -40), và NVIDIA Nemotron 3 Super 120B A12B (Lý luận, -42)
Chi tiết mô hình chính:
➤ Cửa sổ ngữ cảnh: 256K token (tăng từ 128K trên Small 3.2)
➤ Giá cả: $0.15/$0.6 cho mỗi 1M token đầu vào/đầu ra
➤ Tính khả dụng: Chỉ API của Mistral. Ở độ chính xác FP8 gốc, 119B tham số của Mistral Small 4 yêu cầu ~119GB để tự lưu trữ trọng số (nhiều hơn 80GB bộ nhớ HBM3 trên một NVIDIA H100 đơn)
➤ Phương thức: Đầu vào hình ảnh và văn bản với chỉ đầu ra văn bản
➤ Giấy phép: Giấy phép Apache 2.0

10,11K
SkyReels V4 chiếm vị trí số 1 trong lĩnh vực Chuyển Đổi Văn Bản thành Video Có Âm Thanh trong Arena Phân Tích Nhân Tạo, vượt qua Kling 3.0 và Veo 3.1!
SkyReels V4 là mô hình tạo video mới nhất từ @Skywork_ai, đánh dấu một sự chuyển mình lớn từ các mô hình tập trung vào avatar trước đó sang một hệ thống tạo video đa phương thức hoàn chỉnh hỗ trợ đầu vào Văn Bản, Hình Ảnh, Video và Âm Thanh. Mô hình này tạo ra video dài tới 15 giây với độ phân giải 1080p và hỗ trợ âm thanh gốc.
SkyReels V4 cũng hoạt động mạnh mẽ trên các phương thức khác, xếp hạng #2 trong Chuyển Đổi Văn Bản thành Video không có Âm Thanh, #4 trong Chuyển Đổi Hình Ảnh thành Video có Âm Thanh, và #7 trong Chuyển Đổi Hình Ảnh thành Video không có Âm Thanh.
Mô hình này có giá 7,20 USD mỗi phút với âm thanh và 8,40 USD mỗi phút không có âm thanh, định vị nó dưới Kling 3.0 1080p Pro (~20 USD/phút có âm thanh) và Veo 3.1 (24 USD/phút có âm thanh), mặc dù có giá cao hơn Grok Imagine với 4,20 USD/phút có âm thanh.
SkyReels V4 có sẵn qua trang web @SkyReels, với cả ứng dụng web và truy cập API. SkReels V4 Omni sẽ được phát hành sớm.
Xem bên dưới để biết các ví dụ về các thế hệ của SkyReels V4 trong Arena Phân Tích Nhân Tạo 🧵

248
Hàng đầu
Thứ hạng
Yêu thích
