Mistral har lansert Mistral Small 4, en åpen vektmodell med hybrid resonnement og bildeinput, og får 27 poeng på Artificial Analysis Intelligence Index @MistralAI Small 4 er en 119B blandingsmodell av eksperter med 6,5B aktive parametere per token, som støtter både resonnement- og ikke-resonnementmodus. I resonneringsmodus scorer Mistral Small 4 27 på Artificial Analysis Intelligence Index, en forbedring på 12 poeng fra Small 3,2 (15) og nå blant de mest intelligente modellene Mistral har lansert, og overgår Mistral Large 3 (23) og matcher den proprietære Magistral Medium 1,2 (27). Den ligger imidlertid bak åpne vekt-jevnaldrende med lignende totale parametertall som gpt-oss-120B (høy, 33), NVIDIA Nemotron 3 Super 120B A12B (Reasoning, 36), og Qwen3.5 122B A10B (Reasoning, 42). Viktige punkter: ➤ Resonnement- og ikke-resonnementmoduser i én modell: Mistral Small 4 støtter konfigurerbar hybrid resonnering med resonnement- og ikke-resonnementmodus, i motsetning til de separate resonnementvariantene Mistral tidligere har gitt ut med sine Magistral-modeller. I resonnementsmodus scorer modellen 27 på Artificial Analysis Intelligence Index. I ikke-resonnement-modus får modellen 19 poeng, en forbedring på 4 poeng fra forgjengeren Mistral Small 3.2 (15) ➤ Mer token-effektiv enn jevnaldrende av lignende størrelse: Med ~52 millioner output-tokens bruker Mistral Small 4 (Reasoning) færre tokens for å kjøre Artificial Analysis Intelligence Index sammenlignet med resonnementmodeller som gpt-oss-120B (høy, ~78M), NVIDIA Nemotron 3 Super 120B A12B (Reasoning, ~110M) og Qwen3.5 122B A10B (Reasoning, ~91M). I ikke-resonnerende modus bruker modellen ~4 millioner utgangstokens ➤ Innebygd støtte for bildeinput: Mistral Small 4 er en multimodal modell som aksepterer bildeinput så vel som tekst. På vår multimodale evaluering scorer MMMU-Pro, Mistral Small 4 (Resonnering) 57 %, foran Mistral Large 3 (56 %), men bak Qwen3,5 122B A10B (Resonnering, 75 %). Verken gpt-oss-120B eller NVIDIA Nemotron 3 Super 120B A12B støtter bildeinngang. Alle modeller støtter kun tekstutdata ➤ Forbedring i virkelige agentiske oppgaver: Mistral Small 4 får en Elo på 871 på GDPval-AA, vår evaluering er basert på OpenAIs GDPval-datasett som tester modeller på virkelige oppgaver på tvers av 44 yrker og 9 store bransjer, med modeller som produserer leveranser som dokumenter, regneark og diagrammer i en agentisk sløyfe. Dette er mer enn dobbelt så mye som Elo for Small 3.2 (339) og nær Mistral Large 3 (880), men bak gpt-oss-120B (høy, 962), NVIDIA Nemotron 3 Super 120B A12B (Reasoning, 1021), og Qwen3.5 122B A10B (Reasoning, 1130) ➤ Lavere hallusinasjonsrate enn jevnaldrende modeller av lignende størrelse: Mistral Small 4 scorer -30 på AA-Omniscience, vår vurdering av kunnskapspålitelighet og hallusinasjon, hvor poengsummene varierer fra -100 til 100 (høyere er bedre) og en negativ score indikerer flere feil enn riktige svar. Mistral Small scorer 4 ganger foran gpt-oss-120B (høy, -50), Qwen3.5 122B A10B (Reasoning, -40), og NVIDIA Nemotron 3 Super 120B A12B (Reasoning, -42) Viktige modelldetaljer: ➤ Kontekstvindu: 256 000 tokens (opp fra 128 000 på Small 3.2) ➤ Pris: $0,15/$0,6 per 1 million input/output-tokens ➤ Tilgjengelighet: Kun Mistral førsteparts API. Med native FP8-presisjon krever Mistral Small 4s 119B-parametere ~119 GB for å kunne hoste vektene selv (mer enn 80 GB HBM3-minne på en enkelt NVIDIA H100) ➤ Modalitet: Bilde- og tekstinntasting med kun tekstutgang ➤ Lisensiering: Apache 2.0-lisens
Når det gjelder intelligens vs totale parametere, tilbyr Mistral Small 4 (Reasoning, 27) en mindre gunstig avveining enn jevnaldrende i lignende størrelser som gpt-oss-120B (høy, 33), NVIDIA Nemotron 3 Super 120B A12B (Reasoning, 36) og Qwen3.5 122B A10B (Reasoning, 42)
Med ~52 millioner utdata bruker Mistral Small 4 (Reasoning) færre tokens for å kjøre Artificial Analysis Intelligence Index sammenlignet med jevnaldrende modeller som gpt-oss-120B (høy, ~78M), NVIDIA Nemotron 3 Super 120B A12B (Reasoning, ~110M) og Qwen3.5 122B A10B (Reasoning, ~91M)
Full oversikt over resultatene:
Fullstendige resultater tilgjengelig på Mistral Small 4-modellsiden om kunstig analyse:
8,26K