DApp Store | Web3 Hub for hendelser og spill

Populære emner

Mistral har lansert Mistral Small 4, en åpen vektmodell med hybrid resonnement og bildeinput, og får 27 poeng på Artificial Analysis Intelligence Index @MistralAI Small 4 er en 119B blandingsmodell av eksperter med 6,5B aktive parametere per token, som støtter både resonnement- og ikke-resonnementmodus. I resonneringsmodus scorer Mistral Small 4 27 på Artificial Analysis Intelligence Index, en forbedring på 12 poeng fra Small 3,2 (15) og nå blant de mest intelligente modellene Mistral har lansert, og overgår Mistral Large 3 (23) og matcher den proprietære Magistral Medium 1,2 (27). Den ligger imidlertid bak åpne vekt-jevnaldrende med lignende totale parametertall som gpt-oss-120B (høy, 33), NVIDIA Nemotron 3 Super 120B A12B (Reasoning, 36), og Qwen3.5 122B A10B (Reasoning, 42). Viktige punkter: ➤ Resonnement- og ikke-resonnementmoduser i én modell: Mistral Small 4 støtter konfigurerbar hybrid resonnering med resonnement- og ikke-resonnementmodus, i motsetning til de separate resonnementvariantene Mistral tidligere har gitt ut med sine Magistral-modeller. I resonnementsmodus scorer modellen 27 på Artificial Analysis Intelligence Index. I ikke-resonnement-modus får modellen 19 poeng, en forbedring på 4 poeng fra forgjengeren Mistral Small 3.2 (15) ➤ Mer token-effektiv enn jevnaldrende av lignende størrelse: Med ~52 millioner output-tokens bruker Mistral Small 4 (Reasoning) færre tokens for å kjøre Artificial Analysis Intelligence Index sammenlignet med resonnementmodeller som gpt-oss-120B (høy, ~78M), NVIDIA Nemotron 3 Super 120B A12B (Reasoning, ~110M) og Qwen3.5 122B A10B (Reasoning, ~91M). I ikke-resonnerende modus bruker modellen ~4 millioner utgangstokens ➤ Innebygd støtte for bildeinput: Mistral Small 4 er en multimodal modell som aksepterer bildeinput så vel som tekst. På vår multimodale evaluering scorer MMMU-Pro, Mistral Small 4 (Resonnering) 57 %, foran Mistral Large 3 (56 %), men bak Qwen3,5 122B A10B (Resonnering, 75 %). Verken gpt-oss-120B eller NVIDIA Nemotron 3 Super 120B A12B støtter bildeinngang. Alle modeller støtter kun tekstutdata ➤ Forbedring i virkelige agentiske oppgaver: Mistral Small 4 får en Elo på 871 på GDPval-AA, vår evaluering er basert på OpenAIs GDPval-datasett som tester modeller på virkelige oppgaver på tvers av 44 yrker og 9 store bransjer, med modeller som produserer leveranser som dokumenter, regneark og diagrammer i en agentisk sløyfe. Dette er mer enn dobbelt så mye som Elo for Small 3.2 (339) og nær Mistral Large 3 (880), men bak gpt-oss-120B (høy, 962), NVIDIA Nemotron 3 Super 120B A12B (Reasoning, 1021), og Qwen3.5 122B A10B (Reasoning, 1130) ➤ Lavere hallusinasjonsrate enn jevnaldrende modeller av lignende størrelse: Mistral Small 4 scorer -30 på AA-Omniscience, vår vurdering av kunnskapspålitelighet og hallusinasjon, hvor poengsummene varierer fra -100 til 100 (høyere er bedre) og en negativ score indikerer flere feil enn riktige svar. Mistral Small scorer 4 ganger foran gpt-oss-120B (høy, -50), Qwen3.5 122B A10B (Reasoning, -40), og NVIDIA Nemotron 3 Super 120B A12B (Reasoning, -42) Viktige modelldetaljer: ➤ Kontekstvindu: 256 000 tokens (opp fra 128 000 på Small 3.2) ➤ Pris: $0,15/$0,6 per 1 million input/output-tokens ➤ Tilgjengelighet: Kun Mistral førsteparts API. Med native FP8-presisjon krever Mistral Small 4s 119B-parametere ~119 GB for å kunne hoste vektene selv (mer enn 80 GB HBM3-minne på en enkelt NVIDIA H100) ➤ Modalitet: Bilde- og tekstinntasting med kun tekstutgang ➤ Lisensiering: Apache 2.0-lisens

Når det gjelder intelligens vs totale parametere, tilbyr Mistral Small 4 (Reasoning, 27) en mindre gunstig avveining enn jevnaldrende i lignende størrelser som gpt-oss-120B (høy, 33), NVIDIA Nemotron 3 Super 120B A12B (Reasoning, 36) og Qwen3.5 122B A10B (Reasoning, 42)

Med ~52 millioner utdata bruker Mistral Small 4 (Reasoning) færre tokens for å kjøre Artificial Analysis Intelligence Index sammenlignet med jevnaldrende modeller som gpt-oss-120B (høy, ~78M), NVIDIA Nemotron 3 Super 120B A12B (Reasoning, ~110M) og Qwen3.5 122B A10B (Reasoning, ~91M)

Full oversikt over resultatene:

Fullstendige resultater tilgjengelig på Mistral Small 4-modellsiden om kunstig analyse:

8,26K

Topp

Rangering

Favoritter