MiniMax M3: avoin malli, 1M konteksti ja huippukoodaus

MiniMax julkaisi M3-mallin, joka yhdistää kolme rajaominaisuutta samaan avoimeen pakettiin. Malli on natiivisti multimodaalinen, käsittelee miljoonan tokenin kontekstia ja yltää koodauksessa avointen mallien kärkeen. Painot ilmestyivät Hugging Faceen heti julkaisupäivänä. Kuka tahansa voi ladata ne ilman erillistä hyväksyntää.

Kyseessä on Mixture of Experts (MoE) -malli, jossa on 428 miljardia parametria. Yhtä tokenia kohden aktivoituu vain noin 23 miljardia parametria. Rakenne pitää laskennan kevyenä, vaikka mallin kokonaiskoko on suuri. MiniMaxin mukaan M3 on ensimmäinen avoin malli, joka tuo nämä kolme rajaominaisuutta yhteen.

Arkkitehtuuri yhdistää harvuuden ja multimodaalin

M3 on suunniteltu multimodaaliseksi alusta alkaen. Se lukee tekstiä, kuvia ja videota samassa syötteessä ilman erillistä jälkikäteen liitettyä osaa. Tämä erottaa sen monista malleista, joihin kuvantulkinta on lisätty vasta myöhemmin. Yhtenäinen rakenne vähentää viivettä ja yksinkertaistaa käyttöä.

Miljoonan tokenin konteksti-ikkuna nojaa MiniMax Sparse Attention -tekniikkaan. Harva tarkkaavaisuus käsittelee täydellä painolla vain osan token-pareista. Yhtiö lupaa tekniikan tuovan merkittäviä nopeushyötyjä, kun konteksti kasvaa suureksi. Pisinkin ikkuna pysyy näin käyttökelpoisena.

MoE-rakenteessa malli reitittää jokaisen tokenin vain pienelle joukolle asiantuntijaverkkoja. Näin 428 miljardin parametrin malli toimii samalla laskentabudjetilla kuin paljon pienempi tiheä malli. Kompromissina on muistintarve, sillä kaikki painot pitää silti ladata. Tehokkuus syntyy laskennasta, ei muistista.

Yhdistelmä on harvinainen avoimissa malleissa. Multimodaalisuus, pitkä konteksti ja MoE-tehokkuus löytyvät harvoin samasta paketista. M3 niputtaa ne yhteen ilman käyttörajoituksia. Juuri tämä tekee julkaisusta poikkeuksellisen.

Abstrakti visualisointi harvasta tarkkaavaisuudesta: vain osa yhteyspisteistä hehkuu kirkkaana.

Koodaus ja agenttitehtävät ovat kärkeä

M3:n vahvin lupaus on koodaus- ja agenttisuorituskyky. Malli saa SWE-Bench Pro -testissä 59,0 prosenttia. Tulos nostaa sen avointen mallien parhaimmistoon ohjelmistotehtävissä. Ero suljettuihin kärkimalleihin on kaventunut selvästi.

Terminaalitehtävissä malli yltää 66,0 prosenttiin Terminal Bench 2.1 -mittarissa. MCP Atlas -vertailussa tulos on 74,2 prosenttia. Luvut kertovat kyvystä ketjuttaa työkalukutsuja ja viedä monivaiheisia tehtäviä loppuun. Juuri tällaista vakautta agenttityö vaatii.

MiniMax julkaisi mallin rinnalle MiniMax Code -työkalun. Se vie mallin suoraan kehittäjän työnkulkuun. Yhdistelmä asettaa M3:n kilpailemaan suoraan suljettujen koodausmallien kanssa. Kehittäjä voi kokeilla mallia ilman omaa palvelinasennusta.

Avoimet mallit ovat kuroneet eroa suljettuihin koodausmalleihin nopeasti. M3:n tulokset nostavat sen samaan keskusteluun kärkimallien kanssa. Käytännön työssä ratkaisee, kuinka luotettavasti malli vie pitkät tehtäväketjut loppuun. Benchmark-luvut antavat siihen lupaavan lähtökohdan.

Kehittäjän työpiste yöllä, useita näyttöjä täynnä hehkuvaa koodia.

Painot saatavilla ilman jonotusta

M3:n painot julkaistiin Hugging Facessa ilman porttia tai odotuslistaa. Kuka tahansa voi ladata täyden mallikortin heti. Tämä avaa oven paikalliseen hienosäätöön ja yksityisiin klusteriajoihin. Avoimuus madaltaa kokeilun kynnystä tuntuvasti.

Avoin julkaisu jatkaa kiinalaisten laboratorioiden viime kuukausien tahtia. DeepSeek, Moonshot ja Qwen ovat tuoneet markkinoille avoimia malleja tiheässä tahdissa. M3 vie saman linjan entistä suurempaan mittakaavaan. Kilpailu avointen mallien kärjessä kiristyy.

Avoimuus tarkoittaa myös, että yritykset voivat ajaa mallin omassa ympäristössään. Se on tärkeää aloilla, joilla dataa ei voi lähettää ulkopuoliseen rajapintaan. Itse isännöinti vaatii kuitenkin merkittävää laskentatehoa MoE-mallin koon vuoksi. Käyttöönotto edellyttää siksi suunnittelua.

Painojen vapaa saatavuus tukee myös tutkimusta. Yhteisö voi tarkastella mallin toimintaa ja rakentaa sen päälle. Tällainen läpinäkyvyys puuttuu suljetuilta malleilta. Se on avointen julkaisujen pysyvä etu.

Hehkuva avoin holvi vapauttaa datavirtoja palvelimille, kuva avoimista mallipainoista.

Hinnoittelu kiristyy pitkässä kontekstissa

MiniMax tarjoaa M3:n myös rajapinnan kautta. Perushinta on noin 0,30 dollaria miljoonalta syötetokenilta reitityspalveluissa. Hinta asettuu muiden avointen mallien tasolle. Kynnys kokeilla rajapintaa on siksi matala.

Hinta kuitenkin nousee, kun konteksti ylittää 512 000 tokenia. Täydellä miljoonan tokenin ikkunalla veloitus voi kaksinkertaistua. Pisin konteksti maksaa siis selvästi lyhyttä enemmän. Kustannus kannattaa laskea etukäteen.

Hinnoittelumalli kannustaa käyttämään pitkää kontekstia harkiten. Useimmissa tehtävissä lyhyempi ikkuna riittää ja pitää kustannukset kurissa. Miljoonan tokenin ikkuna on varattu tilanteisiin, joissa koko aineisto on luettava kerralla. Tällöin pitkä konteksti maksaa itsensä takaisin.

Pitkä konteksti sopii erityisesti koko koodikannan tai laajan dokumenttijoukon käsittelyyn kerralla. Tällöin malli näkee kaiken aineiston ilman pilkkomista. Arkitehtävissä riittää useimmiten lyhyempi ja edullisempi ikkuna. Valinta riippuu siis tehtävän laajuudesta.

Laaja konesalikäytävä palvelinräkkien rivistöineen, kuvaa laskennan mittakaavaa.

Yhteenveto

M3 vahvistaa avointen mallien asemaa rajakyvyissä. Se yhdistää multimodaalin, pitkän kontekstin ja kärkiluokan koodauksen yhteen pakettiin ilman käyttöporttia. Kehittäjille se tarkoittaa uutta vaihtoehtoa suljettujen mallien rinnalle. Vaihtoehtojen lisääntyminen hyödyttää koko kenttää.

Avoimuus ja vahvat koodaustulokset tekevät M3:sta yhden kesäkuun merkittävimmistä julkaisuista. Seuraavaksi nähdään, miten malli pärjää tuotantokäytössä benchmarkien ulkopuolella. Käytännön kokemukset ratkaisevat sen todellisen arvon.

MiniMax avasi M3:n: 1M konteksti ja kärkiluokan koodauskyky

Arkkitehtuuri yhdistää harvuuden ja multimodaalin

Koodaus ja agenttitehtävät ovat kärkeä

Painot saatavilla ilman jonotusta

Hinnoittelu kiristyy pitkässä kontekstissa

Yhteenveto

Aiheeseen liittyvät artikkelit

Nvidia sijoitti SSI:hin: Sutskeverin laskenta kymmenkertaistuu

Microsoft julkaisi MAI-Cyber-1-Flashin ja Project Perceptionin

KAT-Coder V2.5 ohitti Opus 4.8:n agenttikoodauksessa