Kiinalainen Z.ai julkaisi GLM-5.2:n, joka nousi avointen mallien kärkeen Artificial Analysisin älykkyysindeksissä. Malli sai 51 pistettä ja ohitti aiemmat avoimet huiput MiniMax-M3:n ja DeepSeek V4 Pron. Painot julkaistiin MIT-lisenssillä Hugging Faceen ja ModelScopeen.
GLM-5.2 jakaa edeltäjänsä GLM-5.1:n koon mutta nostaa suorituskykyä tuntuvasti. Samalla konteksti-ikkuna kasvoi 200 000 tokenista miljoonaan. Z.ai suuntaa mallin erityisesti pitkäkestoisiin koodaus- ja agenttitehtäviin.
Kärkisija avointen mallien vertailussa
Artificial Analysisin älykkyysindeksin versiossa 4.1 GLM-5.2 sai 51 pistettä. Se johtaa avointen mallien sarjaa selvästi: MiniMax-M3 ja DeepSeek V4 Pro jäivät 44 pisteeseen ja Kimi K2.6 jäi 43:een. Seitsemän pisteen ero on suuri, kun mittari on tiukka.
Malli on edelleen 744 miljardin parametrin Mixture of Experts (MoE) -malli, jossa aktivoituu 40 miljardia parametria kerrallaan. Koko vastaa edeltäjää, mutta tulos parani 11 pistettä. Suurin harppaus tuli tieteellisessä päättelyssä.
Z.ain mukaan Humanity's Last Exam -testin tulos nousi 12 pistettä 40 prosenttiin ja SciCode 7 pistettä 50 prosenttiin. GDPval-AA v2 -mittarissa GLM-5.2 ylsi 1524 pisteeseen, mikä on samaa luokkaa suljetun GPT-5.5:n kanssa. Avoimelle mallille tulos on poikkeuksellinen.

Miljoonan tokenin konteksti ja IndexShare
Suurin tekninen muutos on kontekstin kasvu miljoonaan tokeniin. Edeltäjä tyytyi 200 000 tokeniin. Laajempi ikkuna antaa mallin pitää muistissaan koko ohjelmistoprojektin arkkitehtuurin, rajapinnat ja aiemmat päätökset.
Pitkä konteksti on raskas laskea, joten Z.ai kehitti IndexShare-tekniikan. Siinä neljä peräkkäistä harvan attentionin kerrosta jakaa saman indeksoijan. Ratkaisu vähentää laskentaa tokenia kohti 2,9-kertaisesti miljoonan tokenin pituudella.
Yhtiö paransi myös mallin MTP-kerrosta spekulatiivista dekoodausta varten. Muutos kasvattaa hyväksyttyjen tokenien määrää jopa 20 prosenttia. Käytännössä malli tuottaa pitkää tekstiä nopeammin ilman laadun pudotusta.

Suunniteltu pitkäkestoiseen koodaukseen
GLM-5.2 on koulutettu agenttitehtäviin, jotka kestävät tunteja. Niihin kuuluvat laajat toteutukset, automaattinen tutkimus, suorituskyvyn optimointi ja monimutkainen virheenkorjaus. Z.ai kutsuu näitä pitkäkestoisiksi tehtäviksi.
Vertailuissa malli yltää lähelle suljettua kärkeä. FrontierSWE-testissä se jää Claude Opus 4.8:sta vain prosentin ja ohittaa GPT-5.5:n. Terminal-Bench 2.1:ssä tulos on 81,0 ja SWE-bench Prossa 62,1, molemmat selvästi edeltäjää korkeammat.
Mallia voi käyttää suoraan suosituissa koodausagenteissa. Z.ai tukee Claude Codea, Clineä ja OpenClawia mukautetulla mallikonfiguraatiolla. Miljoonan tokenin version saa käyttöön mallinimellä glm-5.2[1m], ja päättelyn tason voi valita korkean ja maksimin väliltä.

Avoin lisenssi ja kustannukset
Painot ovat saatavilla MIT-lisenssillä ilman aluerajoituksia. Mallia tarjoavat Z.ain oman rajapinnan lisäksi muun muassa DeepInfra, Fireworks, Nebius ja SiliconFlow. Rajapinnan hinta on 1,4 dollaria miljoonalta syötetokenilta ja 4,4 dollaria tuotetokenilta.
Kapasiteetilla on hintansa. GLM-5.2 käyttää keskimäärin 43 000 tokenia tehtävää kohti, kun edeltäjä tyytyi 26 000:een. Tehtävän keskihinnaksi tulee noin 0,46 dollaria, mikä on enemmän kuin GLM-5.1:llä mutta yhä murto-osa suljettujen mallien hinnasta.
Avoimuus ei poista kaikkia riskejä. Z.ain pilvirajapintaa käyttävän data kulkee kiinalaisen yhtiön kautta, jota koskee maan tiedustelulaki. Painot voi ladata omalle palvelimelle, mutta täysi malli vaatii noin 1,5 teratavua näytönohjainmuistia.

Yhteenveto
GLM-5.2 kaventaa avointen ja suljettujen mallien eroa erityisesti koodauksessa ja pitkäkestoisissa tehtävissä. Miljoonan tokenin konteksti ja MIT-lisenssi tekevät siitä varteenotettavan vaihtoehdon kehittäjille, jotka haluavat ajaa mallin itse.
Tokenien kulutus ja pilvirajapinnan tietoturva jättävät silti harkittavaa. Niille, jotka tarvitsevat kärkitason päättelyä avoimilla painoilla, GLM-5.2 on tällä hetkellä vahvin tarjolla oleva valinta.
