OpenAI GPT-5.6 Sol: kärki koodauksessa ja agenteissa

OpenAI avasi 26. kesäkuuta rajatun esikatselun uudesta GPT-5.6-mallisarjasta. Sarja jakautuu kolmeen tasoon: lippulaiva Soliin, tasapainoiseen Terraan ja nopeaan, edulliseen Lunaan. Yhtiön virallisen blogin mukaan Sol on sen tähän asti vahvin malli, ja se nousee kärkeen erityisesti koodauksessa ja agenttitehtävissä. Mallit nojaavat aiempaa parempaan token-tehokkuuteen, joten ne ratkovat raskaita tehtäviä pienemmällä laskennalla. Julkaisu asettaa GPT-5.6:n suoraan kilpailemaan Anthropicin Claude Mythos -luokan kanssa.

Kolme mallia eri käyttötarpeisiin

GPT-5.6 tuo OpenAI:lle kerroksellisen nimeämismallin, joka muistuttaa kilpailijoiden tapaa erotella mallitasoja. Numero kertoo sukupolven, kun taas Sol, Terra ja Luna ovat pysyviä suorituskykytasoja. Kukin taso voi kehittyä omaa tahtiaan tulevissa julkaisuissa.

Sol on suunnattu vaativimpiin tehtäviin, kuten pitkiin koodaussessioihin, monimutkaiseen päättelyyn ja tietoturvatyöhön. Terra asettuu keskelle: se vastaa OpenAI:n mukaan suorituskyvyltään GPT-5.5:tä, mutta on noin puolet halvempi. Luna on kevyin vaihtoehto, joka on optimoitu nopeuteen ja arkikäyttöön.

Hinnoittelu seuraa tasoja selkeästi. Sol maksaa 5 dollaria miljoonalta syötetokenilta ja 30 dollaria tuotetokenilta. Terra hinnoitellaan 2,50 ja 15 dollariin, Luna puolestaan 1 ja 6 dollariin. Halvin taso tuo siten kärkimallien arkkitehtuuria selvästi matalammalle kynnykselle.

OpenAI aikoo tuoda Sol-mallin myös Cerebras-laitteistolle heinäkuussa. Silloin se voi tuottaa jopa 750 tokenia sekunnissa, aluksi vain valituille asiakkaille kapasiteetin kasvaessa. Yhtiö tavoittelee kärkimallilta siis myös poikkeuksellisen lyhyttä vasteaikaa.

Kolme eri kokoista hehkuvaa palloa rivissa kuvaavat mallien suorituskykytasoja

Max- ja ultra-tilat nostavat päättelyä

GPT-5.6 esittelee kaksi uutta tapaa säätää mallin päättelyä. Uusi max-taso antaa Solille eniten aikaa pohtia vaikeaa ongelmaa. Se on tarkoitettu tehtäviin, joissa pidempi harkinta tuottaa selvästi paremman lopputuloksen.

Toinen uutuus, ultra-tila, on arkkitehtuuriltaan kiinnostavampi. Yhden agentin sijaan ultra jakaa työn useille aliagenteille, jotka työskentelevät rinnakkain. Lähestymistapa muistuttaa tapaa, jolla suuria tehtäviä pilkotaan pienempiin osiin ja kootaan lopuksi yhteen.

Ultra-tilan hyöty näkyy myös mittareissa. Sol Ultra nousi selvästi tavallisen Solin yläpuolelle keskeisessä koodausvertailussa. OpenAI kuvaa tätä puhtaimmaksi näytöksi siitä, että aliagenttimalli todella nopeuttaa monimutkaista työtä.

Uudet tilat näkyvät myös rajapinnassa. Kehittäjät voivat valita päättelytason tehtävän vaativuuden mukaan ja tasapainottaa näin laatua, viivettä ja kustannusta. Aiemmin vastaava säätö oli karkeampi, joten hallinta tarkentuu selvästi.

Keskussolmu haarautuu moneksi rinnakkaiseksi solmuksi, kuva aliagenttien rinnakkaislaskennasta

Koodauksen ja kyberturvan kärjessä

OpenAI julkaisi esikatselun yhteydessä joukon mittaustuloksia. Sol asettaa uuden ennätyksen Terminal-Bench 2.1 -vertailussa, joka testaa komentorivityönkulkuja, suunnittelua ja työkalujen yhteiskäyttöä. Sol Ultra ylsi 91,9 prosenttiin, kun tavallinen Sol jäi 88,8 prosenttiin.

Vertailussa Sol ohittaa kilpailijoiden mallit selvästi. Anthropicin Claude Mythos 5 ylsi samassa testissä 84,3 prosenttiin ja Gemini 3.1 Pro Preview 70,7 prosenttiin. OpenAI:n oma GPT-5.5 jäi 88 prosenttiin, joten harppaus edelliseen sukupolveen on maltillinen mutta selvä.

Kyberturvassa Sol on yhtiön mukaan sen vahvin malli tähän mennessä. ExploitBench-testissä se ylsi aiemman Mythos-esikatselun tasolle käyttäen vain noin kolmasosan tuotetokeneista. OpenAI korostaa silti, ettei malli yltänyt itsenäisiin, päästä päähän ulottuviin hyökkäyksiin koventettuja kohteita vastaan.

OpenAI lupaa julkaista laajemman mittaussarjan, kun mallit tulevat laajaan jakeluun. Esikatselun luvut perustuvat yhtiön omiin testeihin, joten riippumattomat vertailut puuttuvat vielä. Suunta on silti selvä: GPT-5.6 kaventaa eroa kilpailijoiden kärkimalleihin.

Tumma naytto jossa hehkuva komentorivi ja kilpimuoto kuvaamassa kyberturvaa

Saatavuutta rajoittaa valtion ohjaus

Poikkeuksellisinta julkaisussa on sen saatavuus. GPT-5.6-mallit ovat aluksi tarjolla vain rajatulle joukolle luotettuja kumppaneita rajapinnan ja Codexin kautta. OpenAI kertoo toimivansa näin Yhdysvaltain hallinnon pyynnöstä.

Yhtiön mukaan pääsy myönnetään esikatselun aikana asiakas kerrallaan. OpenAI kuvaa porrastettua julkaisua nopeimmaksi tieksi laajempaan saatavuuteen, mutta arvostelee mallia samalla kestämättömäksi. Laajempi pääsy ChatGPT:hen, Codexiin ja rajapintaan on luvattu tulevien viikkojen aikana.

Julkaisun rinnalla OpenAI uudisti myös kehotusten välimuistin. Mallit tukevat nyt selkeitä välimuistipisteitä ja vähintään 30 minuutin elinaikaa. Välimuistin kirjoitukset laskutetaan 1,25-kertaisina, kun taas luetut osumat säilyttävät 90 prosentin alennuksen.

Anthropic kohtasi keväällä vastaavan tilanteen, kun sen Mythos-luokan malli vedettiin pois markkinoilta. OpenAI:n porrastettu malli on lievempi versio samasta ilmiöstä. Huippumallien julkaisuista on tullut myös sääntely- ja turvallisuuskysymys.

Hehkuva digitaalinen lukko hallintorakennuksen edessa kuvaamassa rajattua paasya

Yhteenveto

GPT-5.6 ei ole vain yksi uusi malli vaan kolmen tason perhe, joka jakaa kärkitason kyvyt eri hinta- ja nopeusluokkiin. Max- ja ultra-tilat antavat kehittäjille hienojakoisemman tavan säätää päättelyn syvyyttä. Koodauksen ja kyberturvan mittarit asettavat Solin tällä hetkellä alan kärkeen.

Avoimeksi jää, kuinka nopeasti mallit päätyvät laajaan käyttöön. Valtion ohjaama, porrastettu saatavuus on uusi piirre huippumallien julkaisuissa, ja se vaikuttaa suoraan kehittäjiin ja yrityksiin. Lopullinen arvio kyvyistä saadaan vasta laajemman julkaisun ja kattavampien mittausten myötä.

OpenAI esitteli GPT-5.6 Sol -mallin koodauksen kärkeen

Kolme mallia eri käyttötarpeisiin

Max- ja ultra-tilat nostavat päättelyä

Koodauksen ja kyberturvan kärjessä

Saatavuutta rajoittaa valtion ohjaus

Yhteenveto

Aiheeseen liittyvät artikkelit

DeepReinforce julkaisi avoimet Ornith-1.0-koodausmallit

OpenAI: Codex-agentit muuttuvat työnkulkujärjestelmiksi

Mistral OCR 4 vie rakenteisen dokumenttiälyn omaan konesaliin