Cohere avasi tiistaina North Mini Code -koodausagentin, joka pyörii yhdellä NVIDIA H100 -grafiikkapiirillä. Malli on saatavilla Hugging Facessa avoimella Apache 2.0 -lisenssillä. Kyseessä on suoraan tuotantokäyttöön tähtäävä avoin malli.

Julkaisu tarjoaa kehitystiimeille konkreettisen avoimen vaihtoehdon hallituille malleille, kuten Anthropicin Claude Fable 5:lle. Vastineeksi itsehallinnasta tulee kompromisseja. Näkyvin niistä on mallin sanaisuus, joka kasvattaa kustannuksia. Cohere asemoi mallin nimenomaan tiimeille, jotka rakentavat omia agenttiputkiaan.

Apache 2.0 -lisenssi sallii kaupallisen käytön ja mallin muokkaamisen ilman erillistä sopimusta. Tämä erottaa North Mini Coden monista suljetuista kilpailijoista.

Avoin vaihtoehto hallituille malleille


North Mini Code asettuu markkinaan, jolla on jo Mistralin Devstral Small 2, GitHub Copilot, Cursor ja Claude Fable 5. Jokaisella on omat kustannus- ja käyttöönottoprofiilinsa. Cohere kilpailee nimenomaan avoimuudella.

Coheren etu on omistettavuus. Malli pyörii yhdellä H100:lla, joten tiimit voivat ajaa sen omassa ympäristössään ilman pääsyä ulkoiseen palveluun. Data pysyy talon sisällä, mikä on tärkeää säännellyillä toimialoilla.

VentureBeatin riippumattomissa testeissä North Mini Code tuotti kuitenkin kolme kertaa enemmän tokeneita kuin vertailukelpoiset mallit. Sanaisuus kasvattaa kustannuksia suurissa tuotantokuormissa, joissa tokenien määrä ratkaisee laskun loppusumman.

Avoimuus tuo mukanaan myös vastuun. Tiimin on itse huolehdittava mallin päivityksistä, skaalauksesta ja valvonnasta. Hallitussa palvelussa nämä tehtävät hoituvat taustalla, mutta omaa hintansa vastaan.



Avoimen lähdekoodin lukko kompaktin palvelimen yllä pienessä konesalitilassa.


Arkkitehtuuri ja tekninen pino


North Mini Code on 30 miljardin parametrin Mixture of Experts (MoE) -malli, jossa on aktiivisena vain 3 miljardia parametria kutakin tokenia kohti. Arkkitehtuuri pitää laskennan kevyenä, vaikka malli on kokonaisuutena suuri. Juuri tämä mahdollistaa ajon yhdellä grafiikkapiirillä.

Malli tukee 256 000 tokenin kontekstia ja enintään 64 000 tokenin generointia kerralla. Laaja konteksti pitää useita tiedostoja muistissa samalla ajolla. Tämä sopii monitiedostoisten projektien käsittelyyn, joissa malli tarvitsee laajan kuvan koodikannasta. Pitkä generointiraja taas tukee suurempien muutosten tekemistä yhdellä kertaa.

Cohere ei sovittanut mallia yleiskäyttöisestä pohjasta vaan rakensi sen alusta asti agenttipohjaiseen ohjelmistotyöhön. Mukana on integroitu työkalujen käyttö ja lomitettu päättely, jonka Cohere sanoo parantavan suoritusta monivaiheisissa tehtävissä.

MoE-arkkitehtuuri on yleistynyt avoimissa malleissa juuri tästä syystä. Se yhdistää suuren mallin laadun ja pienemmän mallin ajokustannukset. Yhden grafiikkapiirin tavoite tekee tästä tasapainosta ratkaisevan.



Mixture of Experts -arkkitehtuurin visualisointi: harva verkko ja pitkä kontekstinauha.


Suunniteltu agenttipohjaiseen ohjelmistotyöhön


Cohere kohdisti mallin agenttipohjaiseen ohjelmistokehitykseen. Käyttöalueita ovat aliagenttien orkestrointi, arkkitehtuurin kartoitus, koodikatselmointi ja terminaalityö. Malli on tarkoitettu osaksi laajempaa agenttiputkea.

Malli analysoi ja kartoittaa järjestelmäarkkitehtuuria, nostaa esiin riippuvuuksia ja katselmoi koodia laajojen koodikantojen yli. 256 000 tokenin konteksti pitää monitiedostoiset projektit yhdessä ajossa, jolloin malli näkee kokonaisuuden kerralla.

Cohere koulutti mallin myös terminaaliympäristöihin. Se hoitaa komentotulkin vuorovaikutuksen, pakettiskriptit ja komentorivin työkalut. Yhtiö vertaili mallia Terminal-Bench v2:lla, joka testaa agentteja oikeissa terminaaleissa synteettisten koodaustehtävien sijaan.

Terminaalikeskeisyys erottaa North Mini Coden monista chat-pohjaisista avustajista. Malli on suunniteltu toimimaan siellä, missä kehittäjät tekevät työnsä: komentorivillä ja koodikannan sisällä. Tämä sopii hyvin autonomisiin agenttiputkiin.



Terminaalipohjainen koodaustyö, jossa pienet agentit koordinoivat komentorivin ympärillä.


Kustannusten ja sanaisuuden tasapaino


Huippumallien hintaero on nyt todellinen arkkitehtuurivalinta. Claude Fable 5 maksaa 50 dollaria miljoonalta tuotostokenilta, kun taas North Mini Code pyörii yhdellä H100:lla. Valinta ei ole pelkkä hintakysymys.

Toisella puolella on kustannusten hallinta ja datan sijainti, toisella hallinnoidun infrastruktuurin pienempi vaiva. Coheren mukaan korkean volyymin tiimien kannattaa mallintaa molemmat kustannuspolut omaa kuormaansa vasten ennen valintaa.

Sanaisuus painaa tässä laskelmassa. Kolminkertainen tokenimäärä syö osan oman ajon kustannusedusta, jos kuorma on suuri ja jatkuva. Pienemmissä kuormissa ero jää vähäisemmäksi.

Lopullinen valinta riippuu kuormasta. Pienille ja keskisuurille tiimeille avoin malli voi olla edullisin vaihtoehto. Suurilla volyymeilla sanaisuus voi kääntää laskelman hallitun mallin eduksi.



Valosta tehty vaaka tasapainottaa tokenivirtaa ja tehokasta laskentapiiriä.


Yhteenveto


North Mini Code on Coheren panos avoimeen koodaukseen: 30 miljardin parametrin MoE-malli, joka pyörii yhdellä H100:lla Apache 2.0 -lisenssillä. Se on rakennettu agenttipohjaiseen ohjelmistotyöhön alusta asti, ei sovitettu yleismallista.

Valinta avoimen ja hallitun mallin välillä kiteytyy kustannuksiin ja datan sijaintiin. North Mini Code antaa tiimeille uuden vaihtoehdon, mutta sen sanaisuus kannattaa laskea mukaan ennen tuotantokäyttöä. Avoin lisenssi ja yhden grafiikkapiirin vaatimus tekevät siitä kuitenkin poikkeuksellisen helpon ottaa käyttöön omassa ympäristössä.