Leanstral 1.5: Mistralin avoin Lean 4 -todistusmalli

Mistral AI julkaisi Leanstral 1.5:n, avoimen mallin, joka on rakennettu Lean 4 -todistuskielelle. Malli kirjoittaa ja täydentää matemaattisia todistuksia, jotka kone tarkistaa askel askeleelta. Julkaisu tapahtui 4. heinäkuuta, ja painot ovat ladattavissa Apache 2.0 -lisenssillä.

Leanstral 1.5 ei ole yleiskäyttöinen koodausassistentti. Se keskittyy kapeaan mutta kasvavaan alueeseen: formaaliin verifiointiin ja automaattiseen teoreematodistukseen. Testingcatalogin mukaan malli ratkaisi 587 ongelmaa 672:sta PutnamBench-vertailussa.

Mitä Leanstral 1.5 tekee

Lean 4 on sekä ohjelmointikieli että todistusavustaja. Se tarkistaa jokaisen loogisen askeleen mekaanisesti. Kielellä voi ilmaista niin abstrakteja matemaattisia rakenteita kuin ohjelmakoodin ominaisuuksia.

Leanstral 1.5 toimii koodiagenttina tässä ympäristössä. Se ei tuota vain valmiita vastauksia vaan rakentaa todistuksia monivaiheisesti. Malli osaa myös autoformalisoinnin eli epämuodollisen matematiikan muuntamisen koneellisesti tarkistettavaan muotoon.

Tämä erottaa sen tavallisista kielimalleista. Kun Lean 4 hyväksyy todistuksen, sen oikeellisuudesta ei jää epäilystä. Malli tuottaa todennettua matematiikkaa, ei todennäköisiä arvauksia.

Lean 4 -todistusavustaja tietokoneen näytöllä matemaatikon työpöydällä.

Tekninen rakenne ja saatavuus

Leanstral 1.5 kuuluu Mistralin Small 4 -malliperheeseen. Se on Mixture of Experts (MoE) -malli, jossa on 119 miljardia parametria mutta vain noin 6,5 miljardia aktiivista kerrallaan. Konteksti-ikkuna on 256 000 tokenia.

Mallille on kolme käyttöpolkua. Painot löytyvät Hugging Facesta Apache 2.0 -lisenssillä, ja rajapinta toimii Mistralin Labs-palvelussa nimellä leanstral-1-5. Kolmas vaihtoehto on Mistral Vibe, yhtiön oma agenttikomentorivi.

Labs-listaus antaa mallille ilmaisen hinnan mutta myös aikarajan: se on merkitty poistuvaksi 30. syyskuuta 2026. Kyse on siis kokeellisesta käyttöönotosta. Itse isännöinti onnistuu vLLM:llä neljän näytönohjaimen kokoonpanossa.

Havainnekuva Mixture of Experts -mallin harvaan aktivoituvasta arkkitehtuurista.

Vertailutulokset ja löydetyt bugit

Mistralin raportoimat luvut ovat vahvoja. Malli saturoi miniF2F-vertailun eli saavuttaa sadan prosentin tuloksen sekä validointi- että testijoukossa. PutnamBenchissä se ratkaisi 587 ongelmaa 672:sta.

Muissa mittareissa malli ylsi 87 prosenttiin FATE-H:ssa ja 34 prosenttiin vaikeammassa FATE-X:ssä. FLTEval pass@8 -tulos nousi 31,9:stä 43,2:een. Malli jaksaa myös pitkiä todistusyrityksiä: yhdessä tapauksessa se käsitteli yli 2,7 miljoonaa tokenia 22 kontekstin tiivistyksen aikana.

Käytännön arvoa osoittaa toinen tulos. Leanstral 1.5 löysi viisi aiemmin raportoimatonta bugia avoimen lähdekoodin varastoista. Formaali verifiointi ei ole vain akateeminen harjoitus vaan paljastaa oikeita virheitä.

Kaavionäkymä nousevista vertailutuloksista ja suurennuslasi paljastaa koodin bugin.

Miksi tämä on tärkeää kehittäjille

Leanstral 1.5 edustaa mallien erikoistumista. Yleismallien rinnalle syntyy työkaluja, jotka on hiottu yhteen tehtävään. Formaali verifiointi on juuri tällainen alue, sillä se vaatii tarkkuutta, jota yleismalli ei aina tavoita.

Apache 2.0 -lisenssi tekee mallista käyttökelpoisen yrityksille. Painot voi ladata, mallin voi ajaa omassa konesalissa ja sitä voi virittää ilman rajoittavia sopimuksia. Tämä on merkittävää tiimeille, jotka rakentavat verifioitua ohjelmistoa tai tarvitsevat paikallista ajoa tietoturvasyistä.

Malli tukee myös OpenAI-tyylisiä työkalukutsuja. Kehittäjä voi altistaa funktion, joka kääntää koodinpätkiä, ja Mistral suosittelee lean-lsp-mcp-palvelinta tiiviimpään Lean-integraatioon. Näin todistusmalli kytkeytyy osaksi laajempaa kehitystyönkulkua.

Kehittäjä tarkastelee formaalisti verifioitua koodia suurella näytöllä.

Yhteenveto

Leanstral 1.5 on kapea mutta kunnianhimoinen julkaisu. Se vie avoimen mallin formaalin matematiikan ja verifioinnin ytimeen sallivalla lisenssillä. Vahvat vertailutulokset ja viisi löydettyä bugia osoittavat, että kyse ei ole pelkästä demosta.

Aikaraja Labs-palvelussa muistuttaa julkaisun kokeellisuudesta. Ladattavat painot jäävät kuitenkin käyttöön, ja ne nostavat todennetun päättelyn rimaa Lean 4:ssä.

Mistral avasi Leanstral 1.5:n: avoin todistusmalli Lean 4:lle

Mitä Leanstral 1.5 tekee

Tekninen rakenne ja saatavuus

Vertailutulokset ja löydetyt bugit

Miksi tämä on tärkeää kehittäjille

Yhteenveto

Aiheeseen liittyvät artikkelit

ctx indeksoi tekoälyagenttien muistin yhdellä komennolla

Kimi K2.7 Code on GitHub Copilotin ensimmäinen avoin malli

NVIDIA avasi Nemotron TwoTowerin: avoin diffuusiomalli