Baidu toi 9. toukokuuta julki uuden ERNIE 5.1 -kielimallin. Yhtiö kertoo esikoulutuksen maksaneen noin kuusi prosenttia siitä, mitä vastaavan kokoluokan mallit ovat länsimaissa vaatineet.
Malli astui samana päivänä Qianfan Model Square -alustalle ja ERNIE-palvelun verkkosivuille yritysten ja kehittäjien testattavaksi. LMArenan Arena Search -listalla se nousi pisteytykseen 1 223 ja maailman neljännelle sijalle.
Multi-dimensional elastic pre-training tiivistää parametrit
Baidu kuvaa virallisessa ERNIE-blogissaan tekniikkaa, joka tuottaa yhdellä koulutusajolla useita eri kokoluokan malleja. ERNIE 5.0 toimii pohjana, jonka päälle 5.1 puristaa kokonaisparametrit kolmasosaan ja aktiiviset parametrit puoleen.
Lähestymistapa eroaa länsimaisten frontier-mallien usein toistetusta etenemisestä. Tiheämmät versiot vaativat sielläpäin omat täydet koulutuskierroksensa, mikä kasvattaa GPU-kuluja jokaisessa iteraatiossa.
Baidu kääntää yhtälön päinvastoin. Yksi ajo synnyttää useita kokoluokkia, ja jokainen niistä kantaa ERNIE 5.0:n tietopohjan. Säästö siirtyy asiakaspuolelle alhaisempina inferenssikuluina.

Hakuasteikolla maailman neljäs ja Kiinan kärki
ERNIE 5.1 sijoittui LMArenan Arena Search -listalla pisteytykseen 1 223. Sija on Kiinan paras ja maailman neljäs, ja malli on ainoa kiinalainen kymmenen kärjessä.
Edellä ovat ainoastaan yhdysvaltalaisten suurten laboratorioiden lippulaivat. Tilanne kertoo siitä, että avoimien kiinalaisten mallien kärki on kuroutumassa kiinni juuri agentti- ja hakutehtävissä, joissa erot ovat aiemmin näkyneet selvimmin.
Baidu mainitsee myös päättely- ja luovan kirjoittamisen testit, joissa malli yltää lippulaivamalleille tyypilliseen pisteytykseen. Yhtiön mukaan vahvuus syntyy hakuintegraation ja päättelyn kombinaatiosta.

Halpa esikoulutus painaa hinnoittelua
Esikoulutuksen kuusi prosenttia vastaavasta kokoluokasta tarkoittaa karkeasti kymmenesosaa entisestä laskutasoa. Jos luku pitää itsenäisen tarkastelun, frontier-mallin kynnys siirtyy alaspäin selvästi.
Yhdysvaltojen ja Euroopan kehittäjille kehitys tarkoittaa lisääntyvää painetta perustella token-hintoja. Raaka teho ei enää yksin riitä myyntiargumentiksi, jos kiinalainen vastine syntyy murto-osalla GPU-tunneista.
DeepSeekin V3- ja V4-julkaisut sysäsivät trendin liikkeelle alkuvuoden aikana. ERNIE 5.1 jatkaa samaa linjaa eri tekniikalla ja näyttää, ettei kyse ole yhden tiimin yksittäisestä optimoinnista.

Saatavuus ja Baidun kehittäjäpäivät
Malli on saatavilla heti Qianfan Model Square -alustalla sekä ERNIE-palvelun verkkosivuilla. Baidu tarjoaa lisäksi playground-ympäristön AI Studiossa kokeiluja varten.
Yhtiön kehittäjäkonferenssi pidetään Pekingissä 13.-14. toukokuuta. Perustaja Robin Li kertoo silloin tarkemmista teknisistä yksityiskohdista ja kaupallistamissuunnitelmista.
Ensimmäinen laajempi käyttöönotto tapahtuu yli kymmenellä luovan tuotannon agenttialustalla. Mukana ovat muun muassa ISEKAI ZERO -roolipelialusta ja Mulan AI. Painopiste on tällä hetkellä luovassa työnkulussa, ei perinteisessä yritysraportoinnissa.

Yhteenveto
ERNIE 5.1 osoittaa, että mallien koulutuskustannukset eivät ole enää lukittu nykytasoon. Multi-dimensional elastic pre-training tarjoaa joustavan kokoluokkaperheen yhdellä ajolla, ja tulokset säilyvät kärkimallien tasolla.
Pekingin kehittäjäkonferenssin julkistukset täsmentävät kuvaa ensi viikolla. Sen jälkeen länsimaisten kilpailijoiden on vastattava jollain kustannustasolla, joka kestää uutta vertailua.
