xAI julkaisi beetana Voice Agent Builderin, koodittoman alustan tuotantotason puheagenttien rakentamiseen. Alusta esiteltiin virallisessa ilmoituksessa 1. heinäkuuta. Se pyörii yhtiön omalla Grok Voice -mallilla. xAI:n mukaan toimivan agentin saa pystyyn noin kahdessa minuutissa.
Puheagentit ovat nousseet nopeasti yritysten kiinnostuksen kohteeksi. Ne hoitavat puheluita asiakaspalvelussa, myynnissä ja operaatioissa. Voice Agent Builder pyrkii tekemään niiden käyttöönotosta suoraviivaista ilman koodia.
Puheagentti ilman koodia
Alustan lupaus on yksinkertaisuus. Käyttäjä kuvaa tavallisella kielellä, miten puhelun tulisi edetä. Sen jälkeen hän liittää mukaan dokumentit, työkalut ja rajoitteet.
Koodia ei tarvita missään vaiheessa. xAI kertoo, että nollasta toimivaan agenttiin pääsee noin kahdessa minuutissa. Muutoksia voi testata selaimessa ilman puhelinta.
Kohderyhmänä ovat operaattorit ja kehittäjät, jotka haluavat suuren volyymin puheagentteja ilman koko pinon rakentamista. Valmiiksi mukana tulevat telefonia, tietohaku, työkalut, rajoitteet ja seuranta.

Yksi malli korvaa kolme rajapintaa
Perinteinen puhepino ketjuttaa kolme erillistä palvelua. Puhe muunnetaan tekstiksi, kielimalli käsittelee sen ja teksti muunnetaan takaisin puheeksi. Usein jokainen vaihe tulee eri toimittajalta.
Jokainen siirtymä lisää viivettä, kustannusta ja uusia vikakohtia. Voice Agent Builder korvaa ketjun yhdellä rajapinnalla. Se rakentuu suoraan Grok Voice -mallin päälle speech-to-speech-periaatteella.
Grok Voice on koulutettu nimenomaan todellisella puheludatalla. xAI:n mukaan tiivis kytkös malliin vähentää viivettä verrattuna kolmen rajapinnan yhdistelmään. Agentti selviää myös heikosta äänenlaadusta, vahvoista aksenteista ja yli 25 kielestä.

Valmiit työkalut tuotantoon
Alusta tuo tuotantokäytön työkalut mukanaan. Mukana ovat tietohaku, työkalukutsut, rajoitteet, MCP-tuki ja seurantatyökalut. Tavoite on, että agentin voi viedä suoraan tuotantoon.
Olemassa olevat puhelinnumerot voi tuoda mukaan SIP-yhteydellä. Työkalut kytketään omiin rajapintoihin ja MCP-palvelimiin, ja oman sovelluksen voi liittää WebSocketilla. Jokaiseen tiliin kuuluu ilmainen puhelinnumero.
Ääniä on tarjolla yli 80. Vaihtoehtoisesti brändin oman äänen voi kloonata noin kahden minuutin näytteestä. Laatua mitataan xAI:n τ-voice Bench -testikehyksellä.

Hinnoittelu ja kilpailu
Hinnoittelu on pidetty yksinkertaisena. Agentit laskutetaan API-hinnalla, joka on tällä hetkellä 0,05 dollaria ääniminuutilta. Äänet sisältyvät hintaan, eikä erillistä alustamaksua ole.
Ilmaisen numeron telefonia maksaa 0,01 dollaria minuutilta päälle. Läpinäkyvä hinnoittelu on selvä viesti volyymikäyttäjille, joilla minuutit kertyvät nopeasti.
Kilpailu on kovaa. Cisco toi Webex AI Agentin huhtikuussa 2026, ja markkinoilla toimivat myös Voiceblox ja Talqing. xAI:n valtti on tiivis speech-to-speech-integraatio yhden mallin ympärillä.

Yhteenveto
Voice Agent Builder pakkaa tuotantotason puheagentin yhteen koodittomaan työkaluun. Grok Voice -malli ja speech-to-speech-rajapinta karsivat viivettä ja vikakohtia, joita kolmen palvelun ketju tuo.
Beetavaihe ja läpinäkyvä minuuttihinta madaltavat kokeilun kynnystä. Kilpailluilla markkinoilla ratkaisevaa on, pitääkö lupaus kahden minuutin käyttöönotosta myös vaativassa tuotannossa.
