Googlen Bard-nimellä aiemmin tunnettu tekoälymalli uudelleennimettiin hiljattain Geminiksi, jolle on ehditty jo julkistaa ensimmäinen versiopäivitys 1.5. Google lupailee tuoreimmalle Gemini-versiolleen mittavia parannuksia käyttäjän antamien syötteiden käsittelykykyyn. Gemini 1.5 hyödyntää Transformer- ja MoE (Mixture-of-Experts) -neuroverkkoarkkitehtuureja.

Tekoälylle annettavien syötteiden laajuutta mitataan merkeissä eli ”tokeneissa”, jotka voivat olla kokonaisia sanoja tai niiden osia, kuten tavuja tai kirjaimia. Ne voivat olla myös pieniä osia videoista, kuvista tai vaikkapa ääniraidasta. Mitä laajempia syötteitä tekoäly kykenee prosessoimaan, sitä laadukkaampia ja tarkempia vastauksia se pystyy käyttäjälle tuottamaan. Uuden versiopäivityksen alla ensimmäisenä julkaistava malli on Gemini 1.5 Pro, joka kykenee vakiona käsittelemään jopa 128 000 merkin syötteitä. Samaan laajuuteen pystyy esimerkiksi OpenAI:n GPT-4 Turbo -tekoälymalli. Googlella on kuitenkin kehityksessä jopa miljoonan merkin syötteitä käsittelevä versio Gemini 1.5 Prosta, jolle se antaa markkinoinnissaan luonnollisesti enemmän painoarvoa. Miljoonan merkin laajuuteen yltävä syöte voi olla vaikkapa noin tunnin mittainen video tai esimerkiksi 30 000:n koodirivin tiedosto. Alla olevalla videolla näkyy, miten Gemini 1.5 Pro etsii noin minuutissa kysytyn kohdan 44-minuuttisesta videosta, joka vastaa lähes 700 000 merkkiä.

Google on luvannut valottaa uusien Gemini-mallien hinnoittelua ja saatavuutta lisää, kun kehitystyö on edennyt tarpeeksi. Nyt tarjolla on vain rajatuille käyttäjäryhmille kokeiluun suorituskykyisempi versio 1.5 Prosta yhtiön AI Studio- ja Vertex AI -palvelujen kautta, joskin viiveet ja yleinen käyttäjäkokemus ovat yhä hiontavaiheessa.

Lähde: Google