Sora pystyy luomaan realistista videokuvaa pelkästä tekstisyötteestä, mutta se on vielä kehitysvaiheessa eikä virallista julkaisupäivää ole kerrottu.

Muun muassa ChatGPT:stä tunnettu yhdysvaltalainen OpenAI on julkistanut uusimman generatiivisen tekoälymallinsa Soran, joka pystyy luomaan realistista videokuvaa pelkän tekstisyötteen perusteella. Generoiduissa videoissa voi olla esimerkiksi yksityiskohtaisesti liikkuvia hahmoja erilaisilla taustoilla ja ainakin aluksi ne voivat olla enintään minuutin pituisia. Alla esimerkkivideo syötteestä ”A young man at his 20s is sitting on a piece of cloud in the sky, reading a book.”.

Sora on niin sanottu diffuusiomalli ja generoi pyydetyn videon luomalla aluksi pelkän staattisen ”kohinan”, josta monen askeleen kautta muokataan lopullinen tuotos. Uusien videoiden generoimisen lisäksi Sora voi myös muokata tai jatkaa sille syötettyä jo olemassa olevaa videota.

Tällä hetkellä Soran käyttöoikeus on myönnetty lähinnä ammattilaisille, jotka testaavat mallia esimerkiksi väärinkäytösten ja turvallisuusriskien varalta, sekä eri alojen taiteilijoille palautteen keräämistä varten. OpenAI tähdentää myös, ettei Sora ole täydellinen ja saattaa syötteestä riippumatta esimerkiksi esittää asiat ja esineet väärinä tai sekoittaa vaikkapa oikean ja vasemman keskenään.

OpenAI kertoo kuuntelevansa ulkopuolelta tulevia Soraan liittyviä huolenaiheita sekä käyttökohde-ehdotuksia ja painottaa myös, ettei voi täysin ennustaa, miten ja mihin tarkoituksiin Soraa tulevaisuudessa käytetään. Virallista julkaisupäivää Soralle ei ole kerrottu.

Lähde: OpenAI (1, 2)

This site uses XenWord.
;