
Tekoälyn tulemista niin teollisuuteen kuin arkeenkin on ollut vaikeaa olla huomaamatta etenkin viimeisen vuoden-parin aikana. Yhdysvaltalainen OpenAI, joka on muun muassa ChatGPT- ja Dall-E-tekoälymallien takana, on joutunut enenevissä määrin tekijänoikeuslakeja koskevien syytösten kohteeksi. Generatiivisia tekoälyjmalleja on koulutettava syöttämällä niille massiivisia määriä dataa, jotta ne voisivat tuottaa realistisia vastauksia käyttäjien kyselyihin niin tekstin kuin kuvienkin muodossa. Tässä datassa on väistämättä mukana tekijänoikeussuojattua materiaalia, kuten tekstiä kirjallisuudesta, artikkeleista tai vaikkapa blogikirjoituksista. Taiteen puolella esimerkiksi maalaukset ja valokuvat ovat herättäneet tekoälyn nousukaudella paljon keskustelua juurikin tekijänoikeuksien näkökulmasta. Aiempina vuosina koneoppimista, johon generatiiviset tekoälymallit perustuvat, kehitettiin lähinnä akateemisessa maailmassa. Tekijänoikeuskeskustelu on herännyt vasta OpenAI:n, Microsoftin, Googlen ja muiden suurien toimijoiden alkaessa kaupallistaa tekoälymallejaan.
OpenAI:n mukaan mallien kouluttaminen olisi mahdotonta ilman tekijänoikeussuojattua materiaalia, sillä nykypäivänä suoja koskee käytännössä kaikkea ihmisten tuottamaa sisältöä, olipa se sitten tekstiä, kuvia, videoita tai mitä hyvänsä. Lausunto oli osoitettu Yhdistyneen kuningaskunnan parlamentin ”Communications and Digital Committee” -valiokunnalle, joka on ottanut tekoälymallien lailliset kysymykset syyniinsä. OpenAI kertoi tällä viikolla blogikirjoituksessaan, että se katsoo julkisesti saatavilla olevan materiaalin käyttämisen tekoälymallien koulutukseen hyvän tavan mukaisena. Kuvio on hankala myös siksi, että tekijänoikeussuojalakeja ei olla vielä ehditty kunnolla säätää kattamaan tekoälyn mukanaan tuomia eettisiä kysymyksiä. Jää siis nähtäväksi, miten pitkään tekoäly ja siihen liittyvät tekijänoikeuskysymykset pysyvät lain ”harmaalla alueella”.
Kannattaa siis tehdä Super Lorenzo jolla vähän erilaiset vaatteet jne. Ei ehkä viiksiä?
Aivan, mutta ai ei osaa sitä itsenäisesti tehdä. Et voi koskaan tietää että tekikö nää nykyset mallit (ketjun aihe) riittävän suoran kopion jostain että joutuisit vaikeuksiin kaupallisesta käytöstä, vai ei.
Ei se ole sama asia. Ihminen luo taidetta itse (ellei sitten tahallaan kopioi), mutta tekoäly ei luo mitään itse, vaan se generoi kaiken sen pohjalta mitä se on "nähnyt", eli nimenomaan kopioi muiden työtä.
Mutta jos se generoitu tuotos ei ole mikään kopio.. ehkä siellä voi olla vivahteita jostain muista tuotoksista, mutta eihän ihminenkään yleensä pysty tekemään mitään nollasta niin ettei olisi saanut vaikutteita muualta?
Onko laitonta käydä taidenäyttelyssä ja sen jälkeen tehdä maalaus joka muistuttaa hieman näyttelyssä esillä olleita maalauksia? Mikä ero tekeekö sen ihminen vai kone?
Mutta jos se on kopio? Mistä tiedät?
Tiedät kyllä kun suoraan kopioit, mutta varsinkin musiikki on täynnä esimerkkejä missä useat ihmiset ovat päätyneet toisistaan riippumatta samaan lopputulokseen merkittäviltä osin teosta
Tällaisissa tapauksissa pitäisi kyllä kaikki heittää linnaan ihan varmuuden vuoksi!
Kuitenkin nää tekijänoikeusjutut on vakavimpia rikoksia mitä löytyy.
Musiikin sävelkulku on vähän eri asia kuin vaikkapa suorat kopiot jostain uutisartikkelista, jos lasketaan vaikka mahdollisten permutaatioiden määrää, ymmärrät kyllä. Ihminen kans voi puolustautua plagiointisyytöksiä vastaan esittämällä omat näkemyksensä tapahtumien kulusta, siinä missä AI ei moista osaa.
Jos meinaat niitä harvoja tapauksia, jossa kuvageneraattori generoi jonkin opetusmateriaalina olleen kuvan 1:1, niin toi ongelma koskee vissiin lähinnä tapauksia jossa sitä mallia käytetään vanillana. Kun generoidaan vaikkapa tekstipromptin lisäksi syvyyskarttaa hyödyntäen, en keksi miten olisi mahdollista tuottaa kuva joka on täysi kopio jonkun muun teoksesta, etenkin jos syvyyskartta on valokuvasta jonka olen itse ottanut kädestäni.
Siitä vaan sitten matemaattisesti todistamaan että se ei voi tuottaa liian tarkkaa kopiota jostakin. ”Pixel art plumber” -promptilla spritet ja peliä julkaisemaan.
Oletin että kopiolla tarkoitit niitä 1:1 kuvia, jotka näyttävät aggressiivisesti pakatulta originaalilta. Mario kuvat eivät mene tuohon kategoriaan. Tyyliä voidaan toki imitoida vahvasti, vaikka käyttäisikin syvyyskarttoja sun muita.
Edelleenkään se mitä tekoäly käyttää oppimisaineistona ei kuulu pätkääkään millekään ”oikeuksienhaltioille”. Ainoastaan se jos joku käyttää heidän tuotemerkkiään suoraan ilman lupaa omassa tuotteessaan.
Yleisesti kaikkia taloudellisesti haastavia tilanteita tarkoitin. Suorat plagiaatit on etenkin tekstipohjaisissa llm malleissa edelleen ongelma. Kuvissa taas se että kone ei osaa sanoa että mitä se tuotti, ja aika helposti saa aikaiseksi materiaalia jota käyttäessä joutuisi ongelmiin.
Lakimuutosta vaan kehiin sitten. En pidätä hengitystäni.
Se, että ihminen tutkii muiden teoksia ja saa niistä vaikutteita ja ideoita on täysin luonnollista enkä sitä kielläkään. Sehän menisi ihan mahdottomaksi esimerkiksi kuvataiteen opetuksen kannalta jos ei saisi katsella historian kuuluisia maalauksia ja muita taideteoksia.
Menee nyt ehkä enemmän psykologian puolelle, mutta ihmiset ovat ajanlaskun alusta alkaen inspiroituneet ja hakeneet inspiraatiota aivan kaikenlaisista asioista kuten luonnosta ja eläimistä, mutta myös muiden ihmisten luomuksista. Tämä voi tapahtua tietoisesti tai tiedostamatta. Jos vaikka Picassolta olisi aikoinaan kysynyt hänen inspiraationsa lähteitä, niin ensinnäkin hän olisi voinut kieltäytyä vastaamasta kysymykseen ollenkaan, mutta toisaalta hän tuskin olisi pystynyt luettelemaan jokaikistä asiaa, teosta, ihmistä jne. mistä oli kenties saanut omille teoksilleen vaikutteita.
Tekoäly ei kuitenkaan ole ihminen vaan tietokoneohjelma, johon koulutuksessa käytettävä lähdemateriaali on tietoisesti kerätty ja ajettu kokonaisuudessaan sisään. Toisin sanoen esimerkiksi OpenAI:lle tai Googlelle ei ole millään tasolla epäselvää se, että millä datalla heidän tekoälymallit on luotu. Mikä toisaalta vaikuttaisi olevan epäselvää on se, että kenen dataa käytetään ja käytetäänkö sitä luvan kanssa.
Tekoälymallit ovat tuotteita ja niillä tehdään bisnestä. Ne eivät ilmesty tyhjästä, vaan muiden tuottaman materiaalin käytön tuloksena. Sen vuoksi näiden tuotteiden kehitykseen ei voida käyttää sellaisten tahojen materiaalia, jotka eivät ole lupaa siihen antaneet.
Napsautan sormiani ja tekijänoikeudet lakkaa olemasta tänään. Vuoteen 2025 mennessä seuraavat alat ovat lakanneet olemasta tai kuihtuneet murto-osaan koska bisneksen pohja on viety:
– musiikki
– elokuvat
– tietokone/konsolipelit
– kaupalliset uutis/erikoissivustot
– graafinen suunnittelu
– jääkiekon MM kisat (lähetysoikeudet)
– suuri osa softakehityksestä
– …
Kaikki ylläoleva bisnes pohjaa siihen että kuka tahansa ei voi vaan ottaa tuotettua sisältöä maksamatta ja toistaa/kopioida sitä vapaasti. Saa arvata mikä laki on se joka tältä suojaa.