
Tekoälybuumi on vallannut maailman sellaisella vauhdilla, että heikompia hirvittää. EU ja Yhdysvallat ovat säätämässä vauhdilla lakeja säätelemään alan kehitystä, mutta esimerkiksi jo käytössä olevissakin laajoissa kielimalleissa (Large Language Model, LLM) on rutkasti potentiaalisesti suuria ongelmia setvittäväksi.
Tom’s Hardware on koonnut artikkeliin useita epäkohtia ja muuta pohdittavaa nykyisestä tekoälyvillityksestä. Yksi räikeimmistä kyseenalaisista seikoista on LLM-kielimallien opetus ja siinä käytetty data; mistä se tulee, kuka sitä hallitsee ja kyseleekö kukaan oikeuksien perään? Tuoreena tapauksena New York Times on haastanut Microsoftin ja OpenAI:n oikeuteen, koska mediatalon mukaan ne ovat käyttäneet ChatGPT:n opetukseen erityisen runsaasti sen omistamaa dataa niin tekstien, kuvien kuin videoidenkin muodossa; NY Timesin mukaan ChatGPT-pohjaisten tuotteiden koko liiketoimintamalli perustuu tekijänoikeuksien rikkomiseen.
Kuvien luonnista tutun Midjourneyn tuorein kuudes versio kykenee puolestaan luomaan käytännössä suoria kopioita suosittujen elokuvien ruuduista. Elokuviin konseptitaidetta tekevä Reid Southern on julkaissut viestipalvelu X:ssä joukon Midjourney v6:lla luomiaan kuvia useista elokuvista, kuten Avengers: End Gamesta, Dunesta ja Jokerista. Vaikka katsoja olisi nähnyt elokuvat, voisi Midjourneyllä luotujen kuvien tunnistaminen tekoälyn luomiksi olla vaikeaa tai jopa mahdotonta.
Toinen kuvia luova LLM-malli DALL-E 3 ei välttämättä osaa tuottaa käytännössä identtisiä kohtauksia elokuvista, mutta sen sijaan piirrettyjen hahmojen väärennökset se hanskaa kuin vanhakin tekijä. Tom’s Hardwaren Avram Piltch komensi DALL-E 3:a luomaan esimerkiksi Mikki Hiiren polttamassa tupakkaa ja vesikauhusta kärsivän Väiski Vemmelsäären, eikä tekoälymallilla ollut mitään ongelmia niiden luonnissa tasolla, jota ei erota tekijänoikeuksien haltijan luvalla oikeiden taiteilijoiden tekemistä töistä.
Stanfordin tutkijat ovat puolestaan löytäneet useiden kielimallien opetukseen käytetystä LAION-5B-kuvatietokannasta lasten seksuaalista hyväksikäyttöä kuvaavaa materiaalia. Artikkelin mukaan tietokannassa oli jopa 3000 joko varmistettua tai epäiltyä lasten hyväksikäyttöä kuvaavaa kuvaa. Sanomattakin lienee selvää, miten sellaisen materiaalin käyttö oppimateriaaleissa voi mahdollistaa yhtä haitallisen sisällön luomisen tekoälymallin avulla. Toinen ongelmakohta on kyseisen tietokannan opetuskäyttöön ladanneet tahot, jotka ovat samalla syyllistyneet, tietämättään tai ei, laittoman materiaalin hallussapitoon. LAION-5B:tä on käytetty ainakin Stability AI:n Stable Diffusionin opetuksessa, mutta siinä käytetyssä versiossa tietokannasta on suodatettu pois kaikki ns. NSFW- eli ”Not Safe For Work” -sisältö.
Moraalisten ja immateriaalioikeuksien ongelmien lisäksi myös itse tekoälyprojekteja pyörittävän raudan tehonkulutus on nostettu puheenaiheeksi omassa artikkelissaan. Tom’s Hardwaren mukaan mikäli NVIDIA myi tänä vuonna 1,5 miljoonaa ja ensi vuonna myy 2 miljoonaa H100-laskentapiiriä, ne kuluttaisivat arvioidulla 61 %:n käyttöasteella jopa 13 091 gigawattituntia tehoa vuodessa. Lukema on samaa luokkaa kuin koko Liettuan, Georgian tai Guatemalan vuotuinen kulutus. Luvussa ei ole mukana A100-kiihdyttimiä tai muiden valmistajien piirejä.
Lähde: Tom’s Hardware
Uutiskuva on luotu DALL-E 3 -mallia hyödyntävällä Microsoft Bing Image Creator -työkalulla kehotteella ”Robot stealing data from vault in simpsons cartoon style”. Tarjolla oli myös vaihtoehto, jossa olisi ollut Homer Simpson ehtaan The Simpsons tyyliin.
Toisena samankaltaisena esimerkkinä vaikka vanhojen valokuvien väritykset.
Meille tuli yksi vanha pariskunta, joka halusi vanhan mustavalko-valokuvansa tauluksi. Kysyimme heiltä, haluaisivatko, että kuva olisi väritetty? Eivät tienneet sen olevan edes mahdollista. Kerrottiin, että tekoäly voi "keksiä" kuvaan värit, mutta jos he muistavat minkä väriset vaatteet heillä oli kuvassa päällään yms, niin tekoäly värittää ne silloin oikein. Eivät muistaneet vaatteidensa värejä, mutta sanoivat, ettei väliä vaikka olisi minkä väriset vaatteet, jos kuvan vaan saa värillä.
Tekoäly teki työtä käskettyä ja sylkäisi väritetyn kuvan, kun ensin käytin tunnin-pari sopivien promptien ja config arvojen löytämiseen. Mummeli ja papparainen hämmästelivät, miten luonnollisesti kuva oli väritetty ja työ kelpasi kernaasti, sitten vain tulostus ja kehystys. Myöhemmin tuli lisää vastaavia töitä heiltä ja tuttaviltaan, kun olivat nähneet mitä tekoäly oli saanut aikaan.
Sama homma ollut potrettikuvien laajakuvamuunnoksissa. Mutta kaikki on missä tekoäly on mukana on feikkispämmilapoa ilman mitään laatua. Kuulemma.
Ei ole välttämättä opetusmateriaalissa mukana tuo artikkeli vaan Bingin haulla on pääsy maksumuurin takaiseen artikkeliin ja sitten GPT-4:llä referoidaan artikkelin sisältöä. Näin tuossa arstechnican artikkelin kuvassa ainakin tapahtuu, sillä alaviitteissä on linkki NYT:iin mikä tarkoittaa että Bing Chat on sieltä tietoa hakenut.
Tämä lähinnä tekninen seikka, maksumuurin kiertämisen suhteen yhtä ongelmallista tai jopa ongelmallisempaa asian ollessa näin.
Pakko tunnustaa, että hyvin vähän. Laadulla tarkoitan kuitenkin sitä, että uskon ihmisten vielä toistaiseksi arvostavan enemmän teosta joka on tehty käsin vs. AI:lla. Voin tietysti olla ihan väärässä tässä, mutta jos esim. itse luen vaikka artikkelin, ja saan jälkeenpäin tietää että se olikin AI-generoitu (ei tiedossa etukäteen), niin tällä asialla on minulle negatiivinen vaikutus. Tulee vähän semmoinen huijattu olo.
Kaikki tekstityö missä tekoäly on ollut miltään kantilla mukana, pitäisi olla ehdottomasti siten merkitty heti ensimmäisenä. Tekoälyn kirjoittama teksti on vielä toistaiseksi melko helposti tunnistettavissa sen "poliitikkomaisuuden" vuoksi, mutta jokusen vuoden päästä tuo voi olla jo melko hämärää maastoa. Tässä se kuuluisa lähdekriittisyys tulee pelaamaan entistä tärkeämpää roolia tulevaisuudessa.
Samalla täytyy sanoa, että nostan hattua niille taidepiireissä, jotka kieltävät 100% kaikki tekoälytyöt esim joillain imageboardeilla, mihin käyttäjät voivat lähettää omia teoksiaan. Jatkossakin on oltava paikkoja, missä ei ole parissa sekunnissa generoitua matskua sellaisten teosten seassa, jotka ovat vieneet tunteja tai päiviä käsityönä. Varsinkin, kun suurin osa generoiduista kuvista on todella surkeita, vaikka niiden generoijat tuntevat olevansa seuraava Michelangelo, kun kirjoittivat muutaman sanan ja painoivat nappia.
Kun selaa jotain taideboardia, on kiva, ettei tarvitse miettiä onko tuo nyt ihmisen tekemä vai ei, vaan voi arvostaa sitä taitoa ja kokemusta jonka ihmistaiteilija on kuvaan tuupannut.
Kun on se mallin kanssa luotu logoehdotelma, niin pyytää sitä mallia sitten näytämään samankaltaisia tunnettuja logoja. Niitähän voinee rajoittaa sitten esim vuoden mukaan..
Jokatapauksessa, vaikka logon tekisi kuinka käsin, niin on erittäin mahdollista, että päätyy vähintään lähelle jotain valmista…
Kun nuo kehittyvät, niin varmasti niiden kanssa on parempi työskennellä, kuin ihmisen, kun ne eivät pahastu, jos ei kelpuuta ehdotusta tai yritä väkisin tunkea asioita mukaan, jota ihmiset helposti harrastavat..
Mikä malli moista featurea tukee ja voiko sen tekemään analyysiin luottaa?
Miksi ei voisi? Pelkäätkö, että se peittelisi tahallaan asiaa
Kaikennäköistä voisi varmaan joskus tulevaisuudessa tapahtua juu. Moista mallia ei kukaan ole vielä ymmärtääkseni tehnyt, niin turha antaa minään ”ratkaisuna” mainittuihin nykyisiin ongelmiin.
Esim googlellakin on ollut se kuvahaku jo pitkään, joten eiköhän kyseisen kaltaisia sovellutuksia ole siis olemassa..
Tässä taisit kuitenkin viitata johonkin AI malliin. Ei nuo osaa tracea tehdä taaksepäin saati etsiä mitään opetusaineistostaan.
Mistäpä sen tiedät?
Kuitenkin MS on juurikin ja google on noita juurikin hakuihinkin viritellyt, joten eiköhän siltä toiminnallisuutta löydy.
Ei toki tietenkään kaikista, mutta noiden kehitys tuntuu olevan senverran nopeaa, että ei noissa kärryillä pysy ja jonkun logon etsiminen kuvauksen perusteella on juurikin yksi asia, joka noiden pitäisi kyllä osata..
Ei ole yhdessäkään. Tai jos on niin nimeä toki.
Googlehaku ei ole AI malli.
katso liitettä 1236154
Todella surullista kyllä jos tämä on tehty tosissaan. Jollain kierolla huumori kulmalla voisi ehkä toimia… ISO ehkä. Herääkin kysymys missä muussa on säästetty, jos ulosanti on tätä tasoa. Ehkäpä ei missään, mutta tulkinnanvara ainakin jää. Vaikea kuvitella, että minkään tason ammattilainen päästäisi vastaavaa läpi. Tehtiin ite ja säästettiin.
Heidän sivullaan on jouluaiheisia (myynti)mainoskuvia lisää, niiden AI-jälki on ok. Meilin jossa kutsutaan ostoksille, kuva tosiaan päin mäntyä enkä oikein usko että vitsillä tehty tai sitten en ymmärrä vitsiä
.
Tosiaan, itse näen isona ongelmana tulevaisuudessa sen, kuinka mihinkään kuva/uutismateriaaliin voi luottaa. Kuka valvoo, kenen kautta luotettavat lähteet jne. Propagandakoneistoilla on pian kulta-aika, tällä hetkellä taso on useimmiten aika kömpelöä mitä tulee esimerkiksi sotamateriaaliin. Mutta muutama vuosi ja ollaan siinä tilanteessa ettei photoshop-harrastajakaan erota, onkohan kuva tai video manipuloitu ja kuinka paljon. Tai vaikkapa luotu täysin tyhjästä poliitikolle manifesti, kärjistettynä esimerkkinä.
Jälkikäteen disinformaatiota voidaan tietysti oikaista mutta vahinkoa ehtii sattua, jos sellaista haetaan…
Database of 16,000 Artists Used to Train Midjourney AI, Including 6-Year-Old Child, Garners Criticism
http://www.artnews.com
Ainiin, mitäs se MidJourneyn heppu aikoinaan sanoi siitä, ettei ole mahdollista tietää mistä kuvat tulevat…?
"Holz bluntly answered, “No. There isn’t really a way to get a hundred million images and know where they’re coming from.”
Tämähän olikin siis suora vale.