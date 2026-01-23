Kaksi vuotta sitten aloitettuun joukkokanteeseen tehdyn lisäyksen mukaan NVIDIA hankki datapaketteja Anna's Archivesta, vaikka tämä varoitti yhtiötä materiaalin laittomuudesta.

Tekijänoikeudet ovat olleet murroksessa viime vuosina, kun tyypillisesti tiukasti puolustettu ala on joutunut monessa paikkaa taipumaan tekoälymallien opetuksen edessä. Jotkut tahot taistelevat kuitenkin myös tekoälyjättejä vastaan ja muiden muassa syytettyjen penkille joutunut NVIDIA on saanutnyt uusia syytöksiä niskaansa.

NVIDIA haastettiin vuoden 2024 alkupuolella useiden kirjailijoiden joukkokanteella oikeuteen. Kirjailijat syyttivät NVIDIAa tekoälymallien opettamisesta Books3-datapaketilla, johon sisältyy luvatta tekijäinoikeuksien suojaamia teoksia. NVIDIA luonnollisesti puolusti toimintaansa väittäen kirjojen olevan sen tekoälymallien näkökulmasta vain tilastollisia korrelaatioita.

Prosessi on luonnollisesti edelleen käynnissä ja nyt siihen on saatu mukaan uusia, vakavamman pään syytöksiä. Joukkokanteen nostaneiden tahojen mukaan lisäämissä syytöksissä on mukana lisää tekijänoikeusrikkomusten kohteeksi joutuneita kirjoja, uusia tekoälymalleja ja muita syytöksiä, sekä joukko uusia mukaan lähteneitä kirjailijoita.

Uusien syytösten mukaan NVIDIA on tieten tahtoen ottanut yhteyttä kyseenalaista mainetta nauttivaan Anna’s Archiveen. Anna’s Archive on avoin hakukone erinäisiin ”varjokirjastoihin”, joissa jaetaan luvatta tekijänoikeuksien suojaamaa materiaalia. Syytösten mukaan Anna’s Archive varoitti NVIDIAa sen materiaalien olevan todellisuudessa laittomia, mutta NVIDIA tästä huolimatta halusi ne osaksi opetusmateriaalejaan. Anna’s Archiven kerrotaan antaneen NVIDIAlle pääsyn noin 500 teratavuun dataa, josta vähintään osa oli laitonta, ellei sitten kaikki. NVIDIAn kerrotaan lisäksi hankkineen laitonta opetusmateriaalia LibGenistä, Sci-Hubista ja Z-Librarystä.

Itse laittomien opetusmateriaalien hankkimisen lisäksi NVIDIAn kerrotaan antaneen asiakkailleen työkaluja, joilla he pystyivät lataamaan ”The Pile”:ksi kutsutun datasetin, johon sisältyy myös laiton Books3-paketti.

