NVIDIA julkaisi Ada Lovelace -arkkitehtuurin ja GeForce RTX 40 -näytönohjaimet

Ensimmäisenä myyntiin ehtii 12. lokakuuta GeForce RTX 4090, jota seuraavat marraskuun puolella myyntiin saapuvat käsittämättömästi nimetyt RTX 4080 16 Gt ja RTX 4080 12 Gt.

NVIDIA julkaisi tänään odotetusti uuden Ada Lovelace -arkkitehtuurin ja ensimmäiset siihen perustuvat näytönohjaimet. Ensimmäiseen aaltoon nahkatakkisen toimitusjohtaja Jensen Huangin povarista kaivettiin GeForce RTX 4090, 4080 16 Gt ja 4080 12 Gt.

Ada Lovelace -arkkitehtuurin suurin AD102-siru rakentuu noin 76 miljardista transistorista ja se valmistetaan samalla TSMC:n 4N-prosessilla kuin H100-laskentasiru. Uudet SM-yksiköt tukevat nyt käskyjen uudelleenjärjestelyä, eli käytännössä prosessoripuolelta tuttua Out-of-Order Execution -mallia, mikä parantaa käyttöastetta etenkin säteenseurannassa. 3. sukupolven RT-ytimet tarjoavat kaksinkertaista säde-kolmio-törmäystarkistusnopeutta ja 4. sukupolven Tensoriytimet ovat tuttuja Hopper-laskentapiiristä. Lisäksi mukana on päivittynyt Optical Flow Accelerator -yksikkö. Paneudumme arkkitehtuurin uudistuksiin tarkemmin lähitulevaisuudessa erillisessä artikkelissa.

GeForce RTX 4090 -näytönohjaimen AD102-grafiikkapiirissä on käytössä 128 SM-yksikköä eli 16 384 CUDA-ydintä. NVIDIA ei maininnut tensoriydinten tai RT-ydinten määrää, mutta mikäli suhde on sama kuin aiemmissa sukupolvissa, pitäisi piirissä olla yhteensä 512 tensoriydintä ja 128 RT-ydintä. Muistiväylä on 384-bittinen ja sen jatkeena on 24 Gt GDDR6X-muistia, mutta NVIDIA ei toistaiseksi ole hihkunut niiden nopeudesta.

RTX 4090:n perus- ja Boost-kellotaajuudet ovat 2,23 ja 2,52 GHz, mikä tuottaa maksimsisaan 82,6 TFLOPSin edestä FP32-laskentavoimaa. Jensen kuitenkin kehaisi, että yhtiö on jo ylikellottanut piirin jopa 3 GHz:iin. Tensoriytimet yltävät nyt jopa 1321 TOPSiin, mutta vain FP8-tarkkuudella ja viime sukupolven kanssa vertailukelpoisella FP16-tarkkuudella nopeus on 661 TOPSia. Näytönohjaimen TBP- eli Total Board Power -arvo on ainakin FE-mallille 450 wattia.

GeForce RTX 4090:n suositushinta on NVIDIAn omassa verkkokaupassa 1999 euroa.

GeForce RTX 4080 16 Gt perustuu ennakkotietojen mukaan AD103-grafiikkapiiriin, jossa on käytössä 76 SM-yksikköä eli 9728 CUDA-ydintä. Samalla tensori- ja RT-ydinten logiikalla niitä pitäisi olla käytössä 304 ja 76. Näytönohjaimen muistiväylä on 256-bittinen ja sen jatkeena on, kuten nimikin jo kertoo, 16 Gt GDDR6X-muistia.

RTX 4080 16 Gt:n perus- ja Boost-kellotaajuudet ovat lähellä isoveljeä, eli 2,21 ja 2,51 GHz. Ne tuottavat maksimissaan 48,7 TFLOPSia FP32-suorituskykyä ja 390 TFLOPSia FP16-tensorisuorituskykyä. Näytönohjaimen TBP-arvo on 320 wattia. RTX 4080 16 Gt on hinnoiteltu NVIDIAn kaupassa 1509 euroon.

GeForce RTX 4080 12 Gt:n nimeä on vaikea ymmärtää, sillä se on hyvin eri tuote 16 Gt:n mallista. Näytönohjaimessa on käytössä 60 SM-yksikköä eli 7680 CUDA-ydintä ja tiettävästi piirikin on eri, AD104. Tensoriytimiä pitäisi olla käytössä 240 ja RT-ytimiä 60. Muistiväylä on leikattu 192-bittiseksi ja sen jatkeena on 12 Gt GDDR6X-muistia.

RTX 4080 12 Gt lyö tauluun astetta kovemmat kellot 2,31 GHz:n perus- ja 2,61 GHz:n Boost-kellotaajuuksilla, mikä tuottaa 40,1 TFLOPSin teoreettisen FP32-suorituskyvyn ja 319 TFLOPSia FP16-matriisinmurskausta. TBP-arvoksi on asetettu 285 wattia. NVIDIAn verkkokaupassa RTX 4080 12 Gt:n hintalappuna komeilee 1129 euroa.

Suorituskyvyn osalta NVIDIA ei ole paljastanut vielä liikoja. Yhtiön omissa testeissä verrokkina kaikille kolmelle on GeForce RTX 3090 Ti. Resident Evilissä, Assassin’s Creed Valhallassa ja The Division kahdessa meno on vielä suht maltillista: RTX 4080 12 Gt jää kahdessa ensimmäisessä muutamia prosentteja 3090 Ti:n jälkeen ja kolmannessa ne ovat käytännössä rinta rinnan. RTX 4080 16 Gt on noin 15 % nopeampi kuin RTX 3090 Ti kaikissa kolmessa pelissä. RTX 4090:n suorituskyky on Assassin’s Creedissä noin 50 %, Division 2:ssa 60 % ja Resident Evil Villagessa 60 % parempi kuin 3090 Ti:n.

Warhammer 40K: Darktidessä ja MS Flight Simulatorissa meno muuttuu: RTX 4080 16 Gt peittoaa 3090 Ti:n noin 45 %:n erolla, RTX 4080 16 Gt 80 % erolla ja RTX 4090 jopa 105 % erolla Warhammerissa, kun Flight Simulatorissa kaikki kolme ovat 90-95 % nopeampia kuin 3090 Ti. Erikoisiin lukuihin löytyy selitys DLSS 3:sta, jota tuetaan vain RTX 40 -sarjan näytönohjaimilla. Se parantaa suorituskykyä sekä prosessori- että näytönohjainrajoitteisissa tilanteissa laskemalla ylimääräisiä ruutuja oikeasti skaalattujen ruutujen väleihin. Palaamme teknologiaan tarkemmin erillisessä uutisartikkelissa.

Seuraavan sukupolven peleiksi NVIDIA laski keynotessakin esitellyn Portal with RTX:n, Racer RTX:n ja Cyberpunk 2077:n uuden RT Overdrive -tilan, jossa on maksimoitu pelin säteenseurantaefektit. Kaikki kolme tukevat myös DLSS 3:a ja sen Frame Generation -ominaisuutta, joten ero viime sukupolven lippulaivaan räjähtää käsiin. RTX 4090:n luvataan peittoavan RTX 3090 Ti:n Portalissa noin 2,8-kertaisella, Racer RTX:ssä noin 4,2-kertaisella ja Cyberpunkissa jopa 4,3-kertaisella suorituskyvyllä. Löydät tarkemmat luvut yllä olevasta graafista.

Lähde: NVIDIA