Testissä NVIDIAn uuden RTX 40 -sarjan suorituskykyisin GeForce RTX 4090 -näytönohjain.

NVIDIA esitteli 20. syyskuuta uudet Ada Lovelace -grafiikka-arkkitehtuuriin pohjautuvat GeForce RTX 40 -sarjan näytönohjaimet ja ensimmäisenä myyntiin saapuu suorituskykyisin GeForce RTX 4090 -malli. Kaksi muuta ensimmäisessä aallossa julkaistua näytönohjainta ovat 12 ja 16 gigatavun näyttömuistilla varustetut RTX 4080 -mallit, jotka saapuvat myyntiin myöhemmin marraskuussa.

Saimme NVIDIAlta testiin yhtiön oman Founders Edition -mallin, jolla testitulokset saa julkaista tänään 11. lokakuuta eli päivää aiemmin kuin näytönohjainvalmistajien omilla 4090-malleilla. Kaikkien GeForce RTX 4090 -näytönohjaimien myynti alkaa kuitenkin testitulosten porrastamisesta huolimatta 12. lokakuuta klo 16. Tutustumme tässä artikkelissa NVIDIAn oman GeForce RTX 4090 Founders Edition -näytönohjaimen ominaisuuksiin ja suorituskykytestit on ajettu pääasiassa 3840×2160-resoluutioilla ilman säteenseurantaa ja säteenseuranta käytössä sekä kokeilussa on myös uusi DLSS 3 -ominaisuus. Mukana on myös tehonkulutus-, lämpötila- ja melumittaukset sekä ylikellotustestit.

 

Näytönohjaimen esittely

NVIDIAn oma Founders Edition -versio GeForce RTX 4090:stä ei valitettavasti tule Suomessa lainkaan myyntiin. Näytönohjain on hinnoiteltu yhtiön kotisivuilla 1999 euroon, mutta Suomessa myyntiin saapuvat ainoastaan näytönohjainvalmistajien omat mallit jälleenmyyjien kautta.

4090 Founders Edition perustuu hyvin pitkälle samaan suunnitteluun kuin RTX 30 -sarjan Founders Editionit. Näkyvimmät ulkoiset muutokset ovat hieman kuperat kyljet, pykälän isommat tuulettimet ja NVLink SLI -liittimen puuttuminen.

Näytönohjain on kolmen korttipaikan korkuinen ja 30,4 cm pitkä. Painoa on 2,19 kg ja rakenne on todella jämäkän ja laadukkaan tuntuinen metallinen kokonaisuus. Jäähdytysratkaisun molemmilla puolilla on 115 mm:n tuulettimet, jotka eivät pyöri lepotilassa.

Alapuolen tuuletin imee ilmaa näytönohjaimen etuosasta ja puhaltaa lämpimää ilmaa kotelosta ulos näyttöliittimien yläpuolelta. Takaosan tuuletin imee ilmaa näytönohjaimen läpi alhaalta ylöspäin jäähdyttäen matkalla grafiikkapiiriin kontaktissa olevasta höyrykammiosta lähteviä lämpöputkia. Takaosan tuuletin imee ilman suoraan kohti keskusmuistia ja prosessoria, mutta kotelon takaosaan sijoitetun tuulettimen pitäisi huolehtia lämpimän ilman puhaltamisesta ulos kotelosta.

Näytönohjain on varustettu yhdellä HDMI 2.1 -liittimellä ja kolmella DisplayPort 1.4a -liittimellä. Jostain syystä tuettuna ei ole jo muutama vuosi sitten esitelty DisplayPort 2.0 -standardi, joka on tuettuna Intelin Arc- ja tulee olemaan tuettuna myös AMD:n RDNA 3 -näytönohjaimissa.

4090:n TBP- eli Total Board Power -tehonkulutus on 450 wattia eli sama kuin 3090 Ti:llä. Näytönohjain on varustettu yhdellä ATX 3.0 -standardin mukaisella 16-pinnisellä PCI Express 5.0 12VHPWR-lisävirtaliittimellä. Uusimmista virtalähteistä kyseinen liitin saattaa löytyy jo vakiona, mutta vanhempien virtalähteiden omistajille mukana toimitetaan adapteri, johon liitetään neljä 8-pinnistä PCI Express -lisävirtaliitintä. Päädyn GeForce RTX -teksti on valaistu.

GeForce RTX 4090:ssä on käytössä ominaisuuksiltaan hieman karsittu AD102-grafiikkapiiri, joka valmistetaan TSMC:n optimoidulla 4 nanometrin eli N4-prosessilla. Käytössä on 16384 CUDA-ydintä, 512 teksturointiyksikköä, 512 tensoriydintä, 128 RT-ydintä ja 128 ROP-yksikköä. Grafiikkapiiri rakentuu 76,3 miljardista transistorista ja sen pinta-ala on 608 neliömillimetriä.

Muistiväylä on edelleen 384-bittinen ja sen jatkeena on 24 gigatavua 21,2 Gbps:n nopeudella toimivaa GDDR6X-muistia, jonka myötä muistikaistaa on käytettävissä 1018 Gt/s.

GeForce RTX 3090 Ti:hin ja Samsungin 8 nanometrin prosessilla valmistettuun GA102-grafiikkapiiriin verrattuna AD102:ssä on jopa 48 miljardia transistoria enemmän, mutta piisirun pinta-ala on 20 neliömilliä pienempi. 4090:n karsitussa grafiikkapiirissä CUDA-ytimiä, RT-ytimiä ja Tensor-ytimiä on käytössä 52 % enemmän kuin 3090 Ti:ssä. L2-välimuistin koko on kasvanut 6 megatavusta jopa 72 megatavuun, mutta näyttömuistin määrä ja kaistanleveys on pysynyt samana.

NVIDIA on asettanut Founders Edition -mallissaan grafiikkapiirin toimimaan 3D-rasituksessa 2520 MHz:n Boost-taajuudella. Todellisuudessa grafiikkapiirin kellotaajuus oli 3D-rasituksessa Cyberpunk 2077 -pelissä 4k-resoluutiolla noin 2700 MHz.

 

Testikokoonpano

Suorituskykytesteissä GeForce RTX 3090 -näytönohjainta verrattiin edellisen GeForce RTX 30 -sarjan suorituskykyisimpiin näytönohjaimiin eli 3090- ja 3090 TI -malleihin sekä 2080 Ti:hin. Mukana on testitulokset myös AMD:n leiristä suorituskykyisimmillä Radeon RX 6900 XT- ja 6950 XT -näytönohjaimilla.

 

Hintataso Suomessa 11.10.2022

 

Näytönohjainten testikokoonpano on kasattu Cooler Masterin Cosmos C700P -kotelon sisälle, jonka etupaneelissa kaksi 140 mm:n kotelotuuletinta imee viileää ilmaa kotelon sisuksiin ja takapaneelissa yksi 140 mm:n tuuletin puhaltaa lämmintä ilmaa ulos. Testikokoonpanona toimi NZXT:n Kraken Z63 AIO -nestekierrolla jäähdytetty AMD:n 12-ytiminen Ryzen 9 5900X -prosessori asennettuna Asuksen ROG Crosshair VIII Hero -emolevylle ja 32 gigatavua DDR4-3600-nopeudella toimivaa keskusmuistia. Käyttöjärjestelmänä on käytössä 64-bittinen Windows 10 Pro asennettuna Corsairin 2 teratavun MP600 M.2 SSD:lle. Kokoonpanon virransyötöstä vastaa Asuksen 1200 watin ROG Thor -virtalähde.

  • AMD Ryzen 9 5900X (12/24 ydintä/säiettä, boost 4,8 GHz)
  • Asus ROG Crosshair VIII Hero Wi-Fi (AMD X570)
  • 32 Gt Corsair Dominator Platinum RGB 3600 MHz (16-18-18-36)
  • Corsair MP600 2 Tt M.2 SSD (PCI Express 4.0)
  • Cooler Master COSMOS C700P -kotelo
  • NZXT Kraken Z63 AIO -nestekierto
  • Asus ROG Thor 1200W -virtalähde
  • Microsoft Windows 10 Pro 64-bit

 

Näytönohjainten testimetodit

io-techin näytönohjaintesteissä suorituskykyä mitataan pelaamalla peliä 60 sekunnin ajan ja OCAT-sovelluksen avulla mitataan keskimääräinen ruudunpäivitysnopeus ja minimi, kun 1 % huonoimpia ruutuja jätetään huomioimatta. Kyseessä on tarkemmin ottaen 1. persentiili, kun ruutujen renderöintiajat on muutettu ruudunpäivitysnopeudeksi eli ruutua sekunnissa (FPS, Frame Per Second) ja järjestetty paremmuusjärjestykseen. Tavoitteena on jättää huomioimatta muutama yksittäinen muita hitaammin renderöity ruutu, joka on mahdollisesti poikkeustapaus.

 

Suorituskykytestit 3840×2160-resoluutiolla ilman säteenseurantaa

3DMark TimeSpy Extreme -testissä 4090:n grafiikkatulos oli 69 % parempi kuin 3090 Ti:llä.

Cyberpunk 2077:ssä parhailla Ultra-kuvanlaatuasetuksilla 4090:n keskimääräinen ruudunpäivitysnopeus oli 47 % parempi kuin 3090 Ti:llä.

Flight Simulatorissa parhailla Ultra-kuvanlaatuasetuksilla 4090 oli 11 % suorituskykyisempi kuin 3090.

 

Shadow of the Tomb Raiderissa Highest-kuvanlaatuasetuksilla 4090 oli 64 % suorituskykyisempi kuin 3090 Ti.

Dying Light 2:ssa parhailla High Quality -kuvanlaatuasetuksilla 4090 oli 59 % suorituskykyisempi kuin 3090 Ti.

Far cry 6:ssa parhailla Ultra-kuvanlaatuasetuksilla 4090 oli 40 % suorituskykyisempi kuin 3090 Ti.

Assanssin’s Creed Valhallan sisäänrakennetussa benchmarkissa parhailla Ultra High -kuvanlaatuasetuksilla 4090 oli 45 % suorituskykyisempi kuin 3090 Ti.

Watch Dogs: Legionin sisäänrakennetussa benchmarkissa parhailla Ultra-kuvanlaatuasetuksilla 4090 oli 55 % suorituskykyisempi kuin 3090 Ti.

 

 

Suorituskykytestit 2560×1440- ja 1920×1080-resoluutioilla

Cyberpunk 2077:ssä Full HD -resoluutiolla 4090 oli 9 % ja 1440p-resoluutiolla 12 % suorituskykyisempi kuin 3090 Ti. Molemmilla resoluutioilla 4090:llä Ryzen 9 5900X -prosessori oli suorituskyvyn pullonkaulana.

Counter Strike: Global Offensivessa oli Full HD -resoluutiolla käytössä alhaiset kuvanlaatuasetukset ja käytimme FPS Benchmark -testiä keskimääräisen ruudunpäivitysnopeuden mittaamiseen. 4090 oli 6 % suorituskykyisempi kuin 3090 Ti.

 

DirectX Raytracing & DLSS -suorituskyky (säteenseuranta)

3DMarkin puhtaasti säteenseurantaa käyttävässä DXR-testissä 4090 oli 120 % suorituskykyisempi kuin 3090 Ti.

Cyberpunk 2077:ssä Ray Tracing Ultra -kuvanlaatuasetuksilla ja DLSS Auto-asetuksella 4090 oli 4k-resoluutiolla 34 % suorituskykyisempi kuin 3090 Ti. Kuten tuloksista näkee, 4090 on DLSS päällä suorituskykynsä osalta prosessoririippuvainen, kuten myös RTX 30 -sarjalaiset 1440p- ja 1080p-resoluutioilla.

F1 22:ssä parhailla Ultra High -kuvanlaatuasetuksilla on käytössä myös säteenseuranta, mutta DLSS jätettiin pois käytöstä. 4090 oli 74 % suorituskykyisempi kuin 3090 Ti.

Dying Light 2:ssa High Quality Raytracing -asetuksilla ja DLSS käytössä 4090 oli 72 % suorituskykyisempi kuin 3090 Ti.

Far Cry 6:ssa Ultra-asetuksilla ja säteenseuranta käytössä 4090 oli 40 % suorituskykyisempi kuin 3090 Ti.

 

DLSS 3 -testit

NVIDIA esitteli RTX 40 -sarjan näytönohjaimien julkaisun yhteydessä uuden Deep Learning Super Sampling- eli DLSS 3 -version, jossa isoin uudistus on Optical Multi Frame Generation. Alemman renderöintiresoluution ja skaalauksen lisäksi nyt DLSS myös generoi kokonaan uusia ruutuja parantamaan ruudunpäivitysnopeutta. Frame Generation käyttää NVIDIAn aiempaa järeämpää Optical Flow Accelerator -yksikköä lukeakseen ruuduista liikedataa pelimoottorin liikevektoreiden lisäksi. Sen kerrotaan pystyvän seuraamaan kuvasta esimerkiksi heijastuksia ja vastaavia pikselitasolla asti. Esiopetettu neuroverkko rakentaa näistä ongitun datan ja edeltävien ruutujen perusteella tarvittavat tiedot luodakseen täysin itsenäisesti uuden ruudun, mikä parantaa suorituskykyä sekä prosessori- että näytönohjainriippuvaisissa tilanteissa.

DLSS 3 on tuettu vain Ada Lovelace -arkkitehtuuriin perustuvilla GeForce RTX 40 -sarjan näytönohjaimilla ja DLSS 3 -pelit tukevat automaattisesti myös NVIDIA Reflexiä varmistamaan mahdollisimman pienet viiveet. Tuki DLSS 3:lle on luvattu nyt jo 35 peliin, joista osan kohdalla kyse on nykyisen DLSS 2.0 -tuen päivittämisestä DLSS 3:een. Vaikka peliin olisi lisätty DLSS 3 -tuki, DLSS 2.0 toimii vanhemmilla näytönohjaimilla jatkossakin normaalisti.

Testasimme 4k-resoluutiolla DLSS 3 -ominaisuutta Cyberpunk 2077 -pelillä säteenseuranta päällä ja vertasimme suorituskykyä ja silmämääräisesti kuvanlaatua DLSS 2.0:aan ja kun DLSS oli pois käytöstä.

Ray Tracing Ultra -asetuksella ilman DLSS:ää 4090:n suorituskyky jäi 37 FPS:ään ja peli ei käytännössä ollut sulavasti pelattava. DLSS 2.0 paransi keskimääräistä ruudunpäivitysnopeutta 95 % yli 70 FPS:ään ja pelikokemus parani samalla miellyttävän pehmeäksi. Pelatessa ja liikkeessä DLSS 2.0:n Performance-tason kuvanlaatua oli hyvin hankala erottaa natiivista 4k-kuvasta, mutta pysäytyskuvissa esimerkiksi heijastuksissa, verkkoaidassa, ritilöissä ja tekstuureissa oli havaittavissa selkeää sumeutta, mutta toisaalta jotkin tekstit ja tekstuurit olivat DLSS:llä alkuperäistä kuvaa terävämpiä.

DLSS 3 paransi keskimääräistä ruudunpäivitysnopeutta natiiviin kuvaan verrattuna 238 % ja DLSS 2.0:aan 74 %. Peliä pelatessa ja kuvankaappauksista eroa kuvanlaadussa DLSS 2.0:n ja DLSS 3:n välillä oli mahdoton todeta pikaisella testillä silmämääräisesti. DLSS 3:n kuvanlaatua tullaan tulevaisuudessa testaamaan eri tahojen toimesta todennäköisesti tarkemmin, joten jäämme odottamaan havaintoja kuvanlaatuun ja mahdollisiin ongelmatilanteisiin liittyen.

Microsoft Flight Simulatorissa DLSS 3 paransi keskimääräistä ruudunpäivitysnopeutta natiiviin kuvaan ja DLSS 2.0:aan verrattuna noin 82 %. Flight Simulatorissa DLSS:n käyttö aiheutti selvästi näkyviä grafiikkavirheitä muun muassa tekstuurien reunoihin, lentokoneen varjoon ja reunojenpehmennykseen. Samat virheet toistuivat DLSS 2.0:aa ja DLSS 3:a käytettäessä, joten odotettavissa on todennäköisesti vielä runsaasti viilausta DLSS-tukeen.

 

Hyötyohjelmat ja Open CL -suorituskyky

Blender 3.3.0 Benchmarkin testeissä 4090:n tulokset olivat 63-101  % parempia kuin 3090 Ti:llä.

LuxMark 3.1:n testeissä 4090:n tulokset olivat 53-132 % parempia kuin 3090 Ti:llä.

 

Tehonkulutusmittaukset

Tehonkulutusta mitattiin seinästä Coltech EMT707CTL -mittarilla, joka kertoo koko kokoonpanon tehonkulutuksen ilman näyttöä. 3D-rasituksena käytettiin Cyberpunk 2077 -peliä 4k-resoluutiolla.

Cyberpunk 2077:llä ja säteenseuranta päällä 4090:llä tehonkulutus nousi enimillään noin 450 wattiin, mutta kokoonpanon tehonkulutus jäi noin 55 wattia alhaisemmaksi kuin Asuksen nestejäähdytetyllä ja tehdasylikellotetulla ROG Stric 3090 Ti:llä. Uuden ATX 3.0 -standardin ja 16-pinnisen PCIe 5.0 12VHPWR -virtaliittimen mahdollistama 600 watin tehonkulutus ei siis toteutunut 4090 Foundes Editionilla lähellekään.

 

Lämpötilamittaukset

Grafiikkapiirin lämpötila mitattiin GPU-Z-ohjelman avulla ja 3D-rasituksena käytettiin Cyberpunk 2077 -peliä 4k-resoluutiolla.

AD102-grafiikkapiiri toimi NVIDIAn omalla Founders Editionin jäähdytyksellä 70-asteisena eli lämmöt olivat suhteellisen hyvin kurissa. GDDR6X-muistit toimivat 76-asteisena.

 

Melumittaukset

A-painotuksella suoritetuissa melumittauksissa Velleman DVM805 -desibelimittari sijoitettiin 60 senttimetrin päähän kiinni olevan kotelon kyljestä. Ympäristön melutaso testikokoonpano pois päältä oli 33,3 desibeliä. 3D-rasituksena käytettiin Cyberpunk 2077 -peliä -peliä 4k-resoluutiolla. Virallisesti melua mitataan tiettyjen standardien mukaan, joten mittaukset ovat lähinnä suuntaa antavia.

GeForce RTX 4090 Founders Edition toimi 3D-rasituksessa erittäin hiljaisena ja melutaso oli 37 desibeliä. Korvakuulolla kelojen vinkumista tai korkeataajuista sirinää ei havaittu käytännössä lainkaan.

 

Ylikellotustestit

Ylikellotustestissä NVIDIAn GeForce RTX 4090 Founders Edition oli asennettuna suljetun Cooler Master Cosmos C700P -kotelon sisälle. Power- ja Temp Target- eli tehonkulutuksen ja lämpötilan ylärajat nostettiin maksimiin eli 133 %:iin ja 88 asteeseen. Tuulettimen kierrosnopeuden annettiin olla lämpötilan mukaan automaattisesti säätyvässä Auto-asennossa. Saavutetut kellotaajuudet ovat suuntaa antavia.

Power Limit on vakiona 450 wattia ja 33 % korotus maksimiin tarkoittaa noin 600 wattia.

Näytönohjain ylikellottui AD102-grafiikkapiirin osalta +225 MHz eli 2745 MHz:n Boost-taajuudelle, jolloin todellinen kellotaajuus 3D-rasituksessa oli 4k-resoluutiolla noin 2950 MHz. GDDR6X-muistit venyivät vakaasti ilman negatiivista vaikutusta suorituskykyyn +1500 MHz eli 24 Gbps:n nopeudelle (1500 MHz).

Grafiikkapiirin lämpötila nousi ylikellotettuna 70 asteesta 76 asteeseen, kokoonpanon tehonkulutus nousi 630 watista 705 wattiin ja melutaso nousi 37 desibelillä 38,5 desibeliin.

Ylikellotettuna RTX 4090 Founders Editionilla 3DMark Time Spy Extremen  grafiikkatulos parani 7 % ja F1 22:n keskimääräinen ruudunpäivitysnopeus 9 %.

 

Loppuyhteenveto

GeForce RTX 4090 on erittäin suorituskykyinen näytönohjain ja tarjoaa jälleen ison harppauksen suorituskyvyssä eteenpäin erityisesti 4k-pelaamisessa verrattuna edelliseen RTX 30 -sarjaan. Valitettavasti huippusuorituskykyyn käsiinpäästäkseen joutuu myös venyttämään kukkaron nyörejä mallista riippuen 2000 euron verran tai enemmän. Siinä missä RTX 30 -sarjan julkaisun yhteydessä edullisia suositushintoja suhteessa suorituskykyyn jopa hämmästeltiin, on maailmantilanne muuttunut parin viime vuoden radikaalisti. NVIDIAn toimitusjohtaja Jensen Huang totesi RTX 40 -sarjan julkaisun yhteydessä suoraan, että sirujen hintojen laskeminen on menneisyyttä ja piikiekot ovat nykyään aiempaa kalliimpia.

io-techin testeissä RTX 4090 tarjosi perinteisissä peleissä ilman säteenseurantaa noin 50-70 % parempaa rasterointisuorituskykyä kuin 3090 Ti. 3DMarkin puhtaassa säteenseurantatestissä 4090 oli jopa 120 % suorituskykyisempi kuin 3090 Ti, mutta käytännössä peleissä säteenseuranta käytössä erot jäivät 40-70 %:iin.

Uusi DLSS 3 -ominaisuus ja Frame Generation eli ylimääräisten ruutujen luominen suorituskyvyn parantamiseksi toimi Cyberpunk 2077- ja Microsoft Flight Simulator -pelissä hyvin ja suorituskyky parani DLSS 2.0:aan verrattuna jopa 74-82 % ilman silmämääräisesti suurempaa vaikutusta kuvanlaatuun. RTX 4090:n suorituskyky oli jo ilman DLSS 3 -ominaisuutta niin vakuuttavalla tasolla, ettei sen käytölle nykypeleillä ollut akuuttia tarvetta, mutta sen avulla 4k-resoluutiolla ruudunpäivitysnopeudet saadaan nostettua maagisesta 60 FPS:stä yli 100 FPS:ään.

Tehonkulutus pyöri RTX 4090 Founders Editionilla suurimman osan ajasta 430-450 watin välimaastossa ja Founders Editionin kolmen korttipaikan korkuinen ja reilun parin kilon painoinen jäähdytysratkaisu hoiti hommansa erinomaisesti pitäen grafiikkapiirin ja muistien lämpötilat kurissa ja melutason miellyttävän hiljaisena. Tappiin ylikellotettuna näytönohjain haukkasi 500 wattia, grafiikkapiirin lämpötila nousi 76 asteeseen ja kokoonpanon melutaso nousi 38,5 desibeliin joka on jo selvästi kuultavissa, mutta ei vieläkään häiritsevän äänekäs. Ylikellotettuna näytönohjaimesta saatiin puristettua vielä vajaa 10 % lisää suorituskykyä.

Näytönohjainvalmistajien omien RTX 4090 -mallien testit saa julkaista huomenna. Odotettavissa on järeämpien jäähdytysratkaisuiden myötä alhaisempia lämpötiloja ja parempaa ylikellotuspotentiaalia. Näytönohjaimien myynti alkaa huomenna klo 16, mutta yli 2000 euron hinnoilla mitään järisyttävää ostoryntäystä tuskin on luvassa. AMD esittelee omat RDNA 3 -näytönohjaimensa kolmen viikon kuluttua, jolloin nähdään kuinka kilpailukykyisiä NVIDIAn RTX 4090- ja 4080-näytönohjaimien hinnat todellisuudessa ovat.

This site uses XenWord.