NVIDIA julkaisi tänään odotetusti uuden Ada Lovelace -arkkitehtuurin ja ensimmäiset siihen perustuvat näytönohjaimet. Ensimmäiseen aaltoon nahkatakkisen toimitusjohtaja Jensen Huangin povarista kaivettiin GeForce RTX 4090, 4080 16 Gt ja 4080 12 Gt.
Ada Lovelace -arkkitehtuurin suurin AD102-siru rakentuu noin 76 miljardista transistorista ja se valmistetaan samalla TSMC:n 4N-prosessilla kuin H100-laskentasiru. Uudet SM-yksiköt tukevat nyt käskyjen uudelleenjärjestelyä, eli käytännössä prosessoripuolelta tuttua Out-of-Order Execution -mallia, mikä parantaa käyttöastetta etenkin säteenseurannassa. 3. sukupolven RT-ytimet tarjoavat kaksinkertaista säde-kolmio-törmäystarkistusnopeutta ja 4. sukupolven Tensoriytimet ovat tuttuja Hopper-laskentapiiristä. Lisäksi mukana on päivittynyt Optical Flow Accelerator -yksikkö. Paneudumme arkkitehtuurin uudistuksiin tarkemmin lähitulevaisuudessa erillisessä artikkelissa.
GeForce RTX 4090 -näytönohjaimen AD102-grafiikkapiirissä on käytössä 128 SM-yksikköä eli 16 384 CUDA-ydintä. NVIDIA ei maininnut tensoriydinten tai RT-ydinten määrää, mutta mikäli suhde on sama kuin aiemmissa sukupolvissa, pitäisi piirissä olla yhteensä 512 tensoriydintä ja 128 RT-ydintä. Muistiväylä on 384-bittinen ja sen jatkeena on 24 Gt GDDR6X-muistia, mutta NVIDIA ei toistaiseksi ole hihkunut niiden nopeudesta.
RTX 4090:n perus- ja Boost-kellotaajuudet ovat 2,23 ja 2,52 GHz, mikä tuottaa maksimsisaan 82,6 TFLOPSin edestä FP32-laskentavoimaa. Jensen kuitenkin kehaisi, että yhtiö on jo ylikellottanut piirin jopa 3 GHz:iin. Tensoriytimet yltävät nyt jopa 1321 TOPSiin, mutta vain FP8-tarkkuudella ja viime sukupolven kanssa vertailukelpoisella FP16-tarkkuudella nopeus on 661 TOPSia. Näytönohjaimen TBP- eli Total Board Power -arvo on ainakin FE-mallille 450 wattia.
GeForce RTX 4090:n suositushinta on NVIDIAn omassa verkkokaupassa 1999 euroa.
GeForce RTX 4080 16 Gt perustuu ennakkotietojen mukaan AD103-grafiikkapiiriin, jossa on käytössä 76 SM-yksikköä eli 9728 CUDA-ydintä. Samalla tensori- ja RT-ydinten logiikalla niitä pitäisi olla käytössä 304 ja 76. Näytönohjaimen muistiväylä on 256-bittinen ja sen jatkeena on, kuten nimikin jo kertoo, 16 Gt GDDR6X-muistia.
RTX 4080 16 Gt:n perus- ja Boost-kellotaajuudet ovat lähellä isoveljeä, eli 2,21 ja 2,51 GHz. Ne tuottavat maksimissaan 48,7 TFLOPSia FP32-suorituskykyä ja 390 TFLOPSia FP16-tensorisuorituskykyä. Näytönohjaimen TBP-arvo on 320 wattia. RTX 4080 16 Gt on hinnoiteltu NVIDIAn kaupassa 1509 euroon.
GeForce RTX 4080 12 Gt:n nimeä on vaikea ymmärtää, sillä se on hyvin eri tuote 16 Gt:n mallista. Näytönohjaimessa on käytössä 60 SM-yksikköä eli 7680 CUDA-ydintä ja tiettävästi piirikin on eri, AD104. Tensoriytimiä pitäisi olla käytössä 240 ja RT-ytimiä 60. Muistiväylä on leikattu 192-bittiseksi ja sen jatkeena on 12 Gt GDDR6X-muistia.
RTX 4080 12 Gt lyö tauluun astetta kovemmat kellot 2,31 GHz:n perus- ja 2,61 GHz:n Boost-kellotaajuuksilla, mikä tuottaa 40,1 TFLOPSin teoreettisen FP32-suorituskyvyn ja 319 TFLOPSia FP16-matriisinmurskausta. TBP-arvoksi on asetettu 285 wattia. NVIDIAn verkkokaupassa RTX 4080 12 Gt:n hintalappuna komeilee 1129 euroa.
Suorituskyvyn osalta NVIDIA ei ole paljastanut vielä liikoja. Yhtiön omissa testeissä verrokkina kaikille kolmelle on GeForce RTX 3090 Ti. Resident Evilissä, Assassin’s Creed Valhallassa ja The Division kahdessa meno on vielä suht maltillista: RTX 4080 12 Gt jää kahdessa ensimmäisessä muutamia prosentteja 3090 Ti:n jälkeen ja kolmannessa ne ovat käytännössä rinta rinnan. RTX 4080 16 Gt on noin 15 % nopeampi kuin RTX 3090 Ti kaikissa kolmessa pelissä. RTX 4090:n suorituskyky on Assassin’s Creedissä noin 50 %, Division 2:ssa 60 % ja Resident Evil Villagessa 60 % parempi kuin 3090 Ti:n.
Warhammer 40K: Darktidessä ja MS Flight Simulatorissa meno muuttuu: RTX 4080 16 Gt peittoaa 3090 Ti:n noin 45 %:n erolla, RTX 4080 16 Gt 80 % erolla ja RTX 4090 jopa 105 % erolla Warhammerissa, kun Flight Simulatorissa kaikki kolme ovat 90-95 % nopeampia kuin 3090 Ti. Erikoisiin lukuihin löytyy selitys DLSS 3:sta, jota tuetaan vain RTX 40 -sarjan näytönohjaimilla. Se parantaa suorituskykyä sekä prosessori- että näytönohjainrajoitteisissa tilanteissa laskemalla ylimääräisiä ruutuja oikeasti skaalattujen ruutujen väleihin. Palaamme teknologiaan tarkemmin erillisessä uutisartikkelissa.
Seuraavan sukupolven peleiksi NVIDIA laski keynotessakin esitellyn Portal with RTX:n, Racer RTX:n ja Cyberpunk 2077:n uuden RT Overdrive -tilan, jossa on maksimoitu pelin säteenseurantaefektit. Kaikki kolme tukevat myös DLSS 3:a ja sen Frame Generation -ominaisuutta, joten ero viime sukupolven lippulaivaan räjähtää käsiin. RTX 4090:n luvataan peittoavan RTX 3090 Ti:n Portalissa noin 2,8-kertaisella, Racer RTX:ssä noin 4,2-kertaisella ja Cyberpunkissa jopa 4,3-kertaisella suorituskyvyllä. Löydät tarkemmat luvut yllä olevasta graafista.
Lähde: NVIDIA
Well… Helpottaa 3000 sarjan myyntiä.
Tuo tuo extra fame systeemi muistuttaa televisioiden 480 fraimin systeemiä, jossa normaali fraimimäärä monikertaistetaan. Tässä vain fraimien välille lasketaan jotain variantteja.
Oli tuo tehty miten hyvänsa, niin kyllähän se tekee vertailemisen vaikeaksi…
Pitäsi tallentaa kuvaa fraimi fraimiltä ja verrata miten lasketu fraimit vertautuu oikeisiin fraimeihin. Ja saataisiinko ihan sama aikaa sillä että monistettaisiin sama fraimi, kuten TV-vastaanottamissa.
No jää tilaa 4080 ti kortille, mutta mitähän 4070 tulee olemaan?
sama 192 bit muisti ja 6 Gigaa muistia, että eroaa 4080 12 G mallista?
Kuristetaan muistia lisää ja julkaistaan 10 Gigan malli? Mielenkiinnolla odottelen niitä ”edullisempia” versioita joskus ensi vuoden puolella…
Joo, nuo 4080:t olisi pitänyt nimetä 4070:ksi ja laittaa sitten 4080:ksi joku leikattu versio huippupiiristä. Olisi hyvin erikoista jos tuohon monttuun ei julkaistaisi jotain sillä sekunnilla kun AMD:n kortit ilmestyvät myyntiin.
Jos haluaa vain rasterointisuorituskykyä niin ei kai ole järkeä NVIDIAn tuotteisiin enää katsoakaan kuten ei tainnut olla 30-sarjan kanssakaan, onhan se selvää että jos tuotekehitys ja piirin pinta-ala hajautetaan muuhun kuin rasterointiin niin kilpailija joka ei niin tee tarjoaa paremman suorituskyvyn sekä wateissa että mahdollisesti/todennäköisesti rahassakin laskettuna.
Ei se oikein voi jos tosiaan vain syötetään väliframeja "normaalien" väliin. Pelienginen näkökulmasta mikään ei muutu ja jos "normaalit" tulee samassa ajassa kuin ennenkin on inputlag näiden ruutujen suhteen tasan sama. Tietysti jos "normaaleja" ruutuja viivästetään niin sittenhän näin toki käy.
Visuaalisesti tilanteessa voi tulla ongelmia jos ennustus menee jotenkin karmeasti väärin, mutta testit sitten näyttää kunhan saavat tuotteet ja pätsit peleihin ulos.
Jos 4070 on vielä reilusti enemmän kuristettu niin silloin lähennellään jo 3070:n nopeutta rasteroinnissa, mielenkiintoiseksi menee. Nytkin tuo 12Gt:n 4080 on ilmeisesti vain jotain 15-20% nopeampi kuin 3080 rasteroinnissa.
DLSS3 voi olla ihan mielenkiintoinen, jos se toimii hyvin niin eipä silloin oikein ole väliä, että puolet ruuduista on AI:n taikomia.
Mistäs ehmetistä ne muistikellot kaivoi? En muista nähneeni NVIDIAn sivuilla moisiia
Mielenkiintoinen toki, mutta itsellä on kuvan katsomisen suhteen vähän sama periaate kuin musiikin kuuntelussakin, että haluan sen originaalin lähdedatan näkyville enkä mitään filtteröityä/AI:n keksimää huttua. Jos biisi kuulostaa oikeasti paskalta niin haluan kokea sen paskuuden eikä silleen että minulla on joku ylimääräinen "artisti" toistoketjussa levyn ja omien korvien välillä joka taikoo paskasta kelvollista. Vastaavasti peleissä ja leffoissa kytketään kaikki näyttölaitteen pehmennys/terävöityspaskeet pois päältä ja mahdollisimman natiivi ja studiomasteria vastaava kuva ruutuun.
Tuollahan ne ovat näytonohjainvalmistajien spekseissä, esim.
GALAX confirms AD102-300, AD103-300 and AD104-400 GPUs for GeForce RTX 4090/4080 series – VideoCardz.com
videocardz.com
katso liitettä 954264
Eivät ole, vaan ehkä 25 % nopeampia kiitos käskyjen uudelleenjärjestelyn ja senkin tuottama hyöty vaihtelee merkittävästi pelistä toiseen. Ainut 2x mitä NVIDIA niille mainosti oli energiatehokkuus.
Niin siis tukevat nyt uutena FP8-tarkkuutta 2x nopeudella FP16-matriiseihin verrattuna, vanhemmat eivät tue FP8ia lainkaan.[/quote][/QUOTE]
4090 450W
480 285-340W
no ei siitä rdna3 paljon jos yhtään jää.
7900xt 400W
7800xt 350W
pieniä eroja,ja 4080:net rullaa vähemmällä
hinnat tietty on se pointti,toden. adm kiristää voittonsa pieneksi jotta saa alle…saa nähdä onko varaa.
tod. näköisesti jos ei voita fps kisaa,jonka tietää ennen julkaisua,laskee hinnat mahd. alas kuten ennen.
koko luokka on samaa noilla tehoilla,mutta niinkuin eikkasin,jos rdna3 aikoo pystyä kisaamaan nopeus kuninkuudesta,watteja on oltava.
4090.. harva tarvii, ja tuon kun ostaa on kotona jo 32" 4K näyttö,ellei 8K, jos sellaisia on,raha ei ole este näille.
4080 variaatiot, paras valinta,kiinnostavin veikkaan.
4070 ei tietoa, jos 16-12gb muistia vois olla se valinta,tolla pärjää monta helposti.
nyt sitten odotellaan rdna3 kortteja, olisko 3.10.2022, ja sitten testejä. rtx 4090 on kyllä kova pala.katso liitettä 954272
ja eikös prossu puolellakin tule niitä piakkoin.
sry kirjoitus virheistä,hemmetti, otti ja postas ennekuin ehin editoida, eikä voi korjata jälkenpäin, miksi?
Kyllä sinullakin pitäisi siellä näkyä viestin alalaidassa jossain "Muokkaa" vaihtoehto
40×0 sarjassa pitäisi olla todella iso määrä cachea piirillä. Tuo iso cache auttaa muistikaistan kautta samalla tapaa kuin amd:lla infinity cache. Muistikaistan nopeutta ei voi siis verrata 30×0 sarjaan suoraan tuon cachen koon suurentamisen vuoksi. Nvidia ei ikävä kyllä vielä tuosta puhunut, mutta huhupajat on huhunneet riittävästi, että tän tiedon kanssa voi mennä pankkiin.
En oikein tiedä miten päin tätä Nvidian omaa tekstiä pitäisi tulkita että sen saa koskemaan vain energiatehokkuutta: "The Ada-based CUDA® cores bring double-speed processing for single-precision floating point (FP32) operations over the previous generation GPUs"
NVIDIA Ada Lovelace for Professional Visualization
http://www.nvidia.com
Tensoriytimissä on mainitsemasi lisäksi optimointeja tilanteisiin joissa data on ns. sparse, eli käytännössä tensorissa on paljon nollaa sisällä.
4080 8GB (4060)
4080 6GB (4050)
4080 4GB (4040)
Ei taida olla tiedossa vielä.
Marraskuun jonain päivänä.
4090 julkaistaan lokakuussa, eli se nyt ainakin aiemmin…
Ei mitenkään, se energiatehokkuus on se mitä NVIDIA sanoi shaderytimestään (ts sm-yksiköt/cuda-ytimet jne)
Tuo lainaamasi teksti viittaa koko GPU:n kaksinkertaiseen FP32-suorituskykyyn edeltävään sukupolveen nähden.
Sparse-tuki oli jo Amperessa.
Ei kai tuossa nyt ollut yksinkertaisesta sparse-tuesta kyse, vaan sen tehostamisesta edelleen? Vai onko tuolla linkkaamallani sivulla siis kaikki tiedot silkkaa paskapuhetta? Siellä siis myös:
"Fourth-Generation Tensor Cores
Specialized for deep learning matrix multiply and accumulate math operations, the new fourth-generation Tensor Cores accelerate more data types and support Fine-Grained Structured Sparsity to deliver more than 2X throughput for tensor matrix operations compared to the previous generation.
"
Guru3d:n uutisesta:
katso liitettä 954350
GeForce RTX 4080/4090 announcements (preview)
http://www.guru3d.com
Ei noilla määrillä vielä pitkälle pötkitä. Tiedä sitten onko siellä vielä isompi L3 kakku lisänä.
Ei ole paskapuhetta tietenkään, missasin tuon. Joka tapauksessa ne isot isot luvut tulevat FP8:sta
Asus GeForce RTX 4090 TUF Gaming – OC Edition -näytönohjain, 24GB GDDR6X – 2 999,90€
http://www.jimms.fi
Asus GeForce RTX 4090 ROG Strix – OC Edition -näytönohjain, 24GB GDDR6X – 2 999,90€
http://www.jimms.fi
Noilla pötkitään pitkälle versus ampere.
Siis juu, FP8-tuki on kiva juttu ja sillä saa joitain workloadeja nopeutettua huomattavasti. Kunhan tietää mitä tekee.
Mutta alkuperäinen pointti siitä, että CUDA- ja tensoriytimiä on kärkipään kortissa yli 50% enemmän JA ne on edeltävää sukupolvea tehokkaampia, on edelleen se juttu. Mielestäni teholisäys on huomattava, vaikka sitten tuleekin hinnan ja virrankulutuksen kustannuksella. Ja sitähän alunperin ihmettelinkin että miten tässä ei joidenkin mielestä ole riittävästi teholisäystä.
Täytyy kyllä sanoa että tuo CUDA-ytimien nopeuslisä on vähintäänkin erikoisesti tuolla mainittuna, mikäli siinä on tosissaan tarkoitus vertailla koko piirin laskentanopeutta eikä yhden ytimen nopeutta.
Kolmen kilon näyttis 😀 No nyt jää kyllä hyllylle. Vaikka rahat löytys niin ei kyllä millään pysty. Järjetöntä.
Nyt on kyllä kahen kilon siika.
"Tuotteiden hinnat eivät ole lopullisia ja muuttuvat ennen julkaisua. "
Jimmsillä saattaa hyvinkin olla MSRP eli 2000€ hintaisiakin, kuten oli viime julkkarissakin. Tuolla tosiaan lukee että hinnat muuttuvat ennen julkaisua.
Juurikin näin. Toivotaan, että FSR 2.0:n sekä XeSS:n kehitykseen panostetaan kunnolla.
Edelleen, kun jenkkien MSRP hinta dollareissakin nousi useita satasia, niin miten tämä euron kurssi nyt on muka syypää?
Mitä suotta muuttamaan hintoja. Käyvät varmaan kaupaksi noillakin…
En lähde mitään huhuja spekuloimaan, mutta siis jos tarkastellaan näitä julkaistuja näytönohjaimia:
3080 699$ tai 3080 12GB 799$ -> 4080 12gb 899$ tässä näkisin kyllä että kulut on noussut ja eurohinta sitten luonnollisesti vähintään sen 20 % enemmän (+verot) kun euro heikentynyt.
3080ti 1199$ -> 4080 16gb 1199$ tässä nimenomaan euron kurssi vaikuttaa merkittävästi hintaan, kun msrp sama
3090 1499$ tai 3090ti 1999$ -> 4090 1599$ (tämän yläpuolelle tullee ti-versio vielä eli +100$ ja euron kurssi + verot päälle)
Miksi vertaat 3080 Ti korttiin, kun kaikki Super/Ti malli ovat vasta myöhemmin julkaistuja malleja, kuten tässäkin julkaisussa? Tuossa vertailussa ei ole järjen hiventä.
Myös 3080 vertaaminen 4080 korttiin ontuu pahasti. Surkeampi 4080 vastaa teholisäykseltään ja muiltakin muihin kortteihin verraltaviltaan piirteiltään paljon enemmän malliston x070 korttia.
Vai haluatko tietoisesti tulla höpläytetyksi?
Liekö mielekästä vertailla 3000-sarjan MSRP-hintoja mihinkään? Niitä sai sillä hinnalla hyvin rajattuja julkaisueriä, ja nyt sitten 4000-sarjan julkaisun alla viimein hinnat palanneet suunnilleen siihen MSRP-hintaluokkaan. Tosin niinpä ne 4000-sarjankin hinnat on vielä täysi mysteeri…
Mites tää ajatusmalli toimii siinä kohtaa kun sieltä tulee se 4080 ti ja 4090 ti?
3070 > 4080 12 Gt, 3080 > 4080 16 Gt, 3090 > 4090 on se ainut oikeasti toimiva, koska noita ti-päivitysversioita voidaan pitää käytännössä varmoina
Tää ei ole musta ihan rehellinen vertailu kyllä. Kaikki noi Amperet perustuu isoimpaan, eli GA102 siruun. Adat puolestaan kolmeen eri siruun, AD104, AD103, AD102.
3080:n vertaamisen 4080 16GB:hen hyväksyn kyllä, vaikka siinäkin verrataan isointa sirua toiseksi isoimpaan. Tässä suomihinta on yli tuplaantunut 739€ -> 1509€.
3080 vertautuu hyvin 4080 12gb
4080 16gb on kai isompi piiri joten vertasin 3080ti (jos tulee 4080 ti niin se on 100-200$ kalliimpi)
3090 vertautuu 4090 ja jos tulee ti niin se menee varmaan saman 100-200$ tuon 3090ti:n päälle.
Eikä noilla msrp hinnoilla nyt olekaan väliä, nämä voi olla loppujen lopuksi halvempia suomessa mitä 3000-sarja oli pahimmillaan, tai sitten kalliimpia sen näkee sitten.
Nvidia on näköjään onnistunut tehtävässään.
Kyllä ne sieltä tulee, ennemmin tai myöhemmin, todennäköisesti ensi vuonna viimeistään kunhan varastoja on ensin saatu tyhjennettyä.
lähdettä tälle väitteelle?
nVidia on tyypillisesti aina laskenut "CUDA-ytiminsä määrällä" sitä, montako 32-bittistä FMA-operaatioea voidaan laskea kellojaksossa. Kun (oikeiden) ytimen FMA-yksiköiden määrää on kasvatettu, samalla on kadvatettu sitä, monenako "CUDA-ytimenä" sitä markkinoidaan.
Väärinkäsitys on lähde. Se NVIDIAn väite oli juurikin tuo Adalla tupla FP32-suorituskyky vrt aiemmat GPU:t, ei että itse CUDA-ytimet olisivat kaksi kertaa niin nopeita kuin aiempien CUDA-ytimet
Sähköä syö oletettavasti kuin kiuas ja hintaa auton verran. Ei nyt kyllä jaksa innostua millään näistä. Louhimisenkin sanottiin muuttuneen kannattamattomaksi, niin ei Nvidia kyllä enää saa myytyä sinnekään. AMD:llä tulee olemaan iskun paikka RDNA3:n kanssa.
Toisekseen tuli tuossa ällisteltyä Asuksen 4090 malleja, erityisesti "2xHDMI/3xDP" fyysistä rööritystä. Että onko näissä siis sitten mahku ajella viittä näyttöä yhtäaikaa? Vaiko onko yksi DP/HDMI joko tai?
Hohhoijaa.
Olin valmistautunut siirtymään 3080 -> 4090 mutta hintaa on nyt kyllä sen verran että poistuu hetkeksi valjastettu ostohousut jalasta nopeasti.
Katellaan vastinetta naapurista ja tuumaillaan tovi. Jos saisi jotenkin kikkailua kunnollisen AIB valmistajan kortin alle 2k€ niin sitten vielä voi miettiä. Mitään Jimmsin kolmea tonnia en ala pulittamaan