NVIDIAn odotetaan julkaisevan tänä vuonna uuteen Ampere-arkkitehtuuriin perustuvat näytönohjaimet. Näytönohjaimista ei tiedetä vielä käytännössä mitään, mutta spekulaatioa ja huhuja niistä riittää.
Nyt Twitterissä kunnostautunut vuotaja _rogame on twiitannut kaksi mielenkiintoista tulosta Geekbench 5:n tulostietokannasta. Tuloksissa esiintyy kaksi NVIDIAn nimetöntä näytönohjainta, jotka ovat merkittävästi nykytarjontaa järeämpiä ainakin muistimäärän ja SM-yksiköiden suhteen. Molempien tulokset on ajettu OpenCL-rajapinnalla Windows-alustalla. Tuloksia lukiessa on syytä muistaa, että sovellukset saattavat tulkita julkaisemattomia näytönohjaimia ja niiden ominaisuuksia väärin.
Geekbenchin mukaan kaksikon tehokkaampi näytönohjain on varustettu 24 gigatavun muistilla, 1,11 GHz:n kellotaajuudella ja 118 SM-yksiköllä. Mikäli grafiikkapiirissä on yhtä monta CUDA-ydintä per SM-yksikkö kuin Turing-arkkitehtuurissa, se tarkoittaisi 7552 CUDA-ydintä. Näytönohjain saa OpenCL-rajapinnalla tuloksekseen 184 096 pistettä.
Heikomman mutta edelleen kovan 141 654 pisteen tuloksen saanut näytönohjain on varustettu puolestaan 1,01 GHz:n kellotaajuudella toimivalla 108 SM-yksikön (6912 CUDA-ydintä mikäli suhdeluvut pysyvät ennallaan) grafiikkapiirillä. Muistia näytönohjaimessa on kuitenkin peräti 47 Gt, tai todennäköisemmin 48 Gt, josta näkyy syystä tai toisesta hieman vähemmän Geekbenchille.
Näytönohjainten SM-yksiköiden ja muistin määrästä voidaan tulkita käytännössä varmasti, että kyseessä on oltava NVIDIAn seuraavan sukupolven datakeskuksiin tarkoitetuista näytönohjaimista ja Volta-arkkitehtuurin GV100:n korvaavasta grafiikkapiiristä. Testit on ladattu Geekbench-palveluun viime vuoden loka- ja marraskuussa, eli kyse lienee NVIDIAn sisäisitä testikokoonpanoista. Verrokiksi tunnistamattomien näytönohjainten 184 096 ja 141 654 pisteen tuloksille _rogame mainitsee Quadro GV100:n nettoavan OpenCL-rajapinnalla 142 837 pistettä, Tesla V100:n 154 606 pistettä ja Titan RTX:n 132 804 pistettä.
Lähde: _rogame @ Twitter
* Geekbench-tulos, kun oletetaan korttien kellotaajuuksien olevan sama 1370MHz: 1370 / 1110 x 184096 = 227218
** Geekbench-tulos, kun oletetaan korttien kellojen ja CUDA-ytimien määrien olevan sama 5120kpl: 5120 / 7552 x 227218 = 154046
Jos oletetaan että vuodossa kerrotut ja taulukossa käytetyt arvot pitävät paikkansa, uusien näytönohjainten CUDA-ytimet tekevät samoilla kellotaajuuksilla täsmälleen saman verran työtä kuin GV100-grafiikkapiirissä. Eli Ampere ei olisi tuomassa mitään arkkitehtuurillisia muutoksia CUDA-ytimiin suorituskyvyn saralla, vaan korkeampi suorituskyky saavutetaan suuremmalla määrällä CUDA-ytimiä ja mahdollisesti korkeammilla kellotaajuuksilla, jos sellaisiin voidaan 7nm prosessilla päästä.
Pisteiden skaalautuminen CUDA-ytimien määrän ja kellotaajuuden mukaan on tässä kyllä niin täydellistä, että alkaa mietityttää onko vuotaja tai vuotajalle tiedot välittänyt taho laskeskellut samoja asioita ja lätkinyt sen mukaan CUDA-ytimiä ja kellotaajuutta itse keksimälleen tekaistulle "vuodolle". Käytetty testialusta ja näytönohjainten muistien nopeudet kuitenkin yleensä vaikuttaa tuloksiin ihan jonkin verran.
Aika kovia pisteitä, saa nähdä miten AMD vastaa jos pärjää ollenkaan
Jos et ole siellä 247 päivittämässä Recent results -listaa näiden nimettömien löytäminen on kuin etsisi neulaa heinäsuovasta, joskus joku bongaa, joskus ei. Siellä tietokannassa on aika taatusti muitakin julkaisemattomien näyttisten tuloksia mitä ei ole bongattu.
Mutta 2080Ti silti tuntuvasti nopeampi peleissä.
Joten millaisia johtopäätöksiä voisi siis vetää tälläisestä testistä Amperen/Turingin välillä kun kyse on pelisuorituskyvystä.
Muistisi taitaa nyt pettää sinut pahemman kerran: OpenCL Benchmarks – Geekbench Browser
GTX 1080 Ti saa tuon listauksen mukaan vajaat 60 000 pistettä ja on esim Vega 64:n takana. Toki tuosta puuttuu yksittäisiä parhaita tuloksia, mutta ei tuollaista 90 000 eroa kaavita kokoon kuin iskemällä koneeseen useampi 1080 Ti
Juu meni sekasin taisi olla Vulkan pisteet noi +80k
Mutta Vega64 saa +80k
data-unfurl="true" data-result-id="7982" data-url="https://browser.geekbench.com/v5/compute/45996" data-host="browser.geekbench.com" data-pending="false">
class="link link--external fauxBlockLink-blockLink"
target="_blank"
rel="nofollow noopener"
data-proxy-href="">
Gigabyte Technology Co., Ltd. B450M S2H – Geekbench Browser
browser.geekbench.com
Ei tuo mitään FLOPSeja mittaa, Geekbench 5:n OpenCL-testissä esimerkiksi Turingiin perustuva GTX 1660 Ti on nopeampi kuin GTX 1080 Ti, vaikka jälkimmäisessä on TFLOPSeissa laskettuna suorituskykyä ~tuplat ja peleissäkin yli 50 % nopeampi.
Sieltä on löytynyt vielä isompi, ilmeisesti 128 SM-yksikköä olisi täydessä paketissa.
Kelpais kyllä jos tulisi Desktop Gpu tuollaiset määrät. 2080Ti 4352 alkaa näyttämään hieman vaisulta.
Tosin eihän 4k€ ole nykyään "deskariCPU":sta hinta eikä mikkään että miksei sitten kolmen tonnin näyttiskin niille jotka ei sitä tarvitse mutta haluavat kuitenkin?
Kommentoi uutista tai artikkelia foorumilla (Kommentointi sivuston puolella toistakseksi pois käytöstä)
Lähetä palautetta / raportoi kirjoitusvirheestä