AMD valmistelee parhaillaan RDNA2-arkkitehtuuriin perustuvien Navi2X-grafiikkapiirien julkaisua. Odotus kohdistuu luonnollisesti eniten Big Navina tunnettuun lippulaivamalli Navi21:een, mutta luvassa on myös edullisemmat Navi22- ja Navi23-grafiikkapiirit.
AMD on lisännyt nyt avoimen lähdekoodin RadeonSI Gallium3D -ajureihin tuen paitsi Van Gogh -APU-piirille, myös Dimgrey Cavefish -koodinimelliselle näytönohjaimelle. Linux-päivityksen tiedoista voidaan lukea, että kyseessä on nimenomaan joukon edullisimmaksi oletettu Navi23. Myös muille Navi2X-perheen siruille on olemassa omat merelliset kalojen mukaan nimetyt koodinimensä. Navi21 tunnetaan myös nimellä Sienna Cichlid ja Navi22 nimellä Navy Flounder. Van Gogh tulee olemaan puolestaan yhtiön ensimmäinen RDNA2-arkkitehtuuriin perustuva APU-piiri.
Toinen tuore paljastus tulee AMD:n ROCm 3.8 -version mukana tulevasta uudesta firmwaresta Navi22:lle. Mukana on myös aiemmin vuotaneet tiedot Navi21:lle. Kertauksen vuoksi tällä hetkellä tiedetään, että Navi21:ssä tulee olemaan yhteensä kaksi Shader Arrayta per Shader Engine, neljä Shader Engineä ja 10 Compute Unit -yksikköä per Shader Array, eli yhteensä 80 Compute Unit -yksikköä. Navi22:ssa on tiputettu Shader Engineiden määrä puoleen, eli siinä on yhteensä 40 Compute Unit -yksikköä. Molemmissa on neljä Render Backend -yksikköä per Shader Engine, mikä tarkoittaisi ROP-yksiköiden määrän suhteellisesti puolittuneen RDNA1-näytönohjaimiin nähden, olettaen että Render Backendin rakenne on entisellään.
Itse grafiikkapiirin laskentayksiköiden ja muiden grafiikan piirtämiseen liittyvien yksiköiden lisäksi firmwaren mielenkiintoisinta antia ovat näytönohjainten muistikaistaan viittaavien TCCS-yksiköiden määrä. Listauksen mukaan Navi21:ssä olisi 16 yksikköä ja Navi22:ssa 12 yksikköä, mitkä viittaisivat oletuksena 256- ja 192-bittisiin muistiväyliin. TCCS viittaa tarkemmin L2-välimuistisiivujen määrään, mikä on yleensä suoraan verrannollinen GDDR-muistikanavien määrään, mutta AMD:n tiedetään poikenneen tästä kaavasta aiemminkin.
Lähteet: Phoronix, stblr @ Reddit
Näillä näkymin on 256 mutta mukana Infinity cache.
Eli CU määrän pysyessä samana suorituskyky olisi parantanut 20-25% RX 5700 XT näytönohjaimeen nähden arkkitehtuuriin tehtyjen parannusten ja/tai kellojen nostamisen myötä?
Ei niitä piirejä puoliin leikata, todennäköisemmin 72 ja 36 CU. Noidenkin piirien väliin jää kyllä niin paljon eroa että kolmaskin malli olisi tarpeeseen.
gc_num_tccs = max texture channel caches.
num_packer_per_sh:sta sen sijaan en saanut oikein mitään selvää. Vaikuttaa jotenkin siihen, minkäkokoista tiilausta käytetään.
Jep, eli L2-välimuistisiivujen määrään, mikä on yleensä suoraan verrannollinen GDDR-muistiväylän leveyteen mutta ei aina.
Jos RDNA2 on oikeasti selvästi energiatehokkaampi kuin RDNA, niin siitä rakennetulle keskikokoiselle dGPU läppäripiirille voisi hyvinkin olla tilaa markkinoilla, kun Nvidiakaan ei ole julkaissut mitään pienempiä 7nm / 8nm luokan piirejä.
Jos tuo pitää paikkansa, niin eikö tuo merkitse sitä, että 80CU mallin pitäisi olla nopeampi kuin 3080?
Ei sitä voi suoraan tietenkään noista tuloksista tulkita, mutta entistä todennäköisemmältä se kyllä näyttää olettaen että nuo on Navi22-lukuja (ja pakkohan niiden on olla, ei 80 CU RDNA2 voi olla noin hidas kun 40 CU RDNA1 on niin nopea kuin on)
Ikuna ei se scaalautuvuus ole 100% kun yksiköitä lisätään, mutta jos tuo pitäisi paikkansa, niin yllättävän lähelle pääsisi!
Toki 256 bitin väylä haukkaa enemmän 80cu kuin 40cu tehosta! Eli isommalla voi muisti olla pullonkaula, mutta onhan tämä vielä kuin heittäisi pimeässä kellarissa tikkaa, kun ei edes tiedä missä suunnassa maalitaulu on!
No well eiköhän tuo vuoden loppuun mennessä käy selville ja selkeästi näitä vuotoja on ollut nyt jo vähän enemmän eli jotain silloin valmistumassakin. 🙂
Edellisessä sukupolvessa suoritus skaalautui lähes lineaarisesti Compute Unittien mukaan ainakin yhdessä pelissä. Toki siellä on monta muuttukaa, ettei se ihan näin yksinkertaista ole.
Joo, mutta 5500XT -> 5700XT välissä myös muistiväylä tuplaantuu.
Nyt muistikaistaa on äärettömän vaikea kasvattaa samassa suhteessa kun lähdetään skaalaamaan tuosta ylöspäin. 5700XT käytti jo 14Gbps GDDR6:sia…
Nyt ilmeisesti 40cu 192 bit ja 80cu 256… tuplasti ytimiä, vajaa neljännes lisää kaistaa. Aika velhoja ovat!
Itse odottelen vielä oikeita tietoja ennenkuin lähden arvelemaan mitään. Tuohon väliin ei mitään? Olettaisi että jonkun 60cu olisi vielä jossain tuossa välissä…
Jep… taidan painua koisaamaan ja unohtaa tämän vielä kuukaudeksi, josko sitten olisi jo varmempaa vuotoa tiedossa 😉