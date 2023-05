Yhtiön laskelmien mukaan 32 Mt:n L2-välimuisti voi leikata muistiliikennettä jopa 50 % 2 Mt:n välimuistiin verrattuna.

NVIDIA on julkaissut GeForce RTX 4060 -perheen näytönohjainten julkistuksen yhteydessä myös mielenkiintoisen katsauksen piirin muistipuolen sielunelämään. Blogissa käydään läpi RTX 40 -sarjan eli Ada Lovelace -arkkitehtuurin muistijärjestelmää ja miten kasvanut L2-välimuisti vaikuttaa siihen.

Kuten prosessoritkin, myös grafiikkapiirit noudattavat perinteistä muistihierarkiaa, jossa on eri tasoisia välimuisteja ennen varsinaisia muistiohjaimia. Suoritusyksiköt hakevat dataa niin läheltä kuin mahdollista ja mikäli haettua ei löydy lähimmältä välimuistitasolta, sitä haetaan seuraavalta ja niin edelleen, kunnes jäljelle jää varsinainen muisti (VRAM, Video RAM). NVIDIAlla on käytössä kaksi välimuistitasoa, L1 ja L2. L1-välimuistit ovat kunkin SM-yksikön omia ja suoraan niiden yhteydessä, kun L2-välimuisti on koko grafiikkapiirin yhdessä jakama.

NVIDIAn vertailut on tehty yksinomaan GeForce RTX 4060 Ti:llä (AD106), mutta vertailupisteen saamiseksi grafiikkapiirillä ajettiin testit sekä normaalisti 32 Mt:n että 2 megatavuun rajoitetulla L2-muistilla. Referenssiksi kerrottakoon, että esimerkiksi edeltävässä Ampere-sukupolvessa ns. vastaavalla GA106-piirillä oli 3 Mt L2-välimuistia.

Yhtiön testien mukaan L2-välimuistin kasvattaminen 2 Mt:stä 32 megatavuun AD106:lla laskee muistiliikennettä pelistä riippuen 40-60 %:iin. Vertailu on toteutettu kussakin pelissä 1080p, 1440p ja 4K-resoluutioiden keskiarvolla. Suurin hyötyjä on Call of Duty: Modern Warfare 2 ja pienimmän edun suuremmasta välimuistista vie nimiinsä Assassin’s Creed Valhalla. NVIDIA on tämän myötä keksinyt markkinoida tietyissä yhteyksissä myös näytönohjainten muistikaistaa ns. efektiivisenä muistikaistana välimuistin vaikutuksen vuoksi. Esimerkiksi GeForce RTX 4060 Ti:n 228 Gt/s:n muistikaista on yhtiön mukaan efektiivisesti jopa 554 Gt/s, mikä ajaa ohi edeltävän sukupolven RTX 3060 Ti 12 Gt:n 448 Gt/s todellisesta muistikaistasta.

Pienentyneet muistihaut parantavat luonnollisesti myös suorituskykyä. NVIDIAn mukaan ilman säteenseurantaa 32 Mt:n välimuisti parantaa suorituskykyä noin 17-18 % 2 megatavuun verrattuna. Säteenseuranta käytössä suorituskyky etu on jo noin 25 % ja DLSS 3:lla jopa 34 %. Valitettavasti diasta ei käy ilmi, onko suorituskykyparannukset mitattu keskiarvona samoilla testeillä kuin muistiliikenteen lasku, vai miten. Niin ikään on jätetty mainitsematta se, tarkoitetaanko DLSS 3:lla tässä yhteydessä sekä DLSS Super Resolutionia että Frame Generationia.

Lähde: NVIDIA