Tutustumme AMD:n uuteen Zen 2 -koodinimelliseen x86-arkkitehtuuriin, 3. sukupolven Ryzen-prosessoreiden ominaisuuksiin ja X570-piirisarjaan.

AMD julkaisi keväällä 2017 uuden Zen-arkkitehtuurin ja siihen perustuvat Ryzen-prosessorit työpöydälle sekä Epyc-prosessorit palvelimiin. Niiden kanssa yhtiö lähti uuteen taistoon arkkivihollistaan Inteliä vastaan, joka on viime vuosina dominoinut niin markkinoita ylivoimaisesti.

Täysin uuden mikroprosessoriarkkitehtuurin kehittäminen ja tuotteistaminen kestää noin neljä vuotta. Zen-arkkitehtuurin kehitys alkoi vuosina 2012-2013 ja projektissa näkyvimmin esillä oli Applelta palkattu tietokonearkkitehti Jim Keller, joka on jo aiemmin ollut AMD:lla työskentelemässä K7- ja K8-arkkitehtuurien eli Athlon- ja Opteron-prosessoreiden parissa. Keller siirtyi Zen-arkkitehtuurin valmistuttua AMD:ltä Teslalle työskentelemään autopilottiominaisuuden pariin ja jatkoi keväällä 2018 matkaansa Intelille. Kellerin lähdön jälkeen Zen-arkkitehtuurin parissa ovat julkisuudessa näkyvimmin olleet esille yhtiön teknologiajohtaja Mark Papermaster ja pääarkkitehti Mike Clark.

Julkaisun yhteydessä keväällä 2017 AMD ilmoitti, että Zen-pohjaiset arkkitehtuurit tulevat olemaan käytössä seuraavat 4-5 vuotta ja Socket AM4 -kanta ainakin vuoteen 2020 asti. Tarkemmin ottaen Zen-arkkitehtuuri oli alun perin tarkoitus päivittää ensin Globalfoundriesin 14 nanometrin prosessista 14 nm+ -prosessiin, joka myöhemmin nimettiin 12nm-prosessiksi. Zen+- eli 2. sukupolven Ryzen-prosessorit julkaistiin korkeammilla kellotaajuuksilla keväällä 2018.

Tämän jälkeen vuorossa piti olla siirtyminen Zen 2 -arkkitehtuuriin ja 7 nanometrin prosessiin, jota Globalfoundries ja TSMC molemmat kehittivät tahoillaan. Elokuussa 2018 Globalfoundries ilmoitti kuitenkin lopettavansa 7nm-prosessinsa kehityksen ja luopuvansa siitä kokonaan keskittyen jatkossa 14/12nm FinFET -prosesseihinsa. Samassa yhteydessä AMD ilmoitti tuottavansa jatkossa kaikki 7nm-prosessilla valmistettavat prosessorinsa ja grafiikkapiirinsä TSMC:llä. Globalfoundries jatkaa kuitenkin edelleen AMD:n prosessoreissa käytettävien I/O-piirien ja emolevyjen piirisarjojen valmistusta.

Zen 2 -arkkitehtuurin piti alun perin olla siirtyminen 7 nanometriin ilman suurempia arkkitehtuurimuutoksia ja odotuksena oli, että pienemmän valmistusprosessin myötä kellotaajuudet olisivat  alhaisemman käyttöjännitteen myötä laskeneet. AMD:n pääarkkitehti Mike Clark kertoi io-techille, että tästä syystä Zen 2 oli tarkoitus tuoda vain palvelinpuolelle Epyc-prosessoreihin. 7 nm -prosessilla kellotaajuuksia saatiin kuitenkin lopulta nostettua, joten Zen 2 tuotiin myös Ryzen-työpöytäprosessoreihin. Koska tarkempia syitä ei mainittu, voidaan spekuloida että Globalfoundriesin 7nm-prosessilla odotuksena oli kellotaajuuksien laskeminen, mutta TSMC:n prosessilla niitä saatiinkin nostettua.

AMD lupaa omissa markkinointipuheissaan TSMC:n 7 nanometrin prosessin tarjoavan kaksinkertaisen transistoritiheyden, puolet alhaisemman tehonkulutuksen tai 25 % paremman suorituskyvyn. Huomion arvoinen seikka kuitenkin on, että kyseisissä netissä eri yhteyksissä ja artikkeleissa käytetyissä luvuissa viitataan Vega 10- ja 20-grafiikkapiireihin SGEMM-testissä.

Tuotetasolla AMD lupaa uudella 7 nm:n Ryzen 7 3700X -prosessorilla 75 % paremman suorituskyvyn tehonkulutukseen nähden verrattuna edellisen sukupolven 12 nm:n Ryzen 7 2700X:ään.

IPC- eli Instructions Per Clock -suorituskyky tarkoittaa, kuinka monta käskyä prosessorin liukuhihna kykenee suorittamaan yhden kellojakson aikana. Mitä enemmän prosessori kykenee suorittamaan käskyjä per kellojakso, sitä parempi sen suorituskyky on ja näkyy erityisesti yhden säikeen suorituskyvyssä.

Zen 2 -arkkitehtuuriin päätettiin lisäksi toteuttaa alkuperäisistä suunnitelmista poiketen mukaan myös IPC-parannuksia ja AMD:n mukaan se on saanut parannettua suorituskykyä alkuperäiseen Zen-arkkitehtuuriin nähden noin 15 %. Yleisenä peukalosääntönä arkkitehtuurisuunnittelussa pidetään, että 1 % parannus IPC-suorituskykyyn lisää 1 % tehonkulutusta. Zen 2 -arkkitehtuurin tapauksessa siirtyminen pienempään 7 nanometrin valmistusprosessiin antoi tehokulutukseen jonkin verran pelivaraa, mutta tämän päälle insinöörit ovat parantaneet ja viilanneet arkkitehtuuria useilla eri osa-alueilla. Kyseessä on ns. kohtalaisen helposti toteutettavissa olleita muokkauksia, lisäyksiä ja optimointeja pohjalla olevaan alkuperäiseen Zen-arkkitehtuuriin.

 

Zen 2 -arkkitehtuurin yksityiskohdat

Zen 2 -arkkitehtuurin suunnittelussa yleisellä tasolla kolme pääteemaa olivat suorituskyky, valmistusprosessi ja skaalautuvuus. Suorituskykyyn suurin vaikutus on piirin sisällä kasvaneella kaistanleveydellä, prosessi on päivitetty 12 nanometristä 7 nanometriin ja skaalautumisella tarkoitetaan ydinmäärä nostamista kahdeksasta 16:een vanhalla tutulla Socket AM 4 -kannalla.

Zen 2 -arkkitehtuuri rakentuu edellisten Zen- ja Zen+-arkkitehtuurien päälle ja IPC-parannuksien sekä piirin sisäisen kaistanleveyden kasvattamisen lisäksi osia hyödynnetään entistä tehokkaammin, tietoa säilyy isomman L3-välimuistien ansiosta enemmän piirin sisällä ja turvallisuutta on parannettu. Zen 2 -arkkitehtuuri kykenee noutamaan ja dekoodaamaan neljä x86-käskyä per kellojakso ja jokaisessa ytimessä on neljä kokonaislukuyksikköä ja kaksi liukulukuyksikköä (2 x Fadd & 2 x Fmul).

Mukana on uusi TAGE (Tagged Geometry) haarautumisen ennustin, L1-käskyvälimuisti on puolitettu, mutta sen assosiatiivisuutta on kasvatettu, mikro-operaatioiden välimuisti on tuplattu, kokonaislukuyksikköön on lisätty kolmas AGU eli osoitteenlaskentayksikkö (Address Generation Unit) ja tuettuna on AVX256-käskyjen suorittaminen yhtenä operaationa.

Jokaisella ytimellä on oma 32 kilotavun L1-käskyvälimuisti, 32 kilotavun L1-datavälimuistia ja 512 kilotavun L2-välimuisti sekä kaikkien ytimien kesken jaettu isompi L3-välimuisti, joka on tuplattu Zen- ja Zen+-arkkitehtuureista.

Yksinkertaisimmillaan prosessorin liukuhina rakentuu neljästä vaiheesta, jotka ovat Fetch eli käskyn hakeminen keskusmuistista, Decode eli käskyn tulkinta, Execute eli käskyn suorittaminen ja Writeback eli tuloksen kirjoittaminen rekisteriin tai muistiin. Käytännössä liukuhihnan vaiheet on kuitenkin pilkottu pienempiin vaiheisiin ja esimerkiksi moderneissa AMD:n, Intelin ja Qualcommin prosessoreissa liukuhihnassa on tulkintavasta riippuen noin 10-20 vaihetta.

Liukuhihnan merkittävimpiä uudistuksia ovat parannettu haarautumisen ennustaminen, optimoitu L1-käskyvälimuisti, operaatiovälimuistin parannukset, tuplattu liukuluku & load-store kaistanleveys 256-bittiseksi, mul-viivettä on parannettu ja liukulukuyksikön rekisteritiedosto on suurempi.

Tarkemmat yksityiskohdat arkkitehtuurin uudistuksista löytyä yllä olevista dioista.

L1-käskyvälimuistin uudistamisen ja tuplatun L3-välimuistin lisäksi mukana on muutamia uusia välimuistikäskyjä. AMD:n omien sanojen mukaan tuplattu L3-välimuisti vähentää muistien latenssia maksimissaan 33 nanosekuntia ja käytännön tasolla peleissä on nähtävissä 10-21 % parannus suorituskykyyn.

 

Matisse-koodinimelliset Ryzen 3000 -sarjan prosessorit

3. sukupolven Matisse-koodinimelliset Ryzen-prosessorit perustuvat chiplet-suunnitteluun eli ne rakentuvat kahdesta erillisestä TSMC:n 7 nanometrin prosessilla valmistetusta CCD- eli  Client Compute Die -piiristä ja Globalfoundriesin 12 nanometrin prosessilla valmistettavasta I/O-piiristä (cIOD).

7 nm:n CCD-piirin pinta-ala on 74 neliömillimetriä ja se rakentuu 3,9 miljardista transistorista. 12 nm:n I/O-piirin pinta-ala on 125 neliömillimetriä ja se rakentuu 2,09 miljardista transistorista

Koska käytössä on edelleen vanha tuttu AM4-prosessorikanta ja uudet 3. sukupolven Ryzen-prosessorit ovat yhteensopivia vanhempien emolevyjen ja piirisarjojen kanssa, uudenlainen kolmen piirin chiplet-suunnittelu on täytynyt toteuttaa olemassa olevilla fyysisillä ja sähköisillä reunaehdoilla. Käytännössä tämä on tarkoittanut muun muassa piirien sisäisen rakenteen sekä fyysisten piirien asettelua alustaansa huolellisesti siten, että johtimet saadaan vedettyä AM4-kannan pinneihin mahdollisimman helposti. Johtimien kasvaneen lukumäärän johdosta hartsialusta on päivitetty 12-kerroksiseksi ja piirien juotospallot on vaihdettu kuparipilareihin. Lisäksi useamman piirin käyttämisestä aiheutuu ylimääräisiä logistisia haasteita prosessoreiden lopulliseen kasaamiseen.

6- ja 8-ytimiset Ryzen 5- ja Ryzen 7 -prosessorit on varustettu yhdellä CCD-piirillä ja 12- ja 16-ytimiset Ryzen 9 -prosessorit kahdella CCD-piirillä.

CCD rakentuu kahdesta CPU-kompleksista eli CCX:stä, joka käsittää neljä prosessoriydintä, jotka kykenevät käsittelemään SMT-tuen ansiosta kahdeksaa säiettä. Jokaisella ytimellä on oma 512 kilotavun L2-väimuisti sekä kaikkien ytimien kesken jaettu 16 megatavun L3-välimuisti. CCX:stä on mahdollista kytkeä pois käytöstä yksittäisiä ytimiä eli esimerkiksi 6-ytimisessä prosessorissa molemmista CCX:stä on kytketty pois käytöstä yksi ydin.

CCD-piirit ovat Infinity Fabric -liitäntärajapinnalla yhteydessä I/O-piiriin, joka käsittää DDR4-muistiohjaimen ja I/O Hub -ohjaimen. I/O Hub -ohjaimeen on integroitu PCI Express 4.0 -ohjain 24 linjalla ja neljä USB 3.2 Gen 2×1 -porttia.  PCI Express -linjoista 16 on pyhitetty näytönohjaimelle tai jaettavissa kahdelle näytönohjaimelle, neljä piirisarjalle ja neljä NVME SSD:lle tai SATA-porteille.

 

Ryzen 3000 -sarjan prosessorit

Edullisimmat Zen 2 -arkkitehtuuriin pohjautuvat prosessorit ovat 6-ytimiset ja SMT-tuella 12 säiettä tukevat Ryzen 5 3600- ja 3600X-mallit, jotka kilpailevat Intelin mallistossa 6-ytimisten Core i5-9400- ja 9600-prosessoreiden kanssa. 3600X toimii maksimissaan 4,4 GHz:n Boost-taajuudella ja sen TDP-arvo on 95 wattia. 3600 toimii puolestaan 4,2 GHz:n Boost-taajuudella ja sen TDP-arvo on 65 wattia. Molemmat on varustettu 35 megatavun Gamecachella eli yhteenlasketulla L2- ja L3-välimuistilla.

Ryzen 7 3700X ja 3800X ovat kumpikin 8-ytimisiä prosessoreita SMT-tuella eli 16 säikeellä ja ne kilpailevat Intelin 8-ytimisen Core i7-9700K-mallin kanssa. 3700X:n Boost-kellotaajuus on 4,4 GHz ja 3800X:n 4,5 GHz. 3700X:n TDP-arvo on 65 wattia ja 3800X:n 105 wattia. Molemmissa on yhteensä 36 Mt Gamecache-välimuistia.

Kokonaan uuteen Ryzen 9 -sarjaan tulee nyt aluksi 12-ytiminen 3900X-prosessori, joka kykenee suorittamaan samanaikaisesti 24 säiettä ja kilpailee Intelin 8-ytimisen ja Hyper-Threading-ominaisuudella varustetun Core i9-9900K-lippulaivamallin kanssa. Prosessorin Boost-kellotaajuus 4,6 GHz ja TDP-arvo on 105 wattia. Gamecache-välimuistia on yhteensä 70 megatavua.

E3-messujen yhteydessä Los Angelesissa AMD kertoi tuovansa markkinoille myös 16-ytimisen Ryzen 9 3950X -mallin, joka saapuu myyntiin syyskuussa 749 dollarin hintaan.

AMD:n toimitusjohtaja Lisa Su totesi medialle, että yhtiö ei aio jäädä odottelemaan Intelin seuraavaa prosessorijulkaisua, vaan päätti tuoda kahden 8-ytimisen chiplet-suunnittelun mahdollistaman AM4-kantaisen 16-ytimisen työpöytäprosessorin markkinoille pikimmiten. Luvassa ovat myös uudet Zen 2 -arkkitehtuuriin pohjautuvat Threadripper-tehoprosessorit HEDT-alustalle, mutta ne julkaistaan myöhemmin.

16-ytiminen ja SMT-ominaisuudella 32 säiettä tukeva Ryzen 9 3950X toimii maksimissaan 4,7 GHz:n Boost-taajuudella ja sen perustaajuus on 3,5 GHz. Gamecachea on yhteensä 72 megatavua ja prosessorin TDP-arvo on 105 wattia.

 

X570-piirisarja & PCI Express 4.0 -ohjain

Uusien Ryzen-prosessoreiden kaveriksi julkaistiin myös X570-piirisarja, joka on itseasiassa sama piiri kuin prosessorin I/O-piiri, mutta valmistettu Globalfoundriesin 12 nanometrin prosessin sijaan 14 nm:n viivanleveydellä.

Yksi 3. sukupolven Ryzen-prosessoreiden uudistuksista on tuki PCI Express 4.0 -väylälle, joka tarjoaa 31,5 Gt/s tiedonsiirtonopeuden. Uuden standardin tiedonsiirtonopeus on kaksinkertainen 3.0-standardiin verrattuna.

Piirisarja on yhteydessä prosessoriin PCI Express 4.0 -standardin x4-väylällä ja tarjolla on 8 kappaletta USB 3.2 Gen 2 -portteja, neljä USB 2.0 -porttia, neljä SATA 6 Gbps -porttia sekä 12 kappaletta PCI Express 4.0 -linjoja, jotka on konfiguroitavissa joustavasti eri tarpeisiin.

Lähes kaikki myyntiin tulevat X570-emolevyt on varustettu aktiivisella jäähdytysratkaisulla eli tuulettimella, joten piirisarja voi tietyissä olosuhteissa toimia kohtalaisen lämpöisenä. Emolevyvalmistajien mukaan piirisarjan lämpötila olisi 10 astetta korkeampi ilman tuuletinta.

Uuteen X570-piirisarjaan perustuvista emolevyistä on tiputettu pois tuki 1. sukupolven Ryzen-prosessoreille ja -APU-piireille, eli se tukee vain toisen ja kolmannen sukupolven Ryzen-prosessoreita. Vastaavasti X470-, B450- ja valikoidusti BIOS-päivityksellä jotkut X370- ja B350-piirisarjaan perustuvat emolevyt tukevat uusia 3. sukupolven Ryzen-prosessoreita.

 

Yhteenveto

AMD:n uudet 3. sukupolven Ryzen-prosessorit haastavat entistä paremmin Intelin Core-työpöytäprosessorit. Ytimien lukumäärässä AMD painelee nyt 12- ja 16-ytimisillä malleillaan täysin omille luvuilleen ja parantunut IPC-suorituskyky auttaa kuromaan eroa umpeen erityisesti pelikäytössä.

Zen 3 -arkkitehtuuri on aikataulussa ja kyseessä on päivitys TSMC:n toisen sukupolven 7nm+-valmistusprosessiin EUV-litografialla. Zen 4 -arkkitehtuuri on puolestaan suunnitteilla eikä siitä ole toistaiseksi tiedossa tarkempia yksityiskohtia.

Intel puolestaan on parhaillaan suurissa vaikeuksissa 10 nanometrin prosessinsa kanssa ja tuoreiden roadmap-vuotojen mukaan yhtiö aikoisi pysytellä työpöytäprosessoreissaan 14 nm:n prosessissa jopa vuoteen 2022 asti. Ensi vuonna yhtiö aikoo julkaista Comet Lake -koodinimelliset prosessorit ja vuonna 2021 vuorossa on Rocket Lake. Molemmat uutuudet on merkitty valmistettavaksi 14 nm:n viivanleveydellä ja 10-ytimeen asti.

This site uses XenWord.