
Tutustumme tässä artikkelissa AMD:n uuden Zen-koodinimellisen x86-arkkitehtuurin historiaan ja ominaisuuksiin sekä testaamme clock-to-clock-testeissä Ryzen 7 -sarjan prosessorin suorituskykyä 4 GHz:n kellotaajuudella.
AMD kehitti Zen-arkkitehtuuria neljän vuoden ajan ja käytti siihen yli 2 miljoonaa miestyötuntia. Projektin parissa on työskennellyt samanaikaisesti parhaimmillaan 300 yrityksen insinööriä.
Toimitusjohtaja Lisa Sun mukaan AMD:n oli lopulta pakko kehittää uusi suorituskykyinen x86-arkkitehtuuri, jotta sen heterogeeniseen laskentaan eli prosessori- ja grafiikkaytimien yhdistämiseen nojautuva strategia onnistuisi kääntämään yrityksen kurssin voitolliseksi seuraavan viiden vuoden aikana.
Zen-arkkitehtuurin historia
Elokuu 2012 AMD:n uuden x86-arkkitehtuurin tarina alkoi, kun yritys sai palkattua riveihinsä tietokonearkkitehti Jim Kellerin Applelta johtamaan uusien vähävirtaisten ja suorituskykyisten prosessoriytimien suunnittelua täysin puhtaalta pöydältä.
Tuolloin 53-vuotias Keller on alalla veteraani ja suunnitellut useita prosessoriarkkitehtuureita muun muassa AMD:n, Applen ja Broadcomin tuotteisiin. Keller työskenteli aikoinaan AMD:lla tiimissä, joka suunnitteli K7- ja K8-koodinimelliset arkkitehtuurit, joita käytettiin Athlon- ja Opteron-prosessoreissa. Jälkimmäinen oli ensimmäinen 64-bittinen x86-arkkitehtuuri, jonka kehityksessä Keller toimi pääarkkitehtina.
Toukokuu 2014 Virallisesti Kellerin uusista arkkitehtuureista kuultiin ensimmäisen kerran, kun AMD ilmoitti Core Innovation Update -tapahtumassa julkaisevansa vuonna 2016 kokonaan uudet 64-bittiset ARM- ja X86-ytimet. Samalla paljastettiin K12-koodinimi uudelle Kellerin alaisuudessa kehitettävälle 64-bittiselle ARMv8-prosessoriytimelle.
Ennen uusiin arkkitehtuureihin perustuvia prosessoreita AMD suunnitteli vuodelle 2015 Skybridge-projektia, jonka ajatuksena oli lanseerata 20 nanometrin viivanleveydellä valmistettava ARM- ja x86-prosessori, jotka sopisivat samaan prosessorikantaan. X86-APU-piirissä oli tarkoitus käyttää Puma+-ytimiä ja ARM-järjestelmäpiirissä vähävirtaisia 64-bittisiä A57-ytimiä. Projekti haudattiin kuitenkin lopulta alle vuodessa, sillä Globalfoundries peruutti 20 nanometrin valmistusprosessinsa.
Syyskuu 2014 Muutamaa kuukautta myöhemmin vuorossa oli uuden x86-arkkitehtuurin koodinimen paljastus Deutsche Bank 2014 Technology Conference -tapahtumassa. Silloinen toimitusjohtaja Rory Read mainitsi Zen-arkkitehtuurin K12:n rinnalla ja totesi suoraan, että edellinen vuonna 2011 julkaistu Bulldozer-arkkitehtuuri ei ollut onnistunut tuomaan toivottua mullistavaa muutosta prosessorimarkkinoille.
Tammikuu 2015 Ruotsalainen Sweclockers.com-sivusto julkaisi ensimmäisenä maailmassa skuupin, jonka mukaan ensimmäinen Zen-arkkitehtuuriin perustuva prosessori olisi 8-ytiminen, koodinimeltään Summit Ridge ja valmistettaisiin 14 nanometrin viivanleveydellä.
Toukokuu 2015 Kunnolla AMD:n tulevaisuuden suunnitelmista ja uudesta x86-arkkitehtuurista kerrottiin keväällä järjesetyssä Financial Analyst Day -tapahtumassa. Yrityksen teknologiajohtaja Mark Papermaster kertoi perustiedot ja aikataulun Zen-ytimiä käyttävälle uudelle AM4-kantaiselle ja DDR4-muisteja tukevalle FX-prosessorille, jonka tavoitteeksi ilmoitettiin 40 % parannus IPC-suorituskyvyssä pohjimmiltaan Bulldozer-arkkitehturiin perustuvaan Excavator-ytimeen verrattuna.
Lisäksi Zen-ytimen kerrottiin tukevan Intelin Hyper-Threading-ominaisuuden kaltaista SMT- eli Simultaneous Multithreading -ominaisuutta, jonka avulla pystyttäisiin käsittelemään yhdellä fyysisellä ytimellä samanaikaisesti kahta säiettä. Tulevaisuuden roadmapissa esiteltiin jo Zenin jälkeen julkaistavia entistä suorituskykyisempiä Zen+-ytimiä.
Syyskuu 2015 AMD ilmoitti yllättäen, että Jim Keller jättäisi yrityksen kolmen vuoden työrupeaman jälkeen ja siirtyisi Teslalle johtamaan autopilot-ominaisuuden rautapuolen kehitystä. AMD:n mukaan Kellerin lähtö ei kuitenkaan vaikuttaisi yrityksen tuotejulkaisuihin, jolla viitattiin siihen, että Keller oli saanut työnsä valmiiksi uusien arkkitehtuurien suunnittelun suhteen ja nyt ne siirtyisivät suunnittelupöydältä tuotantoon.
Vuosi 2016 Kesän aikana käynnistyivät huhut, että Zen-arkkitehtuuri viivästyisi vuoden 2017 puolelle ja AMD vahvisti elokuussa, että Summit Ridge -koodinimellinen Zen-prosessori julkaistaisiin vasta seuraavana vuonna. Joulukuussa yritys ilmoitti, että Summit Ridge -työpöytäprosessori julkaistaisiin virallisesti Ryzen-brändinimellä.
Maaliskuu 2017: Ensimmäiset Zen-arkkitehtuuriin perustuvat 8-ytimiset Ryzen 7 -sarjan työpöytäprosessorit saapuvat myyntiin ja ne on hinnoiteltu erittäin kilpailukykyisesti. Suorituskykyisin Ryzen 7 1800X -malli on puolet halvempi kuin Intelin vastaava Core i7-6900K -malli.
Q2/2017 AMD aikoo julkaista Zen-arkkitehtuuriin perustuvat Naples-koodinimelliset palvelinprosessorit 1-2 prosessorin järjestelmiin.
H2/2017 AMD aikoo julkaista Zen-ytimiin ja Vega-grafiikka-arkkitehtuuriin perustuvat Raven Ridge -koodinimelliset APU-piirit kannettaviin tietokoneisiin.
K12? Kaikessa hiljaisuudessa AMD:n itse kehittämä ARM-pohjainen K12-ydin on vaipunut unholaan eikä sen mahdollisesta julkaisuaikataulusta ole tällä hetkellä tarkkaa tietoa.
Zen-arkkitehtuurin yksityiskohdat
Pelkästään paremman suorituskyvyn sijaan sama Zen-arkkitehtuuri suunniteltiin skaalautuvaksi myös vähävirtaisiin prosessoreihin. Aikaisemmin AMD oli kehittänyt rinnakkain kahta eri arkkitehtuuria, jota olivat Excavator suorituskykyisiin prosessoreihin ja APU-piireihin sekä Jaguar vähävirtaisiin mobiiliprosessoreihin.
Merkittävin Zen-arkkitehtuurin suhteen tehty lupaus oli alusta alkaen 40 % parannus Instructions Per Clock- eli IPC-suorituskykyyn Bulldozer-arkkitehtuurin Excavator-ytimeen verrattuna, mutta samaan aikaan suorituskyky/tehonkulutus-suhdetta täytyisi parantaa merkittävästi, jotta prosessori saataisiin mahtumaan 95 watin TDP-arvon raameihin.
Suorituskyvyn ja virrankulutuksen parantamiseksi yleisellä tasolla Zen-arkkitehtuurin suunnittelussa on keskitytty kolmeen kokonaisuuteen, jotka ovat suorituskykyisempi prosessoriydin, parempi välimuistihierarkia sekä alhaisempi virrankulutus. Kyseiset kokonaisuudet ovat pilkottavissa useisiin yksittäisiin uudistuksiin ja ominaisuuksiin.
IPC- eli Instructions Per Clock -suorituskyky tarkoittaa, kuinka monta käskyä prosessorin liukuhihna kykenee suorittamaan yhden kellojakson aikana. Mitä enemmän prosessori kykenee suorittamaan käskyjä per kellojakso, sitä parempi sen suorituskyky on ja näkyy erityisesti yhden säikeen suorituskyvyssä.
Yksinkertaisimmillaan prosessorin liukuhina rakentuu neljästä vaiheesta, jotka ovat Fetch eli käskyn hakeminen keskusmuistista, Decode eli käskyn tulkinta, Execute eli käskyn suorittaminen ja Writeback eli tuloksen kirjoittaminen rekisteriin tai muistiin. Käytännössä liukuhihnan vaiheet on kuitenkin pilkottu pienempiin vaiheisiin ja esimerkiksi moderneissa AMD:n, Intelin ja Qualcommin prosessoreissa liukuhihnassa on tulkintavasta riippuen noin 10-20 vaihetta.
Jos IPC-suorituskyky ja prosessorin liukuhihnan toiminta kiinnostavat, kannattaa ehdottomasti katsoa yllä oleva Android Authorityn erittäin selkokielinen opetusvideo aiheesta.
Zen-arkkitehtuuri kykenee noutamaan ja dekoodaamaan neljä x86-käskyä per kellojakso ja jokaisessa ytimessä on neljä kokonaislukuyksikköä, kaksi luku- ja kirjoitusyksikköä ja kaksi liukulukuyksikköä (2 x Fadd & 2 x Fmul).
Jokaisella ytimellä on oma 64 kilotavun L1-käskyvälimuisti, 32 kilotavun L1-datavälimuistia ja 512 kilotavun L2-välimuisti sekä kaikkien ytimien kesken jaettu isompi L3-välimuisti.
Kun kaikki arkkitehtuurin uudistukset ja parannukset lopulta yhdistettiin ja valmista Ryzen-prosessoria verrataan edellisten sukupolvien Piledriver-ytimiin perustuvaan FX-8300-sarjan prosessoriin sekä Excavator-ytimiin perustuvaan A12-9800-APU-piiriin, AMD kertoo saavuttaneensa Zen-arkkitehtuurilla yli 52 % parannuksen IPC-suorituskyvyssä ja 3,7-kertaisen parannuksen suorituskyky/wattia-suhteessa.
Summit Ridge -koodinimellinen Ryzen-prosessori
Käytännön tasolla Zen-arkkitehtuuriin pohjautuva tuote rakentuu CPU-kompleksista eli CCX:stä, joita voidaan yhdistää toisiinsa ja esimerkiksi 8-ytimisessä Ryzen-prosessorissa on käytössä kaksi CPU-kompleksia. CCX:stä on mahdollista kytkeä pois käytöstä yksittäisiä ytimiä ja AMD on toistaiseksi virallisesti julkaissut tai ilmoittanut julkaisevansa 6- ja 8-ytimiset versiot, mutta teoriassa kahdella CCX:llä on mahdollista toteuttaa myös 2- ja 4-ytimiset Ryzen-mallit.
CCX käsittää neljä prosessoriydintä, jotka kykenevät käsittelemään SMT-tuen ansiosta kahdeksaa säiettä. Jokaisella ytimellä on oma 512 kilotavun L2-väimuisti sekä kaikkien ytimien kesken jaettu kahdeksan megatavun L3-välimuisti. Jokainen ydin voi hakea tietoa jokaisesta välimuistista keskimäärin samalla latenssilla.
CPU-kompleksit kommunikoivat prosessorin sisällä keskenään uudella Infinity Fabric -liitäntärajapinnalla, jonka avulla prosessorin eri osat ja IP:t voivat siirtää tietoa toistensa välillä. Samaa liitäntärajapintaa tullaan käyttämään muun muassa Raven Ridge -koodinimellisissä APU-piireissä, joissa Infinity Fabric yhdistää Zen-prosessoriytimet ja Vega-grafiikkaohjaimen.
8-ytiminen Summit Ridge -koodinimellinen piisiru rakentuu yhteensä 4,8 miljardista transistorista. Ryzen 7- ja 5 -sarjan prosessoreiden Summit Ridge -koodinimelliset piisirut valmistetaan Globalfoundersin 14 nanometrin FinFet-prosessilla (density-optimized) ja niiden TDP-arvo on mallista riippuen 65 tai 95 wattia. AMD ei ole virallisesti kertonut piisirun pinta-alaa, mutta arvioiden mukaan se on noin 195 neliömillimetriä.
Zenin neljä Simultaneous Multithreading- eli SMT-ominaisuutta tukevaa ydintä yhdessä välimuisteineen vievät piisirulta tilaa 44 mm², kun Skylakessa sama määrä ytimiä välimuisteineen vaatii tilaa 49 mm². AMD:n prosessorissa on käytössä 12 metallikerrosta, kun Intelillä niitä on 13. Kumpikin käyttää metallikerroksissaan MiM-kondensaattoreita (Metal-insulator-Metal).
Huolimatta heikommasta prosessista AMD on onnistunut tiivistämään sekä L2- että L3-välimuistin Inteliä pienempään tilaan suhteutettuna muistin määrään. Zenin 512 kilotavun L2-välimuistit vaativat tilaa 1,5 mm² per ydin, kun Skylakessa 256 kt L2-välimuistia vie 0,9 mm² per ydin. Molemmista prosessoreista löytyy 8 megatavua L3-välimuistia per neljä ydintä, mutta AMD on saanut sen ahdettua 16 neliömilliin kun Skylakessa sama määrä muistia vie tilaa 19,3 mm².
Kuten aiemmin mainittiin, AMD kykenee tarvittaessa kytkemään CCX:stä pois käytöstä ytimiä, SMT-ominaisuuden tai L3-välimuistia tarjotakseen sopivan tuotteen eri hintaluokkiin. Näin hyötykäyttöön ja markkinoille saadaan julkaistua valmistusprosessissa osin vioittuneet piisirut.
AM4-prosessorikanta, DDR4-muistituki & PCI Express -ohjain
Ryzen-prosessorit käyttävät uutta 1331-pinnistä AM4-prosessorikantaa ja AMD suunnittelee käyttävänsä samaa kantaa ainakin vuoteen 2020 asti. Uudet teknologiat, kuten DDR5-muististandardi ja PCI Express 4.0 tulevat kuitenkin tulevaisuudessa vaatimaan kannan uudistamisen.
Tällä hetkellä samaan AM4-kantaan Ryzen-prosessoreiden kanssa sopivat 7. sukupolven Bristol Ridge -koodinimelliset APU-piirit ja tämän vuoden toisella puoliskolla julkaistavat Raven Ridge -koodinimelliset APU-piirit, joissa on käytössä Zen-prosessoriytimet ja Vega-grafiikka-arkkitehtuuri.
AMD:n lähitulevaisuuden prosessorit, kuten Zen2- ja Zen3-koodinimelliset arkkitehtuuripäivitykset tulevat todennäköisesti olemaan taaksepäin yhteensopivia nykyisten AM4-emolevyjen kanssa UEFI BIOS -päivityksellä ja uudet emolevyt tulevat toimimaan vanhojen prosessoreiden kanssa.
Prosessorikannan ympäriltä löytyvät muoviset kiinnikkeet ovat samat kuin edellisessä AM3-kannassa, joten klipsumalliset coolerit sopivat myös AM4-kannalle. Emolevyn läpi menevät reiät ovat kuitenkin AM4-emolevyissä eri kohdissa kuin AM3-emolevyissä, joten emolevyn läpi asennettavien coolereiden kanssa tarvitaan uudet AM4-yhteensopivat kiinnikkeet.
Asuksen Crosshair VI Hero -emolevystä löytyy kahdet reiät, joten sen kanssa voi käyttää huoletta niin AM3- kuin AM4-coolereita.
Ryzenin DDR4-muistiohjain tukee virallisesti JEDECn standardien mukaisesti 1333 MHz:n kellotaajuudella toimivia muisteja eli DDR4-2667-nopeutta. Muistikerroin on kuitenkin nostettavissa DDR4-3200-nopeudelle asti ja sitä korkeammat muistitaajuudet on saavutettavissa korottamalla Ref_clk-taajuutta.
Ryzen-prosessoriin integroitu PCI Express -ohjain tukee 3.0-standardia ja käytettävissä on 24 linjaa. Näytönohjaimelle on pyhitetty 16 linjaa ja ne voidaan jakaa kahden näytönohjaimen SLI- ja Crossfire-konfiguraatioissa kahdeksi x8-nopeudella toimivaksi PCI Express väyläksi. Neljä linjaa soveltuu käytettäväksi NVMe SSD:lle tai vaihtoehtoisesti linjat voidaan jakaa kahdelle SATA-väylälle ja 2 linjan NVMe SSD:lle. Lisäksi Ryzeniin on integroitu väylät neljälle USB 3.1 Gen 1 -liittimelle.
SenseMI
”SenseMI, a set of sensing and adapting technologies, including an artificial network inside every “Zen” processor to anticipate future decision, preload instructions, and choose the best path through the CPU”
Ryzen-prosessoreissa on käytössä AMD esittelemä SenseMI-tekniikka, joka käsittää joukon prosessorin suorituskykyyn ja toimintaan liittyviä ominaisuuksia. Vähemmän yllättäen jokaisella SenseMI-tekniikan ominaisuudella on oma markkinointinimensä, joten uusista termeistä ei tule olemaan pulaa.
Virransäästöstä on vastuussa Pure Power -ominaisuus, joka tarkkailee prosessorin lämpötilaa, kellotaajuutta ja käyttöjännitettä. Jos mahdollista, Pure Power optimoi reaaliajassa prosessorin parametreja alhaisemman virrankulutuksen saavuttamiseksi ylläpitäen tarvittavan suorituskyvyn.
Precision Boost on AMD:n uusi markkinointinimi perinteiselle Turbo-ominaisuudelle ja kellotaajuutta pystytään säätämään rasituksessa huomattavasti aiempaa tarkemmin. Precision Boost toimii rinnakkain Pure Power -ominaisuuden kanssa eli lämpötila, kellotaajuus ja käyttöjännite ovat jatkuvasti tarkkailtavana. Tarpeen ja mahdollisuuksien mukaan prosessorin kellotaajuutta voidaan säätää 25 MHz:n askelin tuhat kertaa sekunnissa eli yhden millisekunnin välein, kun perinteisesti prosessoreissa Turbo-tasot ovat olleet minimissään 100 MHz:n askelein.
Extended Frequency Range eli XFR mahdollistaa prosessorin kellotaajuuden nostamisen automaattisesti yli maksimiksi määritellyn Precision Boost -taajuuden, jos prosessorin jäähdytys on kunnossa ja lämpötila sekä tehonkulutus riittävän alhainen. Teoriassa tämä tarkoittaa, että prosessori toimii herkemmin ja kauemmin XFR-kellotaajuudella, mitä parempaa jäähdytystä prosessorilla käytetään.
Ryzen 7 -sarjan prosessoreissa XFR tarkoittaa 1-2 ytimen rasituksessa X-malleissa +100 MHz kellotaajuutta ja ei-X-mallissa +50 MHz kellotaajuutta.
Neural Net Prediction on sovellusten käyttäytymisestä oppiva ja tulevia päätöksiä ennustava tekoäly, joka valmistelee tärkeitä prosessorikäskyjä aloittamaan uuden työkuorman prosessoinnin.
Smart Prefetch on puolestaan joukko oppivia algoritmeja, jotka ymmärtävät sovellusten tapaa käyttää dataa ja ennakoivat, mitä tarvitaan suoritettavaksi tulevaisuudessa. Smart Prefetch lataa tiedot etukäteen välimuisteihin nopeamman ja responsiivisemman laskennan saavuttamiseksi.
Clock-to-clock-suorituskyky @ 4 GHz

Prosessoriarkkitehtuurin suorituskykyä mittaavissa clock-to-clock-testeissä neljän gigahertsin kellotaajuudella olivat mukana AMD:n Zen- ja Piledriver-arkkitehtuurit eli Ryzen 7 1800X- ja FX-8370 -prosessorit sekä Intelin Kaby Lake-, Broadwell-E- ja Haswell-E-arkkitehtuurit eli Core i7-7700K-, 6900K- ja 5960X-prosessorit.
Käytännössä relevantein vertailu käydään 8-ytimisten Zen-, Broadwell-E- ja Haswell-E-arkkitehtuurien kesken. Vertailu vuoksi mukana olivat myös AMD:n edellisen sukupolven arkkitehtuuri, jotta nähdään kuinka paljon AMD on onnistunut kehittämään omaa arkkitehtuuriaan sekä Intelin Kaby Lake edustamassa yrityksen nykyistä arkkitehtuuria.
Kaikilla prosessoreilla käytettiin DDR4-2400-muistinopeutta, paitsi FX-8370:llä oli käytössä DDR3-2400-muistit.
Zen testattiin X370-piirisarjaan perustuvalla Asuksen Crosshair VI Hero -emolevyllä ja käytössä oli kahdeksan gigatavua DDR4-2400-nopeudella toimivaa muistia.
Broadwell-E- ja Haswell-E X99-piirisarjaan perustuvalla Asuksen X99 Deluxe-II -emolevyllä ja käytössä oli 16 gigatavua DDR4-2400-nopeudella toimivaa muistia.
Kaby Lake testattiin Z270-piirisarjaan perustuvalla Asuksen Maximus IX Formula -emolevyllä ja käytössä oli kahdeksan gigatavua DDR4-2400-nopeudella toimivaa muistia.
Piledriver testattiin 990FX-piirisarjaan perustuvalla Asuksen Crosshair V Formula Z -emolevyllä ja käytössä oli kahdeksan gigatavua DDR3-2400-nopeudella toimivaa muistia.
Muiden komponenttien osalta avonaisessa testikokoonpanossa oli käytössä NVIDIAn GeForce GTX 1080 -referenssinäytönohjain ja 1920×1080- eli Full HD -resoluution näyttö. 64-bittinen Windows 10 Pro -käyttöjärjestelmä oli asennettuna Corsairin 120 gigatavun Force GT -SSD-asemalle. Virransyötöstä vastasi Silverstonen 750 watin Strider Gold -virtalähde.
AM4-alusta:
- AMD Ryzen 7 1800X (8/16 ydintä/säiettä)
- Asus Crosshair VI Hero (X370)
- 16 Gt Corsair Vengeance LPX DDR4-2400
AM3-alusta:
- AMD FX-8370 (8/8 ydintä/säiettä)
- Asuis Crosshair V Formula-Z (990FX)
- 8 Gt ADATA XPG V2 DDR3-2400
LGA 2011 -alusta:
- Intel Core i7-6900K (8/16 ydintä/säiettä)
- Intel Core i7-6800K (6/12 ydintä/säiettä)
- Intel Core i7-5960X (8/16 ydintä/säiettä)
- Asus X99-Deluxe II (X99)
- 16 Gt Corsair Vengeance LPX DDR4-2400
LGA 1151 -alusta:
- Intel Core i7-7700K (4/8 ydintä/säiettä)
- 8 Gt Corsair Vengeance LPX DDR4-2400
- Asus ROG Maximus XI Formula (Z270)
Muut komponentit:
- NVIDIA GeForce GTX 1080 Founders Edition (378.49-ajurit)
- Kingston 480 Gt HyperX Predator PCIe
- Corsair HX1000 (1000W)
- Microsoft Windows 10 Pro 64-bit
Prosessoritestit
Cinebench R15 -renderöintitesti testattiin kaikilla prosessorin käytössä olevilla säikeillä ja vain yhdellä säikeellä.
Blender-renderöintitestissä oli käytössä AMD:n julkaisema RyzenGraphic_27-tiedosto (150 samples) ja ohjelma osaa hyödyntää kaikkia prosessoriytimiä.
Geekbench 4:n CPU Benchmark -testi antaa tulokset kaikille ytimille ja yhdelle ytimelle. Testi skaalautuu hyvin prosessorin arkkitehtuurin, ytimien ja kellotaajuuden mukaan.
Handbrake-ohjelmalla enkoodattiin Fast 1080p30-presetillä ja H.264-koodekilla (x264) 6,3 gigatavun kokoinen 3840×1714-resoluution .mov-video .mp4 -containeriin. Ohjelma osaa hyödyntää kaikkia prosessoriytimiä. Aikataulusyistä mukana ovat vain Zen- ja Broadwell-E-arkkitehtuurit (8C/16T).
X265 HEVC Benchmark osaa hyödyntää kaikkia prosessoriytimiä ja käytössä olevia käskykantoja videon enkoodauksessa.
3DMark Fire Striken fysiikkatesti käyttää Bulletin avoimen lähdekoodin fysiikkakirjastoa ja hyödyntää kaikkia prosessoriytimiä simulaatioissaan.
Selainpohjainen Octane 2.0 mittaa Javascript-suorituskykyä kehittyneissä webbisovelluksissa ja testi ajettiin Chromella (Version 55.0.2883.87 m). Testi osaa hyödyntää vain yhtä ydintä.
7-Zip-ohjelman testi hyödyntää kaikkia prosessoriytimiä ja mittaa prosessorin suorituskykyä LZMA-algoritmilla pakkauksessa ja purussa.
3D-testit
Pelitestit suoritettiin 1920×1080-resoluutiolla ja käytössä oli suorituskykyinen GeForce GTX 1080 -näytönohjain. Mukaan on valittu pelejä ja testejä, joissa on nähtävissä prosessorin vaikutus suorituskykyyn, eikä näytönohjain olisi pullonkaulana. Korkeammilla 1440p- ja 2160p-näyttöresoluutioilla prosessorin merkitys vähenee merkittävästi, suorituskyvystä tulee entistä enemmän näytönohjainriippuvainen ja erot tasoittuvat.
ARMA 3 testattiin Yet Another ARMA Benchmark -testin avulla. Käytössä oli parhaat kuvanlaatuasetukset ja SMAA Ultra -reunojenpehmennys.
Battlefield 1 testattiin High-kuvanlaatuasetuksilla pelaamalla peliä 60 sekunnin ajan ja tallentamalla OCAT-ohjelmalla keskimääräinen ruudunpäivitysnopeus ja 99. persentiili Over the Top -kentässä.
Watch Dogs 2 testattiin High-kuvanlaatuasetuksilla pelaamalla peliä 60 sekunnin ajan ja tallentamalla OCAT-ohjelmalla keskimääräinen ruudunpäivitysnopeus ja 99. persentiili.
Total War: Warhammerissa käytettiin pelin sisäistä Benchmark-ominaisuutta.
Civilization VI:ssa käytettiin pelin sisäistä Benchmark-ominaisuutta, joka mittaa viiteen simuloituun vuoroon kuluneen keskimääräisen ajan.
Ashes of Singluarity: Escalation testattiin käyttämällä pelin sisäistä Benchmark-toimintoa ja CPU Focused -testiä.
Grand Theft Auto V testattiin pelin sisäisellä Benchmark-toiminnolla ja testiosioiden ruudunpäivitysnopeuksista laskettiin keskiarvo.
Ryzen 7 -pelitestit SMT-tuella ja ilman
Ajoimme nopeasti kokeilumielessä Battlefield 1-, Watch Dogs 2-, ARMA 3-, Total War: Warhammer- ja GTA V -pelitestit läpi 1920×1080-resoluutiolla, kun SMT oli kytketty pois käytöstä eli Ryzen 7 -prosessorissa oli käytössä ainoastaan 8 fyysistä ydintä. Prosessori ylikellotettiin toimimaan neljän gigahertsin kellotaajuudella, muistit asetettiin toimimaan DDR4-3200-nopeudella ja näytönohjaimena oli GeForce GTX 1080.
Battlefield 1-, Watch Dogs 2- ja GTA V -peleissä nähtiin vain 1-2 FPS parempi ruudunpäivitysnopeus, mutta Total War: Warhammerissa suorituskyky parani jopa 10 FPS:llä, kun SMT oli pois käytöstä. ARMA 3:ssa puolestaan SMT:n pois päältä kytkeminen heikensi tulosta 3 FPS:llä.
Mittasimme myös Battlefield 1- ja Watch Dogs 2 -peleillä 99. persentiilin eli minimi ruudunpäivitysnopeuden, kun 1 % huonoimpia ruutuja on jätetty huomioimatta:
Battlefield 1:
99. persentiili
- SMT on: 104,2 FPS
- SMT off: 116,3 FPS
Watch Dogs 2:
99. persentiili
- SMT on: 86,2 FPS
- SMT off: 87,7 FPS
Battlefield 1:ssä SMT pois päältä kytkemällä 99. persentiili oli jopa 12 FPS:ää parempi, kuin SMT päällä. Watch Dogs 2:ssa ero jäi 1,5 FPS:ään.
Yhteenveto
Nyrkkisäännön mukaan uuden prosessoriarkkitehtuurin kehittämiseen kuluu noin neljä vuotta. AMD palkkasi Jim Kellerin elokuussa 2012 ja Ryzen 7 -sarjan prosessorit julkaistiin myyntiin 4,5 vuotta myöhemmin 2. maaliskuuta 2017. Alun perin tavoitteena oli julkaista Zen vuoden 2016 aikana.
Kun huomioidaan, että AMD ei itse valmista piisiruja ja Ryzen 7 -prosessoreiden julkaisun myötä sen täytyi työskennellä muun muassa emolevyvalmistajien kanssa kokonaan uuden ekosysteemin luomiseksi, aikataulua voidaan pitää kohtalaisen onnistuneena.
AMD:n tavoitteena oli saavuttaa Zen-arkkitehtuurilla 40 % parannus IPC-suorituskykyyn ja samalla yhdistää aikaisemmin käytetyt kaksi erillistä eli vähävirtainen ja suorituskykyinen arkkitehtuuri yhdeksi skaalautuvaksi arkkitehtuuriksi. Lopputuloksena yritys ilmoittaa saavuttaneensa yli 52 % parannuksen IPC-suorituskyvyssä ja suorituskyky/tehonkulutus-suhteen parantuneen 3,7-kertaisesti edelliseen sukupolveen verrattuna.
Koska Zen on täysin uusi tyhjältä pöydältä suunniteltu arkkitehtuuri, eivät sovellus- ja pelikehittäjät ole vielä juurikaan ehtineet optimoida koodiaan tai kääntäjiä, jotta arkkitehtuurista saataisiin puristettua kaikki tehot irti. Totuuden nimissä AMD ei ole viime vuosina ollut kovinkaan merkittävässä roolissa suorituskykyisten x86-prosessoreiden pelikentällä, joten käytännössä kaikki koodit on optimoitu Intelin prosessoreille ja Hyper-Threading-ominaisuudelle.
Esimerkiksi io-techin testeissä mukana olleiden Ashes of the Singularity- ja Total War: Warhammer -pelien kehittäjät Oxide Games ja Creative Assembly ovat todenneet optimoivansa pelimoottorinsa hyödyntämään Ryzen 7 -sarjan prosessoreiden 8 ydintä ja 16 säiettä tulevissa päivityksissä. Myös AMD:n toimitusjohtaja Lisa Su painotti julkaisupäivänä Redditissä järjestetyssä AMA-kyselyssä, että pelisuorituskyvyn odotetaan paranevan ajan myötä, kunhan kehittäjät saavat vietettyä enemmän aikaa Zenin kanssa.
Muutamat lähikuukaudet kertovat, miten Zen-arkkitehtuuri otetaan alalla vastaan ja seuraavan 1-2 vuoden kuluessa voidaan tehdä lopullinen johtopäätös ensimmäisen Zen-arkkitehtuurin onnistumisesta, kun sen vaikutus AMD:n liiketoimintaan konkretisoituu.
Zen-arkkitehtuuri on suunniteltu kestämään ainakin seuraavat 4-5 vuotta ja sitä tullaan päivittämään matkan varrella Zen 2- ja Zen 3 -arkkitehtuureilla. Toistaiseksi ei ole tarkemmin tiedossa, mitä päivitykset tuovat mukanaan ja millä aikataululla, mutta ainakin jossain vaiheessa valmistusprosessi päivittyy nykyisestä 14 nanometristä 7 nanometrin viivanleveyteen.
Ryzenissähän on iso osa prossun sisuksista lukittu muistipuolen nopeuteen. Tätä on oletettu jossain syypääksi muistituen ongelmiin.
Olisiko mahdollista saada myös vaikka parilla eri testiohjelmalla ajetut virrankulutusvertailut näihin clock to clock testeihin? Näkisi mikä on noin samanlaisessa tilanteessa eri kokoonpanojen kokonaiskulutus. Ihan vaan mielenkiinnosta.
Tuo eri kokoonpanojen sopivuus asunnonlämmitykseen rasituksessa mietityttää ja kertoisi myös paljon kellojen noston/laskun vaikutuksista.
Ne on näissä clock-to-clock-testeissä tehonkulutusmittaukset ovat vähän hankalia kun kerran prosessorit eivät toimi vakiotaajuudella eli käyttöjännite on jotain muuta kuin vakiona ja kaikilla on käytössä eri emolevyt niin miten noita sitten vertaa järkevästi keskenään?
Hyvä pointti. Kokonaiskulutuksen mittaus ainakin olisi hieman mitään sanomaton kun emolevyillä on keskenään kovasti eroja. Jos seinä tehoja haluaisi vertailla, voisi toki yrittää keksiä pari liitin valikoimaltaan yms todella samanlaista Intel vs Amd kokoonpanoa ja siitä saisi jonkunlaisen tuloksen + ihan loputtoman foorumiväännön. =)
Lastuja voisi sinänsä keskenään vertailla jos mittaisi virransyötöstä tjsp. itse lastun kulutusta ja viitsisi hakea jokaiselle staattiselle kellotaajuudelle minimi jännitteen jolla se suostuu vielä vakaasti läpäisemään testit. Mielestäni ei maksa vaivaa.. jos joku suosessa sentäs on halpaa se on sähkö.
Voisiko pelit käyttää jotain vanhaa kirjastoa joka on käännetty vuosikymmen sitten Intelin kääntäjällä silloin kuin se vielä sabotoi koodia AMD:n prosessoreille?
Käytännössä ei.
Suurin ongelma on nyt käyttöjärjestelmän skeduleri, tai oikeastaan koodi, joka kertoo sille millaiset ytimet prosessorilla on käytettävissä, ja joka tunnistaa päin honkia sen, mitkä ytimet on oikeita fyysisiä ytimiä ja mitkä SMT:n myötä tulevia virtuaaliytimiä. Ja tämä johtuu siitä, että näiden "oikeaan" tunnistamiseen ei ole mitään "oikeaa virallista varmaa tapaa" vaan näitä joudutaan tunnistamaan purkkakoodilla jossa nimenomaan pitää pitää kirjaa siitä että millainen rakenne minkäkin CPU-valmistajan missäkin mallissa on.
Zenin osalta oikeaa tietoa ei win10n skeduleria tehdessä ollut saatavilla niin sitten analysoidaan väärin, ilmeisesti bulldozin mukaisesti (hassua kyllä, win7:lla ilmeisesti ongelmaa ei ole, siellä ehkä zenille käytetään munkilla samaa tunnistuslogiikkaa kuin core i7lle tms, ilmeisesti tuen lisääminen bulldozerin tunnistamiselle rikkoi zenin oikean tunnistamisen win8ssa ja win10ssä)
Nyt sitten odotellan pari viikkoa että microsoftilta tulee korjaus tuohon.
Mutta 256-bittisillä vektoreilla laskevilla AVX-/AVX2-käskyillä Intelillä on kaksinkertainen kaistanleveys (sekä laskennassa, että lataus-tallennusyksiköissä) Zeniin nähden; Zenillä leveimmät datapolut on 128-bittisiä, intelillä liukuluku-SIMD-laskentayksiköt on Sandy Bridgestä lähtien 256-bittisiä(8*float) ja lataus-tallennusyksiköt Haswellista lähtien 256-bittisiä(ja samalla taisi tulla myös tuki 256-bittisille kokonaislukuvektoreille)
Ei kai niitä voikaan suoraan verrata keskenään. Olisi vaan mielenkiintoista nähdä monen eri prossusukupolven tehonkulutus jollain tietyillä kelloilla ja siihen vertailupalkiksi tuo clock-to-clock-testitulos niilä kelloilla (vaikka joku 3,5GHz). Ei kai emolevyjen virrankulutus ole niin korkea nykyään että se juurikaan vaikuttaisi tulokseen, jos kaikki emolle kytketyt laitteet (paitsi muistit) olisivat samat kaikille kokoonpanoille
Se Ryzenistä sitten Windows 7:llä. Microsoft on ilmeisesti estänyt päivitykset Windows 7 alustalla, jos alla on Ryzen tai Kaby Lake.
https://support.microsoft.com/en-us…ch-you-receive-a-your-pc-uses-a-processor-tha
Ihmisethän aina haluaa että windows ei asentele mitään kysymättä lupaa. Nyt voivat ilmeiseti edelleen asentaa KBxxxxxx.msi paketit, mutta suoraan windows update ei toimi.
Väittäisin, että todella harva oikeasti Windowsinsa noin suostuisi päivittämään. Harva edes tietää, että ne saa myös tuolla tavalla. Tosin ei tavallinen käyttäjä kyllä edes asentele tuota Ryzeniä Windows 7:lle.
Juu. Tavallinen käyttäjä ei saa asennettua windows seiskaa Ryzenille koska sillä hetkellä kun asennusohjelma käynnistyy nousee seinä vastaan kun hiiri ja näppis on pimeänä.
Kauanko menee että joku vääntää "Windows update for old processor" -ohjelman, joka ehdottelee mitä uusia päivityksiä olisi tarjolla ja suorat linkit kaikkiin? Saa toteuttaa. 🙂
WSUS Offline Update – Update Microsoft Windows and Office without an Internet connection
Microsoft Baseline Security Analyzer – MBSA – TechNet Security
Siitä joku värkkäämäään omaa työkalua sitten…:btooth:
Microsoft voisi välillä kokeilla vaihtoehtoa kehittää sellainen käyttöjärjestelmä mihin ihmiset haluaa päivittää sen sijaan, että yritetään paskoa vanhojakin tuotteita.
The Ryzen Gaming Performance Gap is Mostly Gone
@Sampsa – Asiallisia testejä kun niihin linkitetään ulkomailtakin. :tup:
Tähän viestiin olisi voinut vielä laittaa syyn, minkä takia näppäimistö ja hiiri eivät toimi, koska joku kuitenkin tulee Googlen kautta tänne etsiessään vikaa. Syyhän on siis USB3-ajureiden puute Windows 7 käyttöjärjestelmässä. PS/2 näppäimistö ja hiiri toimivat normaalisti, mutta USB-laitteet lakkaavat toimista välittömästi Windowsin asennusohjelmaan saavuttaessa. Joissain harvoissa emolevyissä on PS/2 simulaatiotila, jolla USB hiiri/näppis toimivat. Helekutin ärsyttävä homma…
Tämä nyt on ollut ihan yleinen ongelma monen läppärin kanssa jo pitkään. Puhtaalta pöydältä windows 7:n asennus ei meinaa onnistua kovin helposti kun koneissa ei ole kuin USB3 portteja ja ei optista asemaa.
Mutta miksi taviskäyttäjän pitäisi Windows 7:aa laittakaan, kun 10 toimii helposti ja harvassa on tapaukset joissa 7 on pakollinen jonkun softatuen takia. 99.9% asioista toimii kybälläkin.
Jep. Itse tuli siirryttyä Windows 10:een ainoastaan tämän ongelman takia. Muuten ei olisi ollut mitään tarvetta.
Ja tähän kun lisätään että monen läppärin biosista ei saa usb tai sata ohjainta enään legacy tilaan niin on kovin hauskaa tämä elämä.
Kyllähän ton asennus onnistuu jos pistää ne ajurit sinne asennustietostoihin.Itse kyllä käyttäsin win7:tä vieläkin mutta aika alkaa menemään sen ohi jo kun ajureita ei tule eri laitteille,ei tukea dx12:lle ja ms:nkin lopettaa sen tukemisen.:/
Jos 1500X saa pistettyä siihen 4Ghz niin itse ajattelin sellaisen ostaa ainakin väliajaksi koska eipä noi pelit taida noista lisäcoreista vielä oikein hyötyä(ja samalla saa sen varaosan jolla voi tulevaisuudessa testata emoja,tai se siirtyy toiseen käyttöön).Itse en oikeasti tarvitse kuin ton 4c8t.Tulevaisuutta ajatellen kannattanee ostaa suoraan joku 16GB 2666Mhz muisti?.Hyötyykös noi ddr4 dual dimmeistä paljonkin?.
Väitetään, että Microsoft veti jo ensimmäisen scheduler päivityksen ulos fast ring käyttäjille:
Kuvan perusteella tulokset olisivat varsin hyviä, vaikka se ei vieläkään ole optimaallinen toiminnan suhteen
Ensimmäinen Ryzen pohjainen pelipäivitys:
Dota 2 Update – March 20th, 2017
– Fixed the display of particles in the portrait window.
– Fixed Shadow Fiend's Demon Eater (Arcana) steaming while in the river.
– Fixed Juggernaut's Bladeform Legacy – Origins style hero icons for pre-game and the courier button.
– Improved threading configuration for AMD Ryzen processors.
– Workshop: Increased head slot minimum budget for several heroes.
News – Dota 2 Update – March 20th, 2017
Olen odotellut mielenkiinnolla Agnerin käskylatenssi- ja throughput-mittauksia Ryzenille, eikä tarvinne enää kauan odottaa.
Nyt Agner on saanut testit tehtyä.
Näemmä AMD:lla on nyt eri latenssin omaava vaddpd (3) ja vmulpd (4), juuri kun Intel Skylakessa luovutti yhden syklin vaddpd:ssa (4) (4).
Jakolaskin ja neliöjuuri ovat vauhdikkaampia kuin toivoin, vdivpd throughput per käsky 9 sykliä ja vsqrtpd per käsky 16 sykliä. Skylaken Broadwellistä massiivisesti nopeutetun 128 bittiä leveän yksikön vastineet on 8 ja 12. Ryzenissä syklin pienempi latenssi.
Vgather on mukana vain AVX2 tickboxin takia, throughput näyttää olevan selvästi pienempi kuin edes Haswellissa.
Kokonaislukuvektoreissa näyttäisi olevan Ryzenissa 2-4 kertaa huonompi throughput kuin Skylakessa, jos katsoo vpadd, vpsadbw, vpmadd ja vpmul. Ryzenin latenssi vpmadd ja vpmul kuitenkin pienempi.
Tosin FMAn viive on sitten 5 kellojaksoa ryzenilla.
Salliikohan tuo FMA-toteutus tuon yhteenlaskettavan arvon saapumisen myöhässä, jos ei, niin sitten FMAn käyttö verrattuna erillisiin kerto- ja yhteenlaskuihin usein vaan hidastaa ryzenilla, kun latenssi kasvaa eikä throughputissakaan ole merkittävää parannusta.
vgather on aika hankala toteuttaa joten ihan ymmärrettävää, että se on hidas. Se on kuitenkin intelilläkin niin hidas, että sillonkin yleensä hidastaa enemmän kuin hyödyttää.
Mikäs noiden p* ja vp*-käskyjen ero on? vp* on AVX2sta vex-koodauksella ja sallii 256-bittiset operaatiot kokonaisluvuille ja kohderekisterin olevan eri kuin kumpikaan lähderekistereistä? vai jotain ihan muuta
Eihän tuolla edes ole mainittu vp*-käskyistä mitään skylakelle.
Ja nämä 1.5 käskyä/kello throughputit ryzenillä esim. vpaddille ovat 256-bittisille AVX2-vektoreille (ymm).
128-bittisillä xmm-vektoreilla paddillä 3 käskyä/kellojaksoa,
Niin meinaat kuten naiivissa fir-suodattimessa, toisistaan riippumattomat mullit ja yksi akku? Luulen, että fma Ryzenillä hidastaisi tässä tapauksessa, koska pitempi riippuvuusketju, Skylakella mul+add ja fma pyörisi yhtä nopeasti (hitaasti).
Kun akku unrollataan Ryzen vetäisi mul+add ja fma yhtä nopeasti ja Skylake fma:lla 2x verrattuna add+mulliin. Unrollatulla akulla laskenta joka tapauksessa lentäisi kummallakin verrattuna naiiviin versioon (Tosin, jos kummatkin kerrottavat tulevat välimuistista, kaista loppuu kummallakin ennen laskentaresursseja).
Ryzenissäkin fma hyödyttää, jos mul ja add molemmat ovat osa koodin riippuvuusketjua ja rajoittava tekijä.
p* on SSE-sarjan kokonaisluku-käskyjä (2 operandia ja 128 bittiä leveä) ja vp* on AVX-sarjan vastine (kolme operandia ja 128 tai 256 bittiä leveä). VEX-prefixin 128 bit leveä käsky nollaa implisiittisesti yläosan rekisteriä, välttäen väärät riippuvuudet.
Jätetty vain pois kun SSE- ja AVX-käskyjen välillä ei ole eroja.
Esim.
Vain AVX-versiolla on kolme operandia
@sampsa Tulisiko uusia pelitestejä agesa 1.006 päivityksen jälkeen?