AMD:n Robert Hallockin mukaan suurin osa spekulaatiosta on osunut metsään, eikä esimerkiksi Windows 10:n säieskedulerilla ole ongelmia uuden Zen-arkkitehtuurin kanssa.

AMD julkaisi uuteen Zen-arkkitehtuuriin perustuvat Ryzen-prosessorit kuluvan kuun 2. päivä eli vajaat kaksi viikkoa sitten. Lukuisten erilaisten testien jälkeen netti on täyttynyt spekulaatioista, jotka pyrkii selittämään prosessoreiden suorituskyvyn heittelyt eri testiohjelmissa. Suosituimpia teorioita on ollut muun muassa Windows 10:n säieskedulerin (thread scheduler) vaikeudet uuden arkkitehtuurin kanssa. AMD:n Robert Hallock on julkaissut yhtiön sivuilla blogipostauksen, jossa hän selvittää AMD:n kantaa lukuisiin Ryzeniin liittyviin spekulaatioihin.

AMD:n omien tutkimusten mukaan Windows 10:n säieskeduler toimii Ryzen-prosessoreiden kanssa juuri niin kuin sen pitäisikin ja se osaa käsitellä prosessorin loogisia ytimiä oikein. Monen tahon raportoimat oudot tiedot Sysinternalsin Coreinfo -työkalulla selittyvät puolestaan vanhentuneella versiolla. Coreinfon tuorein 3.31 -versio antaa Ryzenin ytimistä ja välimuisteista oikeat tiedot aiempien versioiden virheellisten sijasta.

AMD:n mukaan erot Windows 7:n ja 10:n suorituskyvyssä selittyvät yksinkertaisesti käyttöjärjestelmien välisillä yleisillä eroilla eikä esimerkiksi ehdotetuilla skedulerin eroilla ole asian kanssa mitään tekemistä. Yhtiö kuitenkin tiedostaa, että vaikka monet ohjelmat osaavat jo nyt hyödyntää Ryzenin arkkitehtuuria tehokkaasti, voisivat lukuisat muut ohjelmat saada optimoinneilla selkeitä suorituskykyparannuksia.

Yksi kysymyksiä herättänyt seikka eri Ryzen-mallien välillä on prosessorin T Control- eli tCTL-anturin raportoimat lämpötilat. Anturi mittaa prosessorin lämpötilaa piisirun ja lämmönlevittäjän yhtymäkohdasta. Eri ohjelmat raportoivat tCTL:n mittauksiin perustuen tällä hetkellä merkittävästi pienempiä lämpötiloja Ryzen 7 1700 -mallille verrattuna 1700X- ja 1800X -malleihin.

AMD:n mukaan syy tälle on halu saada kaikkien Ryzen-prosessoreiden tuuletinprofiilit toimimaan yhtenevällä kaavalla. 95 watin TDP-arvolla varustetut X-prosessorit vaativat luonnollisesti enemmän jäähdytystä kuin 65 watin TDP-arvolla varustetut ei-X-mallit, joten AMD lisää X-prosessoreiden tCTL:n raportoimaan lämpötilaan 20 °C varmistamaan tuulettimen toiminnan riittävällä nopeudella. AMD uskoo lämpötiloja seuraavien ohjelmien päivittyvän tulevaisuudessa ymmärtämään X-prosessoreiden todellisen lämpötilan, mutta sitä odotellessa käyttäjät voivat yksinkertaisesti vähentää 20 °C tCTL-anturin raportoimasta lämpötilasta.

AMD toistaa jälleen suosituksensa käyttää Ryzenin kanssa Windows 10:n Paras suoritusteho -virranhallintaprofiilia (High Performance). Paras suoritusteho -profiili varmistaa, ettei Windowsin virranhallinta sammuta käyttämättömiä ytimiä, mikä hidastaa niiden käyttöönottoa rasituksen kasvaessa. Lisäksi Windowsin virranhallinnan Tasapainotettu-profiili (Balanced) saattaa hidastaa Ryzenin kellotaajuuden ja jännitteen muutoksia verrattuna Paras suoritusteho -profiiliin.

Viimeinen seikka, johon Hallock pureutuu blogissa on Simultaneous Multi-threading eli SMT-ominaisuus. Vaikka lukuisat testit ovat raportoineet useiden pelien suorituskyvyn kärsivän SMT:n ollessa käytössä, pitäisi AMD:n mukaan suorituskykyerojen olla joko olemattomia tai jopa positiivisia. Myös jotkut arvosteluista ovat todenneet samaa huolimatta lukuisista poikkeavista tuloksista.

Io-techin testeissä SMT paransi suorituskykyä parhaimmillaan reilut 8 prosenttia ARMA 3 -pelissä, kun pahimmillaan se heikensi suorituskykyä yli 11 prosenttia Total War: Warhammerissa.

Hallockin blogipostaus antaa vastauksen lukuisiin eri väittelyihin koskien Ryzen-prosessoreita. Se jättää kuitenkin edelleen avoimiksi useita kysymyksiä, kuten suorituskykyerot kun kaikki ohjelman käyttämät säikeet ovat samassa CCX-CPU-kompleksissa verrattuna saman ohjelman suorituskykyyn säikeiden jakautuessa molempiin CCX:iin.

Esimerkiksi NVIDIAn MeshInstancing-demo käyttää kahta säiettä. Roy Botnikin YouTubessa julkaisema testi osoittaa, että kyseisessä ohjelmassa suorituskyvyssä on merkittäviä eroja sen mukaan ovatko suoritettavat säikeet samassa CCX:ssä vai ei. Kun säikeet ovat jakautuneet kahteen CCX:ään, pyörii ruudunpäivitysnopeus Ryzen 7 1800X -prosessorilla ja Radeon R9 200 -sarjan näytönohjaimella noin 14 – 14,5 FPS:n välimaastossa. Kun suoritettavat säikeet ovat samassa CCX:ssä, nousee suorituskyky 16,5 – 17 FPS:n paikkeille. Windows arpoo säikeitä suorittavat loogiset ytimet ohjelman joka käynnistyksellä uudelleen ja eroa voi siis syntyä reilusti yli 15 %.

Myös Hardware.fr-sivusto on testannut hieman vastaavaa tilannetta rajoittamalla Ryzenin neljään ytimeen kahdessa eri konfiguraatiossa. Toisessa konfiguraatiossa on yksi CCX käytössä kokonaisuudessaan ja toinen poistettu käytöstä kokonaan, kun toisessa kummastakin CCX:stä on käytössä kaksi ydintä. 7-Zip-testissä 2+2-ytimen konfiguraatio suoriutui jopa nopeammin kuin 4+0-ydintä, mutta muissa testeissä eroa ei joko ollut käytännössä lainkaan tai 4+0-ydintä suoriutui testistä paremmin. Suurimmillaan ero oli Battlefield 1:ssä, jossa 2+2-ytimen konfiguraatio hävisi 4+0-ytimen konfiguraatiolle liki 20 %:n erolla.

This site uses XenWord.