Tutustumme AMD:n uuteen Zen-koodinimelliseen x86-arkkitehtuuriin ja sen IPC-suorituskykyyn.

Artikkelissa käydään läpi Zen-arkkitehtuurin historia ja kehitysvaiheet sekä tutustutaan arkkitehtuurin uudistuksiin ja 4,8 miljardista transistorista rakentuvaan 8-ytimiseen Summit Ridge -koodinimelliseen piisirun. Lopuksi ajetaan clock-to-clock-suorituskykytestit 4 GHz:n kellotaajuudella AMD:n ja Intelin arkkitehtuurien kesken.
Lue artikkeli: AMD:n uusi Zen x86-arkkitehtuuri ja clock-to-clock-suorituskyky
Lue myös io-techin muut Ryzen-artikkelit:
Sopii varmaan parhaiten tämän alle:
"
By going to 3200 MHz over 2133 MHz we were seeing near 50% performance improvement in simple memory bandwidth tests and a 16% performance jump in our 1080P gaming test.
"
DDR4 Memory Scaling on AMD AM4 Platform – The Best Memory Kit For AMD Ryzen CPUs – Legit Reviews
Samaa testattu jo io-techissä:
Ylikellotustesti ilmalla: Ryzen 7 1800X & 1700X – io-tech.fi
Osaatko valistaa tietämätöntä, että miksi L3-cachen nopeus paranee nopeampien muistien myötä? Ja voisiko olettaa nopeuslisäyksen peleissä johtuvan juuri cachen nopeutumisesta?
Saisiko io-tech testattua ryzeniä myös CFD/FEM ohjelmissa?
Vastaan vielä lisää vanhaan viestiini…
Tuolla mainitaan että Zen vs. Excavator ero olisi ollutkin +64% ja tuo +52% olisi ollut verrattuna Piledriveriin. Eli Sampsan tulokset hyvin lähellä "parasta". :hail…jne: :tup:
Ryzenissähän on iso osa prossun sisuksista lukittu muistipuolen nopeuteen. Tätä on oletettu jossain syypääksi muistituen ongelmiin.
Olisiko mahdollista saada myös vaikka parilla eri testiohjelmalla ajetut virrankulutusvertailut näihin clock to clock testeihin? Näkisi mikä on noin samanlaisessa tilanteessa eri kokoonpanojen kokonaiskulutus. Ihan vaan mielenkiinnosta.
Tuo eri kokoonpanojen sopivuus asunnonlämmitykseen rasituksessa mietityttää ja kertoisi myös paljon kellojen noston/laskun vaikutuksista.
Ne on näissä clock-to-clock-testeissä tehonkulutusmittaukset ovat vähän hankalia kun kerran prosessorit eivät toimi vakiotaajuudella eli käyttöjännite on jotain muuta kuin vakiona ja kaikilla on käytössä eri emolevyt niin miten noita sitten vertaa järkevästi keskenään?
Hyvä pointti. Kokonaiskulutuksen mittaus ainakin olisi hieman mitään sanomaton kun emolevyillä on keskenään kovasti eroja. Jos seinä tehoja haluaisi vertailla, voisi toki yrittää keksiä pari liitin valikoimaltaan yms todella samanlaista Intel vs Amd kokoonpanoa ja siitä saisi jonkunlaisen tuloksen + ihan loputtoman foorumiväännön. =)
Lastuja voisi sinänsä keskenään vertailla jos mittaisi virransyötöstä tjsp. itse lastun kulutusta ja viitsisi hakea jokaiselle staattiselle kellotaajuudelle minimi jännitteen jolla se suostuu vielä vakaasti läpäisemään testit. Mielestäni ei maksa vaivaa.. jos joku suosessa sentäs on halpaa se on sähkö.
Voisiko pelit käyttää jotain vanhaa kirjastoa joka on käännetty vuosikymmen sitten Intelin kääntäjällä silloin kuin se vielä sabotoi koodia AMD:n prosessoreille?
Käytännössä ei.
Suurin ongelma on nyt käyttöjärjestelmän skeduleri, tai oikeastaan koodi, joka kertoo sille millaiset ytimet prosessorilla on käytettävissä, ja joka tunnistaa päin honkia sen, mitkä ytimet on oikeita fyysisiä ytimiä ja mitkä SMT:n myötä tulevia virtuaaliytimiä. Ja tämä johtuu siitä, että näiden "oikeaan" tunnistamiseen ei ole mitään "oikeaa virallista varmaa tapaa" vaan näitä joudutaan tunnistamaan purkkakoodilla jossa nimenomaan pitää pitää kirjaa siitä että millainen rakenne minkäkin CPU-valmistajan missäkin mallissa on.
Zenin osalta oikeaa tietoa ei win10n skeduleria tehdessä ollut saatavilla niin sitten analysoidaan väärin, ilmeisesti bulldozin mukaisesti (hassua kyllä, win7:lla ilmeisesti ongelmaa ei ole, siellä ehkä zenille käytetään munkilla samaa tunnistuslogiikkaa kuin core i7lle tms, ilmeisesti tuen lisääminen bulldozerin tunnistamiselle rikkoi zenin oikean tunnistamisen win8ssa ja win10ssä)
Nyt sitten odotellan pari viikkoa että microsoftilta tulee korjaus tuohon.
Mutta 256-bittisillä vektoreilla laskevilla AVX-/AVX2-käskyillä Intelillä on kaksinkertainen kaistanleveys (sekä laskennassa, että lataus-tallennusyksiköissä) Zeniin nähden; Zenillä leveimmät datapolut on 128-bittisiä, intelillä liukuluku-SIMD-laskentayksiköt on Sandy Bridgestä lähtien 256-bittisiä(8*float) ja lataus-tallennusyksiköt Haswellista lähtien 256-bittisiä(ja samalla taisi tulla myös tuki 256-bittisille kokonaislukuvektoreille)
Ei kai niitä voikaan suoraan verrata keskenään. Olisi vaan mielenkiintoista nähdä monen eri prossusukupolven tehonkulutus jollain tietyillä kelloilla ja siihen vertailupalkiksi tuo clock-to-clock-testitulos niilä kelloilla (vaikka joku 3,5GHz). Ei kai emolevyjen virrankulutus ole niin korkea nykyään että se juurikaan vaikuttaisi tulokseen, jos kaikki emolle kytketyt laitteet (paitsi muistit) olisivat samat kaikille kokoonpanoille
Se Ryzenistä sitten Windows 7:llä. Microsoft on ilmeisesti estänyt päivitykset Windows 7 alustalla, jos alla on Ryzen tai Kaby Lake.
https://support.microsoft.com/en-us…ch-you-receive-a-your-pc-uses-a-processor-tha
Ihmisethän aina haluaa että windows ei asentele mitään kysymättä lupaa. Nyt voivat ilmeiseti edelleen asentaa KBxxxxxx.msi paketit, mutta suoraan windows update ei toimi.
Väittäisin, että todella harva oikeasti Windowsinsa noin suostuisi päivittämään. Harva edes tietää, että ne saa myös tuolla tavalla. Tosin ei tavallinen käyttäjä kyllä edes asentele tuota Ryzeniä Windows 7:lle.
Juu. Tavallinen käyttäjä ei saa asennettua windows seiskaa Ryzenille koska sillä hetkellä kun asennusohjelma käynnistyy nousee seinä vastaan kun hiiri ja näppis on pimeänä.
Kauanko menee että joku vääntää "Windows update for old processor" -ohjelman, joka ehdottelee mitä uusia päivityksiä olisi tarjolla ja suorat linkit kaikkiin? Saa toteuttaa. 🙂
WSUS Offline Update – Update Microsoft Windows and Office without an Internet connection
Microsoft Baseline Security Analyzer – MBSA – TechNet Security
Siitä joku värkkäämäään omaa työkalua sitten…:btooth:
Microsoft voisi välillä kokeilla vaihtoehtoa kehittää sellainen käyttöjärjestelmä mihin ihmiset haluaa päivittää sen sijaan, että yritetään paskoa vanhojakin tuotteita.
The Ryzen Gaming Performance Gap is Mostly Gone
@Sampsa – Asiallisia testejä kun niihin linkitetään ulkomailtakin. :tup:
Tähän viestiin olisi voinut vielä laittaa syyn, minkä takia näppäimistö ja hiiri eivät toimi, koska joku kuitenkin tulee Googlen kautta tänne etsiessään vikaa. Syyhän on siis USB3-ajureiden puute Windows 7 käyttöjärjestelmässä. PS/2 näppäimistö ja hiiri toimivat normaalisti, mutta USB-laitteet lakkaavat toimista välittömästi Windowsin asennusohjelmaan saavuttaessa. Joissain harvoissa emolevyissä on PS/2 simulaatiotila, jolla USB hiiri/näppis toimivat. Helekutin ärsyttävä homma…
Tämä nyt on ollut ihan yleinen ongelma monen läppärin kanssa jo pitkään. Puhtaalta pöydältä windows 7:n asennus ei meinaa onnistua kovin helposti kun koneissa ei ole kuin USB3 portteja ja ei optista asemaa.
Mutta miksi taviskäyttäjän pitäisi Windows 7:aa laittakaan, kun 10 toimii helposti ja harvassa on tapaukset joissa 7 on pakollinen jonkun softatuen takia. 99.9% asioista toimii kybälläkin.
Jep. Itse tuli siirryttyä Windows 10:een ainoastaan tämän ongelman takia. Muuten ei olisi ollut mitään tarvetta.
Ja tähän kun lisätään että monen läppärin biosista ei saa usb tai sata ohjainta enään legacy tilaan niin on kovin hauskaa tämä elämä.
Kyllähän ton asennus onnistuu jos pistää ne ajurit sinne asennustietostoihin.Itse kyllä käyttäsin win7:tä vieläkin mutta aika alkaa menemään sen ohi jo kun ajureita ei tule eri laitteille,ei tukea dx12:lle ja ms:nkin lopettaa sen tukemisen.:/
Jos 1500X saa pistettyä siihen 4Ghz niin itse ajattelin sellaisen ostaa ainakin väliajaksi koska eipä noi pelit taida noista lisäcoreista vielä oikein hyötyä(ja samalla saa sen varaosan jolla voi tulevaisuudessa testata emoja,tai se siirtyy toiseen käyttöön).Itse en oikeasti tarvitse kuin ton 4c8t.Tulevaisuutta ajatellen kannattanee ostaa suoraan joku 16GB 2666Mhz muisti?.Hyötyykös noi ddr4 dual dimmeistä paljonkin?.
Väitetään, että Microsoft veti jo ensimmäisen scheduler päivityksen ulos fast ring käyttäjille:
Kuvan perusteella tulokset olisivat varsin hyviä, vaikka se ei vieläkään ole optimaallinen toiminnan suhteen
Ensimmäinen Ryzen pohjainen pelipäivitys:
Dota 2 Update – March 20th, 2017
– Fixed the display of particles in the portrait window.
– Fixed Shadow Fiend's Demon Eater (Arcana) steaming while in the river.
– Fixed Juggernaut's Bladeform Legacy – Origins style hero icons for pre-game and the courier button.
– Improved threading configuration for AMD Ryzen processors.
– Workshop: Increased head slot minimum budget for several heroes.
News – Dota 2 Update – March 20th, 2017
Olen odotellut mielenkiinnolla Agnerin käskylatenssi- ja throughput-mittauksia Ryzenille, eikä tarvinne enää kauan odottaa.
Nyt Agner on saanut testit tehtyä.
Näemmä AMD:lla on nyt eri latenssin omaava vaddpd (3) ja vmulpd (4), juuri kun Intel Skylakessa luovutti yhden syklin vaddpd:ssa (4) (4).
Jakolaskin ja neliöjuuri ovat vauhdikkaampia kuin toivoin, vdivpd throughput per käsky 9 sykliä ja vsqrtpd per käsky 16 sykliä. Skylaken Broadwellistä massiivisesti nopeutetun 128 bittiä leveän yksikön vastineet on 8 ja 12. Ryzenissä syklin pienempi latenssi.
Vgather on mukana vain AVX2 tickboxin takia, throughput näyttää olevan selvästi pienempi kuin edes Haswellissa.
Kokonaislukuvektoreissa näyttäisi olevan Ryzenissa 2-4 kertaa huonompi throughput kuin Skylakessa, jos katsoo vpadd, vpsadbw, vpmadd ja vpmul. Ryzenin latenssi vpmadd ja vpmul kuitenkin pienempi.
Tosin FMAn viive on sitten 5 kellojaksoa ryzenilla.
Salliikohan tuo FMA-toteutus tuon yhteenlaskettavan arvon saapumisen myöhässä, jos ei, niin sitten FMAn käyttö verrattuna erillisiin kerto- ja yhteenlaskuihin usein vaan hidastaa ryzenilla, kun latenssi kasvaa eikä throughputissakaan ole merkittävää parannusta.
vgather on aika hankala toteuttaa joten ihan ymmärrettävää, että se on hidas. Se on kuitenkin intelilläkin niin hidas, että sillonkin yleensä hidastaa enemmän kuin hyödyttää.
Mikäs noiden p* ja vp*-käskyjen ero on? vp* on AVX2sta vex-koodauksella ja sallii 256-bittiset operaatiot kokonaisluvuille ja kohderekisterin olevan eri kuin kumpikaan lähderekistereistä? vai jotain ihan muuta
Eihän tuolla edes ole mainittu vp*-käskyistä mitään skylakelle.
Ja nämä 1.5 käskyä/kello throughputit ryzenillä esim. vpaddille ovat 256-bittisille AVX2-vektoreille (ymm).
128-bittisillä xmm-vektoreilla paddillä 3 käskyä/kellojaksoa,
Niin meinaat kuten naiivissa fir-suodattimessa, toisistaan riippumattomat mullit ja yksi akku? Luulen, että fma Ryzenillä hidastaisi tässä tapauksessa, koska pitempi riippuvuusketju, Skylakella mul+add ja fma pyörisi yhtä nopeasti (hitaasti).
Kun akku unrollataan Ryzen vetäisi mul+add ja fma yhtä nopeasti ja Skylake fma:lla 2x verrattuna add+mulliin. Unrollatulla akulla laskenta joka tapauksessa lentäisi kummallakin verrattuna naiiviin versioon (Tosin, jos kummatkin kerrottavat tulevat välimuistista, kaista loppuu kummallakin ennen laskentaresursseja).
Ryzenissäkin fma hyödyttää, jos mul ja add molemmat ovat osa koodin riippuvuusketjua ja rajoittava tekijä.
p* on SSE-sarjan kokonaisluku-käskyjä (2 operandia ja 128 bittiä leveä) ja vp* on AVX-sarjan vastine (kolme operandia ja 128 tai 256 bittiä leveä). VEX-prefixin 128 bit leveä käsky nollaa implisiittisesti yläosan rekisteriä, välttäen väärät riippuvuudet.
Jätetty vain pois kun SSE- ja AVX-käskyjen välillä ei ole eroja.
Esim.
Vain AVX-versiolla on kolme operandia
@Sampsa Tulisiko uusia pelitestejä agesa 1.006 päivityksen jälkeen?