
AMD esitteli eilen Zen 2 -arkkitehtuurin ja siihen perustuvan Rome-palvelinpiirin sekä Vega 20 -grafiikkapiirin, joka tuodaan näillä näkymin vain laskentakäyttöön tarkoitettuun Radeon Instinct -tuoteperheeseen. Kaikkia piirien ja arkkitehtuurien saloja yhtiö ei vielä paljastanut, mutta jo nyt kerrotuissa tiedoissa riittää pureskeltavaa.
Zen 2
Zen 2 -arkkitehtuurin prosessoriytimiä on uudistettu monella tasolla. AMD:n mukaan parannuksia on tehty ainakin käskylaskuriin, haarautumisennustajaan, esilukuyksikköön (prefetch), käskyvälimuistiin (instruction cache) ja mikrokäskyvälimuistiin (micro op-cache). Muutosten tarkasta luonteesta kerrotaan vain mikrokäskyvälimuistin osalta, jonka kokoa on kasvatettu aiempaan nähden.
Liukulukupuolella AMD on kaksinkertaistanut yksiköiden leveyden 128 bitistä 256 bittiin. Samalla päivitettiin luonnollisesti myös lataus/tallennusyksikkö, joka on nyt niin ikään 256-bittinen. Myös lähetys/hylky-yksikön luvataan olevan aiempaa nopeampi.
Tietoturvaparannusten osalta AMD ei mennyt sen tarkempiin yksityiskohtiin, kuin kertoo Zen 2:n tarjoavan lisäsuojausta Spectre-haavoittuvuuksilta rautapäivitysten kautta. Spectren toista varianttia ei nykytiedon valossa voida korjata kuin ohjelmisto- tai käyttöjärjestelmätason päivityksillä, jotka on julkaistu jo aiemmin.
Zen 2 -arkkitehtuuri ottaa ainakin palvelinpuolella rajun askeleen pois prosessoreiden nykytrendeistä integroida enemmän ja enemmän yhteen siruun. AMD on päätynyt valmistamaan prosessoriytimet sisältävät ”pikkusirut” (chiplet) 7 nanometrin valmistusprosessilla ja irrottanut niin kutsutun uncoren erilliseksi 14 nanometrin prosessilla valmistettavaksi piiriksi.
Rome-palvelinpiirissä yhden I/O-piirin ympärillä on yhteensä kahdeksan prosessorisirua, joista kukin sisältää kaksi CCX-prosessorikompleksia eli kahdeksan prosessoriydintä. Oletettavasti prosessorisiruihin on lisäksi sijoitettu välimuistit L3-tasoon asti. Rome-prosessorissa on kahdeksan prosessorisirun myötä yhteensä 64 ydintä ja se kykenee SMT-teknologian avulla suorittamaan samanaikaisesti 128 säiettä.
I/O-sirusta AMD on paljastanut tähän mennessä sen verran, että se sisältää kahdeksan DDR4-muistiohjainta, kahdeksan Infinity Fabric -linkkiä sekä luonnollisesti prosessoreista aiemmin löytyneet I/O-linjat, kuten PCI Express, USB ja niin edelleen. AMD ei paljastanut I/O-linjojen määriä, mutta PCIe-tuki on nyt päivitetty PCI Express 4.0 -standardiin.
Zen-arkkitehtuurin tulevaisuudessa ei näillä näkymin tulla näkemään ensimmäisestä sukupolvesta tuttua +-versiota arkkitehtuureista, vaan Zen 2:n seuraaja tulee olemaan suoraan Zen 3. Zen 3:n kerrotaan olevan tällä hetkellä aikataulussaan ja se tullaan valmistamaan 7nm+-valmistusprosesilla, mikä viittaa TSMC:n EUV:ta hyödyntävään versioon 7 nanometrin prosessista. Myös Zen 4 on jo kehitteillä, mutta tulevien arkkitehtuurien aikataulusta AMD ei kertonut sen tarkemmin.
Rome-piireihin perustuvien Epyc-palvelinprosessoreiden toimitukset aloitetaan ensi vuoden alkupuolella.
Vega 20
7 nanometrin valmistusprosessilla Vega 20 -grafiikkapiirin 13,2 miljardia transistoria on saatu mahdutettua 331 mm2:een. Ominaisuuksiensa osalta se on hyvin pitkälti huhujen mukainen ja Vega 10:n tapaan se sisältää edelleen esimerkiksi 64 Compute Unit -yksikköä eli 4096 stream-prosessoria. Stream-prosessoreita on kuitenkin päivitetty ja ne tarjoavat nyt ensimmäistä kertaa GCN-arkkitehtuurien historiassa sitten vuonna 2013 julkaistun Hawaii:n 1:2-suhteen suorituskykyä tuplatarkkuudella. Myös matalien tarkkuuksien tukea on paranneltu ja nopeutettu.
Huippumalli Radeon Instinct MI60 tarjoaa 300 watin TDP:llä laskentavoimaa 7,4 TFLOPSia FP64-tarkkuudella, 14,7 TFLOPSia FP32-tarkkuudella ja 29,5 TFLOPSia FP16-tarkkuudella, sekä 59 ja 118 TOPS:ia INT8- ja INT4-tarkkuuksilla. Vega 20:ssa on 4096-bittinen HBM2-muistiohjain, jonka jatkeena on 32 Gt ECC-virheenkorjausta tukevaa 2 Gbps:n HBM2-muistia, mikä tarkoittaa muistikaistan osalta teratavua sekunnissa. MI60:n rinnalle julkaistaan myös kevyempi Radeon Instinct MI50, mutta sen tarkempia tietoja ei julkistettu vielä.
AMD:n omien testien mukaan Radeon Instinct MI60 tarjoaa ResNet-50-testissä FP16-tarkkuudella noin 2,8-kertaista suorituskykyä Vega 10:een perustuvaan MI25-malliin verrattuna ja FP32-tarkkuudella lähes Tesla V100 PCIe:n tasoista suorituskykyä. SGEMM- ja DGEMM-testeissä MI60:n suorituskyky riittää Tesla V100 PCIe:n peittoamiseen pienehköllä marginaalilla.
Muita Vega 20:n uudistuksia ovat esimerkiksi PCI Express 4.0 -tuki ja Infinity Fabric -tuki näytönohjainten väliseen kommunikaatioon. PCI Express 4.0 tarjoaa prosessorin ja grafiikkapiirin välille maksimissaan 64 Gbps:n kaksisuuntaisen kaistanleveyden, kun näytönohjainten väliseen kommunikaatioon käytettävä Infinity Fabric tarjoaa kaistaa 100 Gbps. Grafiikkapiirin rautatason virtualisointi on tarjoaa kolmannen sukupolvensa myötä mahdollisuuden käyttää yhtä Radeon Instinct MI60 -näytönohjainta maksimissaan 16 virtuaalikoneen palvelemiseen ja yhdelle virtuaalikoneelle voidaan osoittaa maksimissaan kahdeksan omaa laskentakorttia.
Radeon Instinct MI60 -näytönohjaimen toimitukset aloitetaan vielä tämän vuoden puolella.
Päivitys: AMD on julkaissut virallisen videon Next Horizon -tapahtumastaan. Videolla on mittaa reilut kaksi tuntia.
En muuten ole huomannut täällä uutisointia uudesta aika korkealle kellotetusta ekan sukupolven EPYCistä (7371):
AMD Launches The 16 Core EPYC 7671 – Fastest Clocked EPYC Chip
14 nm, 16 ydintä, roimasti korotetut kellotaajuudet, mutta julkaistiin vasta nyt. Voisikohan tästä saada jotain vihiä toisen sukupolven EPYCeistä? Haiskahtaisi mielestäni siltä, että 7 nm prosessilla tulee vain vähintään 32-ytimisiä malleja, ja lisäksi ilmeisesti kellotaajuudet nousevat kohtalaisesti, kun nyt on raaskittu nostaa 16-ytimisenkin boost-taajuus 2,9 gigahertsistä 3,8 gigahertsiin ja perustaajuuskin 2,4 gigahertsistä 3,1 gigahertsiin.
Ei, se ei kerro yhtään mitään toisen sukupolven Epyceistä. Toisen sukupolven Epyceissä on maksimissaan 64 ydintä, ei 32, kellotaajuudet jää nähtäväksi.
Lisäksi nuo "roimasti korotetut kellotaajuudet" ovat sitä vain palvelinpuolella, työasemapuolella Threadripper 2990WX:ssä on 32 ydintä, korkeammat Boost-kellot ja vain 100 MHz pienempi peruskellotaajuus. 16-ytimisessä Threadripper 2950X:ssä on sekä Boost- että peruskellotaajuudet vielä selvästi korkeammat.
Asennetaan piirilevylle joka on tehty piikiekosta ,
Rome prossuissa EI ole chiplettejä ?
Ryzeneissä ei ole moduulia yhdistävää L3 cachea
Mistä Infinity Fabric koostuu , jos siellä ei ole kerroksellisia väyliä
Pelkkiä pintakomponenttejä vai socket pinnejä
Miten Raven toimii ilman prossun sisäistä tiedonsiirtoa
Nojoo, täytyy sanoa, että unohdin Threadripperit kokonaan, eli toki 16-ytimisen mallin kellotaajuuksia piti nostaa, jotta se on kilpailukykyinen 2950X:ää vastaan. Silti väitän, että kyllä tässä on pitänyt huomioida myös tulevat Romet.
Tuskin Romet mitenkään on vaikuttaneet tämän kellotaajuuksiin, en ainakaan itse näe mitään syytä miksi olisi. Romella on ihan toiset myyntivaltit.
Täh? Prosessori eli se varsinainen siru on piikiekolle valotettu (valmistettu). Piirilevyä ei tehdä piikiekoista vaan lasikuidusta, muovista ja metallista. Se piikiekosta leikattu siru voidaan sitten asentaa sille piirilevylle jotta saadaan kiva sockettiin istuva prosessori.
Chipletit eivät ole moduuleita.
Ryzeneissä on CCX:n yhdistävä L3. Romessa on lähes varmasti CCX:n yhdistävä L3. Ryzenissä ei ole moduuleita, kuten ei Romessakaan.
Väylistä, ei ne ole mitään kerroksia tai kalvoja.
Nyt on mahdotonta arvata mihin osaan hkultalan viestistä tällä viittasit, mutta sen verran kuitenkin voidaan todeta heti alkuun ettei pintaliitoskomponenteilla ja "socket pinneillä" ei ole mitään tekemistä toistensa kanssa.
Ei se toimisikaan, kuten ei mikään muukaan prosessori.
Sun viestien taso on kyllä nyt niin heikoissa kantimissa että käytä hyvä ihminen niiden kirjoittamiseen enemmän aikaa. Tarkista viestin rakenne, termit ja niin edelleen ettei tule tällaista sillisalaattia josta muut joutuvat arvailemaan että mitäs ihmettä tällä kertaa mahdat tarkoittaa.
Niinpä , ja kun metallit ovat sähköisesti johtavia , mikä enemmän , mikä vähemmän , niin piirilevyä ei voida rakentaa pelkästään Prossun alumiiniseoksisen kuoren varaan
Väitätkö täten että ytimet rakennetaat erikseen ja asennetaan prosuun erillisinä osina , ettei niitä kasata yhteen chiplettiin ja asenneta kasattuna moduulina
Siis CCX ei olekkaan yhtenäinen komponentti vaan joku hajatelma
Theardripperit on rakennettu tyhjän päälle
Oletko 100% ettei jossain PCB esim, emoissa käytetä kalvoja
Prosessori ei toimisi Duroroplast piirilevyillä , miksi ei
Minä nyt en kertakaikkiaan kykene vertailemaan muistiviideiden viitekehyksiä vuoden 2010 tasoon
Ei, kukaan ei väitä mitään tähän liittyvääkään. Molemmat tuon "ettei":n ympärillä olevat lauseet ovat hyvin hämmentäviä. Ne ytimet tehdään valottamalla piilastua maskilla, samaan aikaan kuin se koko muu piilastu.
Tätä on jo kysytty monta kertaa, mutta voisitko selittää mitä tarkoitat sanalla "moduuli". Ihan oikeasti kenelläkään täällä ei ole mitään hajua mitä tarkoitat sillä.
Ihan vaan pari lausetta jotka kertovat mikä moduuli on. Voisi selventää aika paljon.
Täällä taas tekeydytään typeriksi jotta päästään nillittämään ja halkomaan hiuksia.
Multi-chip module – Wikipedia
Tuo määritelmä vaan ei oikein toimi siihen, mitä ei eks höpöttää/millä tavalla ei eks sanaa käyttää.
Itse asiassa hänen eri viesteissään hän vaikuttaisi tarkoittavan sillä aivan eri asioita.
Että täällä ei todellakaan halota turhaan hiuksia eikä" heittäydytä tyhmäksi" kun tuota sanan merkitystä tivataan.
No Romen chipletit ja IO-chip on vallan loistava esimerkki MCM:stä ja eli moduuleista ja täällä intetään että chipletit ei ole moduuleita.
Käsittääkseni Moduuli on jonkinasteinen suomennos englanninkielen sanasta Module.
Tämä ei todellakaan sovi tuohon määritelmään.
Tyyppi on yksinkertaisesti pihalla kuin lumiukko ja käyttää termejä vaihtelevissa merkityksissä joissa ei ole mitään konsistenttiutta, tarkoittaa välillä sanalla yhtä ja välillä samalla sanalla toista.
Vaikea sanoa kun aina joskus tulee järkevältä kuulostavia pätkiä (kun olettaa että osa termeistä on vain sekoitettu)
ja sitten tulee myös tällaisia
Siis vaikea sanoa että onko kyseessä vain se että termit on ihan sekaisin vain se että on täysin pihalla siitä mistä puhuu.
Kyseessä vois olla melkein jonkinlainen oppivan AI keskustelijan testaus kun kielioppi on oikein mutta käsitteitä joilla on vakiintuneet merkityksent (jotka täytyy ymmärtää pystyäkseen keskustelemaan järkevästi) on ihan sekaisin.
No nyt olen täysin varma, kyseessä täytyy olla jonkinlainen kekskustelevan AI:n kokeilu joka on mennyt täysin metsään.
Miksi olen varma, no kielioppi on oikein mutta tekstin sisältö on puutaheinää, jos ihminen sekoilisi niin pahasti että tekstin sisältö olisi tuolaista puutaheinään niin myös kielioppi olisi sekaisin.
OK Miten sanataiteilija määrittelee Moduulin
AMD:han on suunnitellut prossunsa modulaariksi palasiksi, Jaquar-moduuli ja Ryzen-moduuli ovat aika vastaavia, eli modulaarisia komponentteja jotka voidaan leikata ja liimata eri käyttötarkoituksiin sellaisenaan pakettina. Nyt nähdään onko Zen2:ssa muutettu tuota modulaarista rakennetta, eli onko CCX edelleen 4 ydintä vai onko se laajennettu 8-ytimiseksi. AMD itse ei taida juuri viljellä CCX:tä moduuli nimitystä mutta aivan yleisesti tuota ollaan käytetty ainakin Sonyn ja Microsoftin puolesta kun on puhuttu cpu-moduuleista.
En ole mikään sanataiteilija vaan tieto(kone)tekniikka-alan tutkija.
Zenin yhteydessä en käyttäisi "moduuli"-sanaa ollenkaan, koska ei ole selvää, mitä sillä sen kanssa tarkoitetaan.
Käyttäisin esimerkiksi joko termiä ydin, CCX, piilastu tai paketti, riippuen siitä mistä haluaisin puhua.
Jos vaikka haluttaisiin puhua Epyc -prosessorista
Siinä joko on tai sitten ei myönnetä olevan 8 kpl Chiplet nippua
AMD Previews EPYC ‘Rome’ Processor: Up to 64 Zen 2 Cores
joissa joko on tai ei ole 8 Zen ydintä
Tuosta voidaan laskea 8×8 ja saada jonkinlainen likiarvo
Epycien kohdalla termi tarkka ydinmäärä on hankala koska tuota IO ohjainta ei vielä mikään taho ole avannut , vai löytyykö jo tiedot jostakin tekniseltä sivustolta
Mitähän tarkoittaa piilastu nykyään , eihän nuo ytimet enää perustu yhteen lastuun
Jos paketilla halutaan tarkoittaa koko sitä sisältöä joka on paketoitu yhden prosessorin kuorien sisään, niin termi on hajanainen
Minusta ja minun mielestäni tuo ryzen CCX on moduuli jonka sulkee ydinten yhteinen L3 muisti jota ilman laite olis ikivanha APU
Piilastu, siru tai mikä tahansa vastaava nimi tarkoittaa yhtä piikiekosta leikattua sirua, oli siinä ytimiä sitten 1 tai 100 tai mitä vain muuta. Se ei ole ikinä tarkoittanut yhtään mitään muuta.
"Paketilla" tuossa viimeisimmässä esimerkissä taidettiin viitata siihen kokonaisuuteen, johon kuuluu yksi tai useampi siru ja niiden alusta (piirilevy). Se ei ole millään muotoa hajanainen termi.
Ei olisi, L3-välimuistilla ei ole mitään tekemistä sen kanssa onko kyseessä APU-piiri vai prosessori (jotka ovat loppuviimein täysin sama asia, toisessa vain sattuu olemaan grafiikkaohjain mukana ja AMD antoi niille nimeksi APU-piiri)
Ei ne ole mitään nippuja. Siellä on kahdeksan piilastua jotka sisältää ytimiä ja yksi piilastu joka sisältää musitiohjaimen ja muuta IOta mutta ei ytimiä.
Ei se ole mikään likiarvo. Se on tasan tarkka arvo suurimman rome-konfiguraation yhden paketin ydinmäärälle. (*)
Siinä ei ole tasan yhtään mitään hankalaa. Jokaisessa ydin-chiplet-piirillä on tasan 8 ydintä ja io-piilastulla tasan nolla(*). Saadaan 8 * 8 + 0= 64.
Pala piitä joka leikataan piikiekolta, joka valmistetaan tehtaassa. Näitä piilastuja voidaan sitten laittaa samaan pakettiin yksi kappale tai monta kappaletta.
Ja nyt sinulla tuntuisi olevan kyllä "ydin"-sanankin merkitys pahasti hukassa.
Edellinen/viimeinen kaupallinen prosessori jossa ydin on ollut useammalla piilastulla on IBMn POWER2 vuodelta 1993. Sen jälkeen koko ydin on aina mahtunut yhdelle piilastulle.
Sen sijaan muuta kuin se ydin, esimerkiksi L2-välimuisti tai muistiohjain on sen jälkeenkin pitkään ollut eri piilastulla.
Ei siinä ole mitään hajanaista. Se on hyvin selkeä, koska piilastut pitää aina paketoida että niitä voi käyttää, ja paketin käsite on hyvin selkeä.
Se on paljon vähemmän hajanaisempi sana kun sana "prosessori". Koska alkuperäisessä merkityksessään sana "prosessori" itse asiassa tarkoittaisi sitä, mitä nykyään kutsutaan "ytimeksi", ja se mitä nykyään kutsutaan "moniydinprosessoriksi" olisi itse asiassa alkuperäisen määritelmän mukaan yhden piilastun tai paketin moniprosessorijärjestelmä.
Välimuisti ei sulje yhtään mitään. Se tallettaa datasta tilapäiskopioita.
Ja moduuli ei ole yleisesti käytetty termi tuossa yhteydessä.
Ja huoh. Zenin arkkitehtuurisa oleellista ei ole se, että siellä on neljän ytimen CCXiä, vaan se, millainen se ytimien sisäinen mikroarkkitehtuuri on.
Se, että siellä on perseptronipohjainen haarautumisenennustin joka kulkee varsinaisen käskynhaun edellä.
Se, että siellä on monitasoiset käsky-TLBt joissa käskyjen virtuaaliosoitteet muutetaan fyysisikin osoitteiksi
Se, että siellä on 64 kilotavun L1-käskyvälimuisti
Se, että siellä on 32 tavua kerrallaan hakeva käskynhaku.
Se, että siellä on käskydekooderi, joka voi dekoodata neljää käskyä rinnakkain.
Se, että siellä on micro-op-välimuisti josta voidaan suorittaa 6 mikrokäskyä ohittaen normaali käskynhaku ja dekoodaus
Se, että siellä on stack engine jolla pinoon liittyvät osoitelaskut saadaan tehtyä kätevämmin
Se, että siellä on PRF-pohjainen rekisterien uudelleennimieäminen joka voi uudelleennimetä 6 käskyä kellojaksossa, ja isokokoiset PRFt
Se, että siellä on käskyjen uudelleenjärjestely jossa isot puskurit joissa paljon käskyjä voi odotella suoritukseen menoa
Se, että siellä on neljä kokonaislukulaskentayksikköä, kaksi osoittteenlaskentayksikköä ja nelkä liukuluku-/SIMD-laskentayksikköä
Se, että siellä on kaksi latausporttia L1-välimusitista datapolulle ja yksi tallennusportti datapolulta L1-välimusitille
Se, että siellä on monitasoiset data-TLBt.
Se, että siellä on 32 kiB 8-way joukkoassosiatiivinen L1-datavälimuisti, joka toimii takaisinkirjoittavalla periaatteella
Se, että siellä on leveät väyltä L1- ja L2-välimuistien välillä
Se, että siellä on leveä 8 käskyä kellojaksossa käsittelevä käskynvalmistumislogiikka
ja aika paljon muutakin.
Ja kaikki nämä on tehty siten että ne yhdessä toteuttavat x86-käskykannan.
(*) IO-piilastulla voi toki olla jotain todella pieniä ja heikkoja esimerkiksi virranhallinnan apuna käytettäviä pikkuprosessoriytimiä, mutta näillä ei voida suorittaa sitä varsinaista koodia, jota prosessori suorittaa, joten näitä ei ole mielekästä laskea mukaan.
@El eks en tiedä trollaatko vai mistä on kyse, mutta saa riittää näiden keskusteluiden sotkeminen kun näyttää olevan hakusessa niin perusasiat kuin ternitkin.
Piilastu tarkoitta kokreetisesti piilastua joita esim. Epyc Romessa on 9kpl (8x Chuplet piilastu + 1x IO piilastu).
Paketti/pakkaus tarkoitta sitä alustaa jolle ne pilastut on kiinitety (ja jonkasisällä on johtimet).
Paketti/pakkaus ei ole piirilevy siinämielessä kun mihin temillä piirilevy normaalisti viitataan (vaikakin se on piirilevy kun asiaa tulkitaan kirjaimellisesti).
Prosessori on kokonaisuus joka sisältää Paketin, Piilastut ja mallista riipuen se voi sisältää myös Heatsprederin (joka ei ole alumiiinia niin kuin ilmeisesti jossainvaiheessa väitit).
Tietokoneen Emolevy on piirilevy jolla on Posessorin Kanta on johon prosessori liiteään.
"Tuosta voidaan laskea 8×8 ja saada jonkinlainen likiarvo"
Miksi likiarvo pelleilyä kun AMD on kertonut faktat.
Minä olen pikkasen jo epäilly että voisiko kysessä ola El Capitanin uusi inkarnaatio, kun tekstissä on samaa kuin hänellä ts joku termi joka on jo kertaalleen selitetty hänelle pomppaakin käyttöön toisessa väärässä yhteydessä sen selityksen jälkeen ts vaika pitäisi jo tietää mitä se termi tarkoitta siitä huolimatta se otetaan käytöön täysin eriyhteydessä.
Xilinx Alveo U280 Launched Possibly with AMD EPYC CCIX Support
Mikäs tämä CCIX on ihmiskielellä. Joku välimuistikoherentti juttu, mutta onko tämä isokin asia tm. jos tälläinen tuosta romen io chipistä löytyy? @hkultala tai joku?
Tuossa on jonkin näköinen crashcourse
An Introduction to CCIX
Vega 20:lla varustettu MacBook testissä:
Taitaa kuluttaa jopa selvästi vähemmän kuin 560X koska i9:n suorituskyky on ~5%+ parempi Vegalla kuin 560X:llä ja Applellahan nuo i9-versiot läppäreistä oli nimenomaan lämpörajoitteisia.
Testit Vega 20 vs 560X:
Geekbench OpenCL: +37%
Geekbench Metal: +23%
Unigine Heaven: +82%
Cinebench GPU: ~+18%
Eli aika hyvin tullut lisää suorituskykyäkin, toki huomattavan sovellusriippuvaista että paljonko