
Intel esitteli Alder Lake -prosessoreiden yksityiskohtia jokin aika sitten Intel Architecture Day- ja Hot Chips 33 -tapahtumissa. Nyt hongkongilainen HKEPC on päässyt haastattelemaan Intelin Kiinan kehityskeskuksen johtohahmoihin kuuluvaa Jiqiang Songia Alder Laken eri ydinten suorituskyvystä.
Songin mukaan Microsoft on optimoinut Windows 11:n tehtävien jakoa 12. sukupolven Core-prosessoreiden P- ja E-ydinten välille. P-ytimet eli suorituskykyiset Golden Cove -ytimet saavat raskaat tehtävät ja E-ytimet eli energiatehokkaat Gracemontit, joiden vastuulla on etenkin I/O-prosessien pyörittely.
Vaikka Gracemontit ovat Atom-sarjan perillisiä, niiden suorituskyky on sekä vuotojen että Intelin itsensä mukaan jotain aivan muuta, kuin menneiden vuosien hinnat alkaen Atom-prosessoreilla. Intelin datan mukaan kaksi P-ydintä ja kahdeksan E-ydintä vievät saman verran tehoa, kuin neljä P-ydintä, mutta tarjoavat suurin piirtein samalla pinta-alalla jopa 50 % parempaa suorituskykyä.
Alder Lake -koodinimellä tunnetut 12. sukupolven Core-prosessorit tullaan julkaisemaan näillä näkymin 27.-28. lokakuuta pidettävässä Intel Innovation -tapahtumassa.
Lähde: HKEPC
*) Tämä toki samalla tehonkulutuksella
Nyt on vain yksi kysymys. Tuleeko tästä floppi vai menestys? Nähdäkseni tässä on ainesta molempiin.
Ei ole huonoja tuotteita, on vain huonoja hintoja…
Eli jos hinta on sopiva, niin mikä jottei. Mutta Intelillä on varmasti paineita nostaa prossien hintoja ennen ryzeniä aikakauteen…
Eikös nuo ole kuitenkin molemmat uusia, tuossahan vertaillaan pelkästään P ja E ytimiä eri konfiguraatioissa.
Ainut mitä tuosta kai voi päätellä on että kahdeksan E ydintä peittoaa kaksi P ydintä samalla teholla kahden P ytimen kyljessä, mutta toisaalta ei tiedetä että missä workloadissa. Jos se on melko kevyttä mutta rinnakkaistuu hyvin niin käy järkeen että moar core = better fast. Voi olla eri asia sitten jos laitetaan jotain raskaampaa pureksimaan. Tai ehkä neljä P:tä käy niin kuumana että jäähdytys ei pysy perässä ja kellot rajoittuu. Tai ehkä workload on niin pitkä että boostiaika loppuu kesken ja P ytimet häviää enemmän kellotaajuutta kuin E ytimet.
Tulee olemaan mielenkiintoista nähdä minkälaisia käyttäytymisprofiileja näillä on.
Workload on 150%. Tai näin lukee otsikossa.
Tämä kertoo hyvin siitä, miten Intel mokaa serveripuolella:
Serveripuolella, jossa ajetaan rinnakkaisia workloadeja, nimenomaan kaivattaisiin näitä E-ytimiä, sen sijaan sinne on tulossa pelkkiä P-ytimiä jotka eivät pärjää pinta-ala/suorituskyky tai energiankulutus/suorituskyky-suhteissa AMDn zen3- ja tuleville zen4-ytimille, vaikka ehkä voittavat ne yhden ytimen suorituskyvyssä (jota tarvitaan työpöydällä)
Eiköhän tämä uutisen vertailu ole siitä että P-ytimiä ajetaan tuossa "liian korkeilla" kelloilla ja volteilla, jolloin niiden energiahyötysuhde laskee huonoksi. E-ytimiä taas ajetaan juuri optimaalisilla kelloilla, jolloin niiden hyötysuhde on paras mahdollinen.
Jos P-ytimiä ajettaisiinkin alemmilla kelloilla, olisi niidenkin hyötysuhde taas huomattavasti parempi. Työpöytäkäytössä niistä vain halutaan "kaikki teho irti", jolloin energiatehokkuus lentää roskakoriin. Serveripuolella niitä samoja P-ytimiä voidaankin sitten ajaa sillä hieman alemmalla kellolla ja saada energiatehokkuus taas kuntoon. Toki pinta-alaltaan ne on edelleen isoja, jolloin core-määrässä jäädään tietenkin kakkoseksi. Todellisessa suorituskyvyssä todennäköisesti voitetaan, ainakin hieman.
/mutua
Itse en pitäisi tätä mutuna ollenkaan. Jo useampia vuosia Intelin julkaistuja "P-prosessoreita" on ajettu "ylikellotettuina", eli siinä konfiguraatiossa, joka ei ole lähelläkään energiatehokas, vaan ennemminkin äärimmilleen viritetty. E-ytimistä ei voi tietää tässä vaiheessa, mutta eiköhän se noin ole.
OT. On olemassa myös hinnasta riippumatta huonoja tuotteita. Kuten esimerkiksi vaaralliset Gigabyten virtalähteet tai hengenvaaralliset NZXT:n kotelot/riserit.
Monien isojen ohjelmistojen lisenssit ovat core-määrään sidottuja ja niitä ei E-ytimille ostella. Parasta mahdollista suorituskykyä vaan ja nykyään – virtuaalipalvelimien aikakaudella – samalla koneella pyörii virtualisoituna monta toisistaan riippumatonta palvelinta. Sinne ei Gracemontteja kaipailla.
Työni puolesta joskus jonain vuonna asiakkaalle teen palvelinsuosituksia ja se ydinpohjainen lisensointimalli kyllä asettaa omat rajoituksensa. Lisäksi, jos ideasi olisi pärjännyt bisnes-maailmassa, niin HP:n Project Moonshot olisi viimeistään nyt parasta ikinä. Se alkoi Atom-pohjaisena energiatehokkaana palvelininnovaationa ja laajeni energiatehokkaiden palvelinten tuoteportfolioon, mutta ei siitä käsittääkseni tullut mikään normaaleja Proliantteja syrjäyttävä rajoja rikkova bisnes, vaikka se on jo 8 vuotta sitä yrittänyt.
Gracemont on suorituskyvyltään ihan eri luokkaa kun jotkut muinaiset Atomit. Ei sotketa niitä tähän.
Vanhat Atom-pohjaiset palvelimet failasivat koska niiden ytimet olivat heikkoja, ja niissä oli huono yhden säikeen suorituskyky. Gracemont ei ole onneton, eikä siinä ole huonoa yhden säikeen suorituskykyä. Se ei ole mikään "pikkuydin" tai "Atom-luokan" ydin vaan se on keskikikoinen ydin. Aika monilla mittapuilla se on oikeastaan aika järeäkin ydin, mutta se vaan on suunniteltu pienemmille kellotaajuuksille kuin nuo "isot" ytimet.
On paljon fiksumpaa ajaa koodia samalla suorituskyvyllä Gracemontilla täysillä kelloilla kun efektiivisesti alikellottaa Cove-sarjan ydin matalille kelloille jotta energiankulutus saadaan järkeväksi; rinnakkaisilla workloadeilla. Cove-sarja on optimoitu työpöydälle, n. 5 GHz kelloille, kun taas Gracemont on optimoitu tuonne 3 GHz luokkaan.
Se, että Cove-sarjan ytimiä ajetaan alle 3 GHz:lla jotta tehobudjetit ei pauku ei vaan ole järkevää, kun voisi ajaa sitä koodia myös ytimillä, jotka on suunniteltu siihen suoriuskykyluokkaan.
Ja lisäksi olen tosiaan ehdottamassa sinne myös niitä kahdeksaa Golden Covea, jotta niissä tilanteissa, kun rinnakkaista kamaa ei ole paljoa, saadaan myös paljon sitä yhden säikeen suorituskykyä.
Mutta joo, joissain softissa on typerä lisensointimalli, joka rankaisisi tätä. Säiekohtainen lisenssimalli olisi paljon fiksumpi kuin "ydinkohtainen".
Ei. Vaan niitä ajetaan nimenomaan niillä kelloilla joille ne on suunniteltu[/b}. Cove-sarjan ytimet on suunniteltu maksimaalista yhden säikeen suorituskykyä silmälläpitäen. Pyörimään korkealla kellolla.
Mutta niitä vaan ei ole suunniteltu maksimaalista monen säikeen suorituskykyä silmälläpitäen, ne on siihen liian isoja ja liian virtasyöppöjä.
E-ytimet on suunniteltu monen säikeen workloadeille. E-ytimet pääsee toimimaan tilanteessa, johon ne on suunniteltu.
Ei merkittävästi. Siellä on (melkein) 4 kertaa enemmän logiikka vaihtamassa tilaansa joka kellojakso.
Ja siellä on kaksi kertaa enemmän säikeitä tappelemassa L1-kakkutilasta.
Se kuluttaa joka tapauksessa paljon enemmän virta kuin 4 kertaa pienempi ydin.
Ei. Ne on nimenomaan epäoptimaalisia sille suorituskykyluokalle, joihin niiden tehobudjetti riittää. Liukuhihna on vaan ihan turhaan liian pitkä <3 Ghz kellolle vaikka jännitetä pienentääkin, ja siellä ties kuinka monessa paikassa joidenkin puskurien kokoa tuplattu viimeisten parin viimeisen suorituskykyprosentin takia.
En oo mikään prosessoritietäjä, mutta tarkoittaako nämä siis parempaa Inteliä (x86) ultrabookkeihin? Eli vaikka M1:lle hävitäänkin, niin päästäänkö matkaa kuromaan edes jonkun verran umpeen?
Pelien osalta tietysti vaikuttaa, jos kellotaajuudet laskee, mutta ei kai niitä kaikkia coreja yleensä rääkätä, joten ei nuo hitaammat välttämättä niin pahaksi pullonkaulaksi muodostu? Jos tulkitsin kommentin oikein.
Sitähän se juuri tarkoittaa. Riippuen siitä toki mitä läppärillä tehdään. E-ytimet ovat varsin järeitä IPC:n ollessa lähellä Skylakea, joten riittävät mainosti suurimpaan osaan käyttötapauksista tarjoten hyvän responsiivisuuden ja perf-per-wattin. P-ytimiä todennäköisesti tarvitaan vain kun tehdään jotain todella CPU-intensiivistä, jota normikäytössä tapahtuu todella harvoin. Mielenkiintoista nähdä kuinka konfiguroitavissa W11:n scheduler on. Oma veikkaus on, että pelkkien E-ytimien ollessa käytössä ei ole havaittavissa merkittäviä viiveitä P-yritimiin verrattuna normikuormituksella. M1:een verrattuna Intel tulee kuromaan varmasti eroa kiinni akun kestoon liittyen.
Itse veikkaan, että riippuu paljon siitä, että miten fiksu käyttöjärjestelmä on, eli miten hyvin se osaa heitellä kuormia sopiville ytimille tarpeen mukaan. Optimaalinen strategia voi riippua myös siitä, että minkä käyttäjä on valinnut Windowsissa virransäästöstrategiaksi, eli mennäänkö enemmän virransäästön vai suorituskyvyn ehdoilla.
Ja tästä heräilee itselläni ainakin kysymys että onko vanha Wintel-hegemonia taas voimissaan eli onko tietoa Linux-optimonneista näille kiville?
Ei ole vielä näkynyt eli ei varmaan ole julkkisaikaan saatavilla:
Scheduler Changes For Linux 5.15 – Still No Sign Of Any Intel Thread Director Optimizations – Phoronix
http://www.phoronix.com
Luulisi tulevan jollain aikavälillä kuitenkin, mutta aika kertoo.
On luvattu mutta tulee vähän myöhemmin. Täysin tasavertainen tuki Win11:n kanssa sitten paljon paljon myöhemmmin:
…
On the question of Linux, Intel only went as far to say that Windows 11 was the priority, and they’re working upstreaming a variety of features in the Linux kernel but it will take time. An Intel spokesperson said more details closer to product launch, however these things will take a while, perhaps months and years, to get to a state that could be feature-parity equivalent with Windows 11.
…
Intel Architecture Day 2021: Alder Lake, Golden Cove, and Gracemont Detailed
http://www.anandtech.com
Moni uskoi myös maailman suurimman matkapuhelinvalmistajan pysyvän trendien aallonharjalla ja tietävän mitä asiakkaat haluavat puhelimilla tehdä…
Phöh, sinne meni omalta puoleltani sitten kiinnostus. Hetken ehti jo tuntua siltä että tuo wintel-tuuba olisi jäänyt taakse, mutta ei sitten.
Eikö parempia esimerkkejä löytyisi ihan Intelin omasta lähihistoriasta, eli esim. 4-Core:n ympärillä segmentoimisesta, sekä kokonaan ilman että Meegoa ja Efloppia tarvitsee unohtaa.
Tuossa on se ero, että Intelin serveripuolella ei tarvitse ennustaa kuluttajien käyttäytymistä vaan heillä asiakkaat on isot serverivalmistajat HPE, Dell, Supermicro, Lenovo jne. Lisäksi isoimmat datakeskusyritykset.
Intelin asiakkaat tietävät mitä palveluita ja softia heillä on tuotannossa ja minkälaista kuormaa se aiheuttaa. Se on hyvinkin analyyttistä ja insinöörimäistä työtä. Sama minkä eräs matkapuhelinvalmistaja osasi oikein hyvin mutta ei ymmärtänyt, että kuluttajapuoli toimii myös tunnepohjalta.
Toki edelleen on mahdollista, että Intel ei käy vuoropuhelua asiakkaidensa kanssa. Pidän sitä kuitenkin epätodennäköisenä.
Hittituotteita kuten Itanium, kehitetty palvelinvalmistajien kanssa, kun ne tietävät, mistä kansa tykkää:
Itanium – Wikipedia
en.wikipedia.org
Suorituskyky näissä on varman aika ohjelmisto ja käyttis riippuvainen kuinka hyvin on saatu optimoitu noita ytimiä.
Voi olla floppi mutta voi myös olla hyvä.
Epäilen että alussa tullaan näkemään suuria eroja eri ohjelmien välillä.
Juu tietävät, tämä on kai Intelin sisäisiä dokumentteja. Eli näyttää huonolta, Sapphire Rapids tuolla kultalan ehdottamalla konfiguraatiolla hyvin pitkälti tasoittaisi ja jopa kääntäisi tilanteen. Siksi lähinnä pitää ihmetellä miksi sieltä ei ole sellaista tulossa – tai vaikka pelkillä E-coreilla olevaa versiota.
HBM-versio on hyvä HPC-käyttöön, mutta AMD:n vastine vcache antaa aika vastaavan suuruisen edun AMD:n prosessoreille ja taitaa lisätä tuota etumatkaa kaikessa muussakin käytössä.
8P ydintä lienee ihan riittävästi pelikäyttöön. E-ytimet pelannevat hyvin koodinkääntöön sun muuhun paljon säikeitä vaativaan käyttöön mitä mulla on. Kustannustehokas tapa saada lisävääntöä. Niissä jutuissa missä rinnakkaisuutta ei ole tarpeeksi P-coret pelastavat.
Mun vinkkeli on ehkä vähän erilainen, kun en päivitä konetta usein. Uskoisin, että alder lake alusta riittäisi helposti 5-10v käyttöön ja vaihtaa vain gpu:ta siinä välissä kerran tai kaksi. Tuntuu siltä, että 2022 lopussa on mun konepäivityksen aika. Zen4:en ja raptor laken odottelee. Toivottavasti piiripulakin hieman luovuttaa siihen mennessä niin saisi koneen järkihinnalla ja ilman odottelua. Pahimmassa tapauksessa menee mun päivitys 2023 vuodelle, mutta sillon ei ole enää mitään syytä odotella jotain uutta muista kuin saatavuus/hintasyistä(tyhmää maksaa ylihintaa, jos ei ole pakko, ddr5 muisti myös lienee kallista ja ei optimaalisen noepaa aluksi). Kaikki uudet mun odottamat teknologiat on 2023 standardikamaa(pcigen5 gpu:lle, riittävästi io:ta 2xpcigen4 nvme nopeuden ssd:ta, joita käytetään yhtä aikaa, ddr5 muistit, 16+corea cpu). Tuossa kohtaa haswell pääsee eläkkeelle. Hyvin on 4core haswell palvellut ja palvelee edelleen.
Riippuu ihan "paljon fiksumman" määritelmästä.
Palvelinpuolella usein raa’an throughputin lisäksi tärkeää on myös se, että minkä verran latenssia tietyllä throughputilla joudutaan sietämään ja on ihan mahdollista, että hitaammilla ytimillä ei saavuteta haluttavaa latenssia ollenkaan. Ja etenkin heterogeninen arkkitehtuuri on vaikeammin ennustettava latenssikäytöksen suhteen kun loadit kasvavat. Tulokset voivat heitellä ikävästi sen mukana, että miten säikeet päätyvät hyppimään / starttaamaan tehoytimien ja energiatehokkaiden ytimien välillä ja etenkin jaetussa ympäristössä, jossa ajetaan virtuaalikoneita on tilanne todella vaikeasti hallittavissa.
Paria tuhatta fyysisiä serveriä töissä pyörittävän tiimin jäsenenä / arkkitehtinä voisin haluta palvelimia joissa on ziljoona Gracemontia ja palvelimia joissa on pelkkiä Golven Coveja, mutta heterogenisista palvelinprossuista en ole ainakaan heti kärkeen erityisen innostunut. Ehkä jos schedulerit, hypervisorit, dockerit, kubernetekset jne. osaisivat tarjota hyvät featuret, että latenssikriittisiä prosesseja saisi hallittua paremmin. Vähän hankala lisämuuttuja se on kuitenkin hallittavaksi. Helpompaa vaan jos on tarjolla korkean single-thread suorituskyvyn instansseja ja vastaavasti energiatehokkaampia & halvempia instansseja siihen käyttöön, mihin ne sopivat hyvin.
Muutenkin kun jengi ajaa jotain server-side javascriptiä jne. ja tekee yhtään monimutkaisempaa hommaa tarjoten payloadeja selaimille / clienteille, niin joskus on parempi kiiruhtaa 200-300ms tehoytimillä ja hyväksyä huonompi energiatehokkuus vs. samojen operaatioiden kesto 400-600ms. Aina hinta ei ole kaikki kaikessa ja optimointikin on kovin kallista – se kun on suoraan aikaa pois developereilta ja backlogissa on aina loputtomasti featureita joita voi implementoida.
Noihan (ja ylikin) on olleet saatavilla jo pari vuotta kilpailevassa leirissä.
Uutisessa mainittu IO ei liity tosin noihin juuri mitenkään
Pöytäkoneiden näkökulmastahan näissä prossuissa ei ole mitään järkeä, koska virransäästöstä ei pääse hyötymään, koneen kuluttaessa idlessä vähintään 30-40 W. Syyt miksi tälläisiä prossuja tehdään on luultavasti jo aiemmin mainitsemani "ydinsota", virrankulutuksen räjähtäminen käsiin yli 8 ytimisillä prosessoreilla (pitää kellottaa tappiin vs. AMD) sekä huonot saannot prosessorien valmistuksessa.
Adler Lakessa ytimiä on vain 16, ei ole tulossa mitään 20 ytimen teholäppäreitä Adler Lakella.
Näissä on hyvin paljon järkeä myös pöytäkoneissa; 2+8 maksaa saman verran valmistaa ja vaatii yhtä järeän virtalähteen ja jäädytyksen kuin 4+0 mutta tarjoaa yleensä selvästi paremman suorituskyvyn. Esim. Core i3 voisi saada aika ison suorituskykyhypyn jos vaihtuisi 4+0sta 2+8iksi
Kappas, onkohan tuo täysin varmaa, että 8+8 ytiminen tulee olemaan suurin ydinmäärä mitä on tarjolla? Tullut seurattua sivusilmällä näitä, koska ei ole hirveästi luottamusta, että näistä olisi pelikäyttöön jne.
Olisihan se hienoa, jos i3 tason prossuissa saataisiin iso suorituskykyloikka. Aika näyttää. Veikkaan vaan, että tämä on pakon sanelema ratkaisu Intelille. Saannot ei *vieläkään* taida olla hyvät, koska eivät suoraan kerro valmistettujen sirujen lukuja vaan kaikki tiedot ilmoitetaan piikiekoissa. Voin tietysti olla väärässä, sen näkee sitten kun ensimmäiset viralliset testit julkaistaan.
Nimenomaan peliprossuksihan Intel on tämän 8+8 version tuomassa, läppäreihin 6+8 taitaa jäädä nopeimmaksi versioksi. Pelikäyttöön Intelin tarvitsee saada pelivalmistajatkin yhteistyöhön jotta threadit osataan jakaa fiksusti E ja P-ydinten välillä.
Ja tulee olemaan aivan ylivoimaisesti parasta mitä Intelillä on pelikäyttöön tarjota, kellotaajuuksien pitäisi jopa hiukan lisääntyä vs Rocketlake, efektiivisen cachen määrä yli tuplaantuu. Ainoa jännitettävä asia pelisuorituskykyvyn suhteen on AlderLake vs Zen3d.
Jep, Lenovon ultrabookkia odotellaan täälläkin juuri tämänkaltaisella sirulla. ARM-pohjainen prosessorikin toki käy, jos siitä tulee joskus hallitseva variantti Windows-puolella. Mutta tämäkin on jo varmaan ihan hyvä parannus.
Koska näitä voi odotella, onko realistista että olisivat jo Lenovon ensi vuoden malleissa?
Toki jos tuo tuplataan, niin en hanttiin laita mutta kyllä M1:n ulkopuolellakin jo pärjää aika kivasti.
Kun se Qualcom ottaisi ja nyt päkertäisi ulos jotain M1 tason piiriä ja sitten vielä joku tuikkaisi sillä kevyt läppärin ulos. Saisi varmaan melko pienellä akulla hyvän akkukeston.
Eiköhän nämä ensi vuoden läppärimalleihin tule heti alusta, pöytäprossut on tulossa myyntiin tämän vuoden puolella. Jotkut arviot sanoo, että näitä alkais tulla uusiin kannettaviinkin vielä tämän vuoden puolella Windows 11:n startin yhteydessä.
Heh!

Totta… on noita poikkeuksiakin toki olemassa!
Mutta voiko noita edes määritellä tuotteiksi? Kai ne voi, mutta onneksi Euroopassa moisesta voi pistää valmistajan jo vastuuseen!