Intel Architecture Day -tapahtumassa esiteltiin paitsi tulevaa grafikka-arkkitehtuuria, myös prosessoripuolen tulevia uudistuksia. Intel tulee tämän hetken tietojen perusteella hylkäämään nykyisen arkkitehtuurien nimeämisen uuden tavan tieltä, kun tehokkaiden ydinten puolella siirrytään ensimmäistä kertaa täysin uuteen arkkitehtuuriin sitten Sandy Bridgen.
Intelin tulevien suorituskykyisten prosessoreiden arkkitehtuurin nimi on Sunny Cove. Arkkitehtuuri on rakennettu alusta asti uudelleen ja sen kerrotaan parantavan paitsi IPC:tä (Instructions per Clock), myös energiatehokkuutta yleisluontoisissa laskentatehtävissä ja tekevän prosessoriytimistä entistä leveämpiä. Arkkitehtuuriin sisältyy uusia tapoja pienentää latensseja ja tuki tekoäly- ja kryptografiasuorituskykyä parantaville SHA-NI- (SHA New Instructions) ja vector-AES-käskylaajennoksille. Arkkitehtuurissa on muun muassa kasavatettu useiden puskureiden ja välimuistien kokoa, minkä kerrotaan hyödyttävän etenkin dataintensiivisissä tehtävissä.
Sunny Coven jälkeen vuorossa on Willow Cove, jossa suunnitellaan välimuistirakenne uudelleen, parannellaan tietoturvaominaisuuksia ja optimoidaan arkkitehtuurin fyysistä rakennetta transistoritasolla. Vuonna 2021 tulee puolestaan Golden Cove, jonka on tarkoitus parantaa yhden säikeen, tekoälyn ja verkkojen suorituskykyä sekä parantaa tietoturvaominaisuuksia entisestään.
Intelin Sailesh Kottapalli esitteli tapahtumassa myös väitettyä Ice Lake -perheen Xeon Scalable -prosessoria, mutta ainakin AnandTechin edustaja epäili, onko kyseessä aito tai ainakaan toimiva esiversio tulevasta prosessorista.
Arkkitehtuurien tarkemmista muutoksista kiinnostuneille suosittelemme lämpimästi AnandTechin syväluotaavampaa katsausta.
Intelin vähävirtainen Atom -prosessorisarja tulee saamaan päivityksiä Core-arkkitehtuuria harvemmin. Ensi vuonna on luvassa yhden säikeen suorituskykyä, akkukestoa ja verkkopalvelinsuorituskykyä parantava Tremont ja vuonna 2021 yhden säikeen suorituskykyyn, vektorisuorituskykyyn ja kellotaajuuksiin parantava Gracemont. Toistaiseksi ”Next mont”- nimellä tunnettu kolmas Atom-uutuus on luvassa 2022 tai 2023 ja se keskittyy yhden säikeen suorituskykyyn, kellotaajuuden kohottamiseen ja uusiin ominaisuuksiin.
Kuten jo todettua, Intel tulee uudistamaan prosessoriarkkitehtuuriensa nimeämistä. Aiemmin prosessoriydinten koodinimi on kattanut prosessorin kokonaisuudessaan, kun jatkossa prosessorilla on oma koodinimensä, prosessoriytimillä omansa ja grafiikkaohjaimella omansa. Esimerkiksi Ice Lake -arkkitehtuurin prosessorit tulevat sisältämään Sunny Cove -prosessoriytimet ja Gen11-grafiikkaohjaimen.
Korjaatko Sandy Bridgeksi 😉
AMD on saanu inteliin vauhtia… kovin suuri etu matka vain Ryzenilla ja jos chiplet huhut pitävät paikkansa 3000 – 4000 sarjassa.
Ostaisitko prosessoria tämän näköiseltä mieheltä?
Virne on kun autokauppiaalla.
En koska se ei ole oikea vastaus. Sandy Bridge on Nehalemin johdannainen ja toisen sukupolven "Core-arkkitehtuuri".
Tämä on mielenkiintoinen kuva. Jo siitäkin, mitä se kertoo skylakesta, muistaakseni tuota kuvaa ei ole edes siitä aiemmin julkaistu 😉
Ja tuo kuva vaikuttaisi olevan skylake-SP:stä koska tuossa näkyy 3 FMAta, perus-skylakessahan niitä on vain 2.
Yllättävin yksityiskohta on tallennusyksiköiden lisääminen; Haswell ja skylake pystyivät kahteen loadiin + yhteen storeen kellojaksossa, zen (ylläpidettävästi) yhteensä kahteen(1L+1S tai 2L) muistioperaatioon kellojaksossa, tämä uusi sunny cove kahteen loadiin + kahteen storeen. Ja L1-kakun koko kasvanut 48 kilotavuun. Tarkoittaa todennäköisesti myös assosiatiivisuuden kasvua 8->12.
Muita olennaisia eroja näkyisi olevam LEA-käskyjen suoritus kaikissa liukuhinoissa, toinen kertolaskuyksikkö, ja toinen shuffle-yksikkö. Eli vielä yritetään nipistää IPCtä lisää.
Ei ole. Nehalem pohjaa vielä P6een; Nehalemin ydin toimii samalla vanhalla Tomasulo-toimintaperiaatteella kuiN p6, Sandy Bridgessä sen sijään kaikki datan liikkuminen ytimen sisällä (ja sen myötä kaikki oleellinen siinä ytimessä paitsi fetch ja decode) on täytynyt tehdä uusiksi koska ne toimii PRF-ytimellä aivan eri tavalla.
Näyttäisi nyt että siinä prossun päällä edes lukee jotain, eikä ole vain kiillotettu metallinpala…
Mitäs tekemistä tyypin ulkonäöllä on minkään asian kanssa? Ennakkoasenteet +1, hyvin täällä vedetään.
Ei se ulkonäkö, mutta vaihtamalla sukunimen ensimmäisen kirjaimen saa monta suomalaista haukkumasanaa.. Tätä tyyppiä olisi kiusattu suomalaisella ala-asteella ihan nimen takia.
Lapset on lapsia. Kyllähän ne aikuiseksi kasvavat jossain vaiheessa ja rupeamat tajuamaan paremmin, tosin on yksilöitä joille tätä ei kuitenkaan käy.
Hmm, Anand taas kuvailee Nehalemia "evolutionääriseksi" Nehalemista arkkitehtuurin osalta, vaikka transistorimäärää kasvatettiinkin dramaattisesti ja sitä kautta kilkkeitä tuli lisää
Intel's Sandy Bridge Architecture Exposed
Anandilla ei ole syvällistä ymmärrystä prosessorien arkkitehtuurista, Anand ei osaisi suunnitella (kunnollista) prosessoria.
David Kanterilla on, ja David osaisi.
Hieman OT, mutta minua ymmärtää paremmin, kun yleistää, että olen Anandtechiä lukenut ahkerasti vaikka vuosituhannen vaihteesta asti.
—
Intel on vaan itse päättänyt nimetä Nehalemin 1st Gen. Core Architecture:ksi, niin sillä mennään.
@Kaotik ilmeisesti muuttanut Savoon. 😮
Itse aiheeseen sen verran, että jokohan noilla saataisiin jotain vähän jännempää uutta kuin vaan "lisempää ytimiä ja sama Skylake-suorityskyky"
Skylake-SP:llä saa jo nyt aika paljon skylakea paremmn suorituskyvyn rutiineissa, joissa hyödynnetän AVX-512sta.
Tuo tuleva Sunny Cove on muuten ensimmäinen useamman tallennusyksikön sisältävä x86-ydin KOSKAAN. Kaikissa aiemmissa ollut vain yksi.
Muistelinkin jo vuosia sitten mainitun, että Ice Lake olisi seuraava kokonaan uusi arkkitehtuuri.
Ensi vuodesta tuleekin mielenkiintoinen. Tästä arkkitehtuurista tulee varmaan oikein hyvä, mutta onko 10 nm prosessi ensi vuonna niin hyvällä mallilla, että tuloksena on huippusuorituskykyisiä tuotteita?
Voisitko valaista tietämätöntä, mitä tämä käytännössä meinaa? Hyötyykö muutkin kuin serveri/laskentatieteilijät tästä?
Kuvan- ja videonkäsittelijät yms. voi myös hyötyä, niissä on myös aika paljon numeronmurskausta/signaalinkäsittelyä, ja niitä kuvan-/videonkäsittelysoftia kyllä optimoidaan aika hyvin tukemaan uusia käskykantalaajennuksia.
Pelaajat ei vielä moneen vuoteen, peleihin tulee näille uusille käskykannoille tukea aika myöhään (mm. sen takia, että peleille ja muillekin reaaaliaikasoftille oleellista on saada ne pyörimän riitävän hyvin mahdollisimman hitaalla ja vanhalla raudalla, ei saada pyörimään vielä nopeammin uudella ja tehokkaalla raudalla).
Intelin arkkitehtuuripäivien slaideja läpikäyneenä itselleni jäi käteen tämä:
– Yrittävät enemmän prosessin, arkkitehtuurin, sirublokin ja muistien erottamista ja yhdistelemistä (ajattele enemmän yhdisteltävinä legoina, rajoituksineen, eikä aina monoliittisina arkkitehtuuri-prosessi-siru -blokkeina, joita ei voi yhdistellä)
– Intel on lisäämässä paljon uusia laajennuksia suorittimiensa käskykantoihin, näin taas lisää fragmentoimalla Intelien oman perheen suorittimien keskinäisiä ominaisuuksia, ja (olettan) tehden vaikeammaksi AMD:lle päräjätä suorassa x64-kilpailussa. Eli AVX2/AVX512:n lisäksi tulee lisää pakkaus, kryptaus- ja muita spesifisiä käskyjä, joita sitten AMD voi yrittää tukea omissa suorittimissaan viiveellä, mutta juosten aina jäljessä. Toki tämä edellyttää, että uudet käskyt oikeasti nopeuttavat asioita ja asiakkaat/devaajat alkavat niitä hyödyntämään. Tämän on klassista Microsoftilta lainattua "Embrace and Extended and Make non-standard" -tekniikkaa, jolla pyritään naittamaan asiakas omaan laitteistoon ja tekemällä vaihtaminen toiseen (halvempaan) geneeriseen rautaan vaikeammaksi. Tätähän toki on tehty jo vuosikymmeniä, nyt vain näytti tulevan taas lisää käskyjä kerralla enemmän.
– Asiakkaiden heterogeniset tarpeet ja Intelin levenevä tarjonta (mobiili, työasema, palvelin, superrauta, gpu, fpga, kiihdyttimet, jne) tuo haasteita kehittäjille: kuinka kooda nopeammin, suuremmalle määrälle rautaa ja saada siitä vielä riittävästi teho irti per käytetty devaustunti. Tähän Intelin on sitten tarjoamassa oneAPI -abstrahointirajapintaa: kasaa työkaluja, softia, middlewarea ja fw:tä, joiden on tarkoituksena tehdä koodaaminen hetoregeeniselle raudalle helpommaksi, nopeammaksi.
Tämä kaikki on mielestäni ihan järkevän oloista bisnestä Intelin näkökulmasta. Samalla tuo mahdollistaa, mikäli toteutus ei kompuroi, erilaisten tuotantolinjojen (22nm, 14nm, 10nm ja tulevaisuudessa muut) käyttämisen ja yhdistelemisen erilaisiksi paketeiksi niin, että myös investoitu tuotantokapasiteetti saadaan käyttöön, eikä tarvitse seisottaa tehtaita.
Vaikuttaako tämä sitten siihen, että perustyöpöytä tai läppärikäyttäjät tai pelaajat saavat kauheasti lisää uutta tehoa oikeasti käyttöönsä (eikä vain laskennallisesti paperilla), tai selkeästi halvemmalla suorituskykyä , niin aika näyttää.
Mutta yleisesti ottaen, vaikka kaikki on vielä enemmän tai vähemmän slidwarea, niin en ole ollut näin innoissani PC-puolen rautakehityksen lähivuosien potentiaalista moneen vuoteen. Tuntuu, että eräiden toisten toimijoiden ansoista myös Inteliin on nyt tarttunut tekemisen pakon meininki ja pöydällä olevia palikoita on yritetty järjestää uudelleen hieman tehokkaammin.
Tietenkin tätä kaikkea saadaan odottaa vielä kauppoihin pitkän aikaa, mutta kiva nähdä mitä on tarjolla joskus 2020 loppupuolella…. Itse ainakin olin jo jonkin aikaa sitten kyllästynyt tähän +3-5% IPC,+ 2 ydintä, +0.2GHz ja +20% hintoihin -kitkutuskehitykseen, jota on veivattu jo vuosia.
Ja mitähän uudet käskykannat liittyvät toiseen käskyjen tallennusyksikköön? Eiköhän tuo osaa tallentaa käskyt kuten aikaisemminkin, nyt vain 2x troughput on mahdollinen, hyödyttänee ainakin SMT:tä.
Eikös toi käskykntalaajennosten suhteen perässä tuleminen oli juuri ideaali tilanne kun ei tarvii raivaa tietä ohjelmistokehittäjien mieliin? Intelillä suuremmat resurssit tämänkin suhteen ja jos AMD saa ne vuoden pari jäljessä omiin siruihin niin sehän tulee kuin tilauksesta.
Siis eihän itse IPC ole edistynyt Skylakesta kuin ehkä jotain bugikorjauksia lukuunottamatta.
Ilman kellotaajuuksien nousua nopeuskehitystä ei olisi ollut ollenkaan.
"Seitsemännen sukupolven" Kaby Lakehan olisi rehellisesti nimettynä kuulunut täysin kuudenteen sukupolveen.
Eli 6750 jne malleina.
Coffee Laken lisäytimien ansiosta sen nyt olisi voinut perustella seitsemänneksi sukupolveksi.
Mutta "yhdeksäs" sukupolvi olisi taas kuulunut saman päänumeron alle.
Mitäs uusia käskyjä on tulossa? Nimenomaan IPC nousee, ja nousee paljon enemmän kuin aikaisemmissa Intelin päivityksissä. L1-data on puolitoistakertaistunut, dataportteja on 4, coren portit on noussut 8:sta kymmeneen…. mitähän IPC nousisi, ehkä 15%. Ongelma on 10nm valmistusprosessi, jos kellotaajuus laskee 20% nopeus laskee ei nouse huolimatta IPC:n kasvusta.
SHA-NI- ja vector-AES -käskylaajennokset
Ei mitenkään, enkä missään ole väittänytkään, että liittyisivät.
Se "porttien lisääntyminen" johtuu pelkästään siitä toisesta tallennusyksiköstä. Ne molemmat "uudet portit" on kytketty vain siihen toiseen tallennusyksikköön, ei mihinkään muualle (toinen on sen dataportti, toinen osoiteportti).
AMD on potkaissut munille Inteliä noiden Ryzölöiden kanssa ja hyvä niin. Nyt vaan on silleen että takamatkalta on aika usein vaikea nousta. Nämä uuden sukupolven prossut voivat olla ihan jees…mutta pahoin pelkään että kuraa ja sutta sieltä taas tulee. Onko Intel menneen ajan AMD? Milloin noista saa edes jotain maisiaisia? Milloin GPU:sta tulee mitään tarkempaa tietoa? Vittu! Joulu tulee kohta ja mitään ei ole…
:facepalm:
Inteliltä on tullut kuraa ja sutta viimeksi 10 vuotta sitten, kun Bonnell-pohjainen Atom julkaistiin, joten aika outo on tuo "taas"-sana tuossa.
Anand tuskin "suunnittelee" prosessoreita. Hänen tehtävänsä eivät tietenkään ole julkisesti tiedossa, mutta ne ovat todennäköisesti testaamiseen liittyviä juttuja, eivätkä mitään piirisuunnittelua sinänsä. Tosin varmasti tämä testausporukka tarjoaa sitten omia mittaustuloksiaan niille piirisuunnittelijoille ja softasuunnittelijoille.
Missä kohtaa muuten sanotaan Sunny Coven olevan "rakennettu alusta asti uudelleen"? Esitettyjen asioiden perusteella se on Skylake with steroids eikä tyhjästä luotu.
TPU:lla ainakin mainittiin asiasta ja muistaakseni myös muualla oli maininta siitä (tosin pohjalla saattaa olla myös väärinkäsitys, vrt nehalem vs sandy)
TPU kuittasi yhdellä lauseella asian. Intel kuitenkin kertoo itsekin lisänneensä monen asian määrää ja verrokkina on Skylake. Näin:
Ja näin:
Joten ei tuota tyhjästä luotuna voi pitää millään.
Näköjään arkkitehtuuripäivään liittyi myös Q&A-sessio. Anandtech oli tehnyt niistä tiivistelmän.
Intel's Architecture Day 2018: The Future of Core, Intel GPUs, 10nm, and Hybrid x86
Mielenkiintoisin juttu on heti alussa. Intelillä on tähän asti ollut suunnittelussa prosessoriarkkitehtuuri ja valmistustekniikka sidottu toisiinsa. 10 nm prosessin viivästyminen on tarkoittanut, että myös prosessoriarkkitehtuuri on laahannut perässä. 14 nm prosessilla olisi päästy parempaan suorituskykyyn, jos tätä valmistustekniikkasidosta ei olisi ollut olemassa. Jotta tämän ongelman toistuminen voitaisiin välttää, jatkossa prosessoriarkkitehtuurit ja valmistustekniikat eivät ole sidoksissa toisiinsa, ja samaa prosessoriarkkitehtuuria saatetaan käyttää aiempaa enemmän eri valmistusprosessien kanssa.
Kuulemma AMD:llä vastaava suunnittelutavan muutos tehtiin silloin kun AMD oli ongelmissa, mitä tämä sitten käytännössä tarkoittaakaan.
Käsittääkseni AMD on jo pitkään (lähinnä kai rahaongelmien takia) käyttänyt täysin softan automaattisesti suunnitelmien mukaan luomia piiridesignejä siinä missä intel on kustomoinut jokaisen piirin designin valmistusprosessin mukaan paljon tarkemmin.
Tietääkseni kissasarjan ytimet olivat AMDn ainoat CPU-ydin, missä ei käytetytty custom-logiikkaa.
Ja niitä kissasarjan ytimiä sitten valmistettiinkin aika monella eri valmistustekniikalla (ainakin TSMC "40nm", Globalfoundries "28nm", TSMC "28nm", TSMC "16nm")
Luulis tekoälyn avulla ton piirisuunnitelun ulkoistaminen koneelle olevan tulevaisuudessa paljon parempi kuin ihmisen hitaasti tekemä työ.
En tiedä kuka piirisuunnitelutyökalut valmistaa mutta luulis tän tekoälybuumin aikana edes yrittävän moista.
Bulldozer-sarjan ongelmathan olivat osittain sen takia että syntetisoitu design ei kellottunut yhtä hyvin kuin käsin aseteltu design. Ryzen-sarjakin on ainakin suurimmaksi osaksi syntetisoitua piirisuunnittelua, näkee die-shoteista aivan päivänselvästi, Intelin prosessorit ja AMD kivet Phenomiin asti ovat siiistiä neliörakennetta, syntetisoidut piirit ovat tuollaista jääkukka-asetelmaa. Mahdollisesti jotain kriittisiä polkuja on voitu asemoida käsinkin mutta pääpiirteittäin piirit on täysin automatiikan layouttaamaa, tähän kai Intelkin viittasi.
AMD:llehan syntetisointi piireihin tuli ATI:n mukana, ATI:n tuotteet oli kaikki syntetisoitua ja samaa alettiin soveltaa prosessoreihin pian kaupan jälkeen.
Välimuistisetit on ainakin käsin tehtyä Zenissä ja Vegassa samaa osaamista hyödynnettiin Compute Unitien välimuisteissa
Nopeuskriiittisimmät polut, cache ja IO taitavat olla kaikissa käsilayouttia, myös kissasarjoissa. Mutta iso osa on prosessiriippumatonta automatisoitia layouttia toisin kuin vaikka Phenomissa tai Intelin piireissä joissa siisti neliörakenne on selvästi esillä koko piirissä.
Layoutin automatisointi vs käsin tekeminen on eri asia kuin custom-logiikan käyttö.
Valmistusprosessin mukana tulee kirjastot yleisimpien logiikkakomponenttien tekemiseen.
Näitä on esimerkiksi ihan perus-logiikkaportit, yleisimmät kiikkutyypit, jne.
Laitteistonkuvauskielen kääntäjä kääntää sen prosessorin laitteistonkuvauskielisen kuvauksen näiksi.
Mutta prosessorilla voidaan tarvia/haluta sellaisia komponentteja, joihin nämä standardikirjaston tarjoamat palikat on huonoja, tai joita sieltä ei löydy (jolloin ne pitäisi kasata monesta erillisestä hyvin epäoptimaalisesta palasta)
Eli voidaan tarvia esimerkiksi vielä nopeampia (mutta virtasyöpömpiä) rekistereitä tiettyihin erikoiskäyttötarkoituksiin, tai normaalin rekisterifileen ja siirtorekisterin yhdistelmiä tms. Ja silloin nämä pitää erikseen suunnitella valmistutekniikkakohtaisesti, toki niitä voi sitten ehkä myös käyttää muissakin sille valmistustekniikalle tulevissa piireissä.
Kissasarjan ytimet eivät käytä mitään tällaisia. Zen hyvin todennäköisesti käyttää, ja Bulldozer tietääkseni käyttää.
Layout tehdään melkein aina hierarakisest, osittain manuaalisesti, osittain automatisoidusti.