AMD:n toimitusjohtaja Lisa Su kertoi Computex-virtuaalimessujen keynote-esityksensä päätteeksi yhtiön edistysaskeleista piirivalmistuksen ja paketoinnin saralla. Su esitteli toimivaa prototyyppiä 12-ytimisestä Zen 3 -arkkitehtuurin Ryzen 9 5900X -prosessorista, jossa molempien TSMC:n 7 nanometrin prosessilla valmistettavien CCD- eli Core Chiplet Die -piirien päälle oli pinottu 64 megatavua ylimääräistä SRAM-muistia. 3D V-Cache -teknologian avulla prosessori L3-välimuistin koko on saatu kolminkertaistettua 192 megatavuun (32 + 64 Mt per CCD). SRAM-muistipiirin koko on 6 x 6 millimetriä (36 mm^2) eli noin puolet CCD-piirin pinta-alasta ja se oli liitetty piisiruun Through Silicon Vias -tekniikan avulla (TSVs). .
Käytännön demona AMD esitteli Ryzen 9 5900X -prosessoria toimimassa kiinteällä 4 GHz:n kellotaajuudella ja verrokkina oli vastaava 3D V-Cache -prosessorin prototyyppi. 3D V-Cachen mahdollistaman isomman L3-välimuistin avulla AMD kertoo ruudunpäivitysnopeuden paranevan peleissä Full HD -resoluutiolla keskimäärin 15 %.
- DOTA2 (Vulkan): +18%
- Gears 5 (DX12): +12%
- Monster Hunter World (DX11): +25%
- League of Legends (DX11): +4%
- Fortnite (DX12): +17%
AMD ilmoitti olevansa valmis ottamaan 3D V-Cache -teknologian käyttöön tämän vuoden lopulla. Samassa yhteydessä AMD varmisti olevansa 5 nanometrin valmistusprosessin kanssa aikataulussa ja tuovansa Zen 4 -prosessorit markkinoille ensi vuonna.
Lähde: AMD
Ok, mutta mikä on tämän tiedon lähde? Niin voisi mielellään sieltä lukea aiheesta hivenen lisää.
Sama prosessi mutta radikaalisti eri suunnittelukirjastot kun voi tehdä vain sramia ja niitä läpivientejä.
Siis sehän on TSMC:n SOLC ja vaikka heidän omia esittelysivujaan
TSMC-SoIC™ – Taiwan Semiconductor Manufacturing Company Limited
3dfabric.tsmc.com
No mutta tuossahan sanotaan heti että
The key features of SoIC technology include:
Enables the heterogeneous integration (HI) of known good dies (KGDs) with different chip sizes, functionalities and wafer node technologies.
(a) SoC before chip partition; (b), (c), (d) Variant partitioned chiplets and re-integrated schemes enabled by SoIC technology
SRAM-optimoidut kirjastot, ei se muita rajoituksia anna. On sillä V-ram chipletillä muutakin logiikkaa kuin vain srammia.
Näköjään, ei kuitenkaan ole tulossa ainakaan lähivuosina.
Niin SOLC käsittää kaiken 3d-paketoinnin, tarkemmin tuo käytetty tekniikka on SOLC-COW
Kuulemma ei ole, vaan Zen3 oli koko ajan suunniteltu mahdollistamaan tuo lisävälimuisti ja sen takia kun se ei sisällä yhtään mitään muuta kuin ne SRAMit se on saatukin niin pieneen tilaan.
Oli miten oli niin jos omistaa hyvän 500 sarjan emon niin kannattanee päivittää tähän ja odotelle toinen tai kolmas sukupolvi ddr5 muisteja. Jos taas rakentaa ihan uuden masiinan, niin sitten pitää miettiä. paljonko ddr5 maksaa ja jos odottelee zen4:n julkaisun. Paljonko zen4 on nopeampia ja kuinka paljon jää hintaeroa kun pulttaa sen saman 32 gigaa rammia molempiin.
Jos hinta on kohdallaan niin puhuit ympäri.
AMD-prosujen saatavuus tuntuu parantuneen viime aikoina. Jos juna on kääntynyt kesäksi kuten veikkaan, niin että tarjonta on saanut kysynnän kiinni ja mennyt ohikin, voi olla että Zen kolmosten pula-aika päättyy eikä välttämättä enää palaa kuin hetkeksi seuraavassa julkaisussa. Zen nelosen kohdalla mietityttää enempi muistien saatavuus. AMD voisi myös halutessaan antaa Intelin yksin selvittää uusien muistien alun lastentauteja julkisuudessa ja tulla valmiiseen pöytään kypsemmällä biossilla muutaman kuukauden viiveellä.
Jännitehallinta siirtyy muistikammalle niin voi ollakki jotain erikoisuuksia ekoissa muisteissa ja emoissa. Muuten samaa mieltä
Tarkoitin "lastentaudeilla" eri muistien, prosujen, emolevyjen/bios-versioiden eri yhdistelmien yhteensopivuutta.
Osa ongelmista voi olla "itse aiheutettuja", eli muistit toimii prosun ja/tai muistien standardia kovemmilla kelloilla ja silti odotetaan että ne toimii.
Anandtechin Ian Cutress oli sitä mieltä että Intelin kannattaisi viivyttää Alder lakea juuri siksi koska emolevyvalmistajat valitteli Ianin lähteiden mukaan etteivät ole alkuunkaan riittävän valmiita DDR5 massajulkaisuun.
Ja mitään IGPU:ta tuossa ei testattu vaan CPUn kykyä ruokkia näyttistä.
Niinnoh, olis hankala testata ku koko prossussa ei semmosta ole
OT OT. Koitin googlata paljonko i7 5775c integroitu GPU (128 MB edram) kulkee edram päällä ja pois päältä.
Ei löytynyt minuutissa ja luovutin. Ero voisi olla selvästi isompikin kuin 15 %.
Löytyi kumminkin video i7 5775c/RTX 2080 Cyberpunk testi edram on vs off. Ero on ihan samaa luokkaa kuin tällä Ryzenin tulossa olevalla 3d-cachella.
i7 5775c cache on isompi kuin Ryzenillä per ccx, mutta L4-tasoisena se on varmaan hitaampi.
Kai nyt tietokoneita muuhunkin käytetään kuin pelaamiseen?!?
4k resolle alkaa olemaan myös 144hz näyttöjä. Ei kaikki prossut jaksaa pyörittää kaikkia pelejä 4k:lla niin hyvin että sinnekin ei tarvittaisi lisää tehoa. Lisäksi näytönohjaimet aina kehittyvät nopeammin kuin prosessorit. Eli peli joka nyt pyörii vaikka 100 fps, pyörähtääkin jo seuraavalla sukupolvella noin 150fps+. Nopeasti tulee 4k:lle myös niitä cpu limit tilanteita, jos katsoo vain tulevaisuuteen ihan seuraavaankin sukupolveen asti (näytönohjaintahan useammin päivitetään kuin prosessoria).
Ei tossa prossussa ole integroitua näyttistä. Trollaatko vain?
Ei ole integroitua noissa Vermeer-johdannaisissa eli erillisellä
Ei tämä ole mikään luonnonlaki, vaikka näin onkin Sandy Bridgestä eteenpäin edetty vahvasti
Juu, tämäkin on totta. Jos näkis 4k benchmarkkeja, niin kertoisi enemmän
Erot on moderneilla peleillä luokkaa 1-2% satunnaisiin suuntiin. Vanhoilla peleillä tai erittäin matalilla kuvanlaatuasetuksilla ero on jotakuinkin sama kuin uutisen 15%.
Toki, mutta kun pääsääntöisesti peleissä vielä suurin skaalautuminen tulee siitä yhdensäikeen suorituskyvystä, ja näytönohjaimilla ytimiä lisäämällä. Niin on vaikea pysyä perässä. Hienoa on kyllä että yhdensäikeen suorituskyky on taas alkanut viimeaikoina nousta isommin harppauksin.
"Amdahlin laki". RTX 3000-sarjan näyttiksiä vertaamalla 3060…3090 ei löydy hidastumista, joka johtuisi tehtävän jakamisesta useammalle prosulle kun vain osa työvaiheista olisi rinnakkaistettavissa.
Peleissä prosun lisäytimien tuoma lisähyöty taitaa vähentyä nopeasti, mutta onhan tehtäviä jotka skaalautuu useille CPU-ytimille hyvin. Jos lisää prosun ytimiä, voi sanoa että prosu on kehittynyt mutta sitä käytetään väärään tarkoitukseen
Toki, mutta jostain syystä AMD päätti demota välimuistin tuomaa nopeusetua peleillä.
Ja se ei nykynäyttiksillä onnistu muuten kuin 720 tai 1080p resoilla jolloin näytönohjain ei ole missään tilanteesss pullonkaula.
Eikä se tosielämän pelaamista oikein vastaa mitenkään…
GPU pullonkaula näyttää tältä:
katso liitettä 621884
Esimerkiksi nopea 9600k (6/6) pätkii far cry 5 (gamernexus testi), vaikka keskimääräinen fps on hyvä.
AMD:n listasta löytyy useita esports pelejä. Noissa CPU on helposti pullonkaula vielä 1440p resollakin, Dota2 tästä hyvä esimerkki (ehkä nykynäyttiksillä olisi vielä 4k resollakin).
Vastaa siis kyllä jotenkin tosielämän pelaamista ja AMD:n pelivalinnoista käy vieläpä jotenkin ilmikin se, millaisia pelaajia nämä saattaisivat kiinnostaa.
Ne 0,1 j 1 fps low erotkin tulee vain siinä harvinaisessa tilanteessa että pelatessa on CPU pullonkaula.
Jos jarru on GPU niin 0,1 ja 1% low lukemat on hyvin samalla tavalla samalla viivalla avg fps:n kanssa.
Njoo, tämä menee siihen 300 vs 350fps kerhoon sitten aika useissa peleissä. Eroa saa paperille mutta merkitys pelikokemukseen ja etenkin veren maku suussa kilpapelaamiseen (jossa usei low detailit käytössä..) on mielestäni aika vähäinen.
Taitaa tosiaan olla että 4k on niin GPU rajoitteinen että aika "huono" CPU riittää.
katso liitettä 621974
Tästä Zen 3+ prosessorista ja jostain Nvidian alemman hintaluokan RTX näyttiksestä saisi täydellisen pelikonepakettin korkean frameraten Full HD pelailuun.
Pitäisi vaan optimoida jokaisen modernin pelin grafiikka-asetuksia maksimeista alaspäin, sekä hyödyntää pelin mahdollisesti tukemat DLSS 2.0 ja FSR ominaisuudet, että näyttis- ja prossukuorma lähestyisi kummatkin 100 % pelatessa, täten minimoiden pullonkaulaefektit.
Tuota, eikös prossukuorman nimenomaan haluta olevan reilusti alle 100%? Varsinkin jos käytössä Nvidian näyttis, kun niiden ajurit työntävät laskentaa prossulle ja jos sillä kuormitus maksimi niin näyttiksestä ei saa maksimitehoja irti.
Optimi on prossu ja GPU molemmat "tapissa", tietenkin, ihan näyttisestä riippumatta. Mahdoton toki saavuttaa useimmiten. Se onko asetukset siihen erit eri merkeillä on toinen juttu mikä tietenkin pitää ottaa huomioon siinä kuormia mitoittaessa.
Sillä ei niinkään ole väliä, mikä X86 valmistaja saa aikaan absoluuttisesti nopeimman ytimen. Jos ytimet ovat siinä "suurinpiirtein" kilpailukykyisiä, niin se voittaa suorituskykykisan, jolla on parhaimmat muistiohjaimet ja välimuistisysteemi niissä prossuissa.
Tämä pätee varsinkin, kun ydinten määrä kasvaa.
Edelleen näkisin mielenkiintoisena läppäriprossun, jossa olisi integroituna 8-16 gigaa HBM:ää siihen prossun kanssa.
Käyttöjärjestelmiä tulisi nyt kehittää siten, että ne hahmottaisivat systeemin muistin rakenteen paremmin ja jos systeemissä on esim 8 Gigaa erittäin nopeaa muistia ja 16 Gigaa hitaampaa muistia ja vaikka 16 Gigaa haihtumatonta muistia, niin niitä käytettäisiin siten, että nopeus saataisiin maksimoitua. Tietysti ohjelmille tulisi tarjota rajapinnat hallinnan auttamiseksi. (Esim kun ohjelma varaisi muistia, niin jos sen on oltava mahdollisimman nopeaa, niin se ilmotettaisiin samoin jos haluttaisiin käynistymisen nopeuttamiseksi jotain pysyvään muistiin, niin sekin kerrottaisiin.)
Käyttöjärjestelmän optimi oli joskus aikoinaan alle 90%. Jos mennään yli vuorontajat ruuhkautuvat eikä mitään muuta oikeastaan synny kuin lämpöä. Saattaa olla että nykyään päästään lähemmäksi sataa pinnaa mutta ei varmasti ole optimaalinen tilanne.
Optimi ainakin näyttiksille ei ole tapissa, tai frametimet alkanee kärsiä piikeistä ja inputlagi kasvaa (Battlenonsense joskus testaili tätä). Paljoa siitä ei tarvi pudottaa tosin, 90-95% on varmaan ihan ok tässä mielessä.
Tietysti optimiin liittyy myös sitten kysymyksiä lämpötiloista, jos 90% tarkoittaa myös 90°C:tä niin mielummin optimoi vähän vähemmälle.
Nolla-lähtötiedoilla aiheesta käsittäisin että "optimi" on ristiriitaista ja "optimia" ei välttämättä kannata haluta tai tavoitella.
ATK:ssa tuppaa kait olemaan optimaalista, että tietoa siirretään "purskeina". Eli suurinta osaa tiedosta kannattaa siirtää kohtuullisen kokoinen klöntti kerrallaan ja juuri silloin kun joku puskuri on täyttymässä tai aikaraja ylittyy. Pienissä viipaleissa tapahtuva liikuttelutyö haaskaisi resursseja.
Jos näin on, niin ei ole optimaalista, että näyttiksen ja prosun kuorma olisi koko ajan tasaista, koska tasaisuuden tavoittelu tuottaisi hitaamman lopputuloksen kuin esim. 60 % peruskuorma ja 40 % resursseista makaa suuren osan ajasta odottamassa satunnaisia purskeita, jotka pitää pystyä hoitamaan asap. Ja pelimoottorissa tehdyistä valinnoista riippuisi mikä on optimaalinen prosentti.
Tästä huolimatta olen ollut huomaavinaan että jotkut pelaamani pelit, joissa näyttis on asetusten takia pullonkaula, tuntuvat toimivan kivasti lähes 100 % GPU-käyttöasteella, kun koitetaan ylläpitää 144 Hz ja näyttis ei ihan pysty siihen, mutta sen lämpökuorma pysyy silloinkin hyvin hanskassa. Eli voi olla että 100 % CPU-käyttöaste tuottaisi herkemmin latenssipiikkejä kuin näyttispullonkaula, pelimoottorista riippuen.
Tämä vastaa sitä omaa käsitystäni. Eli jos prossukuorma on 100% ja tulee joku ylimääräinen taski taustalla niin siitä seuraa lagipiikki. 100% näyttiskuormitus on sit se, mitä haetaan.
To enable this, AMD flipped the CCX upside down (the core complex now faces the bottom of the chip, instead of the top), shaved 95% of the silicon on top of the upside-down core complexes, and then attaches the 3D V-Cache chips on top of this formation.
AMD Shares New Details on Their 3D V-Cache Tech for Zen 3+
http://www.techpowerup.com
100 % näyttiskuormitus on hyvä asia kun pelataan 3dmarkkia. Peleissä se tosiaan kasvattaa input lagia ja tekee siitä vähemmän tasaisen. Näytönohjainvalmistajilla on sitten omat erikoisasetuksensa, joilla tuota ongelmaa voi jonkinlaisella menestyksellä kompensoida 100 % käyttötilanteissa. Eiköhän prosessorinkin osalta ole sama tilanne – paras kokemus syntyy, kun ei käydä koskaan kolkuttelemassa sadan prosentin portteja.
Ja siis tietenkin niin, että peli olisi visuaalisesti upea ja siinä olisi paljon fysiikkalaskuja/paljon älykkäitä AI hahmoja. Joskus erehdytään käyttämään surkeasti optimoituja pelejä mittarina suorituskyvystä. Toimii, jos ideana on mitata kyseisen kokoonpanon suorituskykyä. Ei toimi korttien yleisenä nopeusmittarina, jos esim jokainen kokoonpano vetää 100% GPU kuormaa kun maan alle tesseloidaan vettä koko kortin voimalla
Koko prosenteista puhuminen menee tyhmäksi kun ymmärretään että prossu voi sekunnin aikana olla 50 kertaa täysin työttömänä ja 400 kertaa täystyöllistettynä. Aina kaiken "voisi tehdä nopeammin". 100% kuormitus tarkoittaa käytännössä sitä että homma alkaa jo sakkaamaan liian kovan kuorman takia ja kaikkea ei ehditä laskea.
Gpu saa mennä 100%, koska jossain sen pullonkaulan pitää olla. Gpu:lla se pullonkaula ei aiheuta isoja vaihteluja ruutujen välille, jolloin se pelikokemus jää parhaaksi.
Matalimmat ja stabiileimmat viiveet esim. kilpailulliseen pelaamiseen saadaan siten että sekä prossu että näyttis on alle sadassa prosentissa ja kuormaa rajoitetaan fps rajoittimella. Jos pelissä on kuitenkin todella vaihteleva kuorma, niin tuossakin lähestymistavassa on omat ongelmansa.
Toimivat kivasti mutta onko frametime-graafi sileä viiva, joka on siis minusta se optimitilanne huolimatta kenenkään tuntemuksista tai havaintokyvystä? Ei tuon perusteella, jos kerran näyttis ei kykene ylläpitämään sitä tavoitetta eli fps heiluu.
Mutta tässä tosiaan sitten päästään siihen että optimaalisella on monta merkitystä ja kun puhutaan moniosaisesta systeemistä sisäisin riippuvuksin sen määritys absoluuttisesti on melko mahdotonta.
Minulle optimaalinen GPU:n käyttö on tuo sileä frametime-graafi koska se on se mikä määrittää "sulavuuden", mutta joku toinen voi pitää optimaalisena sitä että GPU on "täysin hyödynnetty" (vaikka sillä minun mielestäni tuskin mitään merkityksellistä saadaan aikaan).