Sekä AMD että Intel tulevat julkaisemaan tänä vuonna uuden sukupolven prosessoreita. Julkaisujen lähestyessä nettiin on alkanut valumaan enemmän tai vähemmän luotettavina pidetyiltä tahoilta vuotoja kiihtyvään tahtiin.
Luotettavista vuodoistaan tuttu Golden Pig Upgrades on julkaissut Bilibilissä väitettyjä tietoja tulevista Zen 5 -arkkitehtuurin kuluttajaprosessoreista. Vuodon mukaan työpöydälle päätyvä Granite Ridge ja sen mobiiliversio Fire Range tulevat perustumaan kahteen CCD-siruun ja yhteen IOD-siruun kuten edeltävätkin sukupolven. Sen mukaan prosessorisiruissa tulisi olemaan edelleen maksimissaan kahdeksan ydintä per siru, eli yhteensä 16 ydintä, ja L3välimuistia tulisi olemaan X3D-malleissa maksimissaan 128 Mt kuten nytkin. Prosessorisirut valmistetaan TSMC:n N4- ja IOD-siru N6-prosessilla. IOD:n sanotaan perustuvan Raphaeliin eli Ryzen 7000 -sarjaan, mutta toisaalta siinä kerrotaan myös olevan RDNA 2:n sijasta RDNA 3 -grafiikkaohjain. Piireissä ei ole NPU-tekoälykiihdytintä.
Strix Point -prosessorit kannettaviin ovat aiempien vuotojen mukaisesti 12-ytiminen, mutta Golden Pig Upgrades tarkentaa sen tarkoittavan väitetysti neljää Zen 5- ja kahdeksaa Zen 5c -ydintä yhteensä 24 Mt:n L3 -välimuistilla. GPU perustuu RDNA 3.5 -arkkitehtuuriin jo sisältää maksimissaan 16 noin 2,6-2,7 GHz:n kellotaajuudella toimivaa CU-yksikköä. Tekoälykiihdytin tarjoaa yli 40 TOPSin suorituskyvyn ja vuotaja antaa tukensa myös uudelle Ryzen AI -nimeämiselle.
Strix Halo on kauan odotettu ”järeä APU-piiri” kuluttajapuolelle ja se perustuu useampaan eri siruun. Prosessorissa kerrotaan olevan maksimissaan kaksi 8-ytimistä Zen 5 CCD -sirua yhteensä 64 Mt:n L3-välimuistilla, mutta CCD-sirujen kerrotaan poikkeavan tavalla tai toisella Granite Ridgen siruista. Prosessorisirun rinnalla on GCD-grafiikkasiru maksimissaan 40 RDNA 3.5 Compute Unit -yksiköllä, 32 Mt:n Infinity Cache -välimuistilla sekä yhteensä 16 PCIe Gen 4 -linjalla. NPU sijaitsee oletettavasti GCD-sirulla ja tarjoaa jopa yli 70 TOPSin suorituskyvyn.
AMD:n tarjonnan tulee vuodon mukaan täydentämään Krackaniksi kutsuttu pienempi versio Strix Pointista. Monoliittisessa prosessorissa kerrotaan olevan neljä Zen 5- ja neljä Zen 5c -ydintä 16 Mt:n L3-välimuistilla sekä maksimissaan 8 CU:n RDNA 3.5 -grafiikkaohjain. NPU-tekoälykiihdytin on kuitenkin vastaava ja tarjoaa yli 40 TOPSin suorituskyvyn.
Intelin puolella tuorein väitetty vuoto koskee Arrow Lakeja eli Core Ultra 200 -sarjaa. Benchlifeltä lähtöisin olevien tietojen mukaan työpöydälle saataisiin ilman kerroinlukkoa 24-ytiminen (8P + 16E) Core Ultra 9 285K, 20-ytiminen (8P + 12E) Core Ultra 7 265K ja 14-ytiminen (6P + 8E) Core Ultra 5 245K. Kerroinlukon ja 65 watin TDP:n kanssa luvassa olisi puolestaan 24-ytiminen (8P+16E) Core Ultra 9 275, 20-ytiminen (8P-12E) Core Ultra 7 255 sekä 10-ytiminen (6P+4E) Core Ultra 5 240(F). Lisäksi luvassa on joukko niin ikään kerroinlukittuja T-malleja 35 watin TDP:llä. Tämän ja lukuisten muiden vuotojen myötä voitaneen pitää myös viimein varmana, että Intel on heittänyt hyvästit Hyper-threadingille ainakin toistaiseksi, sillä kukin prosessoreista tukee vain yhtä montaa säiettä, kuin ytimiäkin on. Myös Golden Pig Upgrades on omalta osaltaan kertonut samoista prosessorimalleista vähemmin yksityiskohdin.
Lähteet: Tom’s Hardware (1), (2), VideoCardz
Hyperthreadinging hylkääminen on aikamoinen uutinen, Muistaakseni se lanseerattiin core2 sarjassa, kuinka paljon tuo lisäsi suorituskykyä vai jäikö ns virtuaaliytimien hyöty marginaaliseksi, itse olen muutamassa koneessa ihan mielenkiinnosta kytkenyt ht:n pois päältä, enkä ole huomannut juuri mitään eroa.
Pentium 4 oli eka prossu jossa oli HT ja core2 sitä ei ollut ollenkaan.
Ei.
SMT tuli Intelillä ensin joissain Pentium 4-malleissa, mutta Core2ssa (joka perustui vanhempaan P6-arkkitehtuuriin) sitä ei ollut.
Se tuli uudelleen Nehalemissä (joka oli Intelin viimeinen P6-pohjainen mikroarkkitehtuuri).
Ja sitten se on ollut Sandy Bridgessä ja sen jatkokehitelmissä/Intelin myöhemmissä arkkitehtuureissa.
Ja siihen, paljonko siitä saa hyötyä vaikuttaa todella paljon
1) Mistä mikroarkkitehtuurista on kyse
2) Mitä softaa ajetaan
Pentium 4ssa liian pieni L1D-kakku, SMT sekä replay-mekanismi olivat todella huono yhdistelmä. Uudemmilla prossuilla hyöty siitä on ihan eri luokkaa kuin vanhoilla.
Kuviota myös sotkee myös se, että samaa markkinointinimeä "HyperThreading" Intel on käyttänyt kolmesta aivan eri tekniikasta,
normaaleissa PC-prossuissa se tarkoittaa SMTtä jossa ajetaan montaa säiettä yhtä aikaa, Itaniumissa sama markkinointisana tarkoitti coarse-grained-monisäikeistystä jossa säiettä vaihdettiin lähinnä välimuistihudin tullen eikä ajettu montaa säiettä yhtä aikaa. Ja ekan sukupolven atomissa se tarkoitti fine-grainded-monisäikeistystä jossa voitiin vaihdella säettä aina kellojakson välissä, mutta ei aloitetti yhtä aikaa käskyjen suoritusta monesta eri säikeestä.
Mutta tuollaiseen muutokseen on Intelillä varmasti hyvät syyt. Voi esim olla, että ilman HT:tä saavat enemmän laskentatehoa samalla sähkönkulutuksella, tai saavat enemmän laskentatehoa samalta piipalalta. Ja voi olla viime vuosina lisääntyneet prosessorien tietoturvaongelmatkin tuossa tekijänä, yksinkertainen on helpompaa tehdä turvalliseksi ja saada toimimaan oikein.
Mulle tulee mielikuva että HT hylkäämällä on tarkoitus säästää "wattibudjettia" kun nää ainakin pöytäkoneiden prossut alkaa olemaan varsinaisia moniydinhirvioitä noiden pikkuytimien kanssa.
Noi nimet on vähän…ultra 5 245k. Ultra 5 menisi mutta miksei sitten joku 250k pikemminkin.
Prosessorien nimeäminen on kyllä sellaista sillisalaattia, että ei tosikaan, miksi ei voitu pysyä vanhassa nimeämistavassa. Ai niin, koska core ultra kuulostaa pöhisevämmältä markkinointitekstissä.
Eihän se oikeastaan ollut tehty edes pelikäyttöä ajatellen, vaan käyttämään hyödyksi ajan kun prosessori ei tee mitään. Hyötysovelluksissa se antoi noin 20% parannuksen P4:lle aikanaan joka ei ollut huono millään lailla.
katso liitettä 1314248katso liitettä 1314249
Nämä luvut mainitsematta ollenkaan, mistä prossusta on kyse eivät kerro oikeastaan yhtään mitään.
Oikeasti ei ole mitään "yhtä tekniikkaa nimeltä hyperthreading". On vaan ziljoonan eri Intelin prossun kyky ajaa raudalla montaa säiettä, kolmea täysin eri vaihtoehtoista mekanismia käyttäen(eri prossuissa käytetty eri tekniikkaa). Ja sitten Intelin markkinointi kutsuu näitä kolmea täysin eri asiaa kaikkia nimellä "Hyperthreading".
Ja vaikka käytettäisiin samaa näistä kolmesta, hyöty riippuu todella paljon siitä, paljonko on tilaa välimuisteissa monen eri säikeen eniten käytetylle datalle, paljonko muuten olisi keskimäärin laskentayksikköjä idlaamassa yms.
Se, millainen hyöty siitä saadaan riippuu täysin siitä, mistä prossusta on kyse.
Tuossa kuvien lähde. Löytyi nopsaan käänteisellä kuvahaulla.
4C/4T vs 4C/8T vs 6C/6T
http://www.techpowerup.com
Test Bed Setup:
Intel i7-8700K @ 4.8GHz on all Cores
Hyprethreading disabled in the BIOS for 6C/6T tests
2 Cores disabled in the BIOS and Hyperthreading enabled in the BIOS for 4C/8T tests
2 Cores disabled in BIOS and Hyperthreading disabled in BIOS for 4C/4T tests
Corsair H110i GTX AIO Liquid CPU Cooler
AsRock Z370 Taichi Motherboard
32GB(4x8GB) Corsair Vengeance DDR4 @ 3000MHz
480GB Crucial MX200 SSD
PNY GTX1060 XLR8
Corsair HX850v2 PSU
”Kerroinlukon ja 65 watin TDP:n kanssa luvassa olisi puolestaan …” On nämä TDP-lukemat kyllä irtaantuneet todellisuudesta jo aika pahasti (aikoja sitten).
Noissa on se vähän huono että tuo natiivisti 6/12 prossu rajoitetaan jonnekin 4/8 tai 6/6, niin kaikissa tilanteissa sillä on kuitenkin prossun täysi L3 cache käytössä. Noi rajoitetut testit eivät vastaisi täysin natiiveja 4/8 ja 6/6 prossuja, joissa myöskin olisi aina hieman vähemmän cachea kuin tuossa 6/12 mallissa. Ja tuota cachea ei ainakaan millään julkisilla työkaluilla voi rajoittaa.
Tuolla oli ihan se mainittukin alussa.
Samaten hieman myöhemmin on Hardware Unboxedin testeissä muutaman vuoden takaa, tullut selväksi että pelit hyötyvät enemmän suuremmasta määrästä cachea, kuin suuremmasta määrästä ytimiä, tuolloin muistaakseni he olivat testanneet 8000 ja 9000 sarjan prossuja osin rajoitettuna. Useampaa prossua testattassa saa valittua L3 cachen määrän.