AMD kertoi marraskuun lopulla 24- ja 32-ytimisten 3. sukupolven Threadripper-tehoprosessoreiden lanseerauksen yhteydessä tuovansa tänä vuonna myyntiin myös maailman ensimmäisen 64-ytimisen x86-prosessorin eli 3990X-mallin. Tammikuun alussa CES-tapahtuman yhteydessä yhtiö paljasti prosessorin tarkemmat tekniset yksityiskohdat, antoi esimakua suorituskyvystä ja paljasti myynnin alkavan 7. helmikuuta.
3990X:n veroton suositushinta Yhdysvalloissa on 3990 dollaria ja Suomessa hintataso on julkaisun yhteydessä alkaen 4400 euroa eli se on tuplasti kalliimpi kuin 32-ytiminen 3970X-malli. Uutuus on heti saatavilla muutamien jälleenmyyjien varastoista.
AMD:n omien sanojen mukaan Ryzen Threadripper 3990X on suunnattu eliittityökuormille ja tiettyyn tarpeeseen. Todennäköisimmät käyttökohteet liittyvät esimerkiksi hyvin skaalautuvaan 3D-renderöintiin, ohjelmistojen kääntämiseen, 8k-videonkäsittelyyn, mutta suurin osa sovelluksista ei osaa tehokkaasti hyödyntää 64 ydintä. Jos 3990X-prosessoria ostaessa tarvitsee kysyä, mihin sitä on mahdollista hyödyntää, ei tarvetta niin suurelle määrälle ytimiä todennäköisesti ole.
Siinä missä 24- ja 32-ytimisissä 3. sukupolven Threadrippereissä prosessorialustalle on sijoitettu Globalfoundriesin 12 nanometrin prosessilla valmistetun I/O-sirun ympärille neljä TSMC:n 7 nanometrin prosessilla valmistettua pientä CCD- eli Core Compute Die -prosessorisirua, 64-ytimisessä 3990X-mallissa CCD-prosessorisiruja on kahdeksan kappaletta.
Jokainen CCD-piiri on Infinity Fabric -liitäntärajapinnalla yhteydessä I/O-piiriin ja samalla eroon on päästy 32-ytimisen 2. sukupolven Threadripperin NUMA- eli Non-Uniform Memory Access -arkkitehtuurin rajoitteista ja ongelmista.
7 nm:n CCD-prosessorisirut rakentuvat 3,9 miljardista transistorista ja niiden pinta-ala on 74 neliömillimetriä ja 12 nm:n I/O-siru rakentuu 8,34 miljardista transitorista ja sen pinta-ala on 416 neliömillimetriä. Prosessorisirut ovat identtisiä yhtiön 3. sukupolven Ryzen-prosessoreissa käytettävien prosessorisirujen kanssa, mutta I/O-piiri on liitäntöjensä osalta järeämpi.
3990X:ssä on käytössä SMT-teknologia, joten se kykenee suorittamaan samanaikaisesti jopa 128 säiettä, joka on varsin kunnioitusta herättävä näky Windowsin tehtävienhallinnassa. Nelikanavainen muistiohjain tukee virallisesti DDR4-3200-muisteja neljällä muistikammalla. Kahdeksalla muistikannalla keskusmuistia voi käyttää DDR4-2667-nopeudella 256 gigatavuun asti.
Prosessorin TDP-arvo on 280 wattia, kuten aiemmin lanseeratuilla 24- ja 32-ytimisillä malleilla. Myyntipakkauksen mukana ei toimiteta vakiojäähdytystä, vaan se pitää hankkia erikseen. Prosessori asentuu samaan uuteen TRX4-kantaan kuin 3960X- ja 3970X-mallit ja vaatii toimiakseen uuden TRX40-piirisarjaan perustuvan emolevyn BIOS-päivityksellä.
64-ytimisen 3990X-mallin peruskellotaajuus on 2,9 GHz ja Boost-ominaisuuden myötä kellotaajuus voi nousta maksimissaan 4,3 GHz:iin. L2- ja L3-välimuistia on yhteensä 288 megatavua.
Käytännön testeissä Cinebench R20 -testissä kaikkien ytimien rasituksessa Ryzen Threadripper 3990X toimi Cooler Masterin Wraith Ripper -ilmajäähdytyksellä noin 3150-3200 MHz:n kellotaajuudella ja yhden ytimen rasituksessa kellotaajuus nousi parhaimmillaan 4315 MHz:iin eli jopa hieman yli AMD:n ilmoittaman 4,3 GHz Boost-maksimitaajuuden.
Testikokoonpano
Suorituskykytesteissä AMD:n uutta 64-ytimistä 3990X-mallia verrattiin ensisijaisesti marraskuussa myyntiin saapuneeseen 32-ytimiseen 3970X-malliin. Testeissä on mukana vertailukohtina kaikki AMD:n ja Intelin uusimmat ja suorituskykyisimmät HEDT- ja työpöytäprosessorit.
Kaikilla alustoilla oli käytössä 32 gigatavua DDR4-3200-nopeudella toimivaa muistia 14-14-14-34-latensseilla.
Hintataso Suomessa 7.2.2020
- Ryzen 9 3900X: alkaen 540 €
- Core i9-9900KS: alkaen 600 €
- Ryzen Threadripper 2950X: alkaen 810 €
- Ryzen 9 3950X: alkaen 850 €
- Core i9-7980XE & 9980XE: alkaen 1025 €
- Core i9-10980XE: alkaen 1140 €
- Ryzen Threadripper 3960X: alkaen 1550 €
- Ryzen Threadripper 2990WX: alkaen 1650 €
- Ryzen Threadripper 3970X: alkaen 2190 €
- Ryzen Threadripper 3990X: alkaen 4490 €
Muiden komponenttien osalta avonaisessa testikokoonpanossa oli käytössä Gigabyten GeForce RTX 2080 Ti -näytönohjain, 64-bittinen Windows 10 Pro-käyttöjärjestelmän uusin 1909-versio ja testiohjelmat oli asennettuna M.2 SSD:lle ja virransyötöstä vastasi Cooler Masterin 850-wattinen V850-virtalähde.
TRX4-alusta:
- AMD Ryzen Threadripper 3960X (24/48 ydintä/säiettä)
- AMD Ryzen Threadripper 3970X (32/64 ydintä/säiettä)
- AMD Ryzen Threadripper 3990X (64/128 ydintä/säiettä)
- Asus ROG Zenith II Extreme (TRX40-piirisarja)
- 4 x 8 Gt G.Skill Flare X @ DDR4-3200 (14-14-14-34)
- Corsair MP600 2 Tt M.2 SSD (PCIe 4.0)
LGA 2066 -alusta:
- Intel Core i9-10980XE (18/36 ydintä/säiettä)
- Intel Core i9-7980XE (18/36 ydintä/säiettä)
- Asus ROG Rampage VI Extreme (X299-piirisarja)
- 4 x 8 Gt G.Skill TridentZ RGB @ DDR4-3200 (14-14-14-34)
- Samsung 970 Pro 512 Gt M.2 SSD (PCIe 3.0)
TR4-alusta:
- AMD Ryzen Threadripper 2950X (16/32 ydintä/säiettä)
- AMD Ryzen Threadripper 2990WX (32/64 ydintä/säiettä)
- Asus ROG Zenith Extreme (X299-piirisarja, BIOS: 2001)
- 4 x 8 Gt G.Skill Flare X @ DDR4-3200 (14-14-14-34)
- Corsair MP600 2 Tt M.2 SSD (PCIe 4.0)
AM4-alusta:
- AMD Ryzen 9 3900X (12/24 ydintä/säiettä)
- AMD Ryzen 9 3950X (16/32 ydintä/säiettä)
- Asus ROG Crosshair VIII Hero (X570-piirisarja, BIOS: 1105)
- 4 x 8 Gt G.Skill TridentZ RGB @ DDR4-3200 (14-14-14-34)
- Corsair MP600 2 Tt M.2 SSD (PCIe 4.0)
LGA 1151 -alusta:
- Intel Core i9-9900KS (8/16 ydintä/säiettä)
- Asus ROG Maximus XI Extreme (Z390-piirisarja)
- 4 x 8 Gt G.Skill TridentZ RGB @ DDR4-3200 (14-14-14-34)
- Samsung 970 Pro 512 Gt M.2 SSD (PCIe 3.0)
Muut komponentit:
- Gigabyte GeForce RTX 2080 Ti
- Cooler Master V850 (850 W)
- Microsoft Windows 10 Pro 64-bit (1909 build)
Prosessoritestit
Kuvien ja animaatioiden luontiin suunnatun Cinema 4D -ohjelman suorituskykyä simuloiva Cinebench R20 tukee AVX-käskyjä ja on kestoltaan pidempi kuin vanhempi R15-versio. Cinebench testattiin kaikilla prosessorisäikeillä ja vain yhdellä säikeellä.
Blender-renderöintitestissä oli käytössä legendaarinen BMW Benchmark -testi ja ohjelma osaa hyödyntää kaikkia prosessoriytimiä.
Threadripper 3990X:llä käytössä oli ohjelman tuore 2.81a-versio, joka osaa hyödyntää kaikkia 64 ydintä.
POV-Ray on suosittu säteenseurantaohjelma, josta löytyy sisäänrakennettu kaikkia ytimiä hyödyntävä testi. Myös POV-Raysta oli käytössä tuore versio, joka osaa hyödyntää kaikkia 64 ydintä.
V-Ray Next Benchmark on Chaos Groupin julkaisema testiohjelma, joka mittaa prosessorin suorituskykyä säteenseurannassa (Ray Tracing) ja osaa hyödyntää kaikkia ytimiä.
Corona on itsenäinen renderöintisovellus säteenseurantaan esimerkiksi 3ds Max- ja Maya-ohjelmistoilla. Corona 1.3 Benchmark -testi osaa hyödyntää kaikkia prosessoriytimiä ja antaa tuloksen renderöityinä säteinä sekunnissa (Rays/s).
7-Zip-ohjelman 19.00-versio osaa hyödyntää vain 32 ydintä, mutta uudemmalla 20.00 Alpha -versiolla saatiin käyttöön 64 ydintä. Testi mittaa prosessorin suorituskykyä LZMA-algoritmilla pakkauksessa, 20-version purkutulokset eivät ole vertailukelpoisia 19-version kanssa.
asmFishCP-shakkitesti laskee asemia / sekunti (Nodes). Testi ajettiin komennolla bench 1024 x 26 (x = prosessorin säikeiden lukumäärä). Parhaimpien tulosten saavuttamiseksi AMD:n prosessoreilla käytettiin popcnt-buildia ja Intelillä BMI2-buildia.
Handbrake-ohjelmalla enkoodattiin Fast 1080p30 -presetillä ja H.264-koodekilla (x264) 6,3 gigatavun kokoinen 3840×1714-resoluution .mov-video .mp4 -containeriin (lataa lähdevideo). Kuten tuloksista näkyy, H.264-enkoodaus ei osaa hyödyntää kovinkaan hyvin yli 16 ydintä.
Adobe Lightroom Classic CC:llä exportattiin 250 kpl RAW-kuvia JPG-formaattiin, kuvat pienennettiin 1920×1080-resoluutiolle ja tallennettiin. Operaatioon kulunut aika mitattiin sekuntikellolla.
Adobe Premiere Pro 2020:llä exportattiin 5 minuutin mittainen editoitu 3840×2160-resoluution videoprojekti H.264 YouTube 4K (2160P) -esiasetuksilla videotiedostoksi (40000 kbps). Operaatioon kulunut aika mitattiin sekuntikellolla.
DaVinci Resolve 16 on harrastajien keskuudessa suosittu videoeditointiohjelma, josta on saatavilla ilmainen versio. DaVincillä exportattiin sama 5 minuutin mittainen editoitu 3840×2160-resoluution videoprojekti kuin Premierellä YouTube 2160p -esiasetuksilla videotiedostoksi (10000 kbps). Operaatioon kulunut aika mitattiin sekuntikellolla.
AIDA64:n Memory Benchmark mittaa keskusmuistin muistiväylän kaistanleveyttä megatavuina sekunnissa luku-, kirjoitus- ja kopiointitesteissä. 3990X:n muistisuorituskyky oli samalla tasolla 24-ytimisen 3960X-mallin kanssa.
AIDA:n muistitesti ilmoittaa myös latenssin eli kuinka kauan kestää, kun prosessori pyytää (read command) ja hakee tietoa keskusmuistista. 3990X:n latenssi oli käytännössä samalla tasolla 32-ytimisen 3970X:n kanssa.
3D-testit
Näytönohjainten testimetodit
io-techin näytönohjaintesteissä suorituskykyä mitataan pelaamalla peliä 60 sekunnin ajan ja OCAT-sovelluksen avulla mitataan keskimääräinen ruudunpäivitysnopeus ja minimi, kun 1 % huonoimpia ruutuja jätetään huomioimatta. Kyseessä on tarkemmin ottaen 1. persentiili, kun ruutujen renderöintiajat on muutettu ruudunpäivitysnopeudeksi eli ruutua sekunnissa (FPS, Frame Per Second) ja järjestetty paremmuusjärjestykseen. Tavoitteena on jättää huomioimatta muutama yksittäinen muita hitaammin renderöity ruutu, joka on mahdollisesti poikkeustapaus.
Ajoimme pelitestit kaikkien testiprosessoreiden kesken 1920×1080-, 2560×1440- ja 3840×2160-resoluutioilla ja käytössä oli suorituskykyinen Gigabyten GeForce RTX 2080 Ti -näytönohjain, jotta näytönohjain ei olisi pullonkaulana.
Hyvin näytönohjainriippuvainen Shadow of the Tomb Raider testattiin Highest-kuvanlaatuasetuksilla pelaamalla peliä 60 sekunnin ajan ja tallentamalla OCAT-ohjelmalla keskimääräinen ruudunpäivitysnopeus ja minimi. 3990X:n suorituskyky oli testijoukon toiseksi paras.
F1 2019 testattiin Ultra High -kuvanlaatuasetuksilla pelaamalla peliä 60 sekunnin ajan ja tallentamalla OCAT-ohjelmalla keskimääräinen ruudunpäivitysnopeus ja minimi sateisella Singaporen radalla. Peli on jonkin verran prosessoririippuvainen ja 3990X:n suorituskyky oli todennäköisesti alhaisemmasta kellotaajuudesta johtuen 1080p- ja 1440p-resoluutioilla reilu viisi prosenttia heikompi kuin 24- ja 32-ytimisillä Threadrippereillä.
Tehonkulutus- ja lämpötilamittaukset
Tehonkulutusta mitattiin seinästä Cotech EMT707CTL -mittarilla, joka kertoo koko kokoonpanon tehonkulutuksen ilman näyttöä.
64-ytimisen 3990X-kokoonpanon tehonkulutukseksi mitattiin Cinebenchissä 8 wattia enemmän kuin 32-ytimisellä 3970X-kokoonpanolla.
64 ydintä pitävät huolen siitä, että 3990X:n 280 watin TDP-arvo tulee vastaan kaikkien ytimien rasituksessa melko alhaisilla kellotaajuuksilla. Cinebench R20 on 64 ytimelle liian nopea testi, eikä lämpötila ehtinyt nousta kuin 58 asteeseen. Pidempikestoisessa Blender-rasituksessa prosessorin lämpötila nousi Cooler Masterin Wraith Ripper -ilmajäähdytyksellä 63 asteeseen.
Huom! Suora lämpötilojen vertailu Intelin ja AMD:n prosessoreiden kesken ei ole mahdollista, sillä mittausprosessiin liittyy liian monta muuttujaa kahdella täysin erilaisella alustalla. Tulokset ovat suuntaa antavia.
Loppuyhteenveto
64-ytiminen Ryzen Threadripper on ultimaattinen työjuhta, joka alleviivaa AMD:n Zen 2 -arkkitehtuurin, 7 nanometrin viivanleveydellä valmistettavien pienten chiplet-piirien ja Infinity Fabric -liitäntärajapinnan skaalautumista 6-ytimisistä Ryzen-työpöytäprosessoreista 64-ytimisiin HEDT- ja palvelinprosessoreihin.
4490 euron hintainen Threadripper 3990X tarjoaa yhdessä prosessorikannassa vastaavan tai paremman suorituskyvyn, mitä aikaisemmin on saavutettu ainoastaan useamman prosessorin konfiguraatioilta, murto-osan hinnalla ja kuluttajille helposti saatavilla olevista komponenteista. 280 watin TDP-arvo pitää huolen siitä, että 64-ytiminen 3990X toimii samoilla emolevyillä kuin 24- ja 32-ytimiset mallit ja täydessä rasituksessa maltillinen kellotaajuus ja käyttöjännite saivat lämmöt pysymään kurissa ilmajäähdytykselläkin. Prosessorin kaveriksi kannattaa kuitenkin hankkia mahdollisimman tehokas jäähdytys.
Suorituskykytesteissä 3990X päihitti hyvin skaalautuvissa sovelluksissa Intelin tämän hetkisen suorituskykyisimmän HEDT-prosessorin eli reilun tuhannen euron hintaisen 18-ytimisen Core i9-10980XE:n jopa lähes kolminkertaisella erolla.
Hyvä skaalautuminen onkin 3990X:n tapauksessa avainasemassa sillä kaikki sovellukset eivät osaa tai pysty hyödyntämään 64 ydintä. Prosessorin tuleekin todennäköisimmin ostamaan henkilöt ja yritykset, joilla on hyvin spesifinen ja tiedossa oleva tarve mahdollisimman runsaalle määrälle prosessoriytimiä, joiden avulla voidaan säästää aikaa ja rahaa.
Nähtäväksi jää minkälaisilla keinoilla ja aikataululla Intel pääsee takaisin hevosen selkään ja kykenee haastamaan HEDT-markkinoilla AMD:n 3. sukupolven Threadripper-prosessorit niin suorituskyvyn kuin hinnan suhteen. Pelkästään pahasti myöhästyneen 10 nanometrin prosessin kuntoonsaamisella eroa ei kurota umpeen, vaan apua täytyy hakea entistä pienemmästä valmistustekniikasta ja yhtä isoa piisirua luovemmista ratkaisuista. Siihen asti AMD:lla vaikuttaisi olevan pullat todella hyvin uunissa, varsinkin kun päivitetystä Zen 3 -arkkitehtuurista on jo luvattu maistiaisia myöhemmin tänä vuonna.
Tai kääntää useampaa erää kerralla.
Pitäis.
Melkoinen työjuhta tuntuu kyllä olevan tuo 3990X, etenkin jos softa skaalaa ytimien mukaan. Mutta ei tuo paska tulos ole toisaalta myöskään yhden säikeen osalta. Eli jos vain on käyttöä tehoprossulle, niin tässä AMD antaa kyllä sitä kuuluisaa hunajaa sisällöntuottajille oikein kaksin käsin vieden Inteliä kuin sitä kuuluisaa kuoriämpäriä.
Sivuhuomiona silti mainittakoon, että hieman silti pisti muutamassa testeissä silmään tuo 2990WX hiekko suoristuskyky muutamassa testissä. Mistäköhän moinen…
NUMA-settien vuoksi, ei toimi kaikissa softissa niin kuin pitäisi
Katsos tuo tehon kulutus kun laskenta tehoa on!
Kyllä 64-bit Windows 10 tukee 256 corea ja max kahta eri cpu:ta.
From Microsoft – Windows 10 supports a maximum of two physical CPUs, but the number of logical processors or cores varies based on the processor architecture. A maximum of 32 cores is supported in 32-bit versions of Windows 8, whereas up to 256 cores are supported in the 64-bit versions.
Epäilen samaa tai itse asiassa siellä on 4kpl ryzenin piirejä mahdutettu samalle piirille.Intel kuitenkin toimitus vaikutuksissa.Se mikä toimii niin ei jaksa mitään high enddiä.
Kummelin Keijoa lainatakseni, jo on mylly!
Onhan tuo aivan sairas kivi, mutta hienoa että kehitys kehittyy. 10 vuotta sitten tehokkaimmissa HEDT-kivissä oli se 6 corea (i7-980X), ja pitkään mainstream-alusta junnasi sen 4 coren kanssa käytännössä. Kiitos AMD.
Sinne oli varmaan vahingossa jäänyt runkoon tekstit 10980xe-artikkelista, nyt on päivitetty ajantasalle.
Hardware unboxed oli saanut kellotettu 4ghz (yli 800w virrankulutus 2080Ti kanssa)mutta lämpötila oli korkea sekä itse videossa oli 3,7ghz käytössä.
Miksi nyt tehdään ja testataan kun itse prossu ollu jo tovin toimistolla?!
Ei tuo x265 myöskään skaalaa kovinkaan hyvin. Eikä SVT-AV1. Eli 3970x -> 3990x hyppy tuo vain 30% paremman suorituskyvyn.
target="_blank"
rel="nofollow noopener"
data-proxy-href="">
https://images.anandtech.com/graphs/graph15483/114663.png
data-unfurl="true" data-result-id="912" data-url="https://openbenchmarking.org/embed.php?i=2002079-VE-AMD3990XR16&sha=d9742a1&p=2" data-host="openbenchmarking.org" data-pending="true">
class="link link--external fauxBlockLink-blockLink"
target="_blank"
rel="nofollow noopener"
data-proxy-href="">
Lataa
openbenchmarking.org
Tässähän on tehty juuri kuten pitääkin, eli revikka pihalle NDA:n loputtua. Tänäänhän tämä on julkaistu.
Vai mitä meinaat? Ei näitä päivässä testata kaljatölkki kourassa, varsinkin kun ohella myös monta muutakin prossua jotka testataan samaa revikkaa varten. Kyseessä siis ei ole samanlainen tunnin testiajo kuin meillä harrastajilla, että ajetaan kerran Cinebench ja parit pelitestit.
Windows 10 enterprisellä saadaan joissain testeissä about 2x nopeusero pro:hon verrattuna.
Sitä minä meinasin.
Klo 16 testit linjoilla.
Hyvää duuniahan ukot painaa mutta aina ei ymmärrä…
Mitäköhän kevät tuo tullessaan. Himottaa jo saada 4000- sarjalaisista testejä vähitellen.
Kova peli. Tulevaisuudessa ehkä aika jo siirtyä h.265 pakkauseen testeissä?
2990WX oli vähän kuin erikoistyökalu tietyille kuormille (rendaukseen), ja hankalan muistiarkkitehtuurin takia se oli moneen käyttöön huono valinta. 3990X on oikeastaan tarkoitettu samoihin käyttökohteisiin, mutta toisin kuin 2990WX, siinä on selkeä muistiarkkitehtuuri ja siksi se ei ole varsinaisesti huono missään käytössä.
Ei varmaan:) Jo hinta karkottaa aika suuren osan jne. Toki sisällöntuottajalle, renderöijälle, kaaosteoreetikolle ja tähtitieteilijälle tuosta on iloa:)
Ja siksi tämä prossu onkin 3990X eikä 3990WX. Tuon 2990WX kanssa lisättiin nimeen W, koska se oli vain tietyntyyppiseen workstation työhön hankalamman muistiarkkitehtuurin kanssa. 3990X kanssa ei moista ongelmaa ole, ja tulokset kertoo sen suoraan.
Unohtuiko 9900K pois F1 2019 tuloksista? 10980XE tuloksissa se on mukana.
data-xf-init="lightbox"
data-lb-single-image="1"
data-lb-container-zoom="1"
data-lb-trigger=".js-lbImage-_xfUid-1-1581150882"
data-lb-id="_xfUid-1-1581150882">
Eli jos vain @Sampsa jaksaa, niin ajaisi vielä SMT off tulokset. Todennäköisesti paremmat kuin nyt saadut.
katso liitettä 343916
katso liitettä 343917
Joko on sulle tulossa testikappaletta?
Ei ole, en tiiä saako ollenkaan ja veikkaan että tuskin. AMD:n systeemit jäänyt mun kohdalla tosin heikolle.
Ryzen Masterista julkaistu eilen illalla uusi versio, jonka pitäisi toimia 3990X:n kanssa tai ylipäätään toimia paremmin. En saanut siis noita aiempia versiota käynnistymään kahdella eri Windows-asennuksella.
No ainakin siltä osin siis normisettiä AMD:ltä
Ei vaan onhan tuo tosiaan hieno näyte skaalautuvuudesta, vaikkei kyllä softat oikein ole kärryillä miten sitä pitäis käyttää.
Hiukan epäilyttää että miten järkevää tälläsiä on oikeasti edes firman käyttöön ostaa mutta onhan se hyvä että on tarjolla, suorituskykyä löytyy ainakin.
Ja jos firmalla on Pro for Workstation tai Enterprise -lisenssi Windowsista (tai Linux?) niin suorituskykyä löytyy vielä lisääkin.
Win10 Homella 3990X ei siis toimi lainkaan SMT-päällä (max 64 säiettä käyttiksen rajoitus), Prosta eteenpäin SMT toimii, mutta se näkyy Windowsille kahden socketin järjestelmänä (yli 64 säiettä = 2 socketia Windowsin mielestä) > Pron scheduleria ei ole optimoitu tällaiseen, mutta Pro for Workstation ja Enterprise versioiden scheduler on. AnandTechillä on tarkempia testejä eroista
Eli ainahan tälläisen hirmun järkevyys riippuu siitä mitä tekee. Olishan se itsellekkin kiva kun sen 10 kertaa vuodessa tekee rankempaa editointia etc, niin olis vääntöä tarjolla, mutta kun kone muina 320 päivänä vuodessa pyörisi lähinnä tyhjäkäynnillä, niin ei kande kotiin itse hankkia. Mutta jos työkseen rendaa, niin tämä tiputtaa rendausaikoja neljäsosaan ja 10 tunnin työssä se tuntuu jo paljon!
Processor Group rajoite (max 64 loogista CPUta/Group) on kyllä ihan WIN32 rajapinnan rajoite, eikä liity käytettävään versioon mitenkään. Jos tuosta haluaa yli, pitää säätää softaa tukemaan useampaa CPU-grouppia.
Jos on yhtään monimutkaisempi sovellus, jossa säikeitä pitää siirrellä ja ne ovat eri arvoisia (ei siis benchmark), tästä tulee nopeasti ihan oikea haaste (mutta ei toki mitenkään mahdoton, kunhan on vain ylimääräinen riesa koodareille). Tästä johtuen myös tuki useammalle cpu-groupille voi monessa softassa jäädä vajaaksi vielä pitkään.
Jos käyttää valmissoftaa kannattaa siis selvittää tukeeko se useampaa cpu-grouppia, jos on oma softa, kannattaa miettiä maksaako vaivaa koodata säikeistystä uusiksi vai kannattaako suoraan portata jollekin toiselle käyttikselle.
Pitää olla Windows server tai sitten Workstations tai Enterprice W10 jotta moinen fiitsöri toimii.
Eipä ollut aiemmin tullut mieleen, kun olen vain noiden server-versioiden kanssa puuhaillut isoilla koneilla.
Kyllä parempi vaihtoehto mielestäni olisi ajaa esim. 4 encoodausta samanaikaisesti, mutta tämähän pitäisi sitten tehdä kaikilla prosessoreilla ja jollain 8-core kivellä alkaisi sitten kestämään aikaa että noi 4 samanaikaista encoodausta valmistuu. Lisäksi ei ole mitään käryä että miten muistorohmu tuo 4 encoodausta olisi, että riittäisikö joku tuhnu 16 kikaa enää siihen.
Se h265 kyllä skaalautuu paremmin, ehkä yksi vaihtoehto olisi kokeilla reson nostoa ja suorittaa ne encoodaukset 8K resolla, jolloin tuon h264 pitäisi myös skaalautua paremmin.
Sama scheduleri siellä on. Se on vain konffattu eri tavalla.
’"System/ADvanced setting" -> optimize for background tasks:’ säätää millaisen aikaikkunan välein scheduleri uudelleenscheduloi säikeen. Historiallisista syistä työasemissa käytetään lyhyttä ja serveissä pitkää aikaikkunaa. Tuon olisi syytä olla "background services" kaikissa monen coren koneissa, mutta eipä olekaan ja tämä rupeaa maksamaan.
Samaa voi säätää tarkemmin Win32PrioritySeparation (KVG) rekisteriarvolla.
Scheduleri ei sitten toki ota kantaa miten sille on cpu:t raportoitu (128 säiettä pilkottu muka kahteen cpu:hun). Se vaan scheduloi processor grouppinsa sisällä.
No huoh… Muka pilkottu, ei se ole muka pilkottu kun se tosiaan pilkkoo sen.
data-xf-init="lightbox"
data-lb-single-image="1"
data-lb-container-zoom="1"
data-lb-trigger=".js-lbImage-_xfUid-1-1581284929"
data-lb-id="_xfUid-1-1581284929">
Jos lopputuloksena tarvii H.264 koodekilla pakettua videota, niin siinäpä siirtyy vaikka siihen H.265/HEVC pakkaukseen. Lopputuloksena on video jolla ei tee yhtään mitään kun ei ole yhteensopiva toistolaitteiden kanssa.
Tietenkin, mutta tässä ei ole kyse tuotantotyöstä vaan testistä. Testiohjelma rupeaa menettämään merkitystään testiohjelmana kun se ei enää skaalaudu kasvavan suorituskyvyn mukana. Se on toki edelleen oleellista tietoa sitä nimenomaista käyttäville ja joitain tällaisiakin sovelluksia on hyvä olla mukana muistuttamassa ettei kaikki skaalaudu, mutta se ei tarkoita että esimerkiksi kolme eri H.264-testiä on järkevää jos ne eivät skaalaudu.
Pitäisin suoranaisena ihmeenä jos tällä saralla Intel ottaisi AMD:n kiinni parissa vuodessa.
Tällä hetkellä intel pystyy käsittääkseni vain kahdella xeonilla vastaavaan, ja niidenkin hintalappu emolevyineen on viisinumeroinen ymmärtääkseni.
Riippuu varmaan ihan kuinka arvokasta se oma työaika on. Pidemmällä aikavälillä tuo kyllä maksaa itsensä takaisin takuuvarmasti.
Pidemmällä aikavälillä turhaan kulutettu aika tulee aina kalliimmaksi kuin kalliimpikin rauta, joten jos oikeasti tehdään hyvin säikeistyvää hommaa, niin tuosta on todella paljon hyötyä ja se on tehoonsa nähden halpa.
Päivätöissä käännän softaa ja teoriassa iso projekti säikeistyy varsin loistavasti. Tällä hetkellä alla i9-9900k joka kääntää koko roskan n. puolessatoista tunnissa. 64 ydintä siis olisi massiivinen boosti ajatuksen tasolla.
Käytännössä tosin koko projektia käännetään kerran-kaksi kuussa ja siinä välissä tehdään muutaman minuutin kestäviä iteratiivisia buildeja joista iso osa ajasta kirjoitetaan tiedostoja ja jonka ajan voi lukea koodia ja pohtia seuraavaa peliliikettä.
Eli tämä about 8x hintainen prosessori nopeuttaisi n. 2% työtaakasta luultavasti puoleen tai sinnepäin (käytännössä alkaa tulla riippuvuudet ja I/O vastaan). Jos huonosti käy niin osa ytimistä idlaisi työn puuttuessa, tosin pitäisi generoida riippuvuuskartta jos haluaisi oikeasti tietää monta säiettä saisi kerralla laulamaan.
Mutta pointtina se että vaikka kuinka tiettyä säikeistyvää työkuormaa nopeuttaisi niin ei sillä kyllä käytännön tasolla kovin usein saada merkittävää etua, varsinkaan jos työkuorman aikana voi säätää jotain muuta hyödyllistä. Toki varmaan löytyy tehtäviä jossa 90% ajasta on vain koneen ruksutusta, niihin varmasti tämä tuote on kuin nenä päähän vaikka työedut supistuukin:
data-xf-init="lightbox"
data-lb-single-image="1"
data-lb-container-zoom="1"
data-lb-trigger=".js-lbImage-_xfUid-1-1581326334"
data-lb-id="_xfUid-1-1581326334">
Kommentoi uutista tai artikkelia foorumilla (Kommentointi sivuston puolella toistakseksi pois käytöstä)
Lähetä palautetta / raportoi kirjoitusvirheestä