AMD esitteli marraskuun alussa tehokäyttäjille suunnatun HEDT- eli High-End Desktop-alustansa 3. sukupolven Ryzen Threadripper -prosessoreista 24- ja 32-ytimiset 3960X- ja 3970X-mallit ja myyntiin ne saapuvat tänään 25. marraskuuta. Lisäksi yhtiö kertoi tuovansa ensi vuonna myyntiin vielä entistä suorituskykyisemmän 64-ytimisen 3990X-mallin.
AMD on hinnoitellut Ryzen Threadripper 3960X:n 1399 dollariin ja 3970X:n 1999 dollariin ja niiden suomihinnat ovat 1595 euroa ja 2295 euroa. 2. sukupolven Threadripper-prosessorit jäävät vielä myyntiin tarjoten HEDT-budjettialustan 16, 24 ja 32 ytimellä. 16-ytiminen AM4-kantainen Ryzen 9 3950X edustaa puolestaan AMD:n työpöytäprosessoreiden terävintä kärkeä ja se on odotetusti hinnoiteltu 850 euroon.
Intelin puolelta lähin kilpailija on tänään myyntiin saapunut Cascade Lake-X -koodinimellinen 18-ytiminen Core i9-10980XE, jonka veroton suositushinta Yhdysvalloissa on 979 dollaria ja Suomessa alkaen 1150 euroa.
3. sukupolven Ryzen Threadripper -prosessorit pohjautuvat Zen 2 -arkkitehtuuriin ja käyttävät pikkupiirehin perustuvaa ns. chiplet-arkkitehtuuria ja 24- ja 32-ytimisissä malleissa prosessorialustalle on sijoitettu neljä TSMC:n 7 nanometrin prosessilla valmistettua pientä CCD- eli Core Compute Die -prosessorisirua ja yksi vanhemmalla Globalfoundriesin 12 nanometrin prosessilla valmistettu I/O-siru. CCD-piirit ovat Infinity Fabric -liitäntärajapinnalla yhteydessä I/O-piiriin ja samalla eroon on päästy 32-ytimisen 2. sukupolven Threadripperin NUMA- eli Non-Uniform Memory Access -arkkitehtuurin rajoitteista ja ongelmista.
7 nm:n CCD-prosessorisirut rakentuvat 3,9 miljardista transistorista ja niiden pinta-ala on 74 neliömillimetriä ja 12 nm:n I/O-siru rakentuu 8,34 miljardista transitorista ja sen pinta-ala on 416 neliömillimetriä. Prosessorisirut ovat identtisiä yhtiön 3. sukupolven Ryzen-prosessoreissa käytettävien prosessorisirujen kanssa, mutta I/O-piiri on liitäntöjensä osalta järeämpi.
Molemmissa prosessoreissa on käytössä SMT-teknologia, joten ne kykenevät suorittamaan samanaikaisesti 48 tai 64 säiettä. Nelikanavainen muistiohjain tukee virallisesti DDR4-3200-muisteja 256 gigatavuun asti. Molempien prosessoreiden TDP-arvo on 280 wattia, eikä myyntipakkauksen mukana toimiteta vakiojäähdytystä, vaan se pitää hankkia erikseen.
Prosessorit asentuvat uuteen TRX4-kantaan ja ne eivät ole taaksepäin yhteensopivia sTR4-kannan ja X399-emolevyjen kanssa. Uudet Threadripperit saavat rinnalleen Globalfoundriesin 14 nanometrin prosessilla valmistettavaan TRX40-piirisarjaan perustuvat emolevyt ja heti julkaisun yhteydessä emolevyvalmistajilta on tarjolla useita eri malleja. Piirisarjan TDP-arvoksi on ilmoitettu maksimissaan 15 wattia ja sitä jäähdytetään pienellä tuulettimella.
Alustalla tulee olemaan käytössä yhteensä 88 kappaletta PCI Express 4.0 -linjoja ja ne tukevat vastaavia ominaisuuksia muiden 3. sukupolven Ryzen -prosessoreiden kanssa. PCIe-linjoista yhteensä 16 on varattu prosessorin ja piirisarjan väliseen kommunikointiin (downlink & uplink). Lisäksi prosessorilta on käytettävissä 48 yleiskäyttöistä PCIe-linjaa ja piirisarjalta kahdeksan.
Sekä piirisarjalla että prosessorilla on lisäksi kaksi nelilinjaista PCIe-väylää, joista kukin voidaan jakaa joko yleiskäyttöisiksi PCIe x4 liittimiksi, x4 NVMe -liittimiksi tai neljäksi SATA-liittimeksi. Piirisarjan linjat voidaan konfiguroida tarvittaessa myös yhden PCIe x4:n sijasta kahdeksi PCIe x2:ksi. Piirisarjalla on PCIe-linjoista riippumatta käytössä aina neljä SATA-liitäntää. USB-liittimiä on tarjolla prosessorilta neljä (USB 3.2 Gen 2) ja piirisarjalta yhteensä 12 (8x USB 3.2 Gen 2, 4x USB 2.0).
Prosessoreiden esittely
AMD on 1. ja 2. sukupolven Ryzen Threadripper -prosessoreiden tavoin suunnitellut erikoisen myyntipakkauksen myös 3. sukupolven Threadrippereille. Prosessorin lisäksi pakkauksesta löytyy asennuksessa tarvittava oikealla momentilla varustettu torx-avain ja AIO-nestejäähdytyksiä varten kiinnitysadapteri TRX4-prosessorikannalle. Rehellisesti sanottuna myyntipakkauksessa ei ole mitään järkeä, siinä on logistisesti ajateltuna yli 90 % hukkatilaa ja se on täysin turhaa muoviroskaa.
Ryzen Threadripper 3960X
24-ytimisen 3960X-mallin peruskellotaajuus on 3,8 GHz ja Boost-ominaisuuden myötä kellotaajuus voi nousta maksimissaan 4,5 GHz:iin. L2- ja L3-välimuistia on yhteensä 140 megatavua.
Käytännön testeissä Cinebench R20 -testissä kaikkien ytimien rasituksessa Ryzen Threadripper 3960X toimi Cooler Masterin Wraith Ripper -ilmajäähdytyksellä noin 4020 MHz:n kellotaajuudella ja yhden ytimen rasituksessa kellotaajuus nousi parhaimmillaan 4465 MHz:iin eli hyvin lähelle AMD:n ilmoittamaa 4,5 GHz Boost-maksimitaajuutta.
Ryzen Threadripper 3970X
32-ytimisen 3970X-mallin peruskellotaajuus on 3,7 GHz ja Boost-ominaisuuden myötä kellotaajuus voi nousta maksimissaan 4,5 GHz:iin. L2- ja L3-välimuistia on yhteensä 144 megatavua.
Käytännön testeissä Cinebench R20 -testissä kaikkien ytimien rasituksessa Ryzen Threadripper 3970X toimi Cooler Masterin Wraith Ripper -ilmajäähdytyksellä noin 3840 MHz:n kellotaajuudella ja yhden ytimen rasituksessa kellotaajuus nousi parhaimmillaan 4445 MHz:iin eli hyvin lähelle AMD:n ilmoittamaa 4,5 GHz Boost-maksimitaajuutta.
Testikokoonpano
Testasimme molemmat uudet 3. sukupolven Ryzen Threadripper-prosessorit Asuksen uudella TRX40-piirisarjaan perustuvalla ROG Zenith II Extreme -emolevyllä. 2. sukupolven 16- ja 32-ytiminen Threadripper testatiin Asuksen X399-piirisarjaan perustuvalla ROG Zenith Extremellä. Ryzen 9 3950X- ja 3900X-työpöytäprosessorit testattiin Asuksen X570-piirisarjaan perustuvalla Crosshair VIII Hero -emolevyllä.
Intelin leiristä mukaan ajettiin testit yhtiön suorituskykyisimmällä työpöytäprosessorilla eli 8-ytimisellä Core i9-9900KS:llä ja alustana käytössä oli Asuksen Z390-piirisarjaan perustuva Maximus XI Extreme -emolevy. Kiitos Jimm’s PC-Storelle Core i9-9900KS:n toimittamisesta testiin.
Ajoimme tulokset myös Intelin HEDT-alustan 18-ytimisellä Core i9-7980XE -prosessorilla ja alustana käytössä oli Asuksen X299-piirisarjaan perustuva Rampave VI Extreme -emolevy. Core i9-7980XE on julkaistu pari vuotta sitten ja päivitetty viime vuonna 9980XE-mallilla, jonka kellotaajuus kaikkien ytimien rasituksessa on 400 MHz eli 12 % korkeampi (3,8 vs 3,4 GHz). Valitettavasti meillä ei ole 9980XE-mallia käsissä ja lisäksi Intel tuo 25. marraskuuta myyntiin Cascade Lake-X -koodinimelliset tehoprosessorit. Suorituskykyisin 18-ytiminen Core i9-10980XE toimii kaikkien ytimien rasituksessa edelleen 3,8 GHz:n kellotaajuudella mutta, yhden ytimen Turbo-taajuus on nostettu 4,8 GHz:iin.
Cinebench R20 -tulosten perusteella 9980XE on noin 4 % ja 10980XE noin 7 % suorituskykyisempi kuin tässä testissä käytetty Core i9-7980XE.
Kaikilla alustoilla oli käytössä 32 gigatavua DDR4-3200-nopeudella toimivaa muistia 14-14-14-34-latensseilla.
Hintataso Suomessa 25.11.2019
- Ryzen 9 3900X: alkaen 535 €
- Core i9-9900KS: alkaen 600 €
- Ryzen Threadripper 2950X: alkaen 800 €
- Ryzen 9 3950X: 850 €
- Core i9-7980XE & 9980XE: 1020 €
- Ryzen Threadripper 3960X: alkaen 1595
- Ryzen Threadripper 2990WX: alkaen 1770 €
- Ryzen Threadripper 3970X: alkaen 2295 €
Muiden komponenttien osalta avonaisessa testikokoonpanossa oli käytössä Gigabyten GeForce RTX 2080 Ti -näytönohjain, 64-bittinen Windows 10 Pro-käyttöjärjestelmän uusin 1909-versio ja testiohjelmat oli asennettuna M.2 SSD:lle ja virransyötöstä vastasi Cooler Masterin 850-wattinen V850-virtalähde.
TRX4-alusta:
- AMD Ryzen Threadripper 3960X (24/48 ydintä/säiettä)
- AMD Ryzen Threadripper 3970X (32/64 ydintä/säiettä)
- Asus ROG Zenith II Extreme (TRX40-piirisarja, BIOS: 0601)
- 4 x 8 Gt G.Skill Flare X @ DDR4-3200 (14-14-14-34)
- Corsair MP600 2 Tt M.2 SSD (PCIe 4.0)
TR4-alusta:
- AMD Ryzen Threadripper 2950X (16/32 ydintä/säiettä)
- AMD Ryzen Threadripper 2990WX (32/64 ydintä/säiettä)
- Asus ROG Zenith Extreme (X299-piirisarja, BIOS: 2001)
- 4 x 8 Gt G.Skill Flare X @ DDR4-3200 (14-14-14-34)
- Corsair MP600 2 Tt M.2 SSD (PCIe 4.0)
AM4-alusta:
- AMD Ryzen 9 3900X (12/24 ydintä/säiettä)
- AMD Ryzen 9 3950X (16/32 ydintä/säiettä)
- Asus ROG Crosshair VIII Hero (X570-piirisarja, BIOS: 1105)
- 4 x 8 Gt G.Skill TridentZ RGB @ DDR4-3200 (14-14-14-34)
- Corsair MP600 2 Tt M.2 SSD (PCIe 4.0)
LGA 1151 -alusta:
- Intel Core i9-9900KS (8/16 ydintä/säiettä)
- Asus ROG Maximus XI Extreme (Z390-piirisarja)
- 4 x 8 Gt G.Skill TridentZ RGB @ DDR4-3200 (14-14-14-34)
- Samsung 970 Pro 512 Gt M.2 SSD (PCIe 3.0)
LGA 2066 -alusta:
- Intel Core i9-7980XE (18/36 ydintä/säiettä)
- Asus ROG Rampage VI Extreme (X299-piirisarja)
- 4 x 8 Gt G.Skill TridentZ RGB @ DDR4-3200 (14-14-14-34)
- Samsung 970 Pro 512 Gt M.2 SSD (PCIe 3.0)
Muut komponentit:
- Gigabyte GeForce RTX 2080 Ti
- Cooler Master V850 (850 W)
- Microsoft Windows 10 Pro 64-bit (1909 build)
Prosessoritestit
Uudempi vuonna 2018 julkaistu Cinebench R20 tukee AVX-käskyjä ja on kestoltaan pidempi kuin aiempi R15-versio. Cinebench testattiin kaikilla prosessorisäikeillä ja vain yhdellä säikeellä.
Blender-renderöintitestissä oli käytössä legendaarinen BMW Benchmark -testi ja ohjelma osaa hyödyntää kaikkia prosessoriytimiä.
POV-Ray on suosittu säteenseurantaohjelma, josta löytyy sisäänrakennettu kaikkia ytimiä hyödyntävä testi.
V-Ray Next Benchmark on Chaos Groupin julkaisema testiohjelma, joka mittaa prosessorin suorituskykyä säteenseurannassa (Ray Tracing) ja osaa hyödyntää kaikkia ytimiä.
Corona on itsenäinen renderöintisovellus säteenseurantaan esimerkiksi 3ds Max- ja Maya-ohjelmistoilla. Corona 1.3 Benchmark -testi osaa hyödyntää kaikkia prosessoriytimiä ja antaa tuloksen renderöityinä säteinä sekunnissa (Rays/s).
7-Zip-ohjelman testi hyödyntää kaikkia prosessoriytimiä ja mittaa prosessorin suorituskykyä LZMA-algoritmilla pakkauksessa ja purussa.
asmFishCP-shakkitesti laskee asemia / sekunti (Nodes). Testi ajettiin komennolla bench 1024 x 26 (x = prosessorin säikeiden lukumäärä). Parhaimpien tulosten saavuttamiseksi AMD:n prosessoreilla käytettiin popcnt-buildia ja Intelillä BMI2-buildia.
Handbrake-ohjelmalla enkoodattiin Fast 1080p30 -presetillä ja H.264-koodekilla (x264) 6,3 gigatavun kokoinen 3840×1714-resoluution .mov-video .mp4 -containeriin (lataa lähdevideo).
Adobe Lightroom Classic CC:llä exportattiin 250 kpl RAW-kuvia JPG-formaattiin, kuvat pienennettiin 1920×1080-resoluutiolle ja tallennettiin. Operaatioon kulunut aika mitattiin sekuntikellolla.
Adobe Premiere Pro 2020:llä exportattiin 5 minuutin mittainen editoitu 3840×2160-resoluution videoprojekti H.264 YouTube 4K (2160P) -esiasetuksilla videotiedostoksi (40000 kbps). Operaatioon kulunut aika mitattiin sekuntikellolla.
DaVinci Resolve 16 on harrastajien keskuudessa suosittu videoeditointiohjelma, josta on saatavilla ilmainen versio. DaVincillä exportattiin sama 5 minuutin mittainen editoitu 3840×2160-resoluution videoprojekti kuin Premierellä YouTube 2160p -esiasetuksilla videotiedostoksi (10000 kbps). Operaatioon kulunut aika mitattiin sekuntikellolla.
AIDA64:n Memory Benchmark mittaa keskusmuistin muistiväylän kaistanleveyttä megatavuina sekunnissa luku-, kirjoitus- ja kopiointitesteissä. Threadripper 2950X:n nelikanvainen muistiohjain erottuu selkeästi edukseen Ryzen 9 3950X:n kaksikanavaiseen muistiohjaimeen verrattuna.
AIDA:n muistitesti ilmoittaa myös latenssin eli kuinka kauan kestää, kun prosessori pyytää (read command) ja hakee tietoa keskusmuistista. 3. sukupolven Threadrippereiden Chiplet-suunnittelun myötä keskusmuistin latenssi on noin 15 nanosekuntia hitaampi kuin 2. sukupolven 32-ytimisellä Threadripperilla, mutta 6-8 nanosekuntia nopeampi kuin 2. sukupolven 16-ytimisellä Threadripperilla.
3D-testit
Näytönohjainten testimetodit
io-techin näytönohjaintesteissä suorituskykyä mitataan pelaamalla peliä 60 sekunnin ajan ja OCAT-sovelluksen avulla mitataan keskimääräinen ruudunpäivitysnopeus ja minimi, kun 1 % huonoimpia ruutuja jätetään huomioimatta. Kyseessä on tarkemmin ottaen 1. persentiili, kun ruutujen renderöintiajat on muutettu ruudunpäivitysnopeudeksi eli ruutua sekunnissa (FPS, Frame Per Second) ja järjestetty paremmuusjärjestykseen. Tavoitteena on jättää huomioimatta muutama yksittäinen muita hitaammin renderöity ruutu, joka on mahdollisesti poikkeustapaus.
Ajoimme pelitestit kaikkien testiprosessoreiden kesken 1920×1080-, 2560×1440- ja 3840×2160-resoluutioilla ja käytössä oli suorituskykyinen Gigabyten GeForce RTX 2080 Ti -näytönohjain, jotta näytönohjain ei olisi pullonkaulana.
Battlefield V testattiin DirectX 12 -rajapinnalla Ultra-kuvanlaatuasetuksilla pelaamalla peliä 60 sekunnin ajan ja tallentamalla OCAT-ohjelmalla keskimääräinen ruudunpäivitysnopeus ja minimi Tirailleur-kentässä.
Shadow of the Tomb Raider testattiin Highest-kuvanlaatuasetuksilla pelaamalla peliä 60 sekunnin ajan ja tallentamalla OCAT-ohjelmalla keskimääräinen ruudunpäivitysnopeus ja minimi.
F1 2019 testattiin Ultra High -kuvanlaatuasetuksilla pelaamalla peliä 60 sekunnin ajan ja tallentamalla OCAT-ohjelmalla keskimääräinen ruudunpäivitysnopeus ja minimi sateisella Singaporen radalla.
Counter Strike: Global Offensivessa oli käytössä alhaiset kuvanlaatuasetukset ja käytimme FPS Benchmark -testiä keskimääräisen ruudunpäivitysnopeuden mittaamiseen.
Tehonkulutus- ja lämpötilamittaukset
Tehonkulutus- ja lämpötilamittauksissa prosessoreita rasitettiin Cinebench R20 -testillä, Handbrake-ohjelmalla H.264-enkoodauksella ja Battlefield V -pelillä. Kaikkia prosessoreita jäähdytettiin avonaisessa testipenkissä Noctuan NH-D15 -coolerilla ja kahdella 140 mm:n tuulettimella.
Tehonkulutusta mitattiin seinästä Cotech EMT707CTL -mittarilla, joka kertoo koko kokoonpanon tehonkulutuksen ilman näyttöä.
7 nanometrin prosessilla valmistettavian 3. sukupolven Threadripper-prosessoreilla kokoonpanon tehonkulutus Cinebench R20 -testissä oli yli 400 wattia. 32-ytimisen 3970X:n tehonkulutus oli noin 40 wattia korkeampi kuin 2. sukupolven 32-ytimisellä 2990WX:llä. Battlefield V:ssä 3. sukupolven Threadrippereiden tehonkulutus nousi yli 500 wattiin ja jopa 70 wattia korkeammalle kuin 2. sukupolven 32-ytimisellä 2990WX:llä.
Lämpötilat mitattiin AMD:n prosessoreilla Ryzen Master -ohjelmalla ja kyseessä on testin aikana mitattu maksimiarvo. Kaikkia muita prosessoreita jäähdytettiin Noctuan NH-D15-coolerilla, mutta se ei ole yhteensopiva Threadrippereiden kanssa, joten sillä oli käytössä Cooler Masterin valmistama Wraith Ripper -cooleri.
Uusien 3. sukupolven Threadrippereiden rasituslämmöt olivat selvästi korkeammat kuin 2. sukupolven Threadrippereillä. Cinebench R20 -testissä 3960X:n ja 3970X:n lämmöt pyörivät 75 asteen molemmin puolin ja Battlefield V -pelissä vajassa 70 asteessa. 2. sukupolven 32-ytimisellä Threadripperillä lämmöt olivat noin 20 astetta alhaisemmat.
Core i9-9900KS:llä Cinebench R20 -testissä lämpötila laski noin 30 sekunnissa 67 asteeseen, kun Turbo-ominaisuus laski kellotaajuutta ja pakotti prosessorin TDP-arvon 127 wattiin. Pelikäytössä 9900KS toimi koko ajan 5 GHz:n kellotaajuudella ja lämpötila oli selvästi testijoukon korkein eli 17 astetta korkeampi kuin 3950X:llä ja 22 astetta korkeampi kuin 3900X:llä.
Huom! Suora lämpötilojen vertailu Intelin ja AMD:n prosessoreiden kesken ei ole mahdollista, sillä mittausprosessiin liittyy liian monta muuttujaa kahdella täysin erilaisella alustalla, vaikka käytössä on sama cooleri. Tulokset ovat suuntaa antavia.
Ylikellotustestit
Testasimme 3. sukupolven Threadripper -prosessoreiden ylikellottamista manuaalisesti avonaisessa testipenkissä Cooler Masterin järeällä Wraith Ripper -coolerilla. Prosessoriytimien ylikellotuspotentiaalia haettiin suoraviivaisesti Cinebench R20 -testissä manuaalisessa tilassa kaikkia prosessoriytimien ylikellottaen.
Huom! io-techin testiprosessorit ovat AMD:n lähettämiä testikappaleitä, eikä kaupasta ostettuja retail-versioita, joten ylikellotustesteissä saavutetut tulokset ovat suuntaa antavia. Kannattaa huomioida, kun kokoonpano siirretään avonaisesta testipenkistä kotelon sisälle, lämmöt nousevat useammalla asteella.
Ryzen Threadripper 3960X
Manuaalisesti ylikellotettuna 24-ytiminen 3960X rullasi Cinebench R20 -testin vakaasti 4,35 GHz:n kellotaajuudella, kun prosessoriytimille syötettiin käyttöjännitettä 1,385 volttia. Prosessorin lämpötila nousi vakion 77 asteesta 89 asteeseen ja kokoonpanon tehonkulutus 412 watista 513 wattiin.
Ryzen Threadripper 3970X
Manuaalisesti ylikellotettuna 32-ytiminen 3970X rullasi Cinebench R20 -testin vakaasti 4,265 GHz:n kellotaajuudella, kun prosessoriytimille syötettiin käyttöjännitettä 1,35 volttia. Prosessorin lämpötila nousi vakion 74 asteesta 93 asteeseen ja kokoonpanon tehonkulutus 428 watista 610 wattiin.
Molemmille 3. sukupolven Threadripper-prosessoreille voi suositella custom loop -vesijäähdytystä niin vakiona kuin ylikellotettunakin.
Suorituskyky ylikellotettuna
3. sukupolven Threadripperit tarjoavat jo vakiona melko huimaa suorituskykyä, mutta ylikellotettuna 24-ytimisen 3960X:n tulos parani Cinebench R20:n kaikkien ytimien testissä 7,5 % ja 32-ytimisen 3970X:n 10 %.
Yhden ytimen 1T-testissä kellotaajuus oli molemmilla vakiona noin 4450 MHz, joten manuaalisilla ylikellotuksilla ja alhaisemmilla kellotaajuuksilla 1T-testin tulos laski laski noin 1,5 – 3,3 %.
Myös F1 2019 -pelissä keskimääräinen ruudunpäivitysnopeus laski manuaalisesti ylikellotettuna alhaisempien kellotaajuuksien takia, mutta hyvin marginaalisesti.
Loppuyhteenveto
3. sukupolven Threadripperit-tehoprosessorit jatkoivat siitä, mihin edellisviikolla io-techissä testatulla 16-ytimisellä Ryzen 9 3950X -työpöytäprosessorilla jäätiin. Prosessoritesteissä suorituskyky hyppäsi aivan uudelle tasolle ja samalla kaikissa taulukoissa asteikot piti työstää kokonaan uuteen uskoon. 24- ja 32-ytimiset 3. sukupolven Threadripperit ottivat selvän kaksoisvoiton kaikissa prosessoritesteissä ja pelitesteissä suorituskyky oli samalla tasolla AMD:n ja Intelin suorituskykyisimpien työpöytäprosessoreiden kanssa.
AMD tarjoaa tällä hetkellä tehokäyttäjille HEDT-alustallaan parasta suorituskykyä, mitä markkinoilta löytyy. Samalla uutuusprosessoreiden hintataso on nyt selvästi korkeampi kuin Intelillä, mutta rahoille saa myös vastinetta paremman suorituskyvyn muodossa eikä hinta määräydy sattumanvaraisesti tuhansiin tai yli kymmeneen tuhanteen euroon kilpailun puuttuessa.
32-ytiminen Threadripper 3970X oli prosessoritesteissä pääsääntöisesti noin 35-45 % suorituskykyisempi kuin 2. sukupolven 32-ytiminen Threadripper 2990WX. Joukosta löytyi kuitenkin muutamia testejä, joissa ero kasvoi isommaksi, johtuen todennäköisesti 2990WX:n NUMA-arkkitehtuurista, Windowsin schedulerista eli vuorottajasta tai sovelluskohtaisista ongelmista.
Intelin 18-ytimiseen Core i9-7980XE:hen verrattuna erot kasvoivat kaikkia ytimiä hyvin hyödyntävissä testeissä parhaimmillaan yli 100 %:iin, mutta osassa testejä erot olivat 25-50 % tasolla. Odotamme io-techin testiin parhaillaan Intelin uutta ja suorituskykyisintä HEDT-alustan Cascade Lake-X -koodinimellistä 18-ytimistä Core i9-10980XE -prosessoria, mutta se ei oletettavasti paranna Intelin asemia kuin muutamalla prosentilla. 1150 euron hintainen HEDT-alustan Core i9-10980XE -prosessori painiikin tällä hetkellä samassa sarjassa AMD:n 850 euron hintaisen 16-ytimisen Ryzen 9 3950X -työpöytäprosessorin kanssa.
Tehonkulutusmittauksissa 3. sukupolven Threadripper-kokoonpanot haukkasivat vakiona seinästä 400-500 wattia ja ylikellotettuna yli 600 wattia. 32-ytimisen 3970X:n tehonkulutus oli Cinebench R20:ssä noin 40 wattia korkeampi kuin 2. sukupolven 32-ytimisellä 2990WX:llä ja 70 wattia korkeampi Battlefield V:ssä. Myös lämmöntuotto oli 280 watin TDP-arvolla varustetuilla 3. sukupolven Threadrippereillä korkea ja jäähdytysratkaisuksi voi suositella niin tehokasta jäähdytystä kuin mahdollista. Ilmajäähdytyksellä lämmöt pysyivät 70-80 asteen välimaastossa, mutta ylikellotustesteissä ne karkasivat ilmalla päälle 90 asteeseen.
Ylikellotustesteissä molemmista prosessoreista saatiin puristettua manuaalisesti ylikellotettuna kaikkien ytimien suorituskykyä lisää 7,5 – 10 %, mutta vähäsäikeisiin sovelluksiin ja peleihin manuaalinen ylikellottaminen ei ole suositeltavaa, sillä Turbo-ominaisuudella kellotaajuus nousi 4450 MHz:iin eli hyvin lähelle AMD:n lupaamaa 4,5 GHz:n maksimitaajuutta.
Lyödäkseen lyötyä AMD ilmoitti vielä tuovansa ensi vuonna markkinoille 64-ytimisen Ryzen Threadripper 3990X -prosessorin, jonka kellotaajuuksista, hinnasta tai tarkasta myyntiintulopäivästä ei vielä ole tietoa. SMT-ominaisuudella prosessori kykenee kuitenkin käsittelemään yhtäaikaisesti 128 säiettä, se on varustettu yhteensä 288 megatavulla L2- ja L3-välimuistia, TDP-arvo on 280 wattia ja se sopii samaan TRX4-kantaan kuin 24- ja 32-ytimiset Threadripperit.
Hieno artikkeli! :tup:
Mieleenpainuvimmat jutut:
– CS:GO 9900K 666FPS 😀
– Adoben paska scaalaavuus vs. DaVinci
– Intelin 18c prossussa yhtä paska muistilatenssi kuin AMD:n vastaavissa(kertokoot viisaammat mistä johtuu ja miksei yllä samaan kuin oma 9900k?)
– Pelit rasittaa huomattavasti enemmän prossuja kuin cinebench? :btooth:
Mistä tämä käy ilmi? Virrankulutustestissä ero johtuu siitä, että kokoonpanossa on myös paljon syövä näytönohjain. Lämpötilatestissä taas prossu on kuumempi cinepelissä, kuin bäfässä :think:
Fire strike skaalautuu 16 threadiin asti, parhaat tulokset tulee kun ottaa tässä tapauksessa 2 ydintä ja hyperthreadingin käytöstä 18 ytimisellä.
Time spy extreme taas osaa käyttää ainakin 56 threadia. 15 korkeinta cpu scorea on xeon 3175x jonka jälkeen alkaa näkymään jo uusia threadrippereitä.
Huomenissa pitäisi tulla 3960x, 64gb mem, Msi Creator emo ja Dark rock pro 5 ilmäjäähy.
Mites tuo lämpötahna pitäis laittaa? Tasainen kerros prossun päälle, vaiko X marks the spot.
Kyseessä Arctics MX-4 lämpötahna.
Odottelen vielä sopivaa AIO-jäähyä tulevaksi. Vielä on hieman epävarma olo, että minkälaisen AIO:n
hankkis myöhemmin.
Tarkoitat varmaan Dark Rock Pro TR4?
Itse laappasin muovilastalla hyvin ohuen ja tasaisen lähes läpikuultavan kerroksen koko IHSn päälle.
Tuo on se miten itse olen laittanut jo vuosikymmenet lämpötahnan. Tällöin koko alue IHS:tä on katettu lämpötahnalla, eikä jää kyseenalaisia kohtia ottamatta kontaktia prosessorijäähdyttimeen, jolloin lämpö siirtyy koko alueelta sinne mihin se pitääkin siirtää. Nimenomaan tuollainen määrä levitettynä, että lämpötahnan läpi kuultaa IHS hieman alta.
Samoin olen myös itse tehnyt. Kiitoksia ja jännityksellä jäädään odottamaan prossun lämpötiloja.
Intelin hyvin peleissä menestyvät matalalatenssiset prossut on ringbus topologialla. Mutta toistaiseksi ringbus ei skaalaudu kuin kahdeksaan ytimeen ja siitä yli mentäessä siirrytään mesh topologiaan joka on tuntuvasti heikompi.
Itse olen käyttänyt X ja hyvin levittynyt koko pohjan alalle, videolla näkyy asennus meidän Youtube-kanavalla
Aika vahvasti kuriositeetti-linjalle mennään mutta onko näiden threadrippereiden pelisuorituskykyä testattu smt disabloituna missään?
Jotkut pelit kuten Far Cry 5 eivät toimi kunnolla noin suurella määrällä säikeitä, sellaisiin tapauksiin Ryzen Masterilla Game Mode käyttöön joka disabloi SMT:n
Eikö ole olemassa mitään työkalua, jolla esim sen pelin saa lukittua vain tietyille rajatuille coreille (esim 1-4)?
Process lassolla onnistuu mut farcry pelien ongelma on ollut myös se että jos peli näkee suuren määrän suorittimia niin se ottaa ja kaatuu 😀
… laatupelejä
Vaikka ihan task managerilla kun olet pelin käynnistänyt. Sieltä napsuttelet CPU affinity valinnoista vaikka coret 0-3, voit toki napsutella vaikka 0,1, 14 ja 15 (16C lastulla) mutta se on melkoisen epäoptimaalinen conffi toki. 🙂
Pysyvän profiilin tekoon ainakin joskus piti käyttää jotain työkalua. EOS miten nykyisin, tulee niin vähän wintendoiltua.
Joo helposti saa rajattua pelin käytössä olevat ytimet task managerilla, komentoriviltä tai process lassolla. Ongelmana on lähinnä se, että jos peli kysyy käyttöjärjestelmältä että montako ydintä on olemassa, niin se kertoo täyden määrän ton rajoitetun määrän sijaan ja saattaa tehdä aivan pöhköjä rinnakkaistusvalintoja sen tiedon pohjalta.
Monesti noissa moniydinprossuilla huonosti pyörivissä peleissä saatetaan aivan turhaan jakaa tehtävät niin pieniin osiin, että vastausten keräämiseen menee enemmän aikaa kuin siihen laskemiseen. Ts. joku onglema pilkotaan vaikka 64 osaan vaikka prosessorista riippumatta se laskettaisiin nopeiten esimerkiksi max. neljän säikeen voimin, jolloin synkronointiin menevä aika ei räjähdä liian isoksi. Ohjelmoidessa siis on tehty jotain oletuksia (maksimi)ydinmäärästä sen sijaan että tutkittais limitit joiden yli ei vaan kannata edes yrittää rinnakkaistaa jotain tiettyjä ongelmia. Periaatteessa ei ole mitään oikeaa syytä sille että joku peli pyöris nopeammin pienemmällä ydinmäärällä, vaan kyseessä on aina huono säikeistyksen optimointi.
Kun kerran voidaan virtualisoida koko tietokone, niin eikö ohjelmaa nyt vain voida käynnistää jonkun loaderin läpi, joka virtualisoisi esim pelkän prossun halutun kaltaiseksi ko ohjelman osalta. Eli kysyipä tai tutkipa ohjelma asiaa miten tahansa, niin sen maailmassa koneessa olisi aina esim 4C8T prossu..
Käyttiksen affinity-rajoitukset ihan riittävät tuohon, jos käyttää rajapintoja oikein. Se on softantekijän oma vika, jos on rakennellut isompia himmeleitä olettamaan asioita prosessorista. Mitä virtualisointiin tulee, säikeethän ovat jo käskyjonojen "virtualisointia". Käyttis heiluttaa tahtipuikkoja tuossa ja päättää kenen prosessilla on lupa suorittaa milloin ja missä.
Ihan command promptilla voi säätää affinityn käynnistyksessä vaikka batin avulla. Voi toki olla eri asia paljon softa havainnoi käyttiksen läpi ytimiä.
Mutta mikään muu ei farcy peleihin auta kuin pelin näkemien prossujen määrän pudottaminen.
Se ei millään affiniteetilla korjaudu että jos peli näkee 32 ydintä niin se kaatuu 😀
Kyllä voi! Microsoftia vaan syyttämään siitä että hommat on miten on. Linux puolella käsittääkseni onnistuu läpinäkyvämmin vastaavat säädöt.
Jep, koska se ei varmaan kysele mitään käyttäen siihen tarkoitettuja apeja, vaan se on kovakoodattu kaatumaan tilanteissa jossa sitä ei ajeta n. 4 ytimisellä intelin prossulla XD.
Paskasti koodattu softa. Otetaan toiseksi esimerkiksi vaikkapa GNU make. Softa on vanha kuin taivas ja tukenut useampaa ydintä ihan aikojen alusta (melkein). Muistan kun joskus oli dual-socket Pentium 2 pöydällä, niin siinäkin sai jo monta ydintä käyttöön (tietenkin yksi ydin per CPU sen aikaisissa). Unix-koneissa sai enemmän kun oli parempaa rautaa. Nykyisin ajanut make -j32, eikä mitään merkkiä kaatuilusta.
Veikkaan että make:ssa ei ole mitään keinotekoista rajaa (en jaksa etsiä sorsista). Jonkun pointterin perässä ne threadit on, että sen pointterin bittisyys määrittää maksimin, jos se on yli 16bit pointteri niin ihan varmana leviää kerneli/scheduleri käsiin. Tosin ennen lie tulee reaaliongelmaksi ongelmaksi löytää kone jossa on niin paljon coreja, että se pointteri loppuu kesken (pois lukien tuo 16bit tapaus jossa usignedilläkin "vain" 65+k corea riittää).
Koodin kääntäminen toki on myös kivasti rinnakkaistuva ongelma, ei tarvi tehdä keinotekoisia rajoja. Pelimoottorissa voi hyvinkin tarvita, mutta sen ny voi koodailla silti niin ettei se kosahda ympäri jos on liian monta corea. 😀
Ei käytännössä missään ole mitään 16-bittisiä pointtereita enää. Pointterit on 64-bittisiä 64-bittisessä käyttiksessä. Tarkoittanet jotain muuta kuin pointteria puhuessasi pointterista.
Koodin kääntämisen rinnakkaistus on itseasiassa monimutkaisempi juttu, kuin mitä triviaalisti luulisi.
Tyypillisessä makefileessä käännellään ensin kooditiedostot objektitiedostoiksi, ja sen jälkeen ne linkataan yhteen.
Ja käytännössä tuo linkkaus on täysin yhdessä prosessissa ja säikeessä ajettava ei-rinnakkaistumaton asia, jonka voi tehdä vasta kun kaikki kooditiedostot on ensin käännetty.
Eli, meillä on kaksi eri työvaihetta, toinen rinnakkaistuu (melkein) kooditiedostojen määrän verran, toinen ei yhtään.
Ja perinteinen make tyypillisesti oletuksena ajetaan yhdelle hakemistolle kerrallaan, ja se sitten kutsuu rekursiivisesti alihakemistoille makea, mutta kerralla siis käännetään vain yhtä hakemistoa.
Jos koodi on sijoiteltu suureen määrän hakemistoja joissa jokaisessa on melko pieni määrä kooditiedostoja, rinnakkaistus ei ole kovin hyvää.
Eli pitäisi myös rinnakkaistaa eri hakemistojen kääntäminen rinnakkain, että saisi rinnakkaisuutta tarpeeksi, mutta koska niitä kutsutaan normaalisti rekursiivisesti, säikeiden määrää olisi silloin vaikea rajoittaa, ja riskinä olisi helposti laukoa eksponentiaalinen määrä säikeitä hakemistorakenteen hierarkian syvyyteen nähden. (minkä takia se make ei siis tee tätä oletuksena)
Eli käytännössä jos halutaan hyvin rinnakkaistuvaa kääntösysteemiä, pitääkin se ehkä tehdä jollain muulla kuin makella, tai vähintään käyttää makea hyvin eri tavalla kuin miten sitä on perinteisesti totuttu käyttämään.
Lisäksi erityisesti melko oliopohjaisessa C++-koodissa (ainakin jos siinä käytetään paljon esim. templateja) tulee vastaan helposti sellainen ongelma, että suuurin osa kääntöajasta ei itse asiassa usein kulu varsinaiseen koodin kääntämiseen, vaan siihen, että preprosessori parsii headeita, kun koodi inkludoi vaikka mitä jotka taas ne inkludoivat vaikka mitä, jotka inkludoivat vaikka mitä, ja tämä headerien parsiminen vie saman määrän aikaa, olisi varsinainen koodi hyvin lyhyt tai hyvin pitkä. Tämä tarkoittaa sitä, että jos halutaan vähentää tähän kuluvaa turhaa työtä, kannattaakin samaan kooditiedostoon laittaa mahdollisimman paljon koodia, ja minimoida kooditiedostojen määrä – mikä taas on rinnakkaistamisen kannalta huono.
Isot softaprojektit ovat kyllä usein optimoineet koodin sijoitteluaan tiedostoihin ja kääntöjärjestelmiään aika paljonkin, jotta aikaa ei kulu turhiin headerien parsimisiin, mutta silti saadaan hyödynnettyä paljon rinnakkaisuutta, jotta ne kääntyvät siedettävän nopeasti ja hyötyvät suuresta määrästä ytimiä – mutta sen tekemiseen on jouduttu näkemään paljon vaivaa.
Ihan windowsin start.exe komennolla toi onnistuu käyttämällä /affinity vipua. Sen hex mäskin säätäminen on vaan hiukan työlästä, mutta kun sellaiset yleiset mäskit laittaa jonnekkin jemmaan niin ei senkään kanssa tartte sen enempää ihmetellä kuin sen kerran.
Tuon saa viriteltyä vielä ihan shortcutin kautta toimivaksi, testattu on.
Njoo, en missään kohtaa tarkoittanut, että make olisi hyvä esimerkki tehokkaasta ohjelmasta. Pointti oli vaan, että se on aika vanha työkalu ja testatusti on tukenut nykyisiä prosessimääriä jo pitkään. Nykyisten pelien yms. kaatuilu 4-32 ytimellä on jotain ihan muuta.
<ot>Periaatteessa C++:n moduulien pitäisi jossain määrin auttaa tuohon. Jos ajatellaan sen verran laatikon ulkopuolelta, että ei rajoituta esikääntäjää käyttäviin kieliin (C/C++), niin olioparadigmassa tai templateissa ei sinällään ole rinnakkaistumista estäviä piirteitä niin paljon kuin voisi kuvitella. Lex+parse on perinteisissä ei-optimoivissa kääntäjissä moninkerroin raskaampi operaatio kuin koko loppu pipeline (ja linkkeriä on nykyään alettu mm. LLVM-projektissa rinnakkaistaa myös). Kuitenkin jos kieli ei käytä esikääntäjää, jokaisen moduulin voi jäsentää täysin itsenäisesti. Symboliviittausten ratkonta ja namespacet tuohon päälle ovat 1% siitä ajasta mitä jäsennys, riippuen tietty jäsennysalgoritmista. Jäsentämisessä voi yllättäen levy tulla pullonkaulaksi, kun pitäisi tehdä pieniä lukuja monen tiedoston kanssa rinnan. Levyn optimointiin yksi hopealuoti on käyttää tmpfs:ää. Näin siis jos on tosi kiire. Voidaan myös optimoida siinä, että jos tiedetään projektin käyttävän kaikkia moduuleitaan, voidaan iteroida sorsakoodin hakemistopuu läpi optimaalisesti eikä odotella kunnes tiedostot "löydetään" includeista. Includeilla vasta linkitettäisiin TU:t toisiinsa kun moduulien symbolinimiä aletaan ratkoa. Kieliopilla pystyy hiukan optimoimaan sitä, kuinka paljon viittauksia pitää ratkoa. Ja kaiken kukkuraksi kun on käännetty, ei ole järkeä heittää kaikkea pois vaan esim. kytkeä inotifyllä levyjärjestelmään ja päivittää AST vähän samaan tapaan kuin mitä virtual DOM -hommelit webbipuolellla.. tässäkin hyötyä jos käytössä jokin dataflow-koodausta tukeva funktionaalinen kieli eikä imperatiivinen paske.</ot>
Huom! Wraiht Ripper:in tuuletin on asennettu tehtaalla väärin päin cooleriin!
Vaihdoin tuulettimen suuntaa. Aiemmin se puhalsi suoraan kopan etuosaan ja lisäsi sekä lämpötiloja että ääntä. Nyt kone on paljon hiljaisempi ja lämpötilat tippuivat 10C.
Wraiht Ripperin coolerista irrotetaan alhaalta ruuvit ja sen jälkeen otetaan varovasti coolerin muovikuori päädyistä napsauttamalla. Älä riko muovin sivuilla olevia kumireunoja.
Itse cooleria pitää kiinni kaksi pyöreäpäistä ruuvia sekä muovinapsut. Ruuvit ovat pyöreäpäisiä, jottei kukaan saisi helposti niitä auki. Laita ruuvin sekä ruuvimeisselin väliin paksua kumilenksua ja väännä suoraan ylhäältä , näin ruuvit saa irti. Tämän jälkeen tuuletin pitää varovasti hivauttaa pois coolerista ja kääntää toisin päin, jotta kuuma ilma menee oikealla tavalla kopasta ulos.
Nyt kone hyrrää idlessä ihan mukavasti, eikä huuda jatkuvaa soittoa.
Jouluja kaikille!
edit: väärä hälyytys
Eikös sampsalla ollu jossai striimi koneessa dripperiä jo ennestään. Ainaki huomannu et noitä hyödynetty juuri striimikäytössä ellen ihan väärässä ole. Parhainta kuitenkin et amd iskeny joka osa alueelle ja nyt saamme kilpailun myötä vastinetta rahalle eikä tarvii yli hintaa maksaa kun kilpailua ei ole.
Oma 3970X + Zenith II + 128Gb DDR4 + RTX 2080Ti kone ollut nyt muutaman päivän kasassa ja jonkin verran ehtinyt tässä testejä ajelemaan. Photogrammetria- ja laserkeilauksen rekisteröintiohjelmilla ja lopputulos on se, että joka euron arvoinen setti on kasassa. Esim. Pix4D:llä saman projektin pyöräyttämiseen meni 2700X + 32Gb + 1080Ti aikaa 2:45:35. Tämä Theadripper vetää saman 35:49
Sulla on 4000€ softa kotikäytössä?
Selvästi on käytössä joko kotona tai yrityksessä, MUTTA mitä merkitystä?!
Hyvä, että joku on testannut noilla prossuilla ja jakaa testituloksen!
Eikä se 4000e jostain softasta ole edes paljon, jos tekee hommia sillä.
Toiminimelle ostettu. Maksanut jo monia kertoja itsensä takaisin.
Moukula kysyi viestissään erityisesti kotikäyttäjille relevantteja käyttökohteita joita varten kannattaisi harkita uudesta Threadripperistä maksamista.
En epäile yhtään, etteikö ammattilaisen photogrammetriasovelluksessa 32-coreinen monsteri olisi hyvä valinta. Etenkin kun softan hintaan verrattuna ne muutamat tonnit työasemasta on vielä ihan siedettävä hinta. En vaan näe, että tuolla testituloksella olisi nimenomaan kotikäyttäjälle juurikaan merkitystä.
Sen sijaan esim. Agisoftin metashapen $179 USD hintaisella standard-versiolla tehty testi olisi kotikäyttäjille merkittävästi relevantimpi benchmark. Ties vaikka se olisi jollekin harrastelija droneilijalle erittäinkin mielenkiintoinen softa.
Eli joo, mielenkiintoinen benchmark, mutta ei vastaa ollenkaan sen alkuperäisen kysyjän tarpeeseen.
Jos tässä halutaan alkaa hiuksia halkomaan, en vastannut alkuperäisen kysyjän tarpeeseen. Yleisesti vaan ilmaisin, millaisia tehonlisäyksiä voi ko. prossulta odottaa.
[OT]Agisoftiltakin on professional versio tuosta Metashapesta saatavilla ja sekin maksaa ~$4000[/OT]
Niin on, mutta nimenomaan tuon edullisen version olemassaolo (en tiedä mitä noista pro-featureista voisi harrastelijana kaivata) tekee siitä kotikäyttäjälle mielenkiintoisemman.