
AMD esitteli CES 2020 -messujen kynnyksellä pitämässään lehdistötilaisuudessa tänä vuonna saataville tulevia uutuuksiaan. Joukkoon mahtui myös jo viime vuonna varmistettu uusi keihäänkärki HEDT-markkinoille.
Ryzen Threadripper 3990X on odotetusti 64-ytiminen Zen 2 -arkkitehtuuriin perustuva prosessori, joka kykenee ajamaan SMT-teknologian ansiosta samanaikaisesti 128 säiettä. Prosessorin perus- ja Boost-kellotaajuudet ovat 2,9 ja 4,3 GHz ja prosessoriydinten tukena on yhteensä 288 megatavua välimuistia.
AMD otti ilon irti uudesta prosessoristaan esitellen sen Cinebench 20 -suorituskykyä. Kun tulosgraafiin otettiin mukaan Intelin Core i9-9900KS, AMD:n Ryzen 9 3950X ja viime vuonna esitellyt 24- ja 32-ytimiset Threadripperit, tarvittiin palkkien näyttämiseen kaksi kolmesta screenistä. Kun mukaan lisättiin 3990X:n 25399 pisteen tulos, tarvittiin niiden näyttämiseen kolmaskin lavan takana levittäytyvistä screeneistä.
AMD vertasi prosessorin suorituskykyä myös V-Ray-renderöintisovelluksessa, jossa Threadripper 3990X:ää verrattiin kahteen Intelin Xeon Platinum 8280 -prosessoriin, joissa on käytössä yhteensä 56 ydintä ja 112 säiettä. Terminator: Dark Fate -elokuvasta lainattua ruutua renderöidessä Threadripperiltä vierähti aikaa tunti ja 3 minuuttia, kun Intel-kokoonpanolla aikaa meni peräti puolitoista tuntia. Samalla muistutettiin luonnollisesti Intel-vaihtoehdon viisinkertaisesta hinnasta.
Ryzen Threadripper 3990X saapuu myyntiin 7. helmikuuta ja sen veroton suositushinta on lainattu suoraan prosessorin mallinumerosta: 3990 dollaria.
Onhan nuissa selvä ero. 64-ytiminen Epyc 7742 on 2.25GHz – 3.4GHz, eli selvästi matalammat kellotaajuudet, mutta tarjoaa enempi PCIe-linjoja, tuplasti muistikanavia ja mahdollisuuden tupla-sockettiin. Epycin hinta on about 8,5ke. Eli siis selvästi palvelinrautaa ja räkkiasennuksiin. Threadripper sopii työpöydälle raskaaseen työasemaan, johon on aikaisemmin tungettu dual-socket xeonia (esim. joku HP:n Z800). Työasemakuormilla tulee useammin vastaan tarvetta yhden ytimen boostille, joka TR:llä menee 4,3GHz asti.
Ok. Eli ilmeisesti Threadripper ei sovellu räkkikoteloihin ja varsinki noi tukijutut varmaan tekee sen eron.
Pitää tosiaan muistaa se että TR on kuluttajaprossu ja EPYC konesaleihin tarkoitettu. Niissä on aika paljon eroja keskenään ja siksi vertailu on aika vaikeaa. TR:llä on varmasti tilausta kuvankäsittelyyn, autocad, videoeditointi jne. Mutta EPYC on ihan palvelinpuolen rautaa vaikka samat ytimet siellä on käytössä.
Saattaa osa miettiä kotiin kalleinta TR:ää "työasemaksi" ja EPYC sitten kellariin pyörittämään pelipalvelinta ja "virtuaalikoneita". Peleihin sitten Inteliltä joku, millä saa yhden coren @ 6 GHz. Minusta tuo vauhtisokeus on pahentunut juuri sen takia, että tehokasta rautaa on suhteellisen halvalla eikä niinkään sen takia, että olisi tarvetta. Asia on heti eri jos tekee oikeasti palkkatyötä jollain kodin koneella, mutta jos ei, niin vaikea perustella välillä, miksi se video pitää renderöityä 10 minuutissa 15 minuutin sijaan ja miksi kerneli pitää kääntää 300 kertaa päivässä, jos ei edes devaa sinne ajureita.
Intelin kääntäjä aika absurdi veto tähän, kun valtaosa kääntäjäkehityksestä on GCC/LLVM-maailmassa eikä monenkaan ohjelman kääntyvyyttä edes testata Intelin kääntäjän kanssa.
Ainakin yksi mikä tulee mieleen vastahuomiona on, että march=native -optimointi on aika paljon vaikeampi tehdä Windows-maailmassa. Mieluummin kaivan silmäni haarukalla päästä kuin alan käännellä Windowsiin työohjelmia uusiksi eri käännösvivuilla. Jossain Archissa/Gentoossa paketin kääntö uusiksi on ihan triviaali. Laitat esim. makepkg-vipuihin halutut vivut ja käännät paketin makepkg. Jos ei käännykään vaikka -O3:lla, niin ei huolta, vanha paketti toimii yhä. Jos taas kääntyy, niin makepkg -i ja käynnistyy suoraan normaalisti valikosta. Niin helppoa, että tuota oikeasti tulee tehtyä, jos tehokkuus kiinnostaa.
Gentoo/Arch-käyttäjien osuus kaikista Linux-käyttäjistä on olemattoman pieni.
Suurin osa normaalin linux-työasemista ajaa jotain Ubuntua tai Fedoraa tms. ja suurin osa softista asennetaan binääripaketteina repositoriosta, ja siellä repossa on lähinnä 32-bittiset P6-versiot sekä 64-bittiset versiot.
Ja sitten kaupalliset tehotyöasemasoftat tulee myös binääripaketteina muista lähteistä.
@Sampsa onko tuo 3990X tulossa tänne testiin?
Xeonien vertailu on siitä hankalaa, että suuryritykset maksaa niistä jotain ihan muuta kuin listahintoja. Tiedustelin juuri 3970x tasoisen tupla-xeonilla varustetun tehotyöaseman hintaa ja koko työasema muisteineen yms. ja tehokkaalla RTX-quadrolla varustettuna maksoi suunnilleen sen mikä pelkkien prossujen listahinta oli. Kasailin vk.comista vastaavan 3970x kokoonpanon, ja hintaero oli yllättävän pieni – käytännössä olematon jos huomioi asentamiseen kuluvan ajan.
Tämä muuttaa kyllä pelin täysin, kun vastaavan tehoisten xeoneiden hinta karkaa käsistä isoillakin firmoilla.
Toisaalta firmat saanevat jopa niistä Threadrippereistä (eikä vain Xeoneista ja Epyceistä) listahintaa pienemmät hinnat kun sopivissa määrin ostetaan
Onko yhdelläkään yritysrautaa myyvällä valmistajalla Threadrippereitä tarjolla valikoimissaan?
Luultavasti kaikilla jotka tekevät myös kuluttajakoneita. Eli käytännössä kaikilla paitsi Supermicrolla ja ehkä HPE:llä, jos se lasketaan erilliseksi kuluttaja-HP:sta?
(en tiedä mitä kaikkia nykyään lasketaan "yritysrautaa" tarjoaviksi)
Tarkoitin lähinnä näitä yrityksiä HP, Lenovo, Dell jne. joilta firmat työasemiaan ostavat. Mulle ei ole osunut silmiin yhtäkään TR-työasemaa, ja ennen kuin AMD saa tuotteitaan näille valmistajille kaupattua, niin TR tulee pysymään kuluttaja-/marginaalituotteena vaikka olisi kuinka ylivertainen.
Ja jos ainoa tapa hankkia TR-työasema on kasaamalla se palikoista, niin loppukäyttäjälle prossun hinta on tasan se mitä vk.com, Jimms jne. niistä pyytää (toisin kuin Xeonien tapauksessa)
Tarkoitus ei ollut sanoa, että Linuxistit käyttäisivät juuri noita distroja. Siitä on itsellä aikaa kun tullut mainstream-distrolla käännettyä mitään, joten enpä viitsinyt niiden osalta kommentoida. Fedora tai Ubuntu lienee hiukan työläämpi, mutta valintakysymyksiä nämä. Ainakin debian-pohjaisissa on aika selkeä kehikko pakettien kääntöön. Sitten taas jos miettii mitä virityksiä Windows-puolella tarvitaan että saa esim. open sourcen käännettyä. Ehkä tarvitaan Visual Studio, ehkä pari runtimeä, ehkä pari .NET-runtimeä, ehkä mingw, ehkä pythonin paketointia varten lisävirityksiä. Ja toki vielä se aspekti, että kaikkea softaa ei saa lähdekoodina eikä pysty kääntämään itse.
Ehkä yksi mainitsemisen arvoinen distro on Clear Linux, jota kai jo käytetään jossain päin tuotannossakin ja distro on keskittynyt optimoimaan softaansa tavanomaista enemmän.
Nyt mä näkisin että AMD on asian ytimessä. :smoke:
Mutta kertokaas tyhmälle, että miksi yhden hikisen ruudun renderöinti vie edelleen noin kauan aikaa? Ja millähän tätä monsteria oikein jäähdytetään?
Yksinkertaistettuna laskettavaa on niin paljon. Esim. Moana-elokuvasta on julkaistu saaren 3D-malli avoimeen jakeluun. Siinä on 90 miljoonaa kolmiota/neliötä
Download Disney’s data set for Motunui island from Moana | CG Channel
Ja säteenseurannan kanssa saadaan aina visuaalisesti parempi (tai ainakin fysikaalisesti tarkempi) lopputulos kun käytetään enemmän säteitä ja annetaan niiden kimpoilla pidempään. Eli vedoksia saadaan kyllä nopeasti aikaiseksi, mutta laadukkaan renderöinnin tekeminen vie aikaa.
Renderöinti tehdään vähän kuin säteenseuranta, paitsi ettei käytetä mitään tekoälyä "korjaamaan" virheitä. Ruutujen tarkkuus on siis todella korkea.
Threadripperiin riittää esim 280mm valmisvesijäähy. Intelin tupla xeon on taas serveritason vehje, joissa pelkät tuulettimet vie reippaasti yli 100W.
Periaatteessa geometrian monimutkaisuus ei vaikuta juurikaan renderöintiaikoihin, Valon käyttäytymistä ei pystytä varmaan koskaan simuloimaan photonien tarkkuudella ja mitä tarkemmin valon käyttäytymistä sen kohdatessa eri materiaaleja simuloidaan, sitä kauemmin laskennassa kestää. Toy Story 3:ssa yksittäisen framen laskenta vei pahimmillaan 39h ja tämä siis Pixarin resursseilla, joten tässä ei tule kattoa ihan heti vastaan. Renderöinnissä on kyse aina ajankäytön ja laadun optimoinnista.
AMD käyttää V-Ray testejä mielellään markkinoinnissa, kun V-Ray jostain syystä toimii AMD:n prossuilla todella hyvin. Erot muissa benchmarkeissa ei ole noin suuria.
Eihän 3970x kuluta esim. blenderissä kuin samat mitä 9900k @5GHz. Lämpö tuotetaan huomattavasti isommalla alalla, niin sen jäähdytyäminen pitäisi olla huomattavasti helpompaa. Tän 3990x:n tdp on sama kuin tolla 3970x:llä ja AMD:n prossut tuppaa kaikki kuluttamaan saman verran sähköä jos niillä on sama tdp.
tldr. joku noctuan trx4 jäähy riittää helposti.
Renderöinti on yleisnimitys kaikelle grafiikan piirtämiselle jonkun tietokoneella jonkun geometrian pohjalta.
Säteenseuranta on yksi tapa tehdä renderöintiä, toinen yleisempi tapa on rasterointi.
Ja nämä kaksi toimivat täysin eri periaatteella.
"perinteset 3d-kiihdyttimet" on tehty nopeuttamaan rasterointia.
Säteenseurannalla ei ole mitään tekemistä minkään tekoälyn kanssa. nVidia vaan käyttää polunjäljityksensä (eräs tietty tapa tehdä säteenjäljitystä) kohinanvaimennukseen neuroverkkoa.
Ja V-ray ei tee "vähän kuin säteenseurantaa" vaan se tekee säteenseurantaa.