
Toimitusjohtaja Jensen Huang yllätti eilen NIPS 2017 -konfrenssin yleisön lanseeraamalla uuden Titan V -näytönohjaimen, jossa on käytössä NVIDIAn uuteen Volta-arkkitehtuuriin pohjautuva ja 110 teraFLOPSin tensorilaskentatehoon kykenevä GV100-grafiikkapiiri.
Toukokuussa GTC-konfrenssissa esitelty GV100-grafiikkapiiri rakentuu 21,1 miljardista transistorista ja sen pinta-ala on 815 neliömillimetriä. Grafiikkapiiri valmistetaan TSMC:n 12 nanometrin FFN-prosessilla, joka on räätälöity NVIDIAlle.
Titan V:ssä GV100-grafiikkapiiri toimii 1200 MHz:n perustaajuudella ja 3D-rasituksessa 1455 MHz:n Boost-taajuudella. Käytössä on 80 SM-yksikköä eli 5120 CUDA-ydintä ja 320 tekstuuriyksikköä. Grafiikkapiiristä löytyy myös 640 koneoppimiselle pyhitettyjä Tensor-yksiköitä, jotka ovat erikoistuneet tensoreiden laskentaan. Käytännössä kukin Tensor-ydin suorittaa ”D = A x B + C” -laskutoimituksia 4 x 4 -matriiseilla ja kykenee yhteensä 64 FMA-operaatioon ((Fused Multiply-Add) FP16-kertolasku, FP32-akkumulaatio) kellojaksossa.
3072-bittisen muistiväylän jatkeena on 12 gigatavua 850 MHz:n kellotaajuudella toimivaa HBM2-muistia ja muistiväylän kaistanleveys on 652,8 gigatavua sekunnissa.
Näyttöliittiminä on tarjolla kolme Displayport-liitintä ja yksi HDMI-liitin. Näytönohjaimen TDP-arvo on 250 wattia, virransyöttö on 16-vaiheinen ja piirilevy on varustettu 6- ja 8-pinnisillä PCI Express -lisävirtaliittimille. NVIDIA suosittelee 600-wattisen virtalähteen käyttöä.
Jäähdytysratkaisu on NVIDIAn tutuksi tullut blower-mallinen ratkaisu, jossa grafiikkapiiriä jäähdytetään höyrykammiolla varustetulla kuparisiilillä. Muovinen ilmanohjain on värjätty pronssin väriseksi.
NVIDIA ei informoinut mediaa Titan V:n lanseerauksesta ennakkoon eikä ole myöskään toimittanut medialle testikappaleita. Näytönohjain on kuitenkin ostettavissa välittömästi NVIDIAn kotisivuilta 2999 dollarin hintaan, joten ennemmin tai myöhemmin sillä tullaan näkemään myös pelitestejä, vaikka se onkin suunnattu ensisijaisesti koneoppimisen sovelluksiin.
Lähde: NVIDIA
Ei, vaan leikattu 815mm^2 ammatilaispiiri
Niin piirin koko on 815mm², mistä osia on vain poistettu käytöstä eli 4 sm:ää, yksi neljästä hbm2 muistiväylästä + osa tmu:sta, L2 kakusta ja Ropseista.
Sinällään pascal gp100:sta oli myös samankaltainen piiri olemassa .l 12GB Tesla P100 pcie, nyt nvidia vain myy noita titaneina halvemmalla.
Olisi tosiaan hauskaa tietää minkä kokoinen hypoteettinnen GV102 piiri on mistä on karsittu pelaamisen kannalta turhia ominaisuuksia. Esim. GP100 oli yli 25% isompi kuin GP102, vaikka molemmissa oli yhtä paljon CUDA-ytimiä.
Olisi kyllä yllätys jos ei seuraavan kuuden kuukauden aikana tulisi Volta/Ampere-pelikortteja? Kuitenkin muistinvalmistajat ovat ennakoineet, että heidän asiakkaansa julkaisisi GDDR6-muisteja käyttäviä kortteja "aikaisin vuonna 2018". 6kk päästä on jo kesäkuu.
Pelikortteja tulee ihan taatusti, se "välttämättä" viittasi enemmän siihen onko se Volta vai joku muu.
Ei se piirin koko siitä muutu että osia poistetaan käytöstä.
Aika runsaasti luulisi lähtevän pinta-alaa pois, kun heivataan kaikki tensor-ytimet ja suuri osa fp64-ytimistä.
Ja muistin kaistakin on vain hieman korkeampi kuin 1080 ti:n (512 vs ~600 gb/s). Eli hintaa saisi alaspäin myös käyttämällä gddr5x:ää HBM:n sijaan. Näin siis kuhan Kuluttajamarkkinoille aletaan oikeasti tuuppaamaan näitä.
Njoo, hankala tuota on arvioida kun nvidia ei ole dieshottia gv100:sta julkaissu, niin ei tiedetä noita nykysten SM:ien kokoa tarkasti. Rakennehan SM:ssä on huomattavan erillainen kuin pascaleissa jo tensoreiden takia mutta myös erillisten int32 yksiköiden myötä. Itseäni hieman kyllä epäillyttää että nvidia tulee julkaisemaan toista 84 SM:n piiriä, eiköhän se piiri tule jostain 60-84 välimaastosta. GP102:nen on suhteellisen pieni high end piiriksi. Eli joku 70 SM:ää ja pinta-ala piirille olisi helposti vielä alle 550mm²…
Eiköhän net nopeimmat peliohjaimet tule nvidialta gddr6:lla, 14Gbps gddr6:set 384bit väylässä on jo hieman tuota titan v:n muistikaistaa nopeampi. Toki gddr5x:kin voidaan joissain korteissa nähdä, jos micron sellaiset polkuhinnoilla tarjoaa.
Ihan realistinen vaihtoehto. Gddr6 muistin tuotanton alkamista 2018 vuoden alussa olikin aikaisemmin uhkailtu.
Tiputtavat muistiväylän 256 tai vielä pienemmäksi niin säästävät vielä lisää. Mutta saas nähdä tuleeko refress nykyisistä vai voltajohdannainen…
Pakkohan se on uskoa että GTX 2080 Ti (tai minkä nimen nyt saakin) on nopeampi pelikäytössä kun tämä Voltan Titani, ihan vain muisteista ja muistakin syistä. Nvidialla on ollut Volta jo työn alla aika kauan.
Nvidian volta on ollut markkinoilla kohta puoli vuotta. Aluksi myynnit vaan varattiin noihin nvidian palvelinpaketteihin ja tesloihin.
Juu mutta alunperin Voltasta kuultiin jo 2015 vai oliko peräti 2014
Onko voltassa oikeasti jotain erillisiä tensor-coreja, vai onko siinä ainoastaan jotain lisähardista joka pilkkoo noita matriisikertolaskun operaatioita normaaleille FP-coreille?
640 ”tensorcorea” x 8 olisi 5120.
4×4 matriisin kertolaskussa on 4x4x4 kertolaskua, eli 64.
En kyllä äkkiä keksi miten nuo saataisiin laskettua 8:lla fp32 mul-yksiköllä yhdessä kellossa, vaikka tuettuna olisi fp16 tarkkuus.
Tuolla ei ole nähdäkseni välttämättä kovinkaan paljon yhteistä itse piiritason toteutuksen kanssa, vaan kyseessä on lähinnä looginen lohkokaavio.
Tuntuisi hölmöltä, että nvidia vaan lataisi piirin täyteen suoritusyksiköitä joista 3/4 idlaa riippumatta kuormasta ja kuorman vaihtuessa laskentayksikköclusteria vaan vaihdetaan.
Mutta ehkä se on noin?
Pitää myös muistaa, että etenkin neuroverkoissa on kaksi asiaa, se verkon treenaus ja sitten sen tuloksena saadun ”AI:n” käyttö (inferencing).
Kaiken järjen mukaan GV100 on nimenomaan training-hardis ja sitten se inferencing tehdään jollain muulla hardiksella.
Juu treenauksessahan noita tensoreita tarvitaan.
No ei nyt pelkästään siihen, nvidian oma kyhäelmä tensorRT on ihan inferenceen tehty. Pienemmässä mittakaavassa nuo toki tehdään kevyemmällä raudalla(int8), mutta datacenterissä voidaan jo käyttää hieman jykevämpää rautaa tuohonkin joka pystyy mm. tekemään useampaa inferenceä yhtäaikaa.
Tosin se kannattaa huomioida, että tallaisissa asioissa patentoidaan hommat tiukasti näiden kahden toimesta ja uudet yrittäjät yleensä (jos ne uhkaavat menestyä, joka on jo temppu sinänsä, jos markkinoilla olijat eivät hidastele ihan liikaa) joko ostetaan pois ja ajetaan konkkaan ja ostetaan IP pilkkahintaan. Patenttijärjestelmä suosii vahvasti tällaista toimintaa..
Ei saisi, vaan silloin pitäisi kehittää alusta asti uusi piiri jossa olisi GDDR5(X)-muistiohjain mikä lisää rutkasti kuluja ja siten hintaa.
Ihmisten pitäisi lopettaa tuo "jos siinä olisikin tota muistityyppiä eikä tota toista" -spekulointi, se tarkoittaa aina täysin uuden piirin suunnittelua ellei puhuta jostain DDR3+GDDR5-kombosta
Eikö näin tehty pascalin suhteen myös? Kuluttajille gddr muistia ja ammattikäyttöön hbm muistia.
Patentti ja IP ovat ainakin toistaiseksi näissä olleet ilmeisesti toissijaisia.
Näitä neural net startuppeja on osteltu viimeaikoina isojen toimesta paljon ja esim. economistin teknologiaosasto oli sitä mieltä, että oleellista on lähinnä duunareiden ÄO ja firmoista maksetaan pari miljoonaa per työntekijä jos työntekijöiden taso on tarpeeksi kova.
Juu, siitä oli molemmat versiot, mitä perustekniikkaan tulee, kuluttajaversiota vain oli karsittu muistityypin vaihdon lisäksi.
Tuon hankaluus riippuu varmasti paljon siitä, onko tuo suunnitelma ollut mukana jo aluista asti ja onko homma tehty järkevästi modulaarisesksi. Aika ja rahaahan Nvidialla on ollut ihan reippaasti, joten en sinänsä näe syytä ettei gddr versioita tulisi..
3D tulostimia joskus tutkailin tarkemmin ja niissä oli tuo patentein homman omiminen onnistunut parin ison toimesta todella tiukasti. Itseasiassa halpojen tulostinten kehitys on käytännössä lähes pysähdyksissä juurikin patentointiongelmien kanssa.. Se yhteisökeräyskin tuotti laitteen, joka oli ainankin ongelmissa patenttien takia ja myytiinköhän koko paska sitten jommallekummalle, sitä en muista. Se tapahtui vähän sen jälkeen, kun tutkiskelin asiaa tarkasti..
Se on selvää, että tekoälyttömyyden peruskomponenttien on ymmärretty olevan hyvä rahasampo seuraavana. Näinollen nuo pikkufirmat, joilla on lupaavia ideoita lähtevät todella liukkaasti, jos vain ovat ostettavissa.
Yhdestäkään piiristä ei ollut sekä GDDR- että HBM-versiota, vaan joissain piireissä oli GDDR ja joissain HBM, mutta niissä oli aina muitakin eroja.
Jos piiritasolla mennään, niin ei varmaan. Arkkitehtuuritasolla se onkin eri juttu.
Koskas tei meinaatte testata tätä? 😛
Nvidia ei noita lähettele medialle, Linus osti omansa tosin linus tech tipsin revikat on vähintäänkin suolesta. Tom's tai pcper voisi ehkä ostaa moisen ja testata(pcper mm. osti molemmat vega FE:t ja tom's on suurin). Pienemmillä medioilla tuo menee yleensä lainaus periaatteella.
Minkäs mittarin mukaan Toms on suurin? Ihan uteliaisuudesta mietin, se kun ei ole yksityisessä omistuksessakaan vaan samasta tallista löytyy mm. AnandTech (kumpikin alun perin yksityisiä)
Niin tarkoitin sanomani Purch on suurin, omistaa tosiaan myös anandtechin.
Testataan jos saadaan käsiin (joku io-techin käyttäjä ostaa ja lainaa testiin tms) 😛