NVIDIAn toimitusjohtaja Jensen Huang on hukannut koronapandemian pyörteissä parturinsa puhelinnumeron, mutta tämä ei estänyt nahkatakkista miestä pitämästä GTC 2021:n keynote-esitystä keittiössään. Tapahtuma keskittyi tuttuun tapaan lähinnä tekoälyyn ja raskaaseen laskentaan, vaikka mukaan mahtui myös esimerkiksi esittelyvideo kehityksen alla olevista säteenseurantaa hyödyntävistä peleistä.
GTC 2021 -tapahtuman kenties merkittävin julkaisu oli Grace, NVIDIAn ensimmäinen Arm-arkkitehtuuriin perustuva palvelinprosessori. Arkkitehtuuri on nimetty Grace Hopperin mukaan, joka oli yksi ohjelmoinnin edelläkävijöistä 50-luvulla. Se paikkaa NVIDIAn tarjonnassa ammottavan aukon, sillä tähän asti se on joutunut turvautumaan kolmansien osapuolten prosessoreihin palvelinratkaisuissaan.
NVIDIAn näkemyksen mukaan datakeskuskäytössä x86-palvelinten suurin ongelma on käytössä oleva kaista prosessorin ja laskentapiirien välillä, sillä tämä estää prosessorin suuremman muistiavaruuden hyödyntämisen tehokkaasti. Yhtiön mukaan PCI Express 4.0:n kaista on yksinkertaisesti riittämätön, eikä yksikään x86-prosessori tue sen NVLink-väylää. Dioissa esitellyssä konfiguraatiossa oli käytössä neljä Grace-prosessoria LPDDR5x-muistilla ja neljä laskentapiiriä HBM2e-muistilla. Siinä missä x86-prosessoreilla järjestelmämuistista laskentapiireille on kaistaa parhaimmillaan 64 Gt/s, yltää neljän Gracen järjestelmä peräti 2000 Gt/s:n kaistaan samalla välillä.
Grace perustuu Armin seuraavan sukupolven Neoverse-palvelinytimiin. Itse ytimistä ei tiedetä vielä paljoakaan, mutta aikataulun huomioiden kyse on todennäköisimmin Armv9-ytimistä. NVIDIAn diat ovat sen verran korkean tason kuvauksia järjestelmästä, että ainakin toistaiseksi jää epäselväksi onko yhtiön lupaama yli 500 Gt/s:n muistikaista prosessoreiden ja muistien välillä kaikkien neljän prosessorin yhteenlaskettu kaista, vai onko jokaisella prosessorilla yli 500 Gt/s muistikaistaa.
Jokainen Grace-prosessori tarjoaa yli 300 SPECint-pistettä ja siihen perustuva DGX-laskentanoodi yli 2400 pistettä, kun nykyinen DGX-laskentanoodi nettoaa 450 pistettä. Keynotessa ei paljastettu montako ydintä kussakin Grace-prosessorissa on, mutta mikäli taiteilijan näkemykseen perustuva kuva antaa mitään viitteitä, näyttäisi 80 ydintä hyvin todennäköiseltä. Kunkin prosessorin kanssa samalle piirilevylle on sovitettu kahdeksan LPDDR5X-muistipiiriä ja A100-laskentapiiri, mutta A100 on todennäköisemmin vain osoittamassa tulevan sukupolven laskentapiirin paikkaa piirilevyllä. Grace-prosessorit julkaistaan myyntiin 2023.
NVIDIAn Grace-prosessorit ja seuraavan sukupolven laskentapiirit otetaan ensimmäisenä käyttöön Sveitsin kansallisen supertietokonekeskuksen (SCSC) uudessa Alps-supertietokoneessa sekä Yhdysvaltain Los Alamos National Laboratoryn toistaiseksi nimeämättömässä supertietokoneessa. SCSC:n Alps tulee tarjoamaan peräti 20 exaFLOPSin edestä tehoa tekoälylaskentaan. Supertietokoneissa suorituskykyä on mitattu perinteisesti FP64-tarkkuudella, mutta puhdas suorituskyky ja viittaus nimenomaan tekoälylaskentaan kertoo, että Alpsin suorituskyky saavutetaan matalammilla laskentatarkkuuksilla. Los Alamosin supertietokoneen suorituskykylukemia ei paljastettu tässä vaiheessa. Molemmat supertietokoneet toteutetaan HPE:n toimesta ja ne hyödyntävät sen Cray Ex -palvelinalustaa. Itse prosessoreiden tapaan myös supertietokoneet tulevat käyttöön vuonna 2023.
NVIDIA ilmoitti myös aloittaneensa yhteistyön useiden yritysten kanssa tuodakseen laskentapiirinsä ja näytönohjaimensa uusien markkinoiden saataville. Jatkossa Amazonin Graviton-prosessoreiden rinnalla voidaan nähdä NVIDIAn tarkemmin määrittelemättömiä grafiikkapiirejä, kun Amperen Altran pariksi on sovitettu A100-laskentapiirit ja BlueField-2 DPU:t ja Marvellin Ocetonin pariksi T4-laskentapiirit. Myös MediaTek saa osansa NVIDIAn tarjonnasta, sillä sen kannettaviin suunnattujen MT819x-järjestelmäpiirien pariksi voidaan naittaa RTX 30 -sarjan näytönohjaimia.
Lähde: NVIDIA
Toivottanasti toimivat paremmin, kuin aikoinaan PC emolevyt, jotka olivat hyviä papereilla, muttä käytännössä bugista paskaa (Esim verkkokortti).
Kyllä tuon luokan vehkeissä raudan ja ajurien validointi on aivan eriluokkaa kuin jossain kuluttaja lankuissa.
Ja noita nForce sarjan ongelmia oli vaihtelevasti eri valmistajien emolevyillä vaikka sama piirisarja oli kyseessä, toisilla toimi ja toisilla ei sitten niin millään. Tuli valitettavan tutuksi kun erästä MSI:n K8 lankkua vaihdoin parikin kertaa ja sitten ostin erimerkkisen.
Eiköhän niissäkin syypää ollut se lankun valmistaja tavalla tai toisella, jos kilpailevan firman vehje samalla piirisarjalla toimi.
Taisi olla yöllä vähän silmät ristissä
Mutta väittäisin että 80, ei 84, väittäisin että nuo 4 tummempaa kohtaa identtisissä paikoissa on siellä syystä.
Ainakin vanhemmista piireistä itsellä nForce 2 ja nForce 3 -sarjalaiset olivat aikanaan varsin ongelmattomia, lähinnä nuo PCIe aikakauden emot olivat välillä ongelmallisia nForceilla. Vieläkin löytyy muutama SER-lauta Nvidian piirisarjalla, sinällään harmi kun lopettivat tuon puolen aikanaan.
Tais olla intel ja x86-lisenssikiista, mikä johti nvidian poistumiseen piirisarjabisneksestä?
Ei siellä mitään x86-lisenssikiistoja ollut. Intelin mielestä sen ja NVIDIAn välinen sopimus tiettyjen väylien käytöstä, mikä mahdollisti NVIDIAn piirisarjatuotannon Intelin alustoille, ei kattanut enää Nehalemin vaativia QPI/DPI väyliä, NVIDIAn mielestä kattoi ja mentiin oikeuteen. Homma sovittiin lopuksi muistaakseni oikeuden ulkopuolella, mutta siinä vaiheessa NVIDIA oli jo ulkona piirisarjabisneksestä.
Pointti mulle lienee kuitenkin, että ei tuo poistuminen markkinoilta tainnut olla pelkästään nvidian omasta tahtotilasta kiinni.
Oli siihen hyviä teknisiä syitä, tekninen kehitys johti siihen, että se markkinaslotti missä nVidia piirisarjoillan oli, efektiivisesti kuoli:
Alkuperäinen nForce 420-D oli oikeasti suhteessa silloisiin erillinäyttiksiin melko tehokas, siinä oli aikakauteensä nähden aika reippaasti muistikaistaa ja käytännössä se oli geforce 2 MX (eli puolitettu piiri geforce2n huippumallista), hiukan pienemmillä kelloilla, eli suorituskykyä oli luokkaa 40% huippumallin suorituskyyvstä.
Ja taisi siitä tulla myös näyttiksetön versio, mutta silläkin ihan CPU-suorituskyky oli kova sen järeän muistiohjaimen takia; Jos halusi Athlonilleen piirisarjan olla prossu toimii nopeiten, osti nForcen.
DRAM-Muistiohjainten siirtyminen emolevyn pohjoissiltapiiriltä prosessorin kanssa samalle piirille Athlon 64ssa jo 2003 tarkoitti sitä, että
1) nVidia oli AMDn armoilla sen suhteen, että millainen muistiohjain sieltä CPU-piiriltä löytyi, eikä voinut enää itse laittaa niin järeää muistiohjainta kuin halusi (tai mitkä tehokas piirisarjaan integroitu näyttis tarvisi)
2) piirisarjaan integroidun näyttiksen muistilikenteen piti kulkea prosessoriväylän yli, ja se prosessoriväylä olisi tullut helposti vielä pahemmaksi pullonkaulaksi kuin se CPUn muistiohjain
Joten nVidia ei voinut K8lle enää tehdä piirisarjoja, joissa oikeasti tehokas integroitu näyttis. Eikä nVidia voinut myöskään erottua muiden valmistajien piirisarjoista paremmalla muistiohjaimellaan ihan vaan CPUn suorituskyvyssä.
nVidia jatkoi kuitenkin (hiukan pienemmällä panostuksella) nForce-piirisarjojen kehittämistä K8lle, mutta niiden integroitujen näyttisten suorituskyky jäi jatkuvasti kauemmas erillisnäyttisten suorituskyvystä, samalla kun erot muussa kun grafiikkatoiminnallisuudessa alkoi olla merkitykettömiä.
Intel kuitenkin käytti vielä piirisarjalla olevaa muistiohjainta, joten nVidia alkoi tähystää myös Intelin prossujen suuntaan, ja julkaisi joitna piirisarjoja Intelin prissuille.
Tässä vaiheessa oli kuitenkin jo otettu asenne, että integroidulle piirisarjalle laitetaan vaan ihaan moponäyttiksiä, ja nVidia ei halunnut/uskaltanut kokeilla tehdä jotain esim nelikanavaista muistia käyttävää oikeasti tehokasta (mutta kallista) integroitua näyttistä, vaan nuo integroidut näyttikset mitoitettiin sen mukaan että AMD- ja Intel-versiot on samaa luokkaa suorituskyvyltään.
Lopullinen kuolinisku nVidian piirisarjoille tuli kuitenkin siitä, kun AMD ja Intel alkoivat integroida näyttiksiä CPUn kanssa samalle piirille/samaan pakettiin; Inteliltä tuli alkuvuodesta 2010 Westmere jossa pohjoissiltapiiri intelin omalla integroidulla näyttiksellä oli siirretty emolevyltä CPUn kanssa samaan pakettiin, ja AMDltä tuli LLano ja Brazos 2011, näissä oli CPUn kanssa ihan samalla piilastulla oleva näyttis.
Tällaisen yhdistelmäpiirin sisältävässä tietokoneessa vaan ei enää ollut mitään käyttöän nVidian näyttiksen sisältävälle piirisarjalle. Jäljelle olisi jäänyt ainoastaan hyvin pienten ja halpojen eteläsiltapiirien tekeminen, ja niistä ei suuria katteita olisi kerätty
Ja näistä yhdistelmäpiireistä vielä Brazos oli täysi SoC eli se ei tarvinnut edes sitä eteläsiltapiriä.
Joten sen sijaan että nVidia olisi jäänyt myymään pieniä, halpoja ja vähäkatteisia tusnatavara-eteläsiltapiirejä, se luopui PC-piirisarjabisneksestä kokonaan ja näihin aiemmin käytetyt resurssit suunnattiin esim. ARM-pohjaisiin SoC-piireihin (Tegra).
data-unfurl="true" data-result-id="173406" data-url="https://startupsavant.com/news/nvidia-stock-surges" data-host="startupsavant.com" data-pending="false">
class="link link--external fauxBlockLink-blockLink"
target="_blank"
rel="nofollow noopener"
data-proxy-href="">
Nvidia Stock Surges on Positive Trading Update, New Products Launch
data-onerror="hide-parent"/>
startupsavant.com
Omassa MSI:ssä oli semmoinen varsin ärsyttävä ongelma integroidu 1Gbit verkko-ohjaimen kanssa, että se kyllä 100Mbit linkillä toimi ok, mutta 1GBit linkillä se jossain vaiheessa kusahti kun siirsi filuja verkon yli. Se sitten sai domino efektinä wintendon kusahtamaan, niin ettei ajurin uudelleen asennuskaan enää verkkoa pelastanut vaan piti vetää repair install alusta asti. Sitten se verkko taas toimi jonkun random ajan ja sama uusiksi. Asuksen vastaava viritelmä samalla piirisarjalla yms ei tehnyt tuota.
Oli siinä sitten muutakin, SCSI ohjainkortit toimi aivan käsittämättömän huonosti jos ollenkaan (2/5 ohjaimesta ei toiminut ollenkaan). Sitten jos toimi niin SCSI levyltä sequential siirtonopeus oli 10-15MB/s kun sama ohjain ja sama levy toisessa koneessa nakutti lähellä 100MB/s. En ole sen jälkeen MSI:n lautaa ostanut.
Oli mulla muitakin aikaisempia ihan toimivia nforceja, mutta tuo ny yllättäen jäi mieleen kun noin hirveä räpeltäminen sen kanssa.
Kommentoi uutista tai artikkelia foorumilla (Kommentointi sivuston puolella toistakseksi pois käytöstä)
Lähetä palautetta / raportoi kirjoitusvirheestä