Viime viikolla pidetyssä HotChips-tapahtumassa kokoontuvat alan ammattilaiset esittelemään omien piiriensä ja arkkitehtuuriensa tarkempia saloja. NVIDIAlla oli tapahtumassa esillä sekä Blackwell Ultra GB300 datakeskuksiin että GB10 Superchip työasemiin.

NVIDIA Blackwell Ultra eli GB300 on yhtiön tuorein järeä tekoälymurskain datakeskuksiin. Se rakentuu kahdesta sirusta, jotka on yhdistetty NV-HBI-väylällä, mikä mahdollistaa yhtenä suurena GPU:na toimimisen. Molemmat piireistä ovat niin suuria, kuin TSMC:n 4NP-prosessi mahdollistaa, ja niihin on upotettu yhteensä noin 208 miljardia transistoria.

GB300:ssa on käytössä 160 SM-yksikköä, mikä tarkoittaa yhteensä 20480 CUDA-ydintä. Niiden rinnalla on 5. sukupolven tensoriytimet ja 256 kilotavua Tensor Memory -välimuistia. 12-kerroksisisa HBM3e-muisteja tukeva muistiohjain on 8192-bittinen ja sen jatkeena on 8 Tt/s kaistan takana 288 Gt muistia. Yhden GB300:n TDP-arvo on jopa 1400 wattia.

NVIDIAn referenssialusta GB300:lle on Grace Blackwell Ultra Superchip, jossa on kaksi GB300-piiriä eli yhteensä 4 GPU-sirua ja yksi Grace-palvelinprosessori ynnä kaksi ConnectX-8 SuperNIC -verkkopiiriä. Alustalla on yhteensä teratavu muistia, mutta luku lienee alakanttiin. GB300-piireiltä löytyy yhteensä 576 Gt HBM3e-muistia ja LPDDR5X-muistiakin lienee saatavilla 512 Gt tai ainakin DGX Stationinkin tarjoama 496 Gt- Piirit ovat yhteydessä toisiinsa NVLink-C2C-väylällä.

Vaikka kyseessä on ennen kaikkea datakeskusalusta, NVIDIA on tuonut sen myös työpöydälle järeisiin työasemiin DGX Stationin osana. DGX Stationissa on käytössä yksi Grace-palvelinprosessori, yksi GB300 ja yksi ConnectX-8 SuperNIC -verkkopiiri. GB300:lla on käytössä 288 Gt HBM3e-muistia ja prosessorin kaverina maksimissaan 496 Gt LPDDR5X-muistia.

NVIDIA GB10 Grace Blackwell Superchip on NVIDIAn “jokakodin supertietokoneen” sydän. Järjestelmäpiiri rakentuu 20-ytimisestä Grace-prosessorisirusta (S-Die) ja Blackwell-arkkitehtuuriin perustuvasta GPU-sirusta (G-Die). Sirut on 2,5D-paketoitu samaan pakettiin ja ne valmistetaan TSMC:n 3 nanometrin luokan prosessilla. NVIDIA on suunnitellut piirin yhteistyössä MediaTekin kanssa. MediaTekin vastuulla ovat olleet ennen kaikkea itse prosessoripuoli sekä järjestelmäpiirin yhteinen muistijärjestelmä.

GB10:n prosessorisirulta löytyy kymmenen Cortex-X925- ja kymmenen Cortex-A725-ydintä. Kullakin ytimellä on oma L2-välimuistinsa ja kummallakin ydinryppäällä on oma 16 Mt:n L3-välimuisti. Lisäksi sirulta löytyy koko järjestelmän jakama 16 Mt:n L4-välimuisti. Kumpaakin sirua palveleva, maksimissaan LPDDR5X-9400-nopeutta tukeva muistiohjain on 256-bittinen. Prosessori ja GPU jakavat yhteisen muistiavaruuden (UMA). Sirut on yhdistetty NVIDIAn erittäin nopealla NVLINK C2C -väylällä.

GPU-siru jakaa arkkitehtuurinsa datakeskusten GB100-piirin kanssa ja se rakentuu yhteensä 6144 CUDA-ytimestä. Käytössä on 4. sukupolven RT-ytimet ja 5. sukupolven tensoriytimet, mutta kummankaan tarkkoja lukumääriä NVIDIA ei ole paljastanut. Suorituskykylukemiksi yhtiö kertoo 31 TFLOPSia FP32-tarkkuudella ja 1000 TOPSia NVFP4-tarkkuudella. GPU tukee maksimissaan kolmea DisplayPort- ja yhtä HDMI-liitäntää. DisplayPort on tuettuna USB-C:n läpi DP Alt Moden avulla ja se tukee maksimissaan 4K-resoluutiota ja 120 hertsin virkistystaajuutta per näyttö. HDMI on versiota 2.1a. Koko järjestelmäpiirin TDP on 140 wattia ja se tukee Ubuntu Linuxia sekä NVIDIAn omalle Linux-pohjaiselle DGX Base OS:ää.

Lähde: VideoCardz (1), (2)