Mobiilimaailmaa dominoiva Arm on julkaissut tämän vuotiset uudet ytimensä järjestelmäpiireihin. Uusia ytimiä voidaan odottaa käytettäväksi ensi vuoden lippulaivatason järjestelmäpiireissä. Käsittelemme tässä uutisartikkelissa uuden grafiikkaohjaimen (Graphics Processing Unit, GPU) ja tekoälykiihdyttimen (Neural Processing Unit, NPU).

Uusi Arm Mali-G78-grafiikkaohjain perustuu samaan Valhall-arkkitehtuuriin, kuin edeltävä G77. Tutusta arkkitehtuurista huolimatta uuden grafiikkaohjaimen kerrotaan tarjoavan parhaimmillaan 25 % edeltäjäänsä parempaa suorituskykyä ja tarjoavan 15 % parempaa suorituskykyä pinta-alaan nähden. G78:n uudistuksia ovat ytimen ”ylätason” kellotaajuuden asynkronisointi itse ytimistä, kuvan ruutuihin jakavan Tiler-yksikön parannukset, paranneltu varjostimien riippuvuuksien seuranta sekä mahdollisuus skaalata aina 24 ytimeen asti.

Armin testien mukaan asynkroninen ylätaso nostaa 18-ytimisen Mali-G78:n suorituskykyä testeissä parhaimmillaan 13 ja peleissä 11 %. 24 ydintä puolestaan kasvattaa suorituskykyä sellaisenaan 8 % 18 ytimeen nähden. Asynkroninen ylätaso puolestaan parantaa 24-ytimisen mallin suorituskykyä testeissä lähes 14 % ja peleissä reilut 12 %. Paranneltu varjostinten riippuvuuksien tarkkailu puolestaan parantaa yhtiön testien mukaan suorituskykyä pelistä riippuen 6 – 17 % G77:ään verrattuna. G78 käyttää samalla valmistusprosessilla ja vastaavalla konfiguraatiolla 10 % vähemmän tehoa kuin G77. Asynkronisen ylätason kerrotaan puolestaan mahdollistavan vielä 6 – 13 % pienemmän tehonkulutuksen. Tekoälytehtävien suorituskyky on parantunut keskimäärin 15 %.

Mali-G78:n rinnalle julkaistaan myös kevyempi Mali-G68. Se perustuu samaan arkkitehtuuriin, mutta skaalautuu maksimissaan 6 ytimeen asti.

Arm noudattaa samaa numerointia myös tekoälypuolella ja uusin neuroverkkokiihdytin on ristitty Ethos-N78:ksi. N78:n kerrotaan tarjoavan parhaimmillaan yli kaksinkertaista suorituskykyä, yli 25 % parempaa energiatehokkuutta ja 40 % parempaa muistiväylän hyödyntämistä verrattuna N77:ään tarjoten samalla 30 % parempaa suorituskykyä pinta-alaan nähden. Järjestelmäpiirien suunnittelijoille annetaan myös entistä vapaammat kädet juuri omiin tarpeisiin sopivan mallin valintaan, tuoden tarjolle yli 90 uniikkia konfiguraatiota. Järjestelmäpiirien valmistajat voivat muun muassa konfiguroida ydinten MAC-yksiköiden määrää (multiply-accumulate, yhdistetty kerto- ja yhteenlasku), SRAMin määrän sekä erilaisia vektoriyksiköiden konfiguraatioita.

Lähde: Arm