Total Compute Solutionsista CSS:ksi muuttunut alusta sisältää muun muassa odotetun, Blackhawk-koodinimellisen seuraavan sukupolven Cortex-X-ytimen.

Arm on julkaissut odotetusti tämän vuoden uuden mobiilialustansa uusine prosessoriytimineen ja muineen. Samalla yhtiö on vaihtanut alustansa kutsumanimen TCS:stä eli Total Compute Systemsistä CSS:ään eli Compute Subsystemiin (for Clients).

Armin vuoden 2024 Armv9.2 CSS alusta sisältää uuden sukupolven Cortex-X- ja Cortex-A700-luokan ytimet sekä päivitetyt Cortex-A500-luokan ytimen sekä DynamIQ Shared Unitin, joka sisältää mm. prosessoriydinten L3-välimuistin, hallintalogiikkaa sekä CoreLink-yhdysväylätuen. Lisäksi mukaan kuuluu luonnollisesti uusi 5. sukupolven GPU. Koko alusta on suunniteltu valmistettavaksi 3 nanometrin luokan prosesseilla.

Koko alustan kerrotaan olevan yli 30 % nopeampi laskenta- ja grafiikkatehtävissä, 59 % nopeampi tekoälyn vasteajoissa ja käyttävän jopa 30 % vähemmän tehobudjettia GPU:lle. Sen kerrotaan oelvan myös skaalattavissa tekoäly-PC-markkinoille. Se tukee maksimissaan 14 prosessoriydintä ja 24 GPU-ydintä, kun GPU-puolella maksimi oli aiemmin 16 ydintä.

Blackhawk-koodinimellä aiemmin tunnettu ydin sai kasteessa nimekseen aiemmista sisaruksista selvästi poikkeavan Cortex-X925:n. Yhtiön mukaan se mikroarkkitehtuurissa on levennetty sekä käskyjen purkuyksiköitä että vektoriyksiköitä, mitkä tuottavat jopa 50 % lisää TOPSeja tekoälytehtäviin. Sillä on käytössään 3 Mt omaa L2-välimuistia ja suorituskyvyn luvataan olevan jopa 36 % parempaa Geekbenchin yhden ytimen testissä, kun Time-to-first-token testissä Phi-3-mallilla tekoälysuorituskyky peittoaa Cortex-X4:n jopa 46 % paremmalla ajalla.

Cortex-A700-sarjan uusin tulokas on A725. Suorituskykyinen ytimen kehityksessä on kiinnitetty erityistä huomiota suorituskykyyn tekoäly- ja pelikuormissa. Yhtiön diassa käytetään erikoisesti energiatehokkuuden rinnalla ”performance efficiency” eli ”suorituskykytehokkuus” termiä selittämättä tarkemmin, mistä oikeastaan on kyse, mutta graafin perusteella se vaikuttaisi olevan mahdollisesti maksimisuorituskyky. Sillä oletuksella ytimen energiatehokkuus on Armin mukaan parantunut 25 ja suorituskyky 35 %, kun L3-välimuistiin menevää liikennettä on samalla saatu vähennettyä 20 %.

Päivitetty Cortex-A500 on edelleen nimeltään Cortex-A520, mutta sen luvataan uuden toteutuksen ja 3 nanometrin prosessin myötä olevan 15 % virtapihimpi, kuin viimevuotinen A520 TCS23-alustalla. DSU-120 on päivittynyt etenkin energiatehokkuutta parantavin ominaisuuksin ja sen luvataan kuluttavan tyypillisessä kuormassa jopa 50 % edeltäjäänsä vähemmän tehoa, kun välimuistin hudit kuluttavat vain 60 % entisestä.

GPU-puolella pysytään edelleen 5. sukupolvessa, mutta paljon on myös uudistunut. Uusi sukupolvi skaalautuu maksimissaan 24 ytimeen ja sen nimi riippuu nimenomaan ydinten määrästä: 10 tai enemmän ytimiä ja säteenseurantatuki on yhtä kuin Immortalis-G925, 6-9 ydintä Mali-G725 ja 1-5 ydintä Mali-G625.

Suorituskykyvertailuun Arm on valinnut 14-ytimisen Immortalis-G925:n ja 12-ytimisen Immortalis-G920:n viime sukupolvesta. Yhtiön laskelmien mukaan uusi sukupolvi on 37 % nopeampi grafiikkaintensiivisissä sovelluksissa, 36 % nopeampi tekoälypäättelytehtävissä, kuluttavan 30 % vähemmän tehoa pelatessa ja olevan parhaimmillaan jopa 52 % nopeampi monimutkaisten objektien säteenseurannassa. Yhtiö tarjoaa kehittäjille mahdollisuuden vaikuttaa säteenseurannan tarkkuuteen, mikä vaikuttaa myös suorituskykyparannuksen määrään. Tekoälytehtävissä suorituskykyparannukset ovat Armin mukaan tehtävästä riippuen 29-50 prosenttia.

Lähde: Arm

This site uses XenWord.
;