Yhdysvaltalainen vuonna 2017 perustettu Ampere on julkaissut uuden sukupolven prosessorinsa. Ampere Altra -prosessorit perustuvat ARM-arkkitehtuuriin ja ne on suunniteltu palvelinkäyttöön.
Ampere Altra -prosessorit tarjoavat parhaimmillaan peräti 80 ydintä per prosessorikanta. Ytimet perustuvat Arm Neoverse N1 -ytimiin ja ne ovat yhteydessä toisiinsa mesh-tyyppisen välimuistikoherentin väylän avulla. Neoverse N1 -ytimet on suunniteltu pilvipalvelimien tarpeisiin ja niiden luvataan olevan erityisen energiatehokkaita. Altra-prosessorit valmistetaan TSMC:n 7 nanometrin valmistusprosessilla.
Prosessorin 80 ytimen tarpeita ruokitaan kahdeksalla DDR4-3200-muistikanavalla, jotka tukevat parhaimmillaan 4 teratavua muistia. Yhtiön diojen mukaan välimuistikoherentin mesh-väylän ansiosta kaikkien ydinten muistiviive on identtinen. Prosessori tukee yhteensä 128 PCI Express 4.0 -linjaa, mutta kahden prosessorin järjestelmissä varataan kummaltakin prosessorilta 32 linjaa prosessorikantojen väliselle liikenteelle, jolloin käytettäväksi jää 192 linjaa. Lisäksi tuettuna on CCIX- eli Cache Coherent Interconnect for Accelerators -väylä, johon voidaan kytkeä enimmillään neljä laitetta.
Suorituskyvyn osalta yhtiö arvioi sen Altra-prosessorin tarjoavan SPECint 2017 -testissä 4 % parempaa suorituskykyä kuin AMD:n 64-ytiminen Epyc 7742 ja peräti 123 % parempaa suorituskykyä kuin Intelin 28-ytiminen Xeon Platinum 8280. Lukemat perustuvat yhtiön arvioon kahden 3,3 GHz:n Altra-prosessorin suorituskyvystä. Lisää yhtiön suorituskykydioja löydät Serve the Homen artikkelista. Prosessoreiden TDP-arvo on mallista riippuen 45 – 210 wattia.
Ampere Altra tulee saataville yhden ja kahden prosessorikannan järjestelminä 2U-kokoluokassa. Yhden prosessorikannan Mt. Snow -palvelin on Gigabyten käsialaa, mutta kahden prosessorikannan Mt. Jade -palvelimen valmistajaa ei ole paljastettu vielä. Myös Lenovo tulee valmistamaan Altra-palvelimia, mutta se ei ole Mt. Jaden valmistaja.
Lähde: Ampere
Tuo on mielenkiintoinen ja kysymyksiä herättävä ratkaisu kun muilla valmistajilla yleensä viiveettä naapuriin on pyritty minimoimaan ja schedulerille jätetään vastuu ymmärtää käyttää mahdollisimman läheisiä coreja samalle softalle. Onnistui tai sitten ei..
Mikähän lie takana.. toteutuksen yksinkertaistus vai pinta-alan säästö tjsp.
Sinänsä ei pitäisi palvelinpuolella toisaalta häiritä, kun softat pitäisi kuitenkin kirjoitella asyncronisesti, joten vaikka yksittäinen pyyntö stallaisi johonkin niin sinänsä kokonais suorituskykyyn sen ei pitäisi pahemmin vaikuttaa. Serveripuoella kun ei tarvitse silleen minimi viiveellistä vastetta kun deskarilla peleissä.
Eiköhän tuo ole RISC prossu kuten Armit yleensäkin, eikä CISC.
Ei, vaan ARM64sta/ARMv8ia.
Tuo on ARM-prossu, ei x86-prossu.
Käyttää samaa käskykantaa kuin puhelimien prosessorit, eri kuin kuin PC-koneiden prosessorit.
Vain 128-bittisten vektorien takia ei tästä löyty hirveästi raakaa liukulukuvääntöä, mutta toisaalta SVE mahdollistaa teoriassa joidenkin sellaisten looppien vektoroimisen, mitä aiemmille vektorikäskykannoille ei ole voinut ollenkaan vektoroida. Eri asia sitten tosin on, että kuinka hyvin kääntäjät onnistuvat tässä käytännösä.
Eli kilpailevista prosessoreista vähennettiin suorituskykyä kompensoimaan oman tuloksen huonoa kääntäjää jos oikein ymmärsin?
Jos niitä varataan yhteensä 32 linjaa, niin eikö niitä silloin jää 224 linjaa vapaaksi (2 x 128 – 32 = 224)?
Juu. IMHO melkoisen törkeää/harhaanjohtavaa markkinointia.
Jos todelliset luuvt ei miellytä, käyttäisivät vaan sitten muita benchmarkkeja, joiden luvut miellyttää.
Ja palkkaisivat ihmisiä tekemään sitä kunnollista kääntäjää, se parempi kääntäjä auttaa kyllä kaikkialla muuallakin.
Todennäköisesti tarkoitetaan, että molemmista prosessorikannoista varataan se 32 linjaa (koska pitäähän ne toiselta tulevat linjat johonkin liittää), näin ainakin itse ymmärtäisin asian. Korjatkaa toki, jos ymmärsin väärin.
Toi sana "yhteensä" viittaa yleensä siihen että se on yhteenlaskettu summa, eli molemmat prossut käyttää 16 linjaa suuntaansa.
Joo siinä on käynyt joku ajatuskatkos, korjataan.
Jos tämä firma pysyy pystyssä tarpeeksi pitkään niin että ehti optimoida tuon kääntäjänsä niin ARM palvelimista tulee oikeasti kilpailukykyinen vaihtoehto muissakin kuin muutamassa niche käyttötarkoituksessa (eikös nuo ole jo nyt kilpailukykyisia jos on tarkoituksena ajaa hirveää määrää hyvin kevyitä virtuaalikoneita).