
Intel on julkaissut tänään odotetusti Tiger Lake -koodinimelliset uudet 11. sukupolven Core -prosessorit Iris Xe -grafiikkaohjaimella kannettaviin tietokoneisiin. Uudet prosessorit valmistetaan Intelin 10 nanometrin SuperFin-valmistusprosessilla.
Tiger Lake -koodinimelliset uudet prosessorit rakentuvat uusien Willow Cove -ydinten ja Xe-arkkitehtuurin integroidun grafiikkaohjaimen ympärille. Prosessoreissa on enintään neljä ydintä Hyper-threading-SMT-tuen kera ja GT2-tason Iris Xe -grafiikkaohjain 96 Execution Unit -yksiköllä. Lisäksi ne on varustettu Intel Gaussian and Neural Accelerator 2.0 -kiihdyttimellä (Intel GNA) nopeuttamaan tekoälytehtäviä.
Tiger Laken prosessoriytimet toimivat huippumalli Core i7-1185G7:ssä 3,0 GHz:n perus- ja 4,8 GHz:n Turbo-kellotaajuuksilla. Kaikkien ydinten samanaikainen Turbo-kellotaajuus on maksimissaan 4,3 GHz. Iris Xe -grafiikkaohjain toimii nopeimmillaan 1,35 GHz:n kellotaajuudella. Prosessoriydinten tukena on 12 Mt L3 -välimuistia ja prosessoreiden konfiguroitava TDP-arvo on 12 – 28 wattia. Löydät kaikkien mallien tarkemmat tiedot alla olevasta taulukosta.
Yhtiön testien mukaan prosessori olisi parhaimmillaan sisällöntuotannossa, jossa se tarjoaa Intelin testien mukaan jopa 2,7-kertaa parempaa suorituskykyä, kuin kilpailevat prosessorit. Prosessorin luvataan olevan myös parhaimmillaan kaksi kertaa nopeampi kuin kilpailijat, kun kannettavalla striimataan peliä nettiin.
Intelin kumppaneilta on luvassa markkinoille yhteensä yli 150 erilaista Tiger Lake -kannettavaa. Niitä odotetaan saataville sekä Windows- että Chromebook-kannettavissa. Prosessorit tullaan näkemään kannettavissa sekä perinteisellä Core-brändäyksellä, että uudella Evo powered by Core -brändäyksellä. Evo-brändäys on käytössä toisen sukupolven Project Athena -kannettavissa.
Lähde: Intel
Juuri tuli katottua ja saa tosiaan Tiger Lake parantaa aika paljon jos haluaa pärjätä.
Kannattaa huomata, että GCC:n rinnakkaistamista käännösprosessin sisällä on vasta aloiteltu yhden juniorin projektina GCC Automatic Parallel Compilation Viability Results Help Up To 3.3x – Phoronix
C/C++:n kääntäminen on äärimmäisen epätehokasta, kun aiempaa käännöksen tilaa on työläs selvittää (esim. seuraavan translation unitin kohdalla) ellei käytetä erilaisia puolivillaisia "optimointeja". Lisäksi include-mekanismi sotkee asioita. Linkkaus, LTO yms. perinteisen vahvasti yksisäikeiset vaiheet ovat myös vasta kehitteillä monisäikeisiksi (esim. LLVM:ssä on jo siihen suuntaan). Eli ongelma on ensisijaisesti legacy-kääntäjät ja juurisyy C/C++:n includet, moduulien puute, sekä pari muuta ongelmaa esim. template-instantiointiin ja linkkaamisen symbolikäytäntöihin liittyen.
Ainakin Linuxilla aika moni ohjelma jo hyödyntää useampaa säiettä.
Pari esimerkkiä:
– kuvakatselimissa yhdellä ytimellä kiihdytetään ensin libjpeg-turbolla ja rinnakkain säiepoolilla puretaan esim. albumin kaikki kuvat (käytän omaa katselinta tähän ja speedup on jmh:n mukaan noin ~16 vektorisoinnilla + 16-32 säikeellä, joka on optimaalisin säieluku tällä CPU:lla)
– Gimpissä on OpenCL-filttereitä, jotka voivat olla rinnakkaisia
– En ihan varmasti muista, mutta minusta hdr/raw-ohjelmat käyttävät useampaa säiettä tai pitäisi olla triviaali tehtäväjonoilla
– selaimessa (esim. Firefox) eri sivut ajetaan eri prosesseissa. Lisäksi webworkereilla voi olla oma säie jne. Grafiikan pipeline on säikeistetty
– Mesa-ohjelmat ylipäänsä käyttävät OpenGL-pipelinessä säikeitä ajureista ja ohjelmasta riippuen
– Videoneuvottelut kuten zoom käyttävät minulla ainakin kaikkia läppärin ytimiä
– Ohjelmien kääntäminen (make -j) ja IDE plugineineen käyttää useaa corea. Esim. inotifyllä havaitaan muutos, IDE voi suoraan triggeröidä build-työkalun
– Esim. Gradle luo monta rinnakkaista työjonoa. Gradle jopa jää muistiin joten prosessiaika menee aika tehokkaasti vain kääntelyyn
– R:n tyylisiin ympäristöihin on tuotu Fortran-tason vektorisointia ja säikeitä
– LibreOfficeen on kehitetty esim. taulukkolaskentaan rinnakkaisuutta (ja en näe miksei esim. oikoluku tai indeksointi yms. voisi toimia taustalla eri säikeessä)
– video– ja ääniohjelmat lienevät itsestäänselvyys. Esim. ei-lineaariset video-editorit, jopa cd:n ja dvd:n rippaussoftat
Lisäksi tehokäyttäjillä on usein komentorivillä wrapperit lamen, flacin, imagemagicin, optipng:n ja vastaavien ympärillä gnu parallelilla, joten näihin saa karkeaa tehtävärinnakkaisuutta, joka kyllä saa ainakin oman 1700x:n hörppäämään 120 ampeeria virtaa pitkiäkin aikoja.
Omassa työkäytössä isoin rasite on esim. distrojen paketinhallinnat ja linkkeri ja varsinkin lto, jotka eivät osaa rinnakkaistua. Muuten valtaosa siitä softasta, jolle tehokkuus ylipäänsä on oleellista, on rinnakkaistettu. Johonkin /bin/ls ja gnu nano -tasoisiin ohjelmiin vähemmän tarvii niitä säikeitä.
Eli tämmöisessä neliytimisessä oikeasti kiinnostaa nykypäivänä lähinnä hinta / sähkönkulutus.
Korkealle turbottava vehje rendaa nettisivut ja starttaa softat ihan tuntuvasti nopeammin kuin joku hinnat-alkaen Pentium joka on rajoitettu 2GHz kintaille.
Tuota puolison tieteellistä kirjoittamista kun katsoo, niin workloadit ovat mallia ison docx:n avaus wordiin / pdf:n rendaus ruudulle, nettiselaimessa jonkun DRM-javascript hirveyden rusautus, jotta se journali/digikirja avautuu luettavaksi jonain kammotuksena selaimeen.
Lyhyitä workloadeja joissa 4.5GHz turbot auttavat paljon, mutta neljää useammasta threadistä ei kyllä paljon ole iloa.
Edit: kyllähän tuollaista tekee vähäisemmälläkin suorituskyvyllä, mutta jos koneen ostaa 5v ajaksi, niin jotain kyllä kannattaa satsata prossuunkin, mikäli arvostaa työskentelymukavuutta. Säästetyt sekunnit säästävät hermoja pitkän päälle kun muutenkin työkalut ovat paskoja, eikä sille mahda mitään, että joku adoben drm-kikkare on jätettä.
Eli viimeinen kerta kun laitan alle 6 säikeisen prossun muuhun kuin louhinta koneeseen
Mistä testistä oikein puhut? Laittaisitko linkkiä? (ja jos kyse jostain video-oksennuksesta niin sitten mielellään linkki suoraan videon merkityksellisene kohtaan tai maininta mitä kohtaa pitäisi katsoa, ei linkki koko videoon jossa merkityksellinen kohta löytyy vasta jonkun puolen tunnin katsomisen jälkeen)
Pikaisesti ketjusta löytyi aiemmin vain tuollainen cinebench R20-testi:
Tuossa Tiger Lake pääsee parjaimmillaan yhdellä säikeellä tulokseen 589, 4800U tulokseen 489, vaikka 4800U:lla on suurempi tehobudjetti.
Eli siis Tiger Lake yhdellä säikeellä n. 20% nopeampi kuin 4800U.
Joku kiinalainen sivusto ei kuulosta kovin luotettavalta lähteeltä.
Weetabix varmaan viittasi HW unboxedin 4800U videoon, jossa se lyö ice laken aivan kaikessa mennen tullen. Voihan se olla että ne superfinit antaa 26% lisää ST suorituskykyä ice lakeen verrattuna, mutta itse suhtautuisin väitteeseen varauksella.
Eivät ole vielä julkaisseet kirjoitetussa muodossa tuota, mutta tässä lienee se oleellisin ruutu:
katso liitettä 441009
Vahva tämä. Julkaistujen lukujen valossa luvassa on tosiaan huomattava parannus mihinkään aikaisempaan nähden, siis tuossa etenkin tuossa yhden säikeen suorituskyvyssä (ja toki myös Intelin 10 nm mobiiliprosessorien 1–N säikeen kuorman kellotaajuuksissa).
En tiedä mitä teet koneellasi, mutta en kyllä ole koskaan nähnyt edes kaksiytimisen passiivijäähdytetyn Core m3 -kannettavan hyytyvän Windows työpoydälle.
Ja, se Windows -kirjautuminen on melko pitkälti yhden säikeen prosessi… (koska se ei tarvitse tehoa, siihen riittää hyvin ne Atom-johdannaisetkin).
Niin siis, pätkii *nykyisiä* Intelin prosessoreita, mutta (jos Intel ei ihan suoraan valehtele) niin tulee Intelin seuraavan sukupolven pätkimäksi *todella paljon suuremmalla erolla* kuin mitä tuo nykyinen ”pätkiminen” on.
Nyt siis Tiger Lake on yhden säikeen (ja muutaman säikeen) kuormassa jälleen parasta mitä on saatavissa, kuten viestiä kirjoittaessä myös @hkultala ehti sanomaan.
Niin, toki Intel on parasta vasta sitten kun myös sitä saa kaupoista (ei sillä, jos juuri nyt tarvitsisin nykyisessä asuinpaikassani uuden koneen, se olisi *edelleen* Intel – nyt 10-sukupolven – kurkkasin mielenkiinnosta ja tuo noiden 4800U tai 4750U Pro -kannettavia saatavuus amerikkalaisissa verkkokaupoissa on edelleen surkeaa, esim. Lenovolla on vasta muutama malli eikä vielä mitään noista oikeasti kevyistä tai kosketusnäytöllisistä).
Kurkkaus oli toki vain mielenkiinnosta, oikeassa maailmassa jouduin tämän tekemään loppukeväästä edellisen koneen tärkeimmän rajapinnan – näppäimistön – päättäessä lomauttaa pysyvästi kolmannes näppäimistä. Tuossa kohtaa noita Ryzen-koneita ei ollut lainkaan markkinoilla – paitsi se yksi verkkokameraton 4800HS-pelikannettava Asukselta – vaikka prosessorien julkaisusta oli jo pitkään. Silloin se oikean maailman valinta oli haluamani malli vanhalla Skylake-johdannaisella 8000-sarjalla tai muilta ominaisuuksiltaan huonompi kone, mutta Ice Lakella. Otin ensimmäisen, enkä kadu. Odottamalla saisi aina parempaa, mutta jos koneen tarvitsee nyt eikä parin kuukauden päästä, ei sitä voi oikein odottaakaan.
Mittakaavaa mallien puutteesta, BestBuy ei edes listaa yhtään 4800U-mallia, ja 4700U malleja ilman SMT-tukea on tasan yksi (ja siinäkin on liian vähän muistia).
Jep. Ja, mikä on esim. paljon isompi ero kuin 1065G7 ja 4800U välinen ero, tai edes AMD:n etu noihin uusimpiin Skylake-johdannaisiin nähden.
Jäämme siis odottamaan oikeita puolueettomia testejä. Nykytilanne on että Intel on surkea suorituskyvyssä, ja saatavuuteen on vähän hankala vedota kun näitä uusia Intelin laitteita ei vielä saa mistään (toisin kuin Ryzenia kun niitä saa lähigigantistakin jo).
Tiger Lake Tested: We Benchmark Intel’s Latest With Iris Xe Graphics and 10nm SuperFin
http://www.tomshardware.com
Intel’s Tiger Lake 11th Gen Core i7-1185G7 Review and Deep Dive: Baskin’ for the Exotic
http://www.anandtech.com
Varsin hyvältähän tuo vaikuttaa sekä Ice Lakeen että Ryzen 4800U:hun verrattuna, mutta tämä on tietysti vasta Intelin referenssiläppäri eikä kaupasta ostettavissa oleva tuote.
Ehkä positiivisena puolena voi laskea alhaisemman virrankulutuksen kuin Intelin edellisellä tuossa 15W tasossa (ja alempi kuin Renoir tuossa ekassa testissä). Mutta turpaan tulee liian rumasti tuolla virtamäärällä muissa testeissä.
Tässä lienee se oleellinen juttu rocket lakea ajatellen:
@hkultala :n arviot IPC jytkystä jäivät toteutumatta, ja suorituskykyparannukset johtuu suurelta osin hieman paremmasta energitehokkuudesta ja huomattavasti korkeammasta tehonkulutuksesta.
Lisäksi tolla on V/f käyrä aika epäedullinen, sillä TDP:tä kun nostetaan 15W -> 28W, niin sähköä hörpitään samojen laskutoimitusten loppuunsaattamiseksi +43%.
Nopeasti mutuilemalla näyttäisi, että prosessin + coren yhdistelmälle jännitteen mukana skaalautuvuus on aika huonoa. Todennäköisesti 8-core malli olisi merkittävästi paremman oloinen prossusuorituskyvyn suhteen, koska ytimet toimisivat paljon lähempänä optimaalista kellotaajuusaluetta kun per-core tdp olisi alempana.
GPU on minusta todella iso pettymys, mutta anandin testisuite on myös aivan jätettä.
Pikemminkin päinvastoin, skaalautuvuus jännitteen mukana on hyvä mutta itse ydin vaan on niin suuri että tehonkulutus on suuri. Näkyy 15W capatuissa testeissä joissa Tigerlaken:n 4 ydintä vie yhtä paljon tehoa kuin Renoirin 8 samalla kellotaajuudella.
–> 8 ydinmalli todennäköisesti olisi jopa hitaampi pienillä tehonkulutuksilla –> 8 ydinmallit julkaistaan vain suuremmilla TDP:llä kun mitään hyötyä pienen TDP:n piireissä ei tule.
Jep, Renoirin kepittäminenkään ei näytä itsestäänselvältä – liekö vika paskoissa ajureissa vai onko koko arkkitehtuuri susi – huonohkon ennusteen voisi tämän perusteella tehdä erillisnäytönohjaimien kilpailukykyisyydestäkin.
Ne renoirin ytimet saadaan hörppäämään jopa 140W, tarkoittaako se sitä että ne skaalautuu vielä paremmin?
Ehkä parempi olisi katsoa mitä tapahtuu prosessorin energiatehokkuudelle kun tehorajoja avataan. Eli jos tehonkulutusta nostetaan 86%, saadaan 30% lisää suorituskykyä, mutta saman asian laskemiseen kuluu 43% enemmän energiaa. Sanoisin että skaalautuvuus tällöin korkeammalle jännitteelle/kellontaajuudelle on melko heikkoa. Kyseinen luku on vielä suurelta osin monisäikeisellä kuormalla, voi vain kuvitella millasta (suhteellista)kauheutta toi energiatehokkuus on yksisäikeisellä kuormalla, kun kellot hakkaa 4,8GHz rajoitinta vasten.
Eipä tuo ainakaan akun kestävyydessä näy negatiivisesti, jos meinasit että renoirit hakkaa jatkuvasti 140w tdp limittiä.
Meinasin vaan että ne saa sen verran hörppäämään, en että missään läppärissä näin tapahtuisi.
Eikun mietin vaan että miten saat asian kääntymään niin että Renoir olisi vähemmän energiatehokkaampi suhteessa suorituskykyyn, jos Renoir voittaa Intelin siinäkin ?
Kommentti oli @Sami Riitaoja lle osoitettu, hän kun oli sitä mieltä että tiger lake skaalautuisi jotenkin hyvin, sillä sen saa kuluttamaan enemmän sähköä ydintä kohden (verrattuna renoiriin) tmv. älytöntä.
Lihavoin pari kohtaa. En heti ainakaan huomannut Tom’s Hardwaren puhuvan siitä, mikä oli niiden Renoirin TDP. Yoga Slim 7 on kuulemani mukaan vakiona 25 W, joten Intel-puolelta verrokkina pitääkin olla tuo 28 W eikä se 15 W. (Näitä ultrakannettavia osaa voi ajaa haluamallaan wattimäärällä. Oma Intel-Lenovoni on 12–15 W moodissa yleensä passiivinen, ja siinä 25 W moodissa ähisee ja puhisee säännöllisesti. Itse ajan tuota alempaa tilaa, mutta vakiona näissä on tuo ylempi prosessorista riippumatta.)
Testeihin. Positiiviset:
Yhdellä säikeellä tuo uusi Intel näyttää kyllä aika vahvalta, jos katsotaan tuota (melko edustavaa joukkoa testejä) mitä Geekbench sisältää. Tiger Lake on 39 % nopeampi kuin Renoir (ja 26 % nopeampi kuin Ice Lake). Tämä riippumatta TDP:stä, joka ei noita lyhyitä yleiskäytön ongelmia rajaa.
Ja, kun huomioi, että tuo Yoga Slim on vakiona 25 W konfiguraatio, niin tuo neliytimisen vain 5,4 % hitaampi tulos (kun TDP on 28 W) näyttää kyllä myös melko vakuuttavalta. Kahdeksanytiminen Tiger Lake veisi kaiken järjen mukaan 25 W konfiguraatiossakin Renoiria melko reilulla erolla tuossa sekalaisessa kuormassa. Sellaista ei toki ole, joten monisäikeisessä numeronmurskauksessa AMD voittaa ultrakannettavavertailun.
Peleistä. Intel voitti ainakin Tom’s Hardwaren testeissä kaikki pelitestit (kun TDP oli lähinnä vastaavaa). Anandtech oli päinvastoin. En tiedä miksi.
Anandtech, miten niin 15 W vertailussa Intel saa turpaan? Anandtechin 15 W vertailussa Tiger Lake vaati 24 % vähemmän energiaa kuin Renoir samaan määrään laskentaa (AVX-kuormassa)? Tässä osana toki, että Renoir ei ollut AMD:n vakioasetuksilla, vaan oli Microsoftin aavistuksen aggressivisemmalla turbon käytöllä (joka toki lisäsi hieman suorituskykyä muualla). Ja, verrattuna Ice Lakeen, ero oli yli kolmannes vähemmän energiaa. Akkukesto kiittää. Ja, silti tuloksissa kaikki yleiskäyttöinen koodi tuntui olevan selvästi nopeampaa Tiger Lakella kuin Renoirilla (tai Ice Lakella).
Negatiiviset:
Yksipuolisemmasa kuormassa, kuten Handbrake, Renoir kieltämättä vie Inteliä reilulla 29% erolla. Ja, myöhemmillä sivuilla vieläkin isompia eroja. Kahdeksan on enemmän kuin neljä. Ja, kumpikin prosessori laskee vähemmällä energialla alemmilla kelloilla. Jos haluaa laskea asioita, niin AMD.
Kokonaisuus:
Riippuu mihin konetta käyttää. Intel on kieltämättä nopeampi yleiskäytön kuormassa, mutta toisaalta aika harva noista kuormista on raskaita. AMD murskaa numeroita paremmin, mutta harvapa 15 W kannettavalla noita murskaa jatkuvasti. Voittaja riippuu painotuksista. Akkukestossa luultavasti ovat lähes tasoissa, koska normaalissa käytössä kumpikin vie niin vähän, että se näyttö dominoi… ja kuormassa riippuu kuormasta kumpi voittaa. Itse poimisin nykyhetkessä sen kumman saa nätimmässä koneessa. Erot on marginaalisia, ja riippuu käytöstä.
Niin eihän tuo mikään ihme olisi, kun tiger laket on 10nm ja renoirit 7nm valmistustekniikalla. Varmasti on AMD:llä energia tehokkaammat ytimet vs. Tiger lake ihan minä viikonpäivänä tahansa ja nuo testithän sen aika pitkälle todistaakin.
Vertailet valmistusprosessien markkinalukuja suoraan keskenään?
Ja, tuolla testeissä Intel vei noiden kahden 15 W vertailutestin osalta vähemmän sähköä jos AVX-512 oli saatavilla, ja saman määrän jos sitä ei ollut, siis tuo sivu 7: Intel’s Tiger Lake 11th Gen Core i7-1185G7 Review and Deep Dive: Baskin’ for the Exotic
Kyllä se on nähtävissä kautta linjan että Intelin 4 ydintä vie enemmän virtaa kuin mitä olettaisi. Jos 4:llä ytimellä hädintuskin pärjätään akun kulutuksessa 8-ytimiselle suorittimelle, niin ei voi kehua ainakaan vähävirtaiseksi.
Tuossa linkkisi lopussa sanotaan vielä: "In this case, it’s a win for Renoir – a lot shorter time, and better power to boot, derived from the eight cores built on TSMC 7nm. "
Valikoivaa lukemista siellä, kun näyt ohittaneet sen ensimmäisen testin johtopäätöksineen. Siis sen, jossa: ”All three systems perform the test in roughly the same amount of time, however the Tiger Lake system is very much ahead for efficiency. ”
Siis tuo minun valikoima kohta oli koko arvostelun loppukaneetti, eli totesivat Renoir:n paremmaksi tuotteeksi kaikenkaikkiaan. Intelin energiatehokkuus ei auta kun koko suorittimella ei yksinkertaisesti riitä vääntö edes ulv-käytössä.
Puhut nyt ihan suoraan paskaa. Tuo lainauksesi on sivun 7 lopusta, ja koskee vain tuota ”Professional ISV Workload”. Sillä samalla sivulla on kaksi erillistä testiä, joista ensimmäisen ohitat kokonaan koska – oletettavasti – se ei sovi agendaasi.
Koko testin loppukaneettina on huomattavasti neutraalimpi ”Tiger Lake isn’t sardine oil basting AMD just yet, but it stands to compete well in a number of key markets.”
Ja, miten niin ei riitä vääntö ULV-käytössä? Kyseessä on edelleen se selvästi nopein suoritin tyypillisessä ULV-käytössä, jossa kuorma on yleensä yhden säikeen ja kaiken lisäksi lyhytkestoista.
Samaa todettiin arvostelun lopussakin myös, että on vaikea keksiä mitä intel yritti koko prossulla. Onhan se parempi kuin ice lake, mutta käytännössä kuitenkin turha vs Renoir.
Yhdellä säikeellä saatikka 4:llä ytimellä ei kyllä pitkälle pötkitä tuossa käytössä.
Intel Tiger Lake And Xe Graphics Benchmarks: Laptops Will Roar
hothardware.com
Se ensimmäinen on AVX-512 optimoitu testi. Sen voi ohittaa merkityksettömänä, sillä et sä tule ultrabookilla moista työtä tekemään.
Jos mielestäsi näin ei ole, niin anna toki esimerkki.
Niin ja tietty virrankulutustestejä oikeasti muutenkin odotan eri skenaarioissa. Näissä testeissä kun Intel on aina erikseen mainostanut että virrankulutusta ei saa testata kun eivät ole sille optimoitu vielä ja sitten taas pci4 löytyy mutta sitä ei ole aktivoitu ’verifioinnin takia’. Kuulostaa tuokin vähän selittelyltä, kun pcie4 ei ole läppärissä ihan sen takia että jos kontrolleri vie 8w lisää sitä virtaa niin akkukesto tippuu aika reippaasti.
Joissakin hybridi tehtävissä tuosta Xe:stä voisi olla apua ja varmaan joissakin testeissä hakkaa Ryzenin kun sen integroitua piiriä tuetaan vieläkin aika heikosti joissakin softissa.
Se "7nm" on vain markkinoinnin keksimä luku, sillä ei ole MITÄÄN tekemistä sen prosessin minkäään mittojen kanssa.
Intelin "10nm" tekniikassa pienin sähköjohtojen väli on 36nm, TSMCn "7nm" tekniikassa 40nm
7 nm lithography process – WikiChip
en.wikichip.org
10 nm lithography process – WikiChip
en.wikichip.org
Siis eihän tuo Tigerlaken skaalautuvuus ole missään tapauksessa huonoa, 30% lisää suorituskykyä 43% suuremmalla energiankulutuksella on vielä ihan hyvää skaalautuvuuutta. Ongelmahan on nimenomaan että tehonkulutus on kauttaaltaan suurta, samalla kellotaajuudella Tigerlaken ytimet kuluttavat aika tarkkaan tuplasti tehoa vs. Renoirin ytimet. Eli 15W capatty Tigerlake käy kaikkien ytimien täydessä rasituksessa tästä syystä vain 1800Mhz:n kellotaajuudella ja 12W capatty vain 1200Mhz:n kelloilla. 15W 8C Tigerlakessa ei siis olisi järkeä ja 28W:n 8C versiokaan ei olisi tehoissa edellä kuin aavistuksen 4-ytimistä. Piiriin on turha tunkea suuria ytimiä enempää kuin tehobudjetti antaa myöten käyttää. Eli 8C Tigerlake jos tulee nähdään todennäköisesti vain suuremmissa TDP-versioissa.
Ja Intelin diojen mukaan Tigerlaken skaalautuvuus ei lopu vielä tuohon 4,8Ghz:iin vaan energiatehokkuuden kustannuksella kelloja saa korkeammallekin – tosin tehonkulutus per ydin nousee suurinpiirtein 4W per 100Mhz eli em. vaiheessa mennään sinne huonon skaalautuvuuden alueelle.
Mistä päättelet nuo oikeasti toteutuvat kellotaajuudet? Testeissä niistä ei ole mainittu missään mitään.
Spekseissä ilmoitetut kellotaajuudethan ovat toteutuvat minimit tietyillä TDP-tasoilla ja oikeasti testin aikana kellotaajuus heiluu miten sattuu riippuen siitä suoritettavasta koodista.
Ja tarjoavat n. 10-20% enemmän suorituskykyä. Ei kuulosta kovin hyvältä.
En kyllä ymmärrä, että miksi heitellään tällaisia huuhaaväitteitä "10-20% enemmän suorituskykyä tuplavirrankulutuksella", kun testitulokset eivät sellaista ilmaise.
Toi tuplavirrankulutusarvion heitti @Sami Riitaoja enkä sitä alkanut sen kummemmin tarkistamaan. Suorituskyky on ton 10-20% parempi yhden ytimen kuormissa.
edit:
Sami vissiin tarkoitti, eli kun sähköä annetaan ydintä kohden tuplasti (verrattuna renoiriin), niin suorituskyky per ydin olisi intelillä edelleen parempi. Tämä ei kuitenkaan pidä paikkaansa ollenkaan. Ainoat relevantit testit joissa toi intelin uusi tulokas voittaa renoirin on yhden säikeen kuormat, joissa oletettavasti myös sähkönkulutus on merkittävästi korkeampaa. Tätä eivät anandilla valitettavasti kerenneet testaamaan kunnolla.
katso liitettä 447654
edit2:
Osittain ero löytynee siitä että tiger lake voi yhden ytimen kuormilla kuluttaa hieman yli 15W sähköä, siinä missä U sarjan renoir on rajattu n. 12,5W kulutukseen. Renoir ei arkkitehtuurina ylipäänsä kauheasti tuota enempää saa kulutettua per ydin, tai ainakaan sen käytännön tehot eivät siitä juurikaan enää nouse. Eli tällä mittarilla tuo tiger lake on selvästi parempi prosessori, toisin sanoen se soveltuu paremmin korkean TDP:n tuotteisiin. Matalalla TDP:llä per ydin renoir taas vie ihan kovalla marginaalilla.
Eivät Intelin prossut todellakaan toimi noin normaalin koodin tapauksessa.
CPU:n kellotaajuus tietyllä TDP-limitillä riippuu siitä, että kuinka paljon ILP:tä ajettavasta koodista pystytään repimään ja kuinka täynnä ALU:t pystytään pitämään. Mitä enemmän cache-missejä koodissa ja mitä pahemmat riippuvuudet peräkkäisten laskutoimitusten välillä on, niin sitä korkeammille kelloille se ydin kellottuu.
Esim. mulla on tässä läppärissä 8-coreinen Intelin prossu, jonka baseclock on 2.4GHz. Käytännössä prossu toimii n. 3.5GHz taajuudella 16 threadin rasituksessa pitkässä rasituksessa n. 40-42W tehonkulutuksella, jos koodi on normaalia skalaarikoodia. Jos ajan AVX-256 koodia 16 threadillä, niin kellotaajuus laskee aavistuksen n. 3.35-3.4GHz kintaille ja tehon kulutus nousee muutamalla watilla 42-45W välille.
(Testisoftana just nyt Intelin Power Gadget, kun se sattui olemaan valmiina).
15W:llä Tigerlake pyörii lähes varmasti korkeammilla taajuuksilla kuin 1.8GHz. Mutta kun tuo review ei kerro meille niitä kellotaajuuksia, niin on lähes mahdotonta arvioida sitä, että miten tuo oikeasti skaalautuu.
Juu tuo on ihan totta. Renoir olisi luultavasti merkittävästi energiatehokkaampi ST kuormilla jossain 5-7W TDP läppäreissä, jolloin Tiger Lake ei pystyisi enää ST kuormassa nostamaan kulutustaan n.16W ST optimiinsa. Jännä kyllä laskella noista, että jos Tiger Lake kuluttaa sen n. 16W per ydin sähköä 4,8GHz kellontaajuudella, niin 8 ytiminen Tiger Lake malli skaalautuisi aika nätisti aina 128W TDP:lle asti. Rocket Lake tulee 8:lla ytimellä ja 14nm tekniikalla todennäköisesti olemaan todella janoinen prosessori.
Millä laskutoimituksella päädyit tuollaiseen tulokseen?
Rocket Laken seuraajalle Alder Lakelle (10 nm) lupailtiin kyllä jossain Inteliltä vuotaneessa diassa 125W TDP:tä. Tosin ydinkonfiguraatio olisi siinä 8 isoa ja 8 hitaampaa energiatehokasta ydintä. Kahdeksalla isolla ytimellä vain 80W.
Juu siis kyllähän kellotaajuudet normaalisti nousevat epäedullisen koodin suorituksessa maksimikuormaa korkeammalle. Mutta tässä oli nyt maksimikuormitus vs TDP pohjana vertailulle juuri sen takia että siitä voi lähteä vetämään referenssiä siihen auttaako ytimien lisääminen TDP:n sisällä suorituskykyyn vai ei. Kovin tarkkoja vertailuja ei nyt voi tehdä mutta hyvin summittainenkin arvio näyttäisi että ytimien lisääminen ei hyödytä Tigerlakea millään tavalla matalilla TDP:llä, eli teoreettisetkaan mipsit piirillä eivät juuri nouse ytimien lisäämisestä koska kellotaajuudet lliki puolittuvat ytimien tuplaamisesta pienillä tehorajoilla.
Puhtaissa ST kuormissa Tiger Lake on hieman nopeampi 28W TDP asetuksella kuin 15W TDP:llä. Ero on pieni, mutta tarkoittaa että ST suorituskyvystä ei saada kaikkea irti vielä 15 W kulutuksella. 16W on oma arvio siitä että missä se raja noiden tulosten valossa luultavimmin pyörii.
Itse vedän läppärillä 9750h:lla 3267p.
Kaikki reaalimaailman koodi on epäedullista. Esim. Cinebench 20 9980HK:lla kaikki taustasoftat päällä jne. pyörii testin loppupäässä n. 49W pkg-powerilla 16 threadin rasistuksessa 2.9-3.0GHz kellotaajuudella, eikä siellä 2.4GHz base-clockilla.