Huhtikuussa 2016 AMD:lle saapui ensimmäiset Globalfoundriesin 14 nanometrin prosessilla valmistetut Zeppelin-koodinimelliset piisirut. Zen-arkkitehtuurin suunnittelu oli aloitettu jo neljä vuotta aiemmin, joten käsissä oli 300 insinöörin ja parin miljoonan miestyötunnin aikaansaannos eli Ryzen-prosessoreissa käytettävä 8-ytiminen piisiru.
Piisirun testaamista varten AMD oli kasannut 80 hengen insinööriryhmän, mutta piirisuunniteluun oli lipsahtanut suunnitteluvirhe, jota ei oltu havaittu tietokonesimulaatioissa ennen valmistusta. Piisirua ei saatu edes toimimaan.
”What Su didn’t anticipate was that when the Zeppelin finally got to Austin, it would crash-land”
Ensimmäisenä toimenpiteenä AMD:lta soitettiin Globalfoundriesille ja käskettiin keskeyttää tuotanto välittömästi. Teknologiajohtaja Mark Papermaster soitti toimitusjohtaja Lisa Sulle ja kertoi tilanteen, mutta Sun mukaan testausta ei voitu viivästyttää. Jos ongelmaa ei saataisi korjattua nopeasti, edessä olisi viikkojen tai kuukausien viivästys.
Neljä erillistä työryhmää alkoivat selvittää prototyyppisirun ongelmaa ja mahdollisia ratkaisuja. Su kuvailee toiminnan siirtyneen ”Apollo 13” -tilaan ja kertoneensa työntekijöille, että epäonnistuminen ei ollut vaihtoehto.
Zeppelin-piisiru rakentuu viidestä miljardista transistorista ja siinä on noin 100 eri kerrosta. Suunnitteluvirhe vaikutti AMD:n onneksi vain alle 0,01 prosenttiin transistoreista, ongelmaan löydettiin ratkaisu ja se saatiin korjattua tehtaalla lopulta kuukaudessa. Lisäksi ongelma pysytyttiin kiertämään ja testit saatiin aloitettua jo aikaisemmin.
AMD julkaisi lopulta ensimmäiset Ryzen-prosessorit markkinoille maaliskuussa 2017.
Lähde: Fortune
Ei vain mene jakeluun miten perkeleessä tuollainen voi lipsahtaa läpi noin myöhäiseen prosessin vaiheeseen. Samalla täytyy myös antaa vuoren kokoiset propsit AMD:n työryhmien naisille ja miehille. Olihan tuo aika sankaritason pelastus.
Kyllä sitä paljon isommissakin projekteissa on tullut paljon suurempiakin virheitä. 😀
Näissä tilanteissa yleensä korostuu porukan kyky soveltaa ja miten määrätietoisesti tilanne saadaan hallintaan, ilman että aiheutetaan paniikkia. Propsit AMD:lle, että hoitivat homman kotiin. :tup:
Kyllä sitä helposti ihan monta milliä leveä virtalinjan pätkäkin saattaa puuttua piirilevyltä vaikka olisi simuloitu ja tehty testiversiokin levystä. Kyse onkin tosiaan siitä miten nopeasti ja tehokkaasti asiaan reagoidaan, ettei homma leviä ihan käsiin, kun tuotanto on jo käynnissä.
Tuollaiset prosessorit ovat varmaan monimutkaisimpia testata ja simuloida mitä löytyy. Kuuleman mukaan sekä AMD:llä, että Intelillä olisi kokonaisia palvelinfarmeja, jotka ajavat pelkästään simulaatiota tulevista prosessoreista ja nuo simulaatiot eivät ole mitään päivän parin pikkutestejä.
Täähän vähän kutsuu Der Üntergang pätkää.. Kova suoritus että kuukaudessa korjataan, hattu päästä ja kumarrus AMD:lle!