Til hovedinnhold

Elektromigrasjon

Hva er elektromigrasjon?

Elektromigrasjon og overklokking

Når man overklokker en prosessor, er det et par ting man bør tenke på. Når man øker busshastigheten (FSB) øker man samtidig båndbredden på RAM og alle andre tilkoplede enheter, som ikke nødvendigvis takler hastighetsøkningen like godt. Mange kjenner også det trikset man bruker når man har en prosessor som "nesten gjør 850MHz" - du øker prosessorspenningen litt, og klarer 850 i hvert fall en stund.

Men hva skjer med prosessoren din når du overklokker den, kjører den på hastigheter og spenninger langt over det den er solgt som, uten å sørge for tilstrekkelig kjøling? Det er dette elektromigrasjon dreier seg om for oss overklokkere.

Hva er elektromigrasjon?

Harris Semiconductor Lexicon of technical terms sier det på denne måten:

Motion of ions of a metal conductor (such as aluminum) in response to the passage of high current through it. Such motion can lead to the formation of "voids" in the conductor, which can grow to a size where the conductor is unable to pass current. Electromigration is aggravated at high temperature and high current density and therefore is a reliability "wear-out" process. Electromigration is minimized by limiting current densities and by adding metal impurities such as copper or titanium to the aluminum.

På godt norsk betyr dette at en ekstremt tett elektronstrøm slår av atomer inne i selve lederen og flytter dem. Dette resulterer i et hull i den ene enden og svært stor belastning i den andre enden. I en chip vil formasjoner av slike hull forårsake brudd, og dermed en defekt i prosessoren. I den andre enden kan den økede belastningen resultere i brudd i isolasjonen rundt lederen og dermed kan det oppstå kortslutning mellom to eller flere av disse.

Skjematisk diagram som viser drifting ved katoden, og opphoping ved anoden. Også vist er top-view av en TiN leder med kobber segmenter av varierende lengde.

For å si det helt enkelt betyr dette at når en elektrisk strøm går igjennom en leder, vil noen av metallatomene bli dradd videre sammen med elektronstrømmen.

Dette bildet fra et elektronmikroskop (SEM) viser resultatet av elektromigrasjon

Jo mindre man lager en leder, dess kraftigere blir denne effekten, og trenden i CMOS-teknologien er at de blir mindre og mindre for hvert år. Etterhvert som prosessorkjernene skrumper inn, øker operasjonsfrekvensen, og i snitt har hastigheten økt med omtrent 30% hvert år de siste 15 årene.

Denne økningen vil fortsette eksponensielt. I 1999 spådde The Semiconductor Industry Association en minskning av produksjons-prosessen fra dagens 0,18 micron til 0,13 micron innen slutten av 2003, men allerede nå ser det ut som om både AMD og Intel ligger et godt stykke i forkant av denne spådommen.

Så langt kan det se ut som om problemene i forbindelse med elektromigrasjon kommer til å øke i samme takt som klokkefrekvensen. Så kom kobber...

Aluminium mot kobber

I midten av 90-årene fant IBM ut en fremstillingsmåte som gjorde det mulig å bruke kobber som leder i prosessorer (interconnect), i stedet for aluminium, uten å få problemer med at atomene hoppet ut av kobberlederen, og ut i det omkringliggende chip-materiale. Denne teknikken er nå kjent som "Dual Damascene Cu".

Nå som flere av dagens prosessorer er basert på denne teknologien, både på grunn av pris og mulighet for høyere hastigheter, har det vist seg at dette medbringer en tidligere ukjent bonus. Forskning har vist at Dual Damascene Cu har en mye større motstandsdyktighet mot elektromigrasjon enn den tidligere hyppig brukte aluminium interconnect-teknologien. Dette er klart illustrert i bildet under:

De to metallene har blitt utsatt for nøyaktig de samme belastningene, men mens aluminiumslederen har fått tæret vekk nærmere 1/3 av lengden, er kobberlederen nesten uberørt. Under følger et utdrag av en rapport fra IBM som tar for seg og sammenligner kobber og aluminium interconnects:

- The integrity of the damascene-copper process was evaluated by fabricating 288-Kb SRAMs and performing the standard package thermal cycle and temperature/humidity/bias stresses. In addition, we performed electromigration and stress-migration lifetime measurements of 300 nm wide / 400 nm high wires. For all stresses, subtractive-aluminum control wafers and chips were also fabricated as a reference. The yields for the packaging stresses were excellent, with 0% fails for the damascene-copper chips and 0.4% for the subtractive-aluminum-control chips. Figures 1 and 2 show electromigration and stress-migration data for the 300 nm multilevel wires. Compared with the subtractive-aluminum wires, the damascene-copper wires exhibited more than two orders of magnitude improved reliability. Based on these reliability data, we believe that damascene-copper wiring is fundamentally more reliable than subtractive-aluminum wiring.

StressCopper-Aluminum-
nYieldnYield
2.3V 100°C 5hrs149100%247100%
2.7V 140°C 5000hrs149100%24496.6%
0 - 125°C thermal cycle 20X149100%244100%
-40 - 150°C thermal cycle 200X149100%244100%
-65 - 150°C thermal cycle 1000X11400100%--
-160 - 300°C thermal cycle 200X11400100%--

288-Kb SRAM Functional Stress Results for Subtractive-Aluminum and Damascene-Copper Interconnects

Figure 1. Electromigration Data at 295°C and 2.5 MA/cm2 for Damascene-Copper vs. Subtractive-Aluminum 300 nm Multilevel Lines.

Figure 2. Stress-Migration Test Structure Resistance vs. Time for Damascene-Copper and Subtractive-Aluminum 300 nm Wires (20 Chips Each).

Det som er viktig for oss her, er det som er vist i figur 1. Tiden det tar før det oppstår en feil i kobberlederen sammenlignet med aluminium-lederen er over 100 ganger lengre (150 timer for kobber, mot 1,3 timer for aluminium). Men hvordan påvirker dette min prosessor?

Hva betyr det for meg?

Hvordan påvirker dette min prosessor?

Det har blitt utgitt en rekke tekniske artikler om emnet elektro-migrasjon, men så godt som alle har fokusert på "forced electro-migration", eller tvungen elektromigrasjon, med tanke på testing av chiper. Det er nærmest umulig å oppdrive noen form for litteratur eller dokumentasjon hverken på elektromigrasjon ved normal bruk av prosessoren, eller overklokkede prosessorer. Men når man leser om tvungen elektromigrasjon, kan man se klare likhetstegn mellom dette og overklokkede prosessorer. Jo høyere temperatur, dess større kjangs for at det skal oppstå elektromigrasjon.

Spenning og Varme

Som nevnt tidligere i denne artikkelen, så er det fullt mulig å øke driftsspenningen til en prosessor for å få den til å yte det lille ekstra du er ute etter.

Denne figuren viser sammenhengen mellom maksimum operasjons-frekvens og driftsspenning. Den maksimale operasjonsfrekvensen er proporsjonal med (Vth-V) 1,25/V), hvor vi antar at Vth er lik 0,6V. Mellom 1V og 3V er frekvensen omtrentlig proporsjonal med driftsspenningen, noe som betyr at hvis du har en prosessor som kan kjøre på 850MHz ved 1,5V, vil den normalt kunne kjøre på 1,0GHz til 1,13GHz ved 2,0V.

Når man øker driftsspenningen og operasjonsfrekvensen, betyr dette en økning i varmeutvikling og utstråling fra chip'en; en dobling av spenningen betyr en mulig dobling av frekvensen, men det øker også varme utviklingen med rundt 800% - ikke 400% som man skulle tro. Hvis en prosessor normalt produserer 25W varme, vil den, ved dobbel spenning og frekvens, produsere ca 200W varme!

Hvordan bli kvitt varmen

Nå når vi har lært at høyere spenning og frekvens resulterer i høyere temperaturer, er det på tide å se på noen av mottiltakene: Prosessorkjøling har blitt et svært viktig emne i forbindelse med overklokking. I løpet av de siste årene har man sett en trend med store og dyre kjøleribber og andre, enda mer eksotiske kjøleenheter på det kommersielle markedet. Da jeg for første gang prøvde å overklokke fantes det ingen kjøleribber med kobberinnlegg og doble, super-effektive kjølevifter. Alt måtte bli laget for hånd, og den første gangen jeg så en Slot1 Alpha beundret jeg den med ærefrykt.

Nå for tiden kjemper de forskjellige produsentene om å være i stand til å levere de beste kjøleribbene. Prosessorkjøling har blitt en vitenskap, og det har blitt "big business". Bortsett fra det faktum at god kjøling minsker faren og muligheten for at elektromigrasjon skal oppstå, lar det deg også kjøre din prosessor mye mer stabilt, høyst sannsynlig også på en høyere hastighet.

Jeg forstår jo at en gjennomsnitts overklokker gjør dette delvis for å få et par ekstra megahertz gratis, og delvis også "for the sport of it all". Det betyr at det er de færreste av dere som gjør dette for aller første gang punger ut 4-500 kroner for en kjøleribbe i rent kobber, men heller går for en mer kostnadseffektiv løsning.

Nedkjøling

Forced Air Convention (vanlig kjøleribbe med vifte)

En kjøleribbe har til oppgave å kvitte seg med varmen fra prosessoren, og ut til omgivelsene. Ganske så mange timer har blitt brukt for å finne formelen til "Den ultimate kjøleribbe". Jeg tviler på om noen har funnet den, og jeg tviler på at den noen gang vil bli funnet, men det er allikevel et par ting du kan se etter når du skal kjøpe en prosessorkjøler.

Jo større overflate den har, jo raskere vil den kunne kvitte seg med varmen fra prosessoren. Det du bør ha er en kjøleribbe med mange finner eller pinner og gjerne en skjerm rundt ribben for å hindre at den luften som nettopp har kjølt ribben, og som nå har blitt oppvarmet, blir "resirkulert".

En kjøleribbes effektivitet blir målt i K/W eller C/W, hvor K=Kelvin og C=Celsius. Lavere K-faktor er bedre. La oss anta at vi har en 0,4K/W kjøleribbe, og vi ønsker å overklokke en PIII 700 til 931MHz. Ved 931MHz vil PIII 700'en avgi omtrent 35W med en driftsspenning på 1,8V:

0.4 x 35W = 14 grader høyere enn temperaturen i kassa.

Hvis du har en haug med høyhastighets harddisker, DVD-spillere og andre varmeutviklende enheter og en kasse som ikke har tilstrekkelig ventilasjon, er det ikke uvanlig med en kassetemperatur på ca 30C° til 40C°. Dette gir oss en prosessor temperatur på:

40C° + 0.4 x 35W = 54C°

Det er helt opplagt at en så høy temperatur ikke er ønskelig, så her må du lete etter andre måter å senke temperaturen på.

Varmeledning

Mange kjøleribber blir solgt med en termisk matte (thermal pad) montert på basen (i bunn av kjøleribba). Fjern denne og erstatt den med termisk pasta. Ha i bakhodet at enkelte CPU'er har en ganske skjør "core", dvs den delen av prosessoren som berører kjøleribben, så vær forsiktig. Påfør et jevnt og tynt lag med pasta, så bør temperaturen synke med et par grader og i beste fall flere grader. For en nærmere beskrivelse av hvordan du gjør dette, kan du sjekke goop-guiden vår.

En annen sterkt anbefalt måte, som for øvrig er helt gratis, er å øke effektiviteten til kjøleren ved å redusere den termiske resistansen mellom kjøleribben og prosessoren: lapping av kjøleren. Dette gjorde jeg på en standard Intel kjøleribbe en gang, bare for å se om det virket, og resultatet var svært overbevisende. Først ble jeg sjokkert da jeg så hvor konkav den egentlig var, men da jeg ble ferdig, og fikk testet den, gled sjokket over i glede: Ikke bare sank temperaturen med 3 grader, men det gjorde også at jeg kunne kjøre CeleronII 566'en min på 918MHz i stedet for 892MHz!

Når det gjelder lapping av selve CPU'en, vil jeg være litt mer tilbakeholden, da spesielt med tanke på nyere prosessorer, både på grunn av ESD og, som jeg nettopp nevnte, sårbarheten. Mer informasjon om lapping finner du uansett i vår planslipingsguide.

Kabinettkjøling

Kabinettkjøling er definitivt den mest effektive måten å senke temperaturen på, og det er ganske lett også.

En vanlig datamaskin kommer normalt med en vifte, og den sitter inne i selve strømforsyningen. På grunn av en gammel ATX-standard hender det at enkelte strømforsyninger har vifter som suger luft inn i kassa i stedet for å blåse den ut. Dette er jo i grunnen ganske tåpelig, fordi at da blir all den varme luften som datamaskinen produserer resirkulert inne i kassen. Resultatet er at det blir svært varmt. Har du en slik strømforsyning, vil jeg anbefale at du åpner den, og rett og slett snur viften. Husk på at en slik operasjon vil oppheve enhver garanti som måtte finnes på strømforsyningen.

Videre bør du skaffe en vifte til for å sette i fronten. Denne skal suge kald luft inn i kassen, og man får dermed en bra luftgjennom-strømning. Til slutt vil jeg anbefale deg å fjerne det som hindrer luftstrømmen, nemlig kabler. Kabler og ledninger har en lei tendens til å flyte rundt over alt, og dette bør det gjøres noe med. Åpne kabinettet ditt og se inni.

Klikk for større bilder

Ser det ut omtrent som her, er du på rett vei. Hvis ikke vil jeg si at det er på tide med en liten opprydning. Et godt tips her er å samle alle strømkabler og feste dem med strips. Splitting av IDE og floppy disk kabler frigir masse plass, og det ser ganske fett ut også.

Konklusjon

En prosessors design blir testet på mange forskjellige måter, som for eksempel temperatur og fuktighet, i forkant av lansering på det kommersielle markedet. Denne testingen inkluderer også testing på elektromigrasjon. På grunn av denne testingen anser man ikke elektromigrasjon som et reelt problem ved normal bruk av chipen.

Overklokkede prosessorer kjøres ikke innenfor de rammer som kan defineres som normal bruk, og dermed, på grunn av høyere spenning og frekvenser, er det større kjangs for at elektromigrasjon kan oppstå. Man kan anta, tatt i betraktning alle de ekstra påkjenningene overklokkingen medfører, at livsløpet muligens kan bli redusert med en faktor av 10 til 100 i forhold til en normal chip.

Det innebærer at vanlige brukere av datamaskiner overhode ikke trenger å bekymre seg om dette. Når det gjelder overklokkere derimot, er det en ting som er helt klar: jo høyere temperatur og spenning det er på prosessoren, dess fortere vil atomene forskyve seg, og resultatet kan bli en defekt i prosessoren. Det er ikke så mye man kan gjøre med dette, ettersom det er kun en faktor vi kan forandre, nemlig temperaturen.

Hvis vi senker temperaturen i en chip, senker man automatisk også energi-nivået til atomene inne i chipen. Dette betyr at det tar mye lengre tid, og vil kreve mye mer energi, å flytte på atomene. Dermed har man mulighet for å i stor grad eliminere faren for elektromigrasjon. En annen side av samme sak er at hvis man senker temperaturen i en chip, vil effektiviteten til chipen øke. Senker man temperaturen til -120C° får man en teoretisk økning i effektiviteten på hele 100%, så konklusjonen er helt klar: Jo kaldere, jo bedre!

annonse