Intel Pentium 4 "Prescott"
Introduksjon
Intels nye Pentium 4 "E" prosessor, bedre kjent som "Prescott" er endelig lansert [les vår nyhet]. Det som så ut til å være en enkel forbedring av "Northwood"-kjernen, med 1 MB L2-cache og 90 nm produksjonsprosess, viste seg å være en langt grundigere affære, med mange kritiske forandringer.
Normalt har en overgang til mindre produksjonsprosess resultert i lavere effektforbruk, samtidig som det blir mulig å øke klokkefrekvensen ytterligere. Denne gangen har det gått stikk motsatt. Klokkefrekvensen er ved introduksjonen den samme som for den eksisterende "Northwood"-serien. "Prescott" introduseres på frekvenser fra 2,8 GHz opp til 3,4 GHz. Den raskeste prosessoren ser dog ikke ut til å bli tilgjengelig med det første.
Ryktene har gått om en prosessor med et enormt strømforbruk og en tilsvarende varmeutvikling som skal være vanskelig å hanskes med. Spekulasjonene om ytelsen har også vært mangfoldige. I løpet av denne testen kan vi forhåpentligvis bidra til å besvare noen av spørsmålene.
Vi takker Intel for lån av prosessoren.
Spesifikasjoner
Vi tar først for oss de mest åpenbare forskjellene mellom Northwood- og Prescott-kjernen:
Prescott til venstre, NW til høyre
| "Northwood" | "Prescott" | |
|---|---|---|
| Produksjonsprosess: | 130 nm | 90 nm |
| Antall transistorer: | 55 mill. | 125 mill. |
| Die-size: | 131 | 112 |
| vcore: | 1.47-1.55V | 1.3V - 1.5V |
| Pipelines (eksklusive "decoding stages") | 20 | 31 |
| L1-cache: | 8 kB | 16 kB |
| L2-cache: | 512 kB | 1024 kB |
| SIMD-instruksjoner | SSE/SSE2 | SSE/SSE2/SSE3 |
| TDP (3,2 GHz) | 82 W | 103 W |
Det første som slår en er at antall transistorer er fordoblet, til tross for at de opptar mindre plass enn tidligere. Det er ikke bare 90 nm produksjonsprosess som bidrar til dette, men også det faktum at Intel pakker cachen ekstremt tett. Til tross for at den 1 MB store L2-cachen tar nesten halvparten av transistorene, utgjør den en langt mindre del av kjernearealet, noe man kan se av bildet under. L2 er de "fargede" firkantene med rutemønster øverst (trykk for større bilde):
(kilde: Intel)
SSE3
Med prescott kommer også 13 nye SIMD-instruksjoner, ifølge Intel introdusert "by popular demand" fra utviklere. For øyeblikket er det så godt som ingen programmer som støtter de nye instruksjonene.
(kilde: Intel)
De to nederste instruksjonene, "monitor" og "mwait" er meget interessante, fordi de gjør det mulig å øke ytelsen til Hyper-Threading, uten at de må bygges inn i programvaren. De må derimot støttes av operativsystemet, noe som ikke er tilfelle for Microsoft sine operativsystemer i skrivende stund. Det er fortsatt ikke klart om eller når det kommer en patch til Windows XP.
"Pipelines"
Det som har overrasket de fleste med denne prosessoren, er at den ikke har de to ekstra stegene i pipelinen slik man først trodde - Intel har derimot introdusert hele 11 nye trinn. Ved å dele opp pipelinen i flere deler som hver får mindre å gjøre, tar hvert steg kortere tid og man kan skru opp frekvensen. Ulempen ved denne meget lange pipelinen er at prosessoren blir ekstremt sårbar for "mispredictions", som er tilfelle når prosessoren "gjetter" feil, og må utføre instruksjoner den ikke hadde ventet. Dette betyr at prosessoren må stoppe opp i arbeidet og hente nye data fra cache eller i verste fall fra minnet. Slikt tar tid, og det er dette som er hovedgrunnen til at Pentium 4 gjør mindre arbeid per klokke sammenlignet med andre prosessorer. For å prøve å bøte på dette problemet har Intel gjort mange vesentlige forbedringer i Prescott sin "branch-predictor".
"Strained Silicon"
Intel har også gjort forbedringer i transistor-teknologien. Ved å introdusere stoffer i silisiumen som øker avstanden mellom atomene blir det enklere for elektronene å bane seg vei. En grov simplifisering, men det ihvertfall slik det lyder fra Intel sin PR-maskin.
(kilde: Intel)
ALU-hastighet
Pentium 4-kjernen har 3 ALU-enheter. To av dem er dedikert "enkle" instruksjoner, mens mer kompliserte operasjoner blir håndtert av den tredje, slik at disse i minst mulig grad skal bremse prosessoren. De to ALU-ene kan ta unna to enheter per klokkeslag, og kalles derfor "double-pumped". Det ble spekulert i at Intel måtte halvere hastighetene på disse i Prescott, men det viser seg å ikke være tilfelle. Derimot har Intel utvidet mulighetene til de to "double pumped"-enhetene, slik at de kan ta seg av to operasjoner som tidligere måtte sendes til den "trege" ALU-en.
"Buffer overflow protection"?
Det var tidligere snakk om at Intel skulle integrere funksjonalitet som skulle gjenkjenne og hindre utnyttelse av såkalte "buffer overflow"-hull i programvare. På dette punkte har Intel vært taus, muligens på grunn av manglende programvarestøtte, så vi venter fortsatt i spenning.
Vårt eksemplar
Prosessoren vi har testet er en ES-prosessor som kan kjøres på frekvensene 2800, 3000 og 3200 MHz. Vi tar de vanlige forbehold om at prosessoren kan skille seg fra de som selges i butikkene, spesielt med tanke på overklokkingsegenskaper.
Vi merker oss ellers at prosessoren er stepping 3, allerede ved lansering.
Varme og overklokking
Varmeutvikling
Intel oppgir en "TDP"-rating (Thermal Design Power) for Prescott 3,2 og 3,4 GHz på 103 watt, mens tallet for 2,8 og 3,0 GHz er 89 Watt. TDP er hverken det samme som gjennomsnittlig eller maksimalt effekttap, men en spesifikasjon til de som produserer kjøleløsninger om hvor mye varme løsningene må ta høyde for.
Intel oppgir også et annet tall, nemlig Icc(max) som for 3,4 GHz-versjonen er 91 ampere. Hvis vi ganger med vcore på vårt testeksemplar får vi 91 x 1,375 = 125 Watt! Sunn fornuft tilsier heldigvis at det ligger noen sikkerhetsmarginer i disse tallene.
Medfølgende kjøler. Den har en ny og forbedret "thermal pad" som er lettere å fjerne enn den forrige. Den har omtrent samme konsistens som leire, og kan rulles rulles sammen til en ball, se "erten" i høyre hjørne.
Hvor varm var den?
Vi leste av temperaturen med ABIT sitt IC7-MAX3. Dette hovedkortet er beryktet for å vise høye (ifølge ABIT riktige) verdier. Ikke legg for mye vekt på tallet i seg selv, det varierer uansett med romtemperaturen, men se på forskjellen "Prescott" vs. "Northwood".
Overklokking
Når Intel har lagt så mye arbeid i en prosessor for at klokkefrekvensen kan skrus opp, kan vi da forvente at den kan klokkes til himmels? Svaret er både ja og nei. Vi hadde ingen problemer med å klokke den opp til 3,8 GHz med boxed-kjøleren. På denne frekvensen ble prosessoren naturligvis "god og varm", men det var nok ikke det som stoppet videre klokking. Derimot var det trolig rett og slett hovedkortet som ikke klarte å levere den spenningen som var nødvendig. Til tross for at vi brukte selveste IC7-MAX3 med aktiv kjøling av kondensatorer og MOSFETS, så falt spenningen til kjernen (vcore) som en stein når vi nærmet oss 3,8 GHz. Dette sier oss to ting:
1. Overklokkere må i hovedsak vente på Socket T før de vil klare å utnytte potensialet i denne prosessoren.
2. Intel må finne på noe kreativt, for varmeutviklingen MÅ ned, med mindre de har utviklet en revolusjonerende kjølemetode til kommende prosessorer.
Vi gjør oppmerksom på at overklokking gjøres på eget ansvar. Hardware.no tar ikke ansvar for eventuelle ødelagte komponenter og bortfall av garanti som følge av overklokking. For mer informasjon om overklokking, besøk vår søsterside Overklokking.no.
Testsystem
Testsystem
| Testkonfigurasjon | |
| Maskinvare | |
| Hovedkort | Albatron K8X800 ProII (VIA K8T800)* EPoX 8HDA+ (VIA K8T800) ASUS SK8N (nForce3) ASUS A7N8X Deluxe rev 2.0 (nForce2) ABIT IS7 (Springdale) ABIT IC7-MAX3 Intel D875PBZ (Bonazana) |
| Prosessor | AMD Athlon 64 3000+ (2 GHz) DDR400 AMD Athlon 64 3200+ (2 GHz) DDR400 AMD Athlon 64 3400+ (2,2 GHz) DDR400 AMD Athlon 64 FX-51 (2,2 GHz) DDR400 AMD Athlon XP 3200+ Barton 400 MHz FSB Pentium 4 3.2C GHz Extreme Edition 800 MHz FSB Pentium 4 2.4C GHz 800 MHz FSB Pentium 4 2.8C GHz 800 MHz FSB Pentium 4 3.2C GHz 800 MHz FSB Pentium 4 2.8E GHz 800 MHz FSB Pentium 4 3.2E GHz 800 MHz FSB |
| RAM | Corsair PC3200 REG (2 x 512 MB ) Corsair XMS3200-512LL TwinX (2 x 256 MB) Timing P4 og XP: 5-2-2-2 Timing A64: 5-2-2-2,5 |
| Skjermkort | NVIDIA GeForce4 Ti4200 (275:550) |
| Harddisk | 7200 rpm S-ATA |
| Programvare | |
| Operativsystem | Windows XP Professional SP1 |
| Applikasjoner | CPUMark99 SiSoft Sandra 2003 Comanche 4 3DMark2001 SE Build 330 UT2003 ScienceMark 2.0 Cinebench 2000 Cinebench 2003 Cinema 4D Lame 3.91 Aquamark Super Pi Virtual Dub/DivX PS: Sjekk ut vår benchmark-guide for mer informasjon og nedlastning av testprogramvare. |
| Drivere | nForce3: nForce2 All-in-one v2.45 nForce2: nForce2 All-in-one v2.02 875P/865PE Intel Application Accelerator v2.2 Intel Chipset Utility 5.0 Felles: DirectX 9.0 Detonator 43.45 |
*) Albatron-kortet ble brukt til testingen av Athlon 64 3200+, mens resten av Athlon 64-prosessorene er testet på EPoX 8HDA+.
Prosessoren ble i første omgang testet på ABIT sitt IC7-MAX3. Vi støtte derimot på problemer da vi skulle pumpe opp frekvensen til 3200 MHz, ettersom multiplikatoren ikke ville opp. Når prosessoren kjører på 3200 MHz er den derfor testet på Intel sitt eget "Bonazana" kort. Merk at dette kortet leverer marginalt lavere resultater sammenlignet med IC7-MAX3-kortet. I den store sammenhengen drukner denne forskjellen, men man bør ha den i bakhodet når man studerer Prescott 2,8 GHz vs. Prescott 3,2 GHz.
Ytelse - Syntetisk
Det er ikke gjort noen forandringer som skulle tilsi store forskjeller Prescott og Northwood imellom i denne testen. Prescott kan ikke gjøre noe med Athlon 64 sitt overlegne forsprang hva minnelatency angår for tiden.
Her finner vi en liten, dog tydelig økning i minnebåndbredde. Den teoretiske minnebåndbredden er fortsatt den samme, men prosessoren er blitt bedre til å utnytte den.
Her er det "buffered" testen som benyttes, og noen forskjell Prescott v.s. Nortwood merkes ikke.
Vi har lært å ikke tillegge testene i SiSoft Sandra for mye betydning, men reduksjonen i flyttalsytelse er relativt dramatisk. Vi noterer igjen av ryktet om "double-pumped" ALU-en var blitt "singel-pumped" ikke medfører riktighet, da det ville gitt store utslag i heltallsytelsen.
Til tross forbedret "branch predictor" og dobbelt så mye cache gir de 11 ekstra pipeline-trinnene katastrofale resultater i denne testen. Athlon 64 3400+ kan her skilte med nesten dobbelt så høy ytelse som P4 2,8 GHz. Med de vanlige forebehold om at dette er en 100% syntetisk test, og at utslagene i "virkelige" programmer normalt er mindre ekstreme.
Prescott kommer godt ut av denne testen som er blitt populær blant overklokkere. Den må allikevel se seg slått av de store flaggskipene.
Ytelse - Applikasjonsbasert
Ingenting å skrive hjem om her. Større cache hjelper dessverre ikke stort på prestasjonene.
Her er det vanskelig å stable prosessorene i riktig rekkefølge, fordi testene som presenteres er vidt forskjellige. Her har vi vært "snill" med Prescott og sortert etter CPU-shading, en øvelse den består med glans. I de andre "grenene" er resultatene langt mindre overbevisende.
Denne testen gjør god nytte av HT-teknologien, men dessverre kaster Prescott bort det forspranget Intel hadde med Northwood i denne testen.
Igjen en test som passer Pentium 4 arkitekturen godt, og i "Office"-testen blir "Northwood" faktisk forbigått med komfortabel margin. Vi ser en logisk tendend til at Prescott presterer best på de områdene der Northwood allerede var sterk.
Igjen to tester som passer dårlig for prosessorer med lang pipeline, og tilsvarende dårlig resultat for Prescott.
Ytelse - Applikasjoner
Vi er litt forbauset over resultatene i denne testen, men må konkludere med at den Prescotts forbedrede "branch-predictor" ikke lykkes spesielt godt her.
Her er det jevnt løp mellom Prescott og Northwood, oppførselen er relativt forutsigbar og de ekstra pipeline-stegene senker ikke ytelsen nevneverdig.
Dette resultatet må ses på som en komplett katastrofe, da P4 2,4 GHz slår knock-out på 16% høyere klokkede Prescott. En kraftig advarsel til spillere om å styre bort fra denne arkitekturen inntil videre.
Den samme tendensen ses her, men utslaget er langt mindre.
Igjen samme tendens, Prescott posisjonerer seg ikke som en prosessor for spillere.
Ytelse - Oppsummering
Her har vi plassert de fleste av testene på èn plansje for bedre oversikt. I tester med flere resultater presenteres gjennomsnittet - med mindre annet er spesifisert.
Ganske begredelige resultater for Prescott, tatt i betraktning av at prisen er noenlunde den samme. Northwood slår "Prescott" i 12 tester, èn ender uavgjort og Prescott vinner 3.
Ståa er relativt lik her, men den lille forskjellen er meget interessant. Til tross for et hovedkort som burde gitt marginalt dårligere ytelse over hele linjen, viser så og si alle testene en merkbar forbedring målt mot 2,8 GHz. Dette illustrerer det som antageligvis er hovedgrunnen til at Prescott ble en større forandring enn mange trodde på forhånd. For selv om det hadde vært mulig å ta Northwood til nye høyder ved hjelp av mindre produksjonsprosess og andre forbedringer, ville uttellingen av høyere klokkefrekvenser stadig blitt mindre.
Konklusjon
Til tross for en dramatisk økning i antall "pipelines", holder Prescott noenlunde følge med Northwood, selv om forskjellen er langt fra ubetydelig i enkelte tilfeller. Tretten nye instruksjoner har kommet på plass, og det blir spennende å se hva disse kan bidra med. I skrivende stund er det dog så og si ingen støtte for disse på markedet. 1 MB L2-cache vil nok også høres forlokkende ut for mange, men siden den medfører høyere tilgangstider, går vinningen i mange tilfeller opp i spinningen.
Intel skal ha ros for den bragd de har utført, nemlig å gjennomføre en dramatisk økning i antall "pipelines", uten at ytelsen sank mer enn 5-6% i gjennomsnitt. Det sikrer forhåpentligvis fremtidig ytelse, men sikrer også at Prescott for øyeblikket er en heller lite attraktiv prosessor.
Testene viser at Prescott skalerer bedre Northwood. Når frekvensen passerer 4 GHz, ser det ut til at Prescott vil ha passert Northwood hva ytelse per klokke angår. Igjen hjelper dette lite her og nå, da prosessoren kun er tilgjengelig i frekvenser opp til 3,2 GHz. Forøvrig ser det ut til at Socket 478 vil stoppe på 3,4 GHz. Les mer om Intels prosessorplaner i vår sak "Intels veikart for 2004".
Det generelle inntrykk som sitter igjen er at Prescott presterer best der Northwood allerde var god, og visa versa. Dette stemmer godt overens med de arkitekturmessige endringer som er foretatt.
For øyeblikket peker Athlon 64 [Test]seg ut som det mest attraktive tilbudet for de som har planer om å investere i en ny plattform. For de som allerede måtte sitte på et Socket 478-kort er dommen klar. Styr unna Prescott, da Prescott legger seg et klart steg bak Northwood" i ytelse. Samtidig sørger den for mer varme i kabinettet, og usikkerheten rundt hovedkort-kompatibilitet er stor. Det skal sies av vi ikke hadde noen problemer på de hovedkortene vi hadde tilgjengelige (hvorav to ikke støttet FMB 1.5-standarden).
Den eneste gruppen som muligens måtte være interessert i Prescott på den nåværende plattformen - er overklokkerne. Og da kun dersom de er utstyrt med rikelige mengder kjøling og gjerne har noen triks i bakhånd for å presse noen ekstra amper ut av hovedkortet. I så tilfelle burde det være mulig å presse denne prosessoren langt allerede nå, mens vi andre får smøre oss med tålmodighet.
Det sies at hvis du venter med å kjøpe til "det beste" har kommet på markedet - så får du deg aldri en datamaskin. Men denne gangen kan det lønne seg å være tålmodig. Socket T, PCI-Express og DDR-II ventes allerede i mars.
| + Kan brukes på relativt mange Socket 478-kort + Hyper-Threading |
| - Svakere ytelse til samme pris - Høyt effekttap / varme - Socket 478 blir erstattet om kort tid |
(Prisene på Pentium 4 "Prescott" finner du lenger ned på siden)