Tek.no

Guide

Grunnleggende begrepsguide

Det er ikke til å stikke under en stol at man i datarelaterte artikler kan komme over begreper som virker forvirrende og ukjente. I denne guiden forklarer vi en del hyppig brukte begreper innen dataverdenen.

22 Okt 2003 14:14

Harddisk (HDD)

Harddisk

Hva er en harddisk?
En harddisk er et magnetisk lagringsmedium hvor data lagres på magnetiske plater som spinner rundt. Som vi ser på bildet over består en harddisk av en eller flere plater som er plassert over hverandre hvor data lagres. Data leses og skrives av flere lese- og skrivehoder som sitter ytterst på en mekanisk arm som kan beveges frem og tilbake over platen.

Sektor/Sylinder/Spor/Blokk
En harddisk må ha en eller annen måte å organisere all informasjonen som ligger der. En harddisk er derfor delt opp i flere forskjellige enheter. Data lagres som kjent i bit, men å holde orden på mangfoldige milliarder bit på en harddisk ville være en umulig oppgave. Harddisker behander derfor ikke bit for seg selv, men hånderer en sektor av gangen.

Den minste enheten en harddisk behandler er derfor en sektor. En sektor er en del av harddisken, på typisk 4 KiB (standard NTFS) eller 32 KiB (standard FAT32). En sektor kan inneholde kun én fil, men en fil kan gå over flere sektorer. Dette betyr at hvis man har en fil på 5 KiB i NTFS vil denne bli plassert i to sektorer. Én sektor vil bli fyllt helt opp, og den andre sektoren vil få fyllt 1 KiB. De resterende 3 KiB i den sektoren vil være ubrukt, og vil ikke kunne brukes av andre filer fordi en sektor kun kan inneholde én fil.

En harddisk er videre delt inn i flere tracks/spor. Et spor er rett og slett "en runde" på harddisken, og et spor består av en mengde sektorer. Består harddisken av mer enn én plate eller om platene har data på begge sider, så vil en sylinder være alle sporene på samme plassering på alle platene. En sylinder består altså av 1-6 spor avhengig av hvor mange plater disken består av og om de er dobbeltsidige (som de fleste plater er).

Selv om den minste enheten på en harddisk strengt tatt er en sektor, er det normalt med nye operativsystemer og harddisker at når et program leser fra harddisken, blir det lest inn en "blokk" med data av gangen. En blokk er en samling av sektorer, bestående av normalt 32 eller 64 KiB. Grunnen til at man leser inne en blokk av gangen fremfor en sektor har rett og slett med ytelse å gjøre, og som regel er man interessert i mer enn én sektor av gangen.

Lagringstetthet
Dette er et uttrykk som sier noe om hvor tett data kan lagres på en enkelt plate (hvor tett kan man presse forskjellige sektorer og spor sammen). Siden platene i harddisker (innen en gitt standard)ikke blir større så er det i praksis to måter å utvide kapasiteten på en harddisk:

  • Enten å legge på flere plater i disken. Å utvide antall plater til mer enn tre stk. er stort sett uaktuelt grunnet flere faktorer som varme, støy og sikkerhet.
  • Det andre alternativet er at man kan øke mengden data som kan lagres på hver plate (øke lagringstettheten). Dette er den vanlige måten å gjøre ting på.

En normal lagringstetthet på en 3,5" plate er per dags dato 80 GB (og øker til stadighet). Dette betyr at på en enkelt plate kan det lagres totalt 80 GB. Hvis lagringstetteheten på en plate hadde vært 40 GB ville den fysiske størrelsen fortsatt vært den samme, men sektorene ville hatt større mellomrom mellom seg slik at det blir plass til færre sektorer.

Cache
Harddisker er som regel utstyrt med 2 eller 8 MB med cache. Cache er et elektronisk mellomlager (minne) for data. Cache brukes for å øke ytelsen på harddisken, og dette kan gjøres på flere måter. Data blir f.eks. sendt fra internminnet (RAM) til harddisken. Harddisken er mye tregere enn internminnet fordi den er mekanisk. Disken kan da mellomlagre infomasjonen fra minnet i cache slik at data raskt kan overføres til disken (cache), og så kan harddisken etterpå overføre informasjonen i cachen til selve platene. På den måten vil selve systemet raskere gjøre seg ferdig med overføringen av data og kan gå videre med andre oppgaver, mens harddisken på egenhånd i ettertid jobber litt med denne dataen. Dette er det som kalles write-cache.

Cachen kan også fungere motsatt ved at harddisken gjennomfører intelligent gjetting på hvilke data som snart kommer til å bli spurt om. På den måten kan disken lese inn informasjon fra disken og legge den i cache. Når minnet kommer for å be om en spesiell sektor/blokk på harddisken så ligger denne klar i cache slik at informasjonene blir overført direkte fra cache uten at harddisken faktisk må hente informasjon fra en av platene.

Filsystem
Et filsystem er en teknikk som brukes for å holde orden på filer, mapper, sektorer osv. Det finnes en mengde forskjellige filsystemer. Floppydisketter bruker ofte et format kalt FAT12 (12 bits File Allocation Table), mens CD-plater bruker et system kalt CDFS (Compact Disc File System, også kjent som ISO9660).

Harddisker har et langt større utvalg å velge mellom når det gjelder filsystemer. De mest brukte er FAT32 (kun 28 bit, til tross for navnet - blitt brukt fra Windows 95 OSR/2 og senere), NTFS (Windows NT/2000/XP) og EXT3 (Linux). I tillegg finnes det en hel del mer eller mindre kjente filsystemer som har sine spesialområder.

RPM (Revolutions Per Minute)
Dette beskriver hvor mange ganger platene i harddisken spinner rundt på ett minutt. Typiske hastigheter på dagens harddisker er 5400, 7200, 10 000 og 15 000 RPM. Jo høyere hastighet, jo bedre blir både søketid og overføringshastighet, men samtidig vil det som regel bli mer støy og varme.

Seek/access-time (søketid)
Søketid er den tiden det tar for lesehodet å bevege seg til et gitt sted på harddisken. Gjennomsnittlig søketid er den gjennomsnittlige tiden det tar for lesehodet å komme fra et tilfeldig sted til et annet tilfeldig sted. Typisk søketid på 7200 RPM harddisker ligger på rundt 9 ms, mens enkelte SCSI-disker kan han ned i 4 ms.

IDE, SCSI, P-ATA og S-ATA
Forskjellige harddisker bruker forskjellige grensesnitt, altså måter å koble seg til hovedkortet. Den mest vanlige standarden i dag på PC-er er IDE. Den andre hovedstandarden er SCSI. Forskjellen er i korte trekk at SCSI trenger et eget kontrollerkort med prosessor og RAM for å fungere, mens IDE bruker systemets egen prosessor og minne. Fordelen med SCSI er at det ikke belaster systemets egen CPU i noen særlig grad siden det har sin egen prosessor. Ulempen er at dette er et langt dyrere system.

SCSI-disker er ofte langt raskere enn IDE-harddisker, særlig når det gjelder søkehastighet og RPM. Typiske hastigheter på SCSI er 10 000 og 15 000 RPM, mens IDE som regel har 5400 og 7200 RPM, og et par unntak på 10 000 RPM.

Det finnes en mengde forskjellige SCSI-standarder, og er du interessert i å lære mer om disse kan du lese vår SCSI-guide.

IDE-disker har primært to implementasjoner: Parallell ATA (P-ATA) og den nyere Seriell-ATA (S-ATA). Forskjellen mellom disse to er først og fremst at den ene bruker et parallelt grensesnitt, mens den andre har et serielt-grensesnitt. Den praktiske forskjellen er at kablene til S-ATA er er langt tynnere enn P-ATA-kablene. En annen forskjell er at S-ATA er langt mer skalerbar og kan oppnå langt høyere hastigheter enn P-ATA. En mer grundig gjennomgang av forskjellene kan du lese i denne artikkelen.

DMA
Dette er en teknikk som gir harddisker og andre I/O-enheter direkte tilgang til minnet uten å måtte belaste CPU-en med trafikken. I de fleste tilfeller gir dette ytelsesfordeler.