Sõltumatute ketaste liiasmassiiv

Allikas: Vikipeedia

Sõltumatute ketaste liiasmassiiv on mitmest kõvakettast või kõvaketta partitsioonist moodustatud loogiline plokkseade andmete salvestamiseks, kus samad andmed salvestatakse mitmele kõvakettale.

Inglise keeles on sõltumatute ketaste liiasmassiiv Redundant Array of Independent Disks ehk RAID.[1] Varem kasutati ka nime Redundant Array of Inexpensive Disks ehk odavate ketaste liiasmassiiv. Viimase termini võtsid kasutusele David A. Patterson, Garth A. Gibson ja Randy Katz California Ülikoolist, Berkeleyst 1987. aastal.[2][3]

Nüüdisajal on RAID üldtermin, mis hõlmab kõiki andmete säilitamise võimalusi arvutis, mis jagab ja kordab andmeid mitme kettaseadme vahel. Erinevaid arhitektuure eristatakse numbritega (näiteks RAID 0, RAID 1). Erineva konstruktsiooniga RAID süsteemid hõlmavad kahte peamist eesmärki: suurendada andmete turvalisust ja suurendada lugemis-, ja kirjutamiskiirust. Kui mitu füüsilist ketast on seadistatud kasutama RAID tehnoloogiat, siis öeldakse, et nad on RAID massiivis. Sellises massiivis hajutatakse andmed mitmele kettale, kuid operatsioonisüsteemi jaoks on kõik andmed ühel kettal. RAID-i kasutatakse mitmetel otstarvetel.

Tavapärased RAID-i tasemed[muuda | redigeeri lähteteksti]

Erinevaid RAID-i arhitektuure nimetatakse RAID-i tasemeteks. Algselt oli vaid viis RAID taset, kuid aja jooksul on arenenud mitmed teised tasemed: üksteise sees asetsevad RAID tasemed ja mittestandardsed tasemed.

  • RAID 0: (andmed jaotatakse plokkidena (hargsalvestus)) Suurendab andmeedastuskiirust, kuid RAID 0 massiivis ei ole veakindlust (seetõttu ei ole ta päris RAID). Sellegipoolest loetakse see RAID-i tasemeks, sest RAID 0 massiivis peab kontroller andmeid jaotama mitme ketta vahel. Kui üks ketas massiivis puruneb, kaob kogu massiiv ja seda ei ole võimalik parandada. Massiivi tõrkevõimalus kasvab iga sinna pandud kettaga, sest terve massiivi tõrkevõimalus on kõigi kõvaketaste purunemisvõimaluse summa. RAID 0 massiivis kirjutatakse andmeid plokkidena, mis on kindla suurusega (ploki suurus (stripe size ingl. k), mis on massiivi peamine parameeter, enamasti 16 KiB, 32 KiB ja 64 KiB). Kõigilt ketastelt loetakse ja kirjutatakse andmeid samaaegselt, seetõttu suureneb massiivi andmeedastuskiirus iga lisatud kettaga. RAID 0 ei toeta veatuvastust. Faili lugemisel hargsalvestusega massiivilt, loeb kontroller samaaegselt faili iga osa erinevatelt ketastelt, millel fail paikneb. Seejärel paneb kontroller faili osad enne RAM mällu kirjutamist õiges järjekorras kokku. Kui hargsalvestusega massiivis on rohkem kui kaks ketast, saab seda seadistada hargsalvestusega massiiviks koos paarsusega, mis on RAID 4. Selles massiivis jaotatakse andmed kõikidele ketastele välja arvatud ühele ketastest, mida kasutatakse veaparanduskoodi kirjutamiseks.[4]
  • RAID 1: (peegeldamine teisele kettale, nn "peegelsalvestus") Andmed on kirjutatud identselt mitmele kettale (nn "peegeldatud kettad"). Kuigi enamik RAID 1 massiive tekitatakse kahest kettast, on võimalik ka lisada rohkem kettaid. RAID 1 massiiv võimaldab pärast ketta hävimist tööd jätkata, kuni on olemas vähemalt üks töötav ketas. Sobivate operatsioonisüsteemide olemasolul võib massiivi lugemiskiirus olla suurem kui ühe ketta lugemiskiirus, sest loetakse mitmelt kettalt korraga. Kirjutamiskiirus RAID 1 massiivis sõltub massiivis oleva kõige aeglasema kõvaketta kirjutamiskiirusest.
  • RAID 2: (andmed jaotatakse bittidena, kasutatakse veaparanduskoodi) Kõik kettad on sünkroonitud ja andmed jaotatakse ketaste vahel bittidena. Igale bitireale ketastes arvutatakse veaparanduskood (Hamming'i kood ECC), mis salvestatakse ühele või rohkemale kettale massiivis. Lugemisel saab ECC koodi alusel korrigeerida üksiku ketta vead.
  • RAID 3: (andmed jaotatakse baitidena plokkide kaupa, kasutatakse kindlat ketast, kuhu salvestatakse paarsusinformatsioon) Kõik kettad on sünkroonitud ja andmed jaotatakse baidi kaupa ketaste vahel. Paarsusinformatsioon arvutatakse kindlatele baitidele eraldi (XOR tehtega) ja salvestatakse selleks eraldatud kõvakettal.
  • RAID 4: (andmed jaotatakse plokkidena, kasutatakse kindlat ketast, kuhu salvestatakse paarsusinfo) See on põhimõtteliselt sama, mis RAID 5 (vaata all), kuid paarsusinfo kirjutatakse ainult ühele kindlale kettale. Kõik kettad tegutsevad üksteisest lahus, mistõttu võib lugeda/kirjutada kõikidelt ketastelt korraga. Kuna paarsuskontroll salvestatakse ainult ühele kettale, võib tekkida nn pudelikael, kus infot ei jõuta paarsuskontrolli jaoks mõeldud kettale enam piisava kiirusega kirjutada.
  • RAID 5: (andmed jaotatakse plokkidena, kontrollkood kirjutatakse kõikidele ketastele) Paarsuskontroll jaotatakse kõikide ketaste vahel (iga paarsusinfo kirjutatakse erinevale kettale). Ühe ketta purunemisel massiiv ei hävine ega mõjuta edasise töö tegemist (töö ei peatu, kuid on aeglasem, sest kettal olnud andmed arvutatakse), kuid rikki läinud ketas on vaja välja vahetada ja taastada. Teise ketta purunemisel hävinevad massiivis olevad andmed.
  • RAID 6: (andmed jaotatakse plokkidena, kontrollkood kirjutatakse topelt kasutades XOR tehet ja Reed-Solomoni koodi) Suudab jätkata tööd ka pärast kahe ketta purunemist. See tase muudab suured massiivid mõttekamaks, sest pakub suuremat tõrkekindlust. Samuti on purunenud ketta vahetamiseks rohkem aega, sest võib puruneda ka teine ketas, ilma et töö katkeks.

Järgnev tabel näitab RAID-i tasemete tähtsamaid parameetreid. Mahuefektiivsus on arv vahemikus 0–1 ja näitab, kui suurt hulka on võimalik maksimumist kasutada. Näiteks, kui on kolm ketast paigutatud RAID 3 massiivi, on nende maht 1-(1/3)=0,66. Kui iga sellise ketta mahtuvus on 250 GB, on nende maksimummaht 750 GB, millest RAID 3-s on kasutatav 0,66 ehk 66 %, 500 GB.

Tase Kirjeldus Minimaalne ketaste arv Mahuefektiivsus Tõrketaluvus Lugemiskiiruse kasv Kirjutasmiskiiruse kasv Mudel
RAID 0 Andmed jaotatakse plokkidena (hargsalvestus). 2 1 0 (puudub) nX nX RAID Level 0
RAID 1 Peegeldamine teisele kettale, nn peegelsalvestus. 2 1/n n−1 ketast nX 1X RAID Level 1
RAID 2 Andmed jaotatakse bittidena, kasutatakse veaparanduskoodi. 3 1 − 1/n ⋅ log2(n-1) 1 ketas, kui veaparanduskood leiab vea üles. RAID Level 2
RAID 3 Andmed jaotatakse baitidena plokkide kaupa, kasutatakse paarsuskontrolli. 3 1 − 1/n 1 ketas RAID Level 3
RAID 4 Andmed jaotatakse plokkidena, kasutatakse paarsuskontrolli. 3 1 − 1/n 1 ketas RAID Level 4
RAID 5 Andmed jaotatakse plokkidena, kontrollkood kirjutatakse kõikidele ketastele. 3 1 − 1/n 1 ketas (n−1)X sõltub RAID Level 5
RAID 6 Andmed jaotatakse plokkidena, kontrollkood kirjutatakse kahte erinevasse kohta. 4 1 − 2/n 2 ketast RAID Level 6

Hübriid-RAID[muuda | redigeeri lähteteksti]

Paljud andmeedastuskontrollerid lubavad kasutada hübriidseid RAID tasemeid ehk kasutada kahte või enamat RAID taset korraga. Massiivi elemendid võivad olla kettad, kuid ka RAID tasemed. Rohkem kui kahte RAID taset kasutatakse erilistel juhtudel.

Kuna ei ole rohkem kui 9 RAID taset, kirjeldatakse hübriid-RAID-i tasemed liites kaks kasutatavat taset kokku, pannes vahele „+“ märgi. Järjekord on ka oluline: kasutades RAID 1+0 taset, on kettad RAID 1 massivis ja see on omakorda RAID 0 massiivis. Samuti on võimalik ka RAID 0+1. Tähtis on kindlaks määrata, mis on kõige peamine massiiv. Kui kasutatakse peamist RAID massiivi RAID 0, ei kirjutata enamasti „+“ märki kahe numbri vahele (näiteks RAID 10, RAID 50).

  • RAID 0+1: peegeldatud RAID 0 plokid teisele kettale (minimaalselt neli ketast; paarisarv kettaid) garanteerib veakindluse ja parema andmeedastuskiiruse, kuid on keerulisema ehitusega.
Peamine erinevus RAID 1+0 ja RAID 0+1 vahel on see, et RAID 0+1 puhul võib üks pool RAID 1 massiivist puruneda ilma, et see tööd häiriks.
  • RAID 1+0: peegeldatud kettad on RAID 0 massiivis (minimaalsest kaks ketast, kuid kasutatakse tihti nelja, et kasutada ära suuremat andmevahetuskiirust; paarisarv kettaid) garanteerib veakindluse ja parema andmeedastuskiiruse, kuid on keerulisema ehitusega.
Peamine erinevus RAID 0+1 ja RAID 1+0 vahel on see, et RAID 1+0 puhul on andmeedastuskiirus suurem, kui RAID 0+1 puhul. Kui RAID 1 kaotab ühe poole ketastest, on kogu massiiv hävinenud.
  • RAID 5+1: peegeldatakse RAID 5 taset (mõned tootjad kirjeldavad seda kui RAID 53).

RAID-i paarsus[muuda | redigeeri lähteteksti]

Mitmed RAID-i tasemed kasutavad veatuvastusalgoritme, nn paarsuskontrolli. Paarsuskontroll on laialt kasutatav meetod, et vähendada vigade protsenti.

Paarsuskontroll seisneb põhimõttel "kas üks või teine, kuid mitte mõlemad ja kumbki." Näiteks:

0 XOR 0 = 0
0 XOR 1 = 1
1 XOR 0 = 1
1 XOR 1 = 0

XOR operatsioon on põhiline tehe, mida tehakse paarsuse arvutamisel. Seda kasutatakse nii andmete kaitseks, kui andmete taastamiseks.

Olgu RAID massiivis 6 kõvaketast (4 andmete jaoks, üks paarsuse jaoks ja üks käigult vahetatav), kus iga ketas võimaldab hoida ainult üht baiti. Selline oleks algseis, kus ei ole midagi ketastele kirjutatud:

Drive #1: -------- (Andmed)
Drive #2: -------- (Andmed)
Drive #3: -------- (Andmed)
Drive #4: -------- (Andmed)
Drive #5 -------- (Käigult vahetatav)
Drive #6 -------- (Paarsus)

Nüüd kirjutame mõned bitid kõvaketastele, kus hoitakse andmeid:

Drive #1: 00101010 (Andmed)
Drive #2: 10001110 (Andmed)
Drive #3: 11110111 (Andmed)
Drive #4: 10110101 (Andmed)
Drive #5 -------- (Käigult vahetatav)
Drive #6 -------- (Paarsus)

Iga kord, kui ketastele kirjutatakse andmeid, arvutatakse paarsus. Selle RAID massiivi paarsuse arvutamine tehakse sellise tehtega:

00101010 XOR 10001110 XOR 11110111 XOR 10110101 = 11100110

"11100110" on paarsus. Nüüd kirjutatakse paarsus selleks ette nähtud kettale:

Drive #1: 00101010 (Andmed)
Drive #2: 10001110 (Andmed)
Drive #3: 11110111 (Andmed)
Drive #4: 10110101 (Andmed)
Drive #5: -------- (Käigult vahetatav)
Drive #6: 11100110 (Paarsus)

Kui nüüd mingil põhjusel kaob üks ketastest ära, siis peab selle jaoks andmed uuesti arvutama kasutades XOR tehet ja paarsust, kus selle ketta andmed, mis kadus, asendatakse paarsusega. Ütleme, et kolmas ketas on katki läinud. Siis näeb arvutus välja selline:

00101010 XOR 10001110 XOR 11100110 XOR 10110101 = 11110111

Kui kolmas ketas on taastatud, saab massiiv edasi normaalselt töötada.

Drive #1: 00101010 (Andmed)
Drive #2: 10001110 (Andmed)
Drive #3: -Katki- (Andmed)
Drive #4: 10110101 (Andmed)
Drive #5: 11110111 (Käigult vahetatav)
Drive #6: 11100110 (Paarsus)

Tavaliselt vahetatakse rikki läinud ketas uuega ja andmed, mis olid vahepeal käigult vahetatavas, kopeeritakse sinna tagasi. Käigult vahetatav ketas taastab oma algse oleku ja massiiv näeb välja samasugune, nagu oli enne ketta kadumist:

Drive #1: 00101010 (Andmed)
Drive #2: 10001110 (Andmed)
Drive #3: 11110111 (Andmed)
Drive #4: 10110101 (Andmed)
Drive #5 -------- (Käigult vahetatav)
Drive #6 11100110 (Paarsus)

Samamoodi saab andmeid taastada kõikides RAID massiivides, mis kasutavad XOR paarsuskontrolli, ükspuha kui palju on kettaid või kui suured need on.

Andmete varundamine[muuda | redigeeri lähteteksti]

RAID-i süsteem, mida kasutatakse põhisüsteemi kettana, ei ole mõeldud asendama andmete varundamist. Paaris paigutus loob andmete varundamisele sarnase süsteemi, mis on mõeldud ära hoidma andmete kadumist füüsiliste kahjustuste või vigade puhul üksikutel draiveritel. Paljude teiste funktsioonide andmete varundamine ei ole võimalik ainult antud RAID-i ridade puhul üksinda. Kõige tähelepanuväärsem on võime taastada eelmisi andmete versioone, mida on vaja kaitsta tarkvara vigade eest, mida põhjustab mittesoovitud andmete kirjutamine kettale.

Rakendused[muuda | redigeeri lähteteksti]

  • Tarkvarapõhine RAID – rakendusi pakuvad mitmed erinevad operatsioonisüsteemid.Tavaliselt on nad kas RAID 0 või RAID 1s.
  • Riistvarapõhine RAID – Riistvarapõhine RAID kasutab erinevaid patenteeritud ketaste asetusi, nii et pole võimalik ühendada erinevate firmade ühendusi. Nad ei kasuta protsessorit ja BIOS suudab neilt alglaadida, parem integratsioon seadme draiveritega võib võib pakkuda paremat käitumist vigadega.
  • Draiverite põhine RAID – Kasutatakse väikseid kiipe, millel on vajalikud draiverid.
  • Võrgupõhine RAID – pole päris RAID, kuid kasutatakse andmete hoidmiseks üle võrgu.

Probleemid RAIDI-ga[muuda | redigeeri lähteteksti]

RAID kaitseb sinu andmeid küll kõvaketta rikke puhul, kuid sinu andmed on nähtavad operaatorile, tarkvarale, riistvarale ja hävitavatele viirustele. Mitmed uuringud näitavad et põhilised vead on tekitatud operaatorite poolt. Näiteks serveri operaator asendab vale ketta vigasesse RAID-i ja tõkestab süsteemi protsessi. Enamik hästi disainitud süsteeme kaasab eraldi varukoopiate süsteemi mis hoiab andmete koopiaid.

Viited[muuda | redigeeri lähteteksti]

  1. I. Zolk lk 49–50
  2. David A. Patterson, Garth Gibson, and Randy H. Katz: A Case for Redundant Arrays of Inexpensive Disks (RAID)
  3. Vallaste, RAID (Redundant Array of Independent Disks) e-Teatmik
  4. Ron White. How Computers Work (9th Edition). Que Publishing, 2008.

Kirjandus[muuda | redigeeri lähteteksti]

Välislingid[muuda | redigeeri lähteteksti]