Mine sisu juurde

Paikselt taastatav kood

Allikas: Vikipeedia

Paikselt taastatav kood (ka Locally Recoverable Code, Locally Repairable Code, LRC) on kodeerimisteoorias kooditüüp, kus koodisõna iga sümbol on esitatav funktsioonina mingist väiksest osast ülejäänud sümbolitest.[1]

Paikselt taastatavaid koode (edaspidi lühendatud PTK) kasutatakse andmesalvestuses, eriti pilv- ja hajussalvestuses. Kui osa andmebaasi sisust ei ole kättesaadav, siis PTK-d võimaldavad puuduva info ülejäänud andmete põhjal tõhusalt taastada. Seetõttu kasutatakse neid selleks, et suurendada salvestussüsteemide veataluvust.[2]

Definitsioon[muuda | muuda lähteteksti]

Paikselt taastatav kood on üks kustutuskoodi liik. PTK-d loodi, kuna klassikaliste kustutuskoodide puhul (mille hulka kuuluvad nt Reed-Solomoni koodid) on vaja ühe sümboli taastamiseks nii palju teisi sümboleid, et taastamise protsess muutub ebatõhusaks ja aeglaseks. Paiksuse (locality) ja paikselt taastatavate koodide eesmärk on vähendada ühe sümboli taastamiseks vajaminevate sümbolite arvu.[3]

PTK-sid kirjeldatakse üldiselt kujul (n, k, r)-PTK, kus n tähistab koodi pikkust, k tähistab koodi mõõdet ja r tähistab koodisõnade paiksust.[1]

Paikselt taastatava koodi definitsioon[muuda | muuda lähteteksti]

Öeldakse, et koodil on paiksus r, kui tema iga koodisõna puhul on võimalik mistahes sümbolit taastada, kasutades r sümbolit ülejäänud koodisõnast. Teisisõnu, koodisõna iga sümbol peab olema esitatav funktsioonina mingist väiksest osast ülejäänud sümbolitest. Formaalsem koodi paiksuse kirjeldus on järgmine: Olgu kood ja olgu koodisõna, mis koosneb sümbolitest. Kui iga sümboli puhul, kus kuulub hulka , leidub selline elemendist koosnev hulk , nii et hulka kuuluvatel indeksitel asuvate elementide põhjal on võimalik taastada element , siis on -paikne.[1]

Indeksite hulka, millel asuvatest elementidest on võimalik otsitav element taastada, nimetatakse elemendi taastehulgaks (recovery set).[1]

t-paikselt taastatava koodi definitsioon[muuda | muuda lähteteksti]

Paikselt taastavatel koodidel võib olla üks või mitu taastehulka. Taastehulkade arvu rõhutamiseks võib PTK-sid tähistada kujul t-PTK ehk (n, k, r, t)-PTK.[4]

Taastehulkade arv defineeritakse järgmiselt[4]: Tähistagu koodi koordinaatide alamhulka . Olgu puhul defineeritud koodisõnade hulk . Öeldakse, et koodil on ühisosata taastehulka, kui iga jaoks leidub paarikaupa ühisosata alamhulka nii, et iga puhul kehtib võrdus

PTK-de kasutamisel andmesalvestussüsteemides kehtib põhimõte, et mida rohkem on taastehulki, seda parem on andmete kättesaadavus, sest siis saab korraga anda rohkematele kasutajatele juurdepääsu samadele andmetele.[4]

Tõestused parameetrite kohta[muuda | muuda lähteteksti]

Paikselt taastatavate koodide parameetrite kohta on tõestatud erinevaid tõkkeid.

Miinimumkauguse tõkked[muuda | muuda lähteteksti]

Gopalani jt artiklis[5] ning Papailiopoulose ja Dimakise artiklis[6] tõestatakse järgmine tõke ühe taastehulgaga (n, k, d)-PTK-de kohta, kus paiksus on r ja d on koodi miinimumkaugus:

Koode, mis saavutavad selle tõkke võrdusega, peetakse optimaalseteks PTK-deks, nt püramiidkoodid[5]. See tõke on ühtlasi Singletoni tõkke üldistus: Singletoni tõkke saab kätte siis, kui ülaltoodud avaldises võtta [1]. Rawati jt artiklis[3] ning Wangi jt artiklis[7] on tõestatud järgmine tõke koodi miinimumkauguse kohta:
Tegemist on eelmise tõkke üldistusega juhtudele, kus koodisõna igal sümbolil on üks või rohkem taastehulka[1]. Tamo jt artiklis[1] on veel tõestatud järgmine miinimumkauguse ülemine tõke, kus tähistab taastehulkade arvu ja tähistab taastehulkade elementide arvu:

Kooditeguri tõkked[muuda | muuda lähteteksti]

Gopalan jt[5] ning Papailioulos ja Dimakis[6] on tõestanud ühe taastehulgaga (n,k,r)-PTK-de kooditeguri kohta järgmise tulemuse:

Ühe või rohkema (ühisosata) taastehulgaga koodide kohta on Tamo jt artiklis[1] tõestatud järgmine kooditeguri ülemine tõke, kus on koodi taastehulkade arv ja on koodi paiksus:
Lisaks miinimumkauguse ja kooditeguri tõketele on tõestatud, et mida väiksem on koodi paiksus, seda madalam on veataluvus.[5]

Optimaalsete paikselt taastatavate koodide konstruktsioonid[muuda | muuda lähteteksti]

Nagu eelpool mainitud, peetakse optimaalseteks PTK-deks neid koode, mille puhul kehtib võrdus [5]

Silberstein jt[8] on kirjeldanud konstruktsiooni optimaalsete -PTK-de jaoks, mis põhineb Gabidulini koodidel (Gabidulini koodid on MRD-koodid). Konstruktsioonis kasutatakse paikse grupi (local group) mõistet. Nimelt, töös kirjeldatav andmetalletussüsteem koosneb tipust, millest igaüks sisaldab mingi arvu sümboleid. Ühe tipu sümbolid saab taastada, kasutades ülimalt teist tippu nn paikse grupi seast, mille suurus on . Selliste koodide kohta on artiklis tõestatud järgmine tõke, kus ja on paiksuse parameetrid, on tipu sümbolite arv ning on koodi mõõde:

Teine konstruktsioon on kirjeldatud Tamo jt artiklis[9]. See konstruktsioon põhineb MDS-koodidel ja Reed-Solomoni koodidel. Töös on tõestatud ka optimaalsuse tingimust kinnitav võrdus

Prakashi jt artiklis[10] on kirjeldatud konstruktsioon ühe taastehulgaga optimaalsete PTK-de jaoks. Kirjeldatud konstruktsioonis on tehtud oluline edasiminek võrreldes eelnevate konstruktsioonidega: koodi tähestiku suurus ehk on võrreldav koodi pikkusega n. See-eest, koodi pikkus on piiratud täpse väärtuseni [10]

Koodi pikkuse piirangust saadakse mööda Tamo ja Bargi artiklis[11]. Artiklis on toodud ühe taastehulgaga optimaalsete PTK-de konstruktsioon, mis põhineb Reed-Solomoni koodide üldistusel. Selliselt konstrueeritud koodide kohta tõestatakse artiklis iga korral, , miinimumkauguse tõke mis tõestab konstruktsiooni optimaalsust. Antud juhul on koodi tähestiku suurus võrreldav koodi pikkusega , ilma et koodi pikkusele oleks seatud piiranguid.[11]

Edasiarendused[muuda | muuda lähteteksti]

Maksimaalse taastatavusega paikselt taastatavad koodid[muuda | muuda lähteteksti]

Maksimaalse taastatavusega paikselt taastatavad koodid on sellised koodid, mis suudavad parandada samaaegselt kõik vead, mida on informatsiooniteoreetiliselt võimalik parandada, arvestades paiksusega[2]. Selliseid koode kasutatakse nt Microsofti pilvsalvestussüsteemis Microsoft Azure[12].

Kvantpaikselt taastatavad koodid[muuda | muuda lähteteksti]

Louis Golowichi jt artiklis[13] tutvustatakse kvantpaiksuse kontseptsiooni ja defineeritakse kvant-PTK mõiste. Mainitakse, et kvant-PTK võiks leida rakendust kvantandmesalvestuses ning kirjeldatakse kvant-PTK-de konstruktsioone, parameetrite tõkkeid ja muid omadusi.

Paikse veatuvastusega paikselt taastatavad koodid[muuda | muuda lähteteksti]

Carlos Munuera artiklis[14] on kirjeldatud koodimudelit, mis ühendab paikse taastatavuse paikse veatuvastusega. Eesmärgiks on tuvastada olukordi, kus paiksel taastamisel kasutatavate elementide väärtused on vigased ja seetõttu tuleb taastamise tulemus vigane.

Viited[muuda | muuda lähteteksti]

  1. 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 Tamo, Itzhak; Barg, Alexander; Frolov, Alexey (juuni 2016). "Bounds on the Parameters of Locally Recoverable Codes" (PDF). IEEE Transactions on Information Theory. 62 (6). arXiv:1506.07196.
  2. 2,0 2,1 Guruswami, Venkatesan; Jin, Lingfei; Xing, Chaoping (oktoober 2020). "Constructions of maximally recoverable local reconstruction codes via function fields" (PDF). IEEE Transactions on Information Theory. 66 (10). arXiv:1808.04539v1.
  3. 3,0 3,1 Rawat, Ankit Singh; Papailiopoulos, Dimitris S.; Dimakis, Alexandros G.; Vishwanath, Sriram (august 2016). "Locality and Availability in Distributed Storage". IEEE Transactions on Information Theory. 62 (8). DOI:10.1109/TIT.2016.2524510.
  4. 4,0 4,1 4,2 Tamo, Itzhak; Barg, Alexander (2014). "Bounds on Locally Recoverable Codes with Multiple Recovering Sets" (PDF). 2014 IEEE International Symposium on Information Theory. arXiv:1402.0916v1.
  5. 5,0 5,1 5,2 5,3 5,4 Gopalan, Parikshit; Huang, Cheng; Simitci, Huseyin; Yekhanin, Sergey (november 2012). "On the Locality of Codeword Symbols" (PDF). IEEE Transactions on Information Theory. 58 (11). arXiv:1106.3625v1.
  6. 6,0 6,1 Papailiopoulos, Dimitris S.; Dimakis, Alexandros G. (oktoober 2014). "Locally Repairable Codes" (PDF). IEEE Transactions on Information Theory. 60 (10). arXiv:1206.3804v2.
  7. Wang, Anyu; Zhang, Zhifang (november 2014). "Repair Locality With Multiple Erasure Tolerance" (PDF). IEEE Transactions on Information Theory. 60 (11). arXiv:1306.4774v1.
  8. Silberstein, Natalia; Rawat, Ankit Singh; Koyluoglu, O. Ozan; Vishwanath, Sriram (2013). "Optimal locally repairable codes via rank-metric codes". 2013 IEEE International Symposium on Information Theory. DOI:10.1109/ISIT.2013.6620541.
  9. Tamo, Itzhak; Papailiopoulos, Dimitris S.; Dimakis, Alexandros G. (detsember 2016). "Optimal Locally Repairable Codes and Connections to Matroid Theory". IEEE Transactions on Information Theory. 62 (12). DOI:10.1109/TIT.2016.2555813.
  10. 10,0 10,1 Prakash, N.; Kamath, Govinda M.; Lalitha, V.; Vijay Kumar, P. (2012). "Optimal linear codes with a local-error-correction property" (PDF). 2012 IEEE International Symposium on Information Theory Proceedings. arXiv:1202.2414v1.
  11. 11,0 11,1 Tamo, Itzhak; Barg, Alexander (august 2014). "A family of optimal locally recoverable codes" (PDF). IEEE Transactions on Information Theory. 60 (8). arXiv:1311.3284v2.
  12. Gopi, Sivakanth (16. jaanuar 2018). "Maximally Recoverable Local Reconstruction Codes". microsoft.com. Vaadatud 13. jaanuaril 2024.
  13. Golowich, Louis; Guruswami, Venkatesan (november 2023). "Quantum Locally Recoverable Codes" (PDF). IEEE Transactions on Information Theory. 60 (8). arXiv:2311.08653.
  14. Munuera, Carlos (detsember 2018). "Locally Recoverable codes with local error detection" (PDF). arXiv:1812.00834v1