Aegrida

Allikas: Vikipeedia

Aegrida on rida kronoloogiliselt järjestatud (indekseeritud) andmetest. Aegridu talletatakse tavaliselt kronoloogilistes andmebaasides (ehk TSDB-des). "Tavaliselt" on aegrida jada võrdsete ajavahemikega punktidest. Seega on see diskreetse ajaga andmete jada.[1] Näited aegridadest on ookeani loodete kõrgused, päikeseplekkide arv ning Dow Jonesi tööstuskeskmise päevane lõplik väärtus.

Aegread esitatakse graafiliselt väga sageli joondiagrammidena. Aegridasid kasutatakse statistikas, signaalitöötluses, mustrite tuvastamises, ökonomeetrias, finantsmatemaatikas, ilmaprognoosimises, maavärinate ennustuses, elektroentsefalograafias (EEG), juhtimistehnoloogias, astronoomias, kommunikatsioonitehnikas ja üldiselt igas rakendus- ja inseneriteaduste valdkonnas, mis hõlmavad ajalisi mõõtmisi.

Kirjeldus[muuda | muuda lähteteksti]

Aegridade analüüs hõlmab aegrea andmete analüüsimeetodeid, et tuua välja sisukas statistika ning teised andmete karakteristikud. Aegridade prognoos on mudeli kasutamine tulevaste väärtuste ennustamiseks eelnevalt vaadeldud väärtuste põhjal. "Tihti" kasutatakse teooriate testimiseks regressioonanalüüsi, mille põhjal väärtused ühest või rohkematest iseseisvatest aegridadest mõjutavad mingi teise aegrea vaadeldavat väärtust. Sellist üksiku aegrea vahelesegamise analüüsi nimetatakse katkestatud aegridade analüüsiks, mitte aegridade analüüsiks, mis keskendub üksikute aegridade või mitmete üksteisest sõltuvate aegridade väärtuste võrdlemiseks erinevatel ajahetkedel.[2]

Aegridadel on loomupärane ajaline järjestus. See eristab aegridade analüüsi ristlõikelistest uuringutest, kus ei ole vaatluste loomulikku ajalist järjestust (nt palkade võrdlus vastavalt haridustasemele, kus isikute andmed võivad olla sisestatud mistahes järjestuses). Aegridade analüüs on ka eristatav ruumiliste andmete analüüsist, kus vaatlused on "tavaliselt" geograafiliste kohtadega seotud (nt maja hindade arvestamine sõltuvalt asukohast ning majale omastest omadustest). Aegridade stohhastiline mudel peegeldab tavaliselt asjaolu, et vaatlused, mis on ajaliselt üksteisele lähemal, on lähemalt seotud, kui vaatlused, mis on üksteisest kaugemal. Lisaks sellele, aegridade mudel kasutab tihti loomulikku ühesuunalist ajalist järjekorda nii, et antud perioodi väärtused on väljendatud mitte tuleviku, vaid mineviku väärtuste tuletistena.[3]

Aegridade analüüsi saab kasutada reaalarvuliste pidevate andmete, diskreetsete arvuliste andmete või diskreetsete sümbolitest andmete korral (nt tähemärkide järjestused, nagu inglise keele tähed ja sõnad).[4]

Analüüsimeetodid[muuda | muuda lähteteksti]

Aegridade analüüsimeetodid on jagatud kahte klassi: sageduspiirkondade meetodid ja ajapiirkondade meetodid. Neist esimene sisaldab spektraalanalüüsi ning lainekujuanalüüsi ning teine seeriaanalüüsi ja ristkorrelatsioonianalüüsi. Ajapiirkondade meetodi korral tehakse korrelatsioon ja analüüsimine filtreerimismeetodil kasutades kaalutud korrelatsiooni, vähendades seeläbi vajadust töötada sageduspiirkonnas.[5]

Lisaks sellele saab aegridade analüüsimise tehnikaid jagada parameetrilisteks ning mitteparameetrilisteks meetoditeks. Parameetriline lähenemine eeldab, et aluseks oleval statsionaarsel stohhastilisel protsessil on kindel struktuur, mida saab kirjeldada vähemate parameetritega (näiteks kasutades autoregressiivset või liikuva keskmise mudelit). Nendes lähenemistes on eesmärgiks selle mudeli parameetrite hindamine, mis kirjeldab stohhastilist protsessi. Vastupidi hinnatakse mitteparameetrilise lähenemise korral protsessi spektri kovariatsiooni ning ei eeldata, et protsessil on mingi kindel struktuur.[5]

Aegridade analüüsi meetodid võivad samuti olla jagunenud lineaarseks ja mittelineaarseks ning ühemõõtmeliseks ja mitmemõõtmeliseks.[5]

Mudelid[muuda | muuda lähteteksti]

Tähistus[muuda | muuda lähteteksti]

Aegridade analüüsimise korral kasutatakse erinevaid tähistusi. Levinud aegrea tähistus, mille indeksid on naturaalarvud, kirjutatakse

.

Teine levinud tähistus on

,

kus T on indeksite hulk.

Viited[muuda | muuda lähteteksti]

  1. J. Awange, B. Paláncz, R. Lewis, L. Völgyesi (2018). Mathematical Geosciences: Hybrid Symbolic-Numeric Methods.{{raamatuviide}}: CS1 hooldus: mitu nime: autorite loend (link)
  2. M. Imdadullah (27. detsember 2013). "Time Series Analysis and Forecasting". itfeature.com, Basic Statistics and Data Analysis. Vaadatud 18.03.2018.
  3. Sio-Iong Ao (2010). Applied Time Series Analysis and Innovative Computing.
  4. J. Lin, E. Keogh, S. Lonardi, B. Chiu (13. juuni 2003). "A symbolic representation of time series, with implications for streaming algorithms". Vaadatud 18.03.2018.{{netiviide}}: CS1 hooldus: mitu nime: autorite loend (link)
  5. 5,0 5,1 5,2 J. Strickland (2014). Predictive Analytics using R.