Kasutaja:Annikail/liivakast

Allikas: Vikipeedia

Aegrida on rida ajaliselt järjestatud indekseeritud andmetest. Tavaliselt on aegrida jada võrdsete ajavahemikega punktidest. Seega on see diskreetse ajaga andmete jada. Näited aegridadest on ookeani loodete kõrgused, päikeseplekkide arv ning Dow Jonesi tööstuskeskmise päevane lõplik väärtus.

Aegread esitatakse graafiliselt väga sageli joondiagrammidena. Aegridasid kasutatakse statistikas, signaalitöötluses, mustrite tuvastamises, ökonomeetrias, finantsmatemaatikas, ilmaprognoosimises, maavärinate ennustuses, elektroentsefalograafias (EEG), juhtimistehnoloogias, astronoomias, kommunikatsiooni tehnikas ja üldiselt igas rakendus- ja inseneriteaduste valdkonnas, mis hõlmavad ajalisi mõõtmisi.

Aegridade analüüs hõlmab aegrea andmete analüüsimeetodeid, et tuua välja sisukas statistika ning teised andmete karakteristikud. Aegridade prognoos on mudeli kasutamine tulevaste väärtuste ennustamiseks eelnevalt vaadeldud väärtuste põhjal. Tihti kasutatakse teooriate testimiseks regressioonanalüüsi, mille põhjal väärtused ühest või rohkematest iseseisvatest aegridadest mõjutavad mingi teise aegrea vaadeldavat väärtust. Sellist üksiku aegrea vahelesegamise analüüsi nimetatakse katkestatud aegridade analüüsiks, mitte „aegridade analüüsiks“, mis keskendub üksikute aegridade või mitmete üksteisest sõltuvate aegridade väärtuste võrdlemiseks erinevatel ajahetkedel.[1]

Aegridadel on loomupärane ajaline järjestus. See eristab aegridade analüüsi ristlõikelistest uuringutest, kus ei ole vaatluste loomulikku ajalist järjestust (nt. palkade võrdlus vastavalt haridustasemele, kus isikute andmed võivad olla sisestatud mistahes järjestuses). Aegridade analüüs on ka eristatav ruumiliste andmete analüüsist, kus vaatlused on tavaliselt geograafiliste kohtadega seotud (nt. maja hindade arvestamine sõltuvalt asukohast ning majale omastest omadustest). Aegridade stohhastiline mudel peegeldab tavaliselt asjaolu, et vaatlused, mis on ajaliselt üksteisele lähemal, on lähemalt seotud, kui vaatlused, mis on üksteisest kaugemal. Lisaks sellele, aegridade mudel kasutab tihti loomulikku ühesuunalist ajalist järjekorda nii, et antud perioodi väärtused on väljendatud mitte tuleviku, vaid mineviku väärtuste tuletistena.

Aegridade analüüsi saab kasutada reaalarvuliste pidevate andmete, diskreetsete arvuliste andmete või diskreetsete sümbolitest andmete korral (nt. tähemärkide järjestused, nagu inglise keele tähed ja sõnad[2]).

Analüüsi meetodid[muuda | muuda lähteteksti]

Aegridade analüüsi meetodid on jagatud kahte klassi: sageduspiirkondade meetodid ja ajapiirkondade meetodid. Neist esimene sisaldab spektraalanalüüsi ning lainekujuanalüüsi ning teine seeriaanalüüsi ja ristkorrelatsioonianalüüsi. Ajapiirkondade meetodi korral tehakse korrelatsioon ja analüüsimine filtreerimismeetodil kasutades kaalutud korrelatsiooni, vähendades seeläbi vajadust töötada sageduspiirkonnas.

Lisaks sellele saab aegridade analüüsimise tehnikaid jagada parameetrilisteks ning mitteparameetrilisteks meetoditeks. Parameetriline lähenemine eeldab, et aluseks oleval statsionaarsel stohhastilisel protsessil on kindel struktuur, mida saab kirjeldada vähemate parameetritega (näiteks kasutades autoregressiivset või liikuva keskmise mudelit). Nendes lähenemistes on eesmärgiks selle mudeli parameetrite hindamine, mis kirjeldab stohhastilist protsessi. Vastupidiselt, hinnatakse mitteparameetrilise lähenemise korral protsessi spektri kovariatsiooni ning ei eeldata, et protsessil on mingi kindel struktuur.

Aegridade analüüsi meetodid võivad samuti olla jagunenud lineaarseks ning mittelineaarseks ja ühemõõtmeliseks ning mitmemõõtmeliseks.

Mudelid[muuda | muuda lähteteksti]

Tähistus[muuda | muuda lähteteksti]

Aegridade analüüsimise korral kasutatakse erinevaid tähistusi. Levinud aegrea X tähistus, mille indeksid on naturaalarvud, kirjutatakse

X = {X1, X2, ...}.

Teine levinud tähistus on

Y = {Yt: t ∈ T},

kus T on indeksite hulk.

Viited[muuda | muuda lähteteksti]

  1. Imdadullah, 2013. Basic Statistics and Data Analysis. [1] (18.03.2018).
  2. Lin, Keogh, Lonardi, Chiu 2003. A symbolic representation of time series, with implications for streaming algorithms. [2] (18.03.2018).