Kļūdu / atlikumu analīze

Kļūdu / atlikumu analīze

Normāla sadalījuma noteikšana

1. Grafiskā metode

Izveido atlikumu (residuals) histogrammas attēlu.

Ko skatāmies: Kļūdu grafiskā analīze parāda, ka histogrammas forma ir līdzīga zvanveida ar nelielu ekscesu un pozitīvu asimetriju – labā aste ir bieza un aprauta. Standartizēto kļūdu vērtības iekļaujas intervālā no (-3;+3).

Standartizēto kļūdu grafiks izskatās vienmērīgs, bez tendencēm – kļūdu sadalījums varētu būt normālais sadalījums.

 

Boxplot grafikā (kaste ar ūsām) skatāmies, lai nebūtu statistiski nozīmīgu izlēcienu (apzīmēti ar *).

 

 

2. Analītiskā metode

Veic Kolmogorova-Smirnova (N > 50) vai Shapiro-Wilk (N < 50) testu atlikumiem. Ja p > 0,05, tad ir normāls sadalījums, MKM nosacījums izpildās.

Tests of Normality
Kolmogorov-Smirnova Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
Unstandardized Residual ,101 36 ,200* ,970 36 ,414
*. This is a lower bound of the true significance.
a. Lilliefors Significance Correction

 

Heteroskedasticitātes noteikšana

1. Grafiskā metode

Izveido standartizēto atlikumu grafiku pret regresijas prognozētām vērtībām.

Standartizētās kļūdas attiecībā pret standartizētu Y^ norāda uz salīdzinoši vienmērīgu sadalījumu, kurā pamanāmas atsevišķas izlecošas vērtības.

 

 

Izveido nestandartizēto atlikumu grafiku pret X vērtībām.

Meklējam izlēcienus vai kādu formu, tendenci.

Dažreiz var redzēt arī šādu ainu:

 

Izveido atlikumu kvadrātu grafiku pret X vērtībām.

 

Kļūdu kvadrātu attiecības pret faktoru grafikā  vērojama pieaugoša izplešanās tendence. Pastāv arī izlēcieni, kas kopumā varētu liecināt par heteroskedasticitātes problēmu modelī.

Dažreiz pēc kļūdu kvadrātu attiecībā pret faktoriem grafikos īsti nevar saprast. Iespējams ir kāds izlecošais punkts, bet galvenais, lai nav tādas izteiktas trijstūra vai vēdekļa formas.

 

2. Izmantojot Spīrmena rangu korelācijas testu.

Paņem atlikumu absolūtās vērtības un veic Spīrmena korelāciju testu ar X faktoriem. Ja iegūtas statistiski nozīmīga korelācija (Sig. < 0,05) – pastāv heteroskeds.

ABS_Residuals
Spearman’s rho ABS_Residuals Correlation Coefficient 1,000
Sig. (2-tailed)
N 36
LN_Exports Correlation Coefficient ,250
Sig. (2-tailed) ,142
N 36
Unempl Correlation Coefficient -,178
Sig. (2-tailed) ,300
N 36
LN_investments Correlation Coefficient -,242
Sig. (2-tailed) ,156
N 36

3. Izmantojot Goldfelda-Kvandta testu.

Šķērsgriezuma datu gadījumā Goldfelda-Kvandta (GQ) testa sākumā izlasi sasortē pēc kāda no faktoriem vai pēc Y^. Lai atdalītu lielos Xus no mazajiem, “neitrālos” izmet.

Pēc tam aprēķina, zinot datu skaitu N, cik jāņem vērtības no augšējā gala un no apakšējā gala.

n= 32
c=?
Ieteikumi no literatūras:
1) n/6= 5,33
n/3= 10,67
Tā kā  n pāra skaitlis, arī c izvēlēsimies pāra skaitli.
c (n-c)/2
6 13
8 12 mana izvēle.
10 11

 

Un tad veic 2 palīgregresijas.

Palīgregresija, kas iegūta pirmajiem 12 novērojumiem (mazajiem Xiem)

 

ANOVA tabula no palīgregresijas, kas iegūta pirmajiem 12 novērojumiem (mazajiem Xiem):

ANOVAa
Model Sum of Squares df Mean Square F Sig.
1 Regression 27985,739 2 13992,870 110,473 ,000b
Residual 1139,971 9 126,663
Total 29125,710 11

Palīgregresija, kas iegūta pēdējiem 12 novērojumiem (lielajiem Xiem)

ANOVA tabula no palīgregresijas, kas iegūta pēdējiem 12 novērojumiem (lielajiem Xiem):

ANOVAa
Model Sum of Squares df Mean Square F Sig.
1 Regression 1074192,593 2 537096,296 168,740 ,000b
Residual 28646,890 9 3182,988
Total 1102839,483 11

Un visbeidzot rēķina F vērtību un p-vērtību.

F (lielāko dispersiju dala ar mazāko):  3182,988 / 126,663 = 25,130

F krit = =F.INV.RT(0,05;9;9) = 3,179

P-vērtība: F.DIST.RT(25,130; skaitītāja brīvības pakāpes; saucēja brīvības pakāpes) = F.DIST.RT(25,130; 9; 9) = 0,000

F > Fkrit un p < 0,05, secinām, ka heteroskeds konstatēts.

 

Ja ir laikrindu dati

Tā kā šajā gadījumā izvēlētie dati ir laikrindas, GQ testā neko nesortē! Vienkārši sadala izlasi divās daļās (divos laika periodos), un novērtē attiecīgās palīgregresijas. Tālākais – tāpat kā iepriekš.

 

4. Izmantojot White / Vaita testu.

Veic palīgregresiju, kur Dependent Variable ir atlikumu kvadrāti, bet Independent: ieliek visus faktorus,  faktoru kvadrātus, un faktoru savstarpējos reizinājumus.

Piemēram, ja ir 2 faktori:

n*R2= 11,47984
p-vērtība= 0,074631

p-vērtība =CHISQ.DIST.RT(n*R2; faktoru skaits bez konstantes)

 

Autokorelācijas noteikšana

1. Grafiskā metode

Izveido nestandartizēto atlikumu grafiku pret laiku.

 

Kļūdas veido garas vienas zīmes vērtību virknes – tātad blakus esošām kļūdām biežāk ir viena zīme, tas ir, pozitīva autokorelācija

Izveido nestandartizēto atlikumu grafiku pret LAGS.

 

Tā kā vairums punktu grupējas I un III kvadrantā, secinām, ka ir pozitīva autokorelācija. Pretēji – negatīva autokorelācija. Mākonis – nav autokorelācijas.

 

2. Izmantojot skrējienu testu

Runs Test
Unstandardized Residual
Test Valuea ,0000000
Cases < Test Value 21
Cases >= Test Value 15
Total Cases 36
Number of Runs 14
Z -1,393
Asymp. Sig. (2-tailed) ,164
a. Mean

 

Tā kā p-vērtība > 0,05, secināms, ka nepastāv autokorelācija.

Ja būtu < 0,05 un z < 0, tad pozitīva autokorelācija. Ja būtu < 0,05 un z > 0, tad negatīva autokorelācija.

 

Jeb manuāls aprēķins:

 

 

3. Ar Durbina-Vatsona d-testa palīdzību

 

Durbina-Vatsonapie p = 0,05:

TABULAS