Kļūdu / atlikumu analīze
Normāla sadalījuma noteikšana
1. Grafiskā metode
Izveido atlikumu (residuals) histogrammas attēlu.
Ko skatāmies: Kļūdu grafiskā analīze parāda, ka histogrammas forma ir līdzīga zvanveida ar nelielu ekscesu un pozitīvu asimetriju – labā aste ir bieza un aprauta. Standartizēto kļūdu vērtības iekļaujas intervālā no (-3;+3).
Standartizēto kļūdu grafiks izskatās vienmērīgs, bez tendencēm – kļūdu sadalījums varētu būt normālais sadalījums.
Boxplot grafikā (kaste ar ūsām) skatāmies, lai nebūtu statistiski nozīmīgu izlēcienu (apzīmēti ar *).
2. Analītiskā metode
Veic Kolmogorova-Smirnova (N > 50) vai Shapiro-Wilk (N < 50) testu atlikumiem. Ja p > 0,05, tad ir normāls sadalījums, MKM nosacījums izpildās.
Tests of Normality | ||||||
Kolmogorov-Smirnova | Shapiro-Wilk | |||||
Statistic | df | Sig. | Statistic | df | Sig. | |
Unstandardized Residual | ,101 | 36 | ,200* | ,970 | 36 | ,414 |
*. This is a lower bound of the true significance. | ||||||
a. Lilliefors Significance Correction |
Heteroskedasticitātes noteikšana
1. Grafiskā metode
Izveido standartizēto atlikumu grafiku pret regresijas prognozētām vērtībām.
Standartizētās kļūdas attiecībā pret standartizētu Y^ norāda uz salīdzinoši vienmērīgu sadalījumu, kurā pamanāmas atsevišķas izlecošas vērtības.
Izveido nestandartizēto atlikumu grafiku pret X vērtībām.
Meklējam izlēcienus vai kādu formu, tendenci.
Dažreiz var redzēt arī šādu ainu:
Izveido atlikumu kvadrātu grafiku pret X vērtībām.
Kļūdu kvadrātu attiecības pret faktoru grafikā vērojama pieaugoša izplešanās tendence. Pastāv arī izlēcieni, kas kopumā varētu liecināt par heteroskedasticitātes problēmu modelī.
Dažreiz pēc kļūdu kvadrātu attiecībā pret faktoriem grafikos īsti nevar saprast. Iespējams ir kāds izlecošais punkts, bet galvenais, lai nav tādas izteiktas trijstūra vai vēdekļa formas.
2. Izmantojot Spīrmena rangu korelācijas testu.
Paņem atlikumu absolūtās vērtības un veic Spīrmena korelāciju testu ar X faktoriem. Ja iegūtas statistiski nozīmīga korelācija (Sig. < 0,05) – pastāv heteroskeds.
ABS_Residuals | |||
Spearman’s rho | ABS_Residuals | Correlation Coefficient | 1,000 |
Sig. (2-tailed) | |||
N | 36 | ||
LN_Exports | Correlation Coefficient | ,250 | |
Sig. (2-tailed) | ,142 | ||
N | 36 | ||
Unempl | Correlation Coefficient | -,178 | |
Sig. (2-tailed) | ,300 | ||
N | 36 | ||
LN_investments | Correlation Coefficient | -,242 | |
Sig. (2-tailed) | ,156 | ||
N | 36 |
3. Izmantojot Goldfelda-Kvandta testu.
Šķērsgriezuma datu gadījumā Goldfelda-Kvandta (GQ) testa sākumā izlasi sasortē pēc kāda no faktoriem vai pēc Y^. Lai atdalītu lielos Xus no mazajiem, “neitrālos” izmet.
Pēc tam aprēķina, zinot datu skaitu N, cik jāņem vērtības no augšējā gala un no apakšējā gala.
n= | 32 | ||||
c=? | |||||
Ieteikumi no literatūras: | |||||
1) | n/6= | 5,33 | |||
n/3= | 10,67 | ||||
Tā kā n pāra skaitlis, arī c izvēlēsimies pāra skaitli. | |||||
c | (n-c)/2 | ||||
6 | 13 | ||||
8 | 12 | mana izvēle. | |||
10 | 11 | ||||
Un tad veic 2 palīgregresijas.
Palīgregresija, kas iegūta pirmajiem 12 novērojumiem (mazajiem Xiem)
ANOVA tabula no palīgregresijas, kas iegūta pirmajiem 12 novērojumiem (mazajiem Xiem):
ANOVAa | ||||||
Model | Sum of Squares | df | Mean Square | F | Sig. | |
1 | Regression | 27985,739 | 2 | 13992,870 | 110,473 | ,000b |
Residual | 1139,971 | 9 | 126,663 | |||
Total | 29125,710 | 11 |
Palīgregresija, kas iegūta pēdējiem 12 novērojumiem (lielajiem Xiem)
ANOVA tabula no palīgregresijas, kas iegūta pēdējiem 12 novērojumiem (lielajiem Xiem):
ANOVAa | ||||||
Model | Sum of Squares | df | Mean Square | F | Sig. | |
1 | Regression | 1074192,593 | 2 | 537096,296 | 168,740 | ,000b |
Residual | 28646,890 | 9 | 3182,988 | |||
Total | 1102839,483 | 11 |
Un visbeidzot rēķina F vērtību un p-vērtību.
F (lielāko dispersiju dala ar mazāko): 3182,988 / 126,663 = 25,130
F krit = =F.INV.RT(0,05;9;9) = 3,179
P-vērtība: F.DIST.RT(25,130; skaitītāja brīvības pakāpes; saucēja brīvības pakāpes) = F.DIST.RT(25,130; 9; 9) = 0,000
F > Fkrit un p < 0,05, secinām, ka heteroskeds konstatēts.
Ja ir laikrindu dati
Tā kā šajā gadījumā izvēlētie dati ir laikrindas, GQ testā neko nesortē! Vienkārši sadala izlasi divās daļās (divos laika periodos), un novērtē attiecīgās palīgregresijas. Tālākais – tāpat kā iepriekš.
4. Izmantojot White / Vaita testu.
Veic palīgregresiju, kur Dependent Variable ir atlikumu kvadrāti, bet Independent: ieliek visus faktorus, faktoru kvadrātus, un faktoru savstarpējos reizinājumus.
Piemēram, ja ir 2 faktori:
n*R2= | 11,47984 |
p-vērtība= | 0,074631 |
p-vērtība =CHISQ.DIST.RT(n*R2; faktoru skaits bez konstantes)
Autokorelācijas noteikšana
1. Grafiskā metode
Izveido nestandartizēto atlikumu grafiku pret laiku.
Kļūdas veido garas vienas zīmes vērtību virknes – tātad blakus esošām kļūdām biežāk ir viena zīme, tas ir, pozitīva autokorelācija
Izveido nestandartizēto atlikumu grafiku pret LAGS.
Tā kā vairums punktu grupējas I un III kvadrantā, secinām, ka ir pozitīva autokorelācija. Pretēji – negatīva autokorelācija. Mākonis – nav autokorelācijas.
2. Izmantojot skrējienu testu
Runs Test | |
Unstandardized Residual | |
Test Valuea | ,0000000 |
Cases < Test Value | 21 |
Cases >= Test Value | 15 |
Total Cases | 36 |
Number of Runs | 14 |
Z | -1,393 |
Asymp. Sig. (2-tailed) | ,164 |
a. Mean |
Tā kā p-vērtība > 0,05, secināms, ka nepastāv autokorelācija.
Ja būtu < 0,05 un z < 0, tad pozitīva autokorelācija. Ja būtu < 0,05 un z > 0, tad negatīva autokorelācija.
Jeb manuāls aprēķins:
3. Ar Durbina-Vatsona d-testa palīdzību
Durbina-Vatsonapie p = 0,05:
TABULAS