Link: OLE-Object-Data Autokorelace náhodných složek Druhou nesnází, která provází odhad zobecněného lineárního regresního modelu, je případná autokorelace náhodných složek regresní rovnice. Tento dost častý úkaz se vyskytuje daleko častěji u jednorovnicového modelu, jehož pozorování tvoří časové řady ( u průřezových údajů je pozorován vzácně ). Jeho důsledkem je, že odhady parametrů modelu pořízené obyčejnou metodou nejmenších čtverců OLS sice zůstávají nestranné, ale ztrácejí vydatnost. Při znalosti kovarianční matice náhodných složek je pro získání vydatného odhadu nutno uplatnit zobecněnou metodu nejmenších čtverců GLS. Odhad s^2 rozptylu náhodných složek s^2 metodou OLS je však vychýlený. Indikace přítomnosti autokorelovanosti náhodných složek : O přítomnosti autokorelace náhodných složek (jejichž teoretické hodnoty neznáme) se lze přesvědčit jen nepřímo, vyšetřením reziduálních hodnot. Velmi názorný obrázek o míře autokorelovanosti náhodných složek podává (A) Durbin-Watsonův koeficient autokorelace reziduí určený výrazem který je definován jako podíl součtu čtverců diferencí dvou po sobě jdoucích reziduálních hodnot a součtu čtverců všech reziduí. Rozsah přípustných hodnot DW- koeficientu se pohybuje v rozmezí < 0 , 4 >, přičemž obě krajní hodnoty signalizují maximální možnou korelovanost dvou následujících reziduálních hodnot Pro případ DW @ 0 jde o kladnou autokorelaci 1.řádu , v případě DW @ 4 o zápornou autokorelaci, zatímco prostřední hodnota DW @ 2 znamená nepřítomnost autokorelace 1.řádu. Poznámka 1 Po umocnění výrazu v čitateli vzorce pro DW vidíme, že : - při nepřítomnosti autokorelace reziduí bude skalární součin vektorů e[t] a e[t-1] blízký nule, takže zbytek čitatele bude přibližně rovný dvojnásobku jmenovatele. - při silné kladné autokorelaci bude tento skalární součin blízký a výraz bude přibližně roven součtu - - konečně při silné záporné autokorelaci bude zmíněný skalární součin blízký -a výrazy a budou přibližně stejné co do absolutní velikosti i co do znamének. Vše platí za předpokladu, že rozdíl v počtu členu sumací (ve jmenovateli je o 1 člen více) nebude při dostatečně početném datovém vzorku podstatný. Poznámka 2 Zřetelná kladná autokorelace (1.řádu) je charakteristická delšími řetězci shodných znamének reziduálních hodnot ležícími střídavě nad a pod vyrovnávající regresní nadrovinou. Silná záporná autokorelace (1.řádu) je naopak typická téměř pravidelným střídáním znamének reziduálních hodnot (tj. zřetelnou oscilací dvou po sobě jdoucích reziduálních hodnot kolem vyrovnávající regresní nadroviny). Nevýhodou Durbin-Watsonova koeficientu je však skutečnost, že empiricky získanou hodnotu DW nelze v úplnosti statisticky testovat (rozdělení testové statistiky závisí na prvcích matice X, které jsou rozdílné pro každý statistický výběr). V důsledku toho obsahuje interval přípustných hodnot pro DW-koeficient < 0,4 > dvě "hluché oblasti", v nichž nelze rozhodnout, zda hypotéza o nepřítomnosti autokorelace 1. řádu bude zamítnuta ve prospěch některé z alternativ (kladná či záporná autokorelovanost). Tak v intervalu < > se zamítá hypotéza neautokorelovanosti ve prospěch alternativy: existence kladné autokorelace 1. řádu v intervalu < [ ]> nelze test rigorózně vyhodnotit v intervalu < > se nezamítá (přijímá) hypotéza neautokorelovanosti v intervalu < > nelze test rigorózně vyhodnotit v intervalu < [ ]> se zamítá hypotéza neautokorelovanosti ve prospěch alternativy: existence záporné autokorelace 1. řádu "Mezní" hranice [ ]lze spočítat pro libovolný počet stupňů volnosti (T-k) a pro obvyklé hladiny významnosti (a=0,01 nebo 0,05). Příslušné hodnoty jsou tabelovány. Postupy vedoucí k eliminaci autokorelovanosti náhodných složek (B) COCHRANE-ORCUTTova procedura, kterou lze popsat tímto iterativním opakováním následujících tří fází (B0) Předstupněm iteračního procesu je výpočet parametrů b^(0) modelu v původní specifikaci obyčejnou metodou nejmenších čtverců OLS a následné stanovení vyrovnaných hodnot závisle proměnné a hodnot reziduí : (B1) Formulujeme autoregresní schéma 1. řádu pro rezidua e[t] ve tvaru , kde [ ]je příslušný bílý šum autoregresního procesu 1. řádu (jeho realizace jsou centrované, nekorelované, homoskedastické a stejně rozdělené náhodné veličiny). K zachování stacionarity procesu je, jak známo, nutné splnění podmínky . (B2) Odhad [ ]koeficientu autokorelace 1. řádu získáme pomocí výrazu při dodefinování . (B3) Takto získaný odhad se použije v modifikovaném regresním modelu. Modifikace je představována úpravou jednotlivých modelových proměnných pomocí metody zobecněných diferencí : V případě např. 3 vysvětlujících proměnných, kde první "vysvětlující" proměnnou představuje vektor jedniček, má tento vztah podobu ( pro ) Aplikací obyčejné OLS na takto modifikovaný model získáme upravený odhad vektoru parametrů . Tento odhad se dosadí do původního modelu a následně se spočtou (přes vyrovnané hodnoty) upravená rezidua . S těmi se vstoupí do druhého kroku iterační procedury představované opakováním fáze (B1). Následuje opět sekvence operací (B2), (B3) atd. Poté, co v průběžném r-tém kroku získáme odhady pro , porovnáme je s hodnotami veličin získanými v předchozím kroku. Jestliže rozdíly ve dvou po sobě jdoucích krocích nepřekročí předepsanou odchylku (stanovenou např. ve formě maxima z odchylek u jednotlivých parametrů a nebo jako (v absolutní hodnotě vzatý) rozdíl odhadů autoregresního koeficientu tj. , můžeme výsledky dosažené v daném iteračním kroku považovat za uspokojivé a příslušné odhady převzít jako konečné. Určitou podobnost s předchozím postupem vykazuje (C) DURBINova dvoustupňová metoda použitelná i v případě přítomnosti autokorelace vyšších řádů u náhodných složek. (C1) Model se nejprve -- obdobně jako v kroku (B3) předchozí metody -- převede na tvar zobecněných diferencí resp. po substitucích , atd. a [ ]získá tvar Odtud se pomocí metody OLS získá konzistentní odhad autoregresního koeficientu 1.řádu [ ]příslušejícího zpožděné hodnotě proměnné [ . ](C2) Tento odhad [ ]se dosadí do výchozího tvaru modelu a opětovným použitím OLS se získají zpřesněné odhady [ ]pro , [ ]pro , , pro [ ]atd. s uspokojivými asymptotickými (tj. pro velký rozsah výběru T) vlastnostmi. Nevýhodou tohoto postupu je však zřetelně zvýšený počet odhadovaných parametrů, který dosáhne počtu 2k-1 - ke každému původnímu (j=2,.., k) (tedy až na ) přísluší nyní dvojice parametrů [ ]z nichž jeden je "původní" a druhý vznikne násobením hodnotou . V případě relativně malého počtu pozorování T ve srovnání s počtem vysvětlujících proměnných regresní rovnice k není tedy tento postup příliš vhodný. Nevýhodu spojenou s oblastmi nerozhodnutelnosti testování závisejícími na u Durbin-Watsonova koeficientu odstraňuje podobně konstruovaná míra známá jako (D) von Neumannův koeficient (podíl)[1] autokorelace reziduí Tato míra je definována vztahem Lze ukázat, že jsou-li náhodné složky e[t] a tedy i rezidua e [t] normálně rozdělena, pak pro dost velký počet pozorování T má statistika vN také přibližně normální rozdělení. Její střední hodnota a rozptyl jsou dány výrazy Kritické hodnoty vN-podílu jsou pro různá T a obvykle používané hladiny významnosti tabelovány. Rezidua [ ]získaná metodou OLS však nejsou nezávisle rozdělena, dokonce ani tehdy ne, jsou-li nezávisle rozděleny náhodné složky . To snižuje přínos této statistiky při aplikaci v ekonometrických modelech. V situacích, kdy se mezi vysvětlujícími proměnnými objevují též zpožděné endogenní proměnné, není použití Durbin-Watsonova koeficientu vhodné. Příčinou toho, že DW-koeficient nedává při přítomnosti vysvětlujících zpožděných endogenních proměnných objektivní závěry, je skutečnost, že DW-koeficient se v tomto případě blíží ke 2 v důsledku výskytu právě těchto proměnných, ne jen v důsledku neautokorelovaných náhodných složek. Účinnějším indikátorem je v některých situacích (E) Durbinova h-statistika autokorelace reziduí definována následovně : kde je odhad výběrového rozptylu odhadnutého regresního koeficientu u zpožděné endogenní proměnné . Při nulové hypotéze o sériové nezávislosti náh. složek je statistika h asymptoticky normálně rozdělena ( s nulovou střední hodnotou a jedničkovým rozptylem) Lze ji testovat jako normální směrodatnou odchylku (alternativní hypotézou je přítomnost autokorelace 1. řádu). Omezenost jejího použití vyplývá z podmínky kladného jmenovatele . Zde je nutno uplatnit alternativní testovací postupy. Poznámka: V případě, že h-statistika není definována, doporučuje se (následně po provedení OLS-regrese) např. definovat regresní rovnici ve tvaru Testování hypotézy se převede na testování statistické významnosti koeficientu v této regresi. DW test není přímo použitelný v případě testování sériové korelace vyšších řádů nebo při nelineární formě autokorelace náhodných složek. Některé modifikace k zmírnění problému v těchto situacích navrhli Nerlove, Wallis, Theil, Nagar a Geary. (F) Berenblut-Webbův test[2] je založen na statistice , kde jsou rezidua z regrese prvních diferencí na první diference vysvětlujících proměnných (bez konstanty) tj. z regrese Jestliže původní rovnice obsahuje konstantu, můžeme užít tabulky pro D-W testovou statistiku pro posouzení hodnot BW-statistiky. BW-statistika je navíc uplatnitelná, i když se vyskytne situace, kdy . Jestliže je model homoskedastický a jsou-li náhodné složky regresní rovnice generovány autoregresním schématem 1. řádu, lze zapsat kovarianční matici náhodných složek v následující podobě: V této matic, jak patrno, jsou na hlavní diagonále samé jedničky a na "rovnoběžkách" s touto hlavní diagonálou vždy příslušné mocniny , kde s je rovno rozdílu indexů příslušného prvku od součtu indexů diagonálního prvku (ležícího na stejném řádku, resp. sloupci). Při takovémto schématu lze uplatnit zobecněnou metodu nejmenších čtverců GLS tak, že se transformace původních pozorování provede tak, že se k této transformaci použije matice R ve tvaru Tato matice má nenulové prvky jen ve dvou řadách. jednou je hlavní diagonála, která má všechny prvky rovny 1 až na první prvek, jehož hodnota je a druhou nenulovou řadou je řada ležící bezprostředně pod hlavní diagonálou, která je obsazena prvky s hodnotami rovnými . Příslušná transformace se pak projeví tím způsobem, že pozorování jsou upravena do této podoby tzn. že j-tý sloupec matice je obsazen (vždy až na první prvek) "zobecněnými diferencemi"[3] ------------------------------- [1] von Neuman, John: Distribution uf the ratio of the Mean Square Successive Difference to the Variance. Annals of Mathematical Statistics 1941 s. 367-295 [2] Berenblut, I.,I., Webb, G.,I.: A New Test for Autocorrelated Errors in the Linear Regression Model. Journal of the Royal Statistical Society Vol.35/1973 s. 33-50. [3] Někdy se tento postup nazývá Prais-Winstenovou transformací.