Link: OLE-Object-Data

   Autokorelace náhodných složek


     Druhou nesnází, která provází odhad zobecněného lineárního regresního modelu, je případná
autokorelace náhodných složek regresní rovnice. Tento dost častý úkaz se vyskytuje daleko častěji u
   jednorovnicového modelu, jehož pozorování tvoří časové řady ( u průřezových údajů je pozorován
   vzácně ). Jeho důsledkem je, že odhady parametrů modelu pořízené obyčejnou metodou nejmenších
   čtverců OLS sice zůstávají nestranné, ale ztrácejí vydatnost. Při znalosti kovarianční matice
náhodných složek je pro získání vydatného odhadu nutno uplatnit zobecněnou metodu nejmenších čtverců
            GLS. Odhad s^2 rozptylu náhodných složek s^2 metodou OLS je však vychýlený.


   Indikace přítomnosti autokorelovanosti náhodných složek :

   
   O přítomnosti autokorelace náhodných složek (jejichž teoretické hodnoty neznáme) se lze
   přesvědčit jen nepřímo, vyšetřením reziduálních hodnot.

               Velmi názorný obrázek o míře autokorelovanosti náhodných složek podává

   (A)  Durbin-Watsonův koeficient autokorelace  reziduí určený výrazem

                                           
   který je definován jako podíl součtu čtverců diferencí dvou po sobě jdoucích reziduálních
   hodnot a součtu čtverců všech reziduí. Rozsah přípustných hodnot DW- koeficientu se pohybuje
   v rozmezí < 0 , 4 >, přičemž obě krajní hodnoty signalizují maximální možnou korelovanost dvou
   následujících reziduálních hodnot Pro případ DW @ 0 jde o kladnou autokorelaci 1.řádu ,
   v případě DW @ 4 o zápornou autokorelaci, zatímco prostřední hodnota DW @ 2 znamená
   nepřítomnost autokorelace 1.řádu.

   
   Poznámka 1   Po umocnění výrazu v čitateli vzorce pro DW vidíme, že :

   -         při nepřítomnosti autokorelace reziduí bude skalární součin vektorů e[t] a e[t-1]
   blízký

        nule, takže zbytek čitatele bude přibližně rovný dvojnásobku jmenovatele.

   -         při silné kladné autokorelaci bude tento skalární součin blízký  a 

        výraz      bude přibližně roven součtu   -

   -         konečně při silné záporné autokorelaci bude zmíněný skalární součin blízký

      -a  výrazy  a    budou přibližně stejné co do  absolutní  velikosti i co do znamének.

   
 Vše platí za předpokladu, že rozdíl v počtu členu sumací (ve jmenovateli je o 1 člen více)  nebude
                         při dostatečně početném datovém vzorku podstatný.

   
   Poznámka 2 Zřetelná kladná autokorelace (1.řádu) je charakteristická delšími řetězci shodných
   znamének reziduálních hodnot ležícími střídavě nad a pod vyrovnávající regresní nadrovinou.

   Silná záporná autokorelace (1.řádu) je naopak typická téměř pravidelným střídáním znamének
   reziduálních hodnot (tj. zřetelnou oscilací dvou po sobě jdoucích reziduálních hodnot kolem
   vyrovnávající regresní nadroviny).

    Nevýhodou Durbin-Watsonova koeficientu je však skutečnost, že empiricky získanou hodnotu DW
    nelze v úplnosti statisticky testovat (rozdělení testové statistiky závisí na prvcích matice X,
    které jsou rozdílné pro každý statistický výběr). V důsledku toho obsahuje interval přípustných
    hodnot pro DW-koeficient < 0,4 > dvě "hluché oblasti", v nichž nelze rozhodnout, zda hypotéza o
    nepřítomnosti autokorelace 1. řádu bude zamítnuta ve prospěch některé z alternativ (kladná či
    záporná autokorelovanost). Tak

   
    v intervalu <  > se zamítá hypotéza neautokorelovanosti

                                   ve prospěch alternativy: existence kladné autokorelace 1. řádu

    v intervalu < [ ]> nelze test rigorózně vyhodnotit

    v intervalu <  > se nezamítá (přijímá) hypotéza neautokorelovanosti

    v intervalu <  > nelze test rigorózně vyhodnotit

    v intervalu < [ ]> se zamítá hypotéza neautokorelovanosti

                                  ve prospěch alternativy: existence záporné autokorelace 1. řádu

   
    "Mezní" hranice [ ]lze spočítat pro libovolný počet stupňů volnosti (T-k) a pro obvyklé hladiny
    významnosti (a=0,01 nebo 0,05). Příslušné hodnoty jsou tabelovány.

   
    Postupy vedoucí k eliminaci autokorelovanosti náhodných složek

   
   (B) COCHRANE-ORCUTTova procedura, kterou lze popsat tímto iterativním opakováním následujících
   tří fází

   
   (B0) Předstupněm iteračního procesu je výpočet parametrů b^(0) modelu v původní specifikaci
   obyčejnou metodou nejmenších čtverců OLS a následné stanovení vyrovnaných hodnot   závisle
   proměnné a hodnot reziduí :

   
   (B1)  Formulujeme autoregresní schéma 1. řádu pro rezidua e[t]  ve tvaru

                                                        ,

   kde  [ ]je příslušný bílý šum autoregresního procesu 1. řádu (jeho realizace jsou centrované,
   nekorelované, homoskedastické a stejně rozdělené náhodné veličiny). K zachování stacionarity
   procesu je, jak známo, nutné splnění podmínky .

   (B2)  Odhad [  ]koeficientu autokorelace 1. řádu   získáme pomocí výrazu

   
                                                       při dodefinování   .

   (B3) Takto získaný odhad   se použije v modifikovaném regresním modelu. Modifikace je
   představována úpravou jednotlivých modelových proměnných pomocí metody zobecněných diferencí :

   
   V případě např. 3 vysvětlujících proměnných, kde první "vysvětlující" proměnnou představuje
   vektor jedniček, má tento vztah podobu ( pro )

    
   Aplikací obyčejné OLS na takto modifikovaný model získáme upravený odhad  vektoru parametrů .
   Tento odhad se dosadí do původního modelu a následně se spočtou (přes vyrovnané hodnoty)
   upravená rezidua . S těmi se vstoupí do druhého kroku iterační procedury představované
   opakováním fáze (B1). Následuje opět sekvence operací (B2), (B3) atd.

   
   Poté, co v průběžném r-tém kroku získáme odhady pro

   , porovnáme je s hodnotami veličin        získanými v předchozím  kroku. Jestliže rozdíly ve
   dvou po sobě jdoucích krocích nepřekročí předepsanou odchylku (stanovenou např. ve formě
   maxima z odchylek u jednotlivých parametrů a nebo jako (v absolutní hodnotě vzatý) rozdíl
   odhadů autoregresního koeficientu  tj. , můžeme výsledky dosažené v daném iteračním kroku
   považovat za uspokojivé a příslušné odhady převzít jako konečné. 

   
                                Určitou podobnost s předchozím postupem vykazuje

   
   (C)  DURBINova dvoustupňová metoda použitelná i v případě přítomnosti autokorelace vyšších
   řádů u náhodných složek. 

   
   (C1) Model se nejprve -- obdobně jako v  kroku (B3) předchozí metody -- převede na tvar
   zobecněných diferencí

   
   resp.  po substitucích

   
       ,   atd.  a [   ]získá tvar

   
   Odtud se pomocí metody OLS získá konzistentní odhad autoregresního koeficientu 1.řádu
   [  ]příslušejícího zpožděné hodnotě  proměnné [ .

   ](C2) Tento odhad [  ]se dosadí do výchozího tvaru modelu a opětovným použitím OLS se získají
   zpřesněné odhady [ ]pro , [ ]pro ,  ,  pro [ ]atd. s uspokojivými asymptotickými (tj. pro
   velký rozsah výběru T) vlastnostmi.

   
   Nevýhodou tohoto postupu je však zřetelně zvýšený počet odhadovaných parametrů, který dosáhne
   počtu 2k-1 - ke každému původnímu  (j=2,.., k) (tedy až na ) přísluší nyní dvojice parametrů
   [  ]z nichž jeden je "původní" a druhý    vznikne násobením  hodnotou .  V případě relativně
   malého počtu pozorování T ve srovnání s počtem vysvětlujících proměnných regresní rovnice k
   není tedy tento postup příliš vhodný.

   
   Nevýhodu spojenou s  oblastmi nerozhodnutelnosti testování závisejícími na  u Durbin-Watsonova
   koeficientu odstraňuje podobně konstruovaná míra známá jako

   
   (D) von Neumannův koeficient (podíl)[1]  autokorelace reziduí 

   
                                  Tato míra je definována vztahem

                                                          
   Lze ukázat, že jsou-li náhodné složky e[t]  a tedy i rezidua e [t]  normálně rozdělena, pak
   pro dost velký počet pozorování T má statistika vN také přibližně normální rozdělení. Její
   střední hodnota a rozptyl jsou dány výrazy

   
   Kritické hodnoty vN-podílu jsou pro různá T a obvykle používané hladiny významnosti
   tabelovány. Rezidua [ ]získaná metodou OLS však nejsou nezávisle rozdělena, dokonce ani tehdy
   ne, jsou-li nezávisle rozděleny náhodné složky  . To snižuje přínos této statistiky při
   aplikaci v ekonometrických modelech.

   
   V situacích, kdy se mezi vysvětlujícími proměnnými objevují též zpožděné endogenní proměnné,
   není použití Durbin-Watsonova koeficientu vhodné. Příčinou toho, že DW-koeficient nedává při
   přítomnosti vysvětlujících zpožděných endogenních proměnných objektivní závěry, je skutečnost,
   že DW-koeficient se v tomto případě blíží ke 2 v důsledku výskytu právě těchto proměnných, ne
   jen v důsledku neautokorelovaných náhodných složek.

   
   Účinnějším indikátorem je v některých situacích

   
   (E)  Durbinova h-statistika  autokorelace reziduí definována následovně :

   
   kde  je odhad výběrového rozptylu odhadnutého regresního koeficientu u zpožděné endogenní
   proměnné .  Při nulové hypotéze o sériové nezávislosti náh. složek je statistika h
   asymptoticky normálně rozdělena ( s nulovou střední hodnotou a jedničkovým rozptylem) Lze ji
   testovat jako normální směrodatnou odchylku (alternativní hypotézou je přítomnost autokorelace
   1. řádu). Omezenost jejího použití vyplývá z podmínky kladného jmenovatele . Zde je nutno
   uplatnit alternativní testovací postupy.

   
   Poznámka: V případě, že h-statistika  není definována, doporučuje se (následně po provedení
   OLS-regrese) např. definovat regresní rovnici ve tvaru

   
   Testování hypotézy  se převede na testování statistické významnosti koeficientu  v této
   regresi.

   
   DW test není přímo použitelný v případě testování sériové korelace vyšších řádů nebo při
   nelineární formě autokorelace náhodných složek. Některé modifikace k  zmírnění problému
   v těchto situacích navrhli Nerlove, Wallis, Theil,  Nagar a Geary.

   
   (F)  Berenblut-Webbův test[2]   je založen na statistice

   
                                                    ,

   kde  jsou rezidua z regrese prvních diferencí  na první diference vysvětlujících proměnných
   (bez konstanty) tj. z regrese

       
   Jestliže původní rovnice obsahuje konstantu, můžeme užít tabulky pro D-W testovou statistiku
   pro posouzení hodnot BW-statistiky. BW-statistika je navíc uplatnitelná, i když se vyskytne
   situace, kdy .

   
   Jestliže je model homoskedastický a jsou-li náhodné složky regresní rovnice generovány
   autoregresním schématem 1. řádu, lze zapsat kovarianční matici náhodných složek   
   v následující podobě:

   
   V této matic, jak patrno, jsou na hlavní diagonále samé jedničky a na "rovnoběžkách" s touto
   hlavní diagonálou vždy příslušné mocniny , kde s je rovno rozdílu indexů příslušného prvku od
   součtu indexů diagonálního prvku (ležícího na stejném řádku, resp. sloupci).

   
   Při takovémto schématu lze uplatnit zobecněnou metodu nejmenších čtverců GLS tak, že se
   transformace původních pozorování provede tak, že se k této transformaci použije matice R ve
   tvaru

   
   Tato matice má nenulové prvky jen ve dvou řadách. jednou je hlavní diagonála, která má všechny
   prvky rovny 1 až na první prvek, jehož hodnota je  a druhou nenulovou řadou je řada ležící
   bezprostředně pod hlavní diagonálou, která je obsazena prvky s hodnotami rovnými .

   
   Příslušná transformace se pak projeví tím způsobem, že pozorování jsou upravena do této podoby

   
   tzn. že j-tý sloupec matice je obsazen (vždy až na první prvek) "zobecněnými diferencemi"[3]

   -------------------------------

   [1] von Neuman, John: Distribution uf the ratio of the Mean Square Successive Difference to
   the Variance. Annals of Mathematical Statistics 1941 s. 367-295

   [2] Berenblut, I.,I., Webb, G.,I.: A New Test for Autocorrelated Errors in the Linear
   Regression Model. Journal  of the Royal Statistical Society Vol.35/1973 s. 33-50.

   [3]  Někdy se tento postup nazývá Prais-Winstenovou transformací.