Link: OLE-Object-Data NEPŘÍMÁ METODA NEJMENŠÍCH ČTVERCů ILS ( Indirect Least Squares method ) v soustavě simultánních regresních rovnic Nepřímá metoda nejmenších čtverců je další z okruhu metod, které poskytují (stejně jako 2SLS nebo IV ) vždy (přinejmenším) konzistentní odhady strukturních parametrů regresních rovnic v interdependentních ekonometrických modelech. Metoda se od obou předchozích liší tím, že se k odhadu strukturních parametrů nepřistupuje přímo, ale přes parametry redukované formy modelu. V jejím algoritmu se místo transformací pozorovaných proměnných uplatňují transformace strukturních parametrů. Smyslem těchto transformací je převedení strukturních parametrů na zpravidla početnější množinu parametrů redukovaného tvaru (ty jsou jednodušeji a vždy odhadnutelné) a následně (lze-li to ovšem provést) zpětné určení strukturních parametrů pomocí parametrů redukovaného tvaru. Hlavní nesnází při tomto postupu je obecná neproveditelnost zpětného převodu (tzn. z odhadnutých parametrů redukovaného tvaru nelze vždy získat parametry tvaru strukturního) -- příčinou nesnáze je tzv. identifikační problém. Formální popis metody pro i-tou strukturní rovnici : V rovnici zapsané jako vyjádříme nejprve redukovanou formu (celého modelu) jako , kde ^ a ^ Všimněme si blíže vztahu mezi parametry strukturního a redukovaného tvaru : - počet parametrů strukturního tvaru je dán počtem prvků v maticích , kterých je dohromady (neuvažujeme-li jiná omezení než normovací pravidlo v matici B) . Zpravidla však je počet (nenulových parametrů) strukturního tvaru (tzn. s respektováním omezení kladených na některé z nich) výrazně menší, neboť v obou maticích je přítomno mnoho nulových prvků v důsledku nepřítomnosti mnoha modelových proměnných v jednotlivých rovnicích (nerovnosti platí u rozsáhlejších modelů u většiny rovnic). Vkládaná omezení jsou nutná i jako "prevence" proti výskytu problémů spojených s identifikací rovnic. - počet parametrů redukovaného tvaru je dán rozměry (obecné) matice P, tedy . Na rozdíl od strukturního tvaru je počet parametrů omezeného redukovaného tvaru (kdy bereme v úvahu omezení kladená na strukturní parametry) zpravidla jen o málo menší než . Parametry redukovaného tvaru obsažené v matici P jsou vždy odhadnutelné (obyčejnou metodou nejmenších čtverců OLS). Odhadnutá matice P je zřejmě (1) Důležitější otázkou je, zda a za jakých podmínek lze zpětně z odhadu P odvodit původní parametry (obsažené v maticích ), tzn. parametry námi uvažované i-té rovnice . Pro detailní analýzu uvažujme např. vztahy mezi parametry 1.regresní rovnice (uvažování 1.rovnice není újmou na obecnosti,pouze přispěje k přehlednému zápisu) Zapišme nyní ze vztahu jen ty prvky, které se bezprostředně vztahují ke strukturním parametrům první rovnice. Dostaneme : (2) ( U vektorů a matic jsou uvedeny pro větší názornost dimenze. ) K získání explicitnějších vztahů mezi uvažovanými parametry je třeba navíc rozdělit matici parametrů redukovaného tvaru P tak, aby bylo patrné, které její submatice se vztahují k veličinám vystupujícím v 1. regresní rovnici [1]: pro subvektory jsme použili značení p[[.,.]], pro submatice P[[.,.]] . Vztahy, které se přímo vztahují k parametrům první regresní rovnice, lze zapsat takto : (3A) (3B) První "řádek" (3A) představuje soustavu rovnic o neznámých , druhý "řádek" (3B) vyjadřuje soustavu rovnic o neznámých [2]. Celá soustava q rovnic je jednoznačně řešitelná právě tehdy, jestliže existuje jednoznačné řešení části (3B) pro strukturní parametry [ ]. (Část (3A) má charakter rekursívní podsoustavy, která je vždy řešitelná). Existence řešení podsoustavy (3B) -- které nemusí být nutně jediné - je klíčově závislé na tom, v jakém poměru jsou rozměry matice P [[q-q1,m1]] (nejsou-li jinak řádky nebo sloupce této matice lineárně závislé). V úvahu přicházejí tři možnosti: možnost (A) Bude-li platit [ ], bude mít podsoustava (3B) sice nekonečně mnoho algebraických řešení, ale nebude možno vyvodit žádné řešení statistického problému odhadu parametrů b[.1] (a následně ani g[.1] ), protože nebude možné vyjádřit zbývající odhadované parametry jen pomocí známých veličin (prvků P[[ q-q1,m1]] , p [[q-q1,1]]). Zůstane totiž neurčených "přebytečných" m[1] parametrů d [q1+1] ....... d [q1+m1] . Odhady parametrů (první) strukturní rovnice není možné tedy statistickým způsobem nijak získat. Jde o případ podidentifikovanosti (první) regresní rovnice. . možnost (B) Bude-li platit je vidět, že soustava (3B) bude mít právě jediné řešení za předpokladu, že submatice odhadů koeficientů redukovaného tvaru P[[ q-q1,m1]] je regulární, což nastane tehdy, bude-li navíc splněna hodnostní podmínka (4) Pokud hodnostní podmínka splněna nabude, nastane obdobný problém jako v situaci (A). Pokud tedy současně s (B) nastane (4), lze odhady parametrů získat jednoznačně jako (5) Tato situace odpovídá případu přesné identifikovanosti (první) regresní rovnice. možnost (C) Bude-li platit [ ]Submatice P[[q-q1,m1]] je nyní singulární. K tomu, aby existovalo nějaké řešení statistického problému odhadu, je nutné, aby zůstala v platnosti podmínka (3). Jinak by nastal stejný problém jako v situaci (B) : při hodnosti m[1]-1 by existovala regulární submatice P[[ q-q1,m1] ] řádu i hodnosti m[1]-1, z které bychom mohli odvodit nanejvýš m[1]-1 parametrů (avšak v závislosti na 1 neurčitelném (přebytečném) parametru. Statisticky bychom tedy (všechny) parametry odvodit nemohli. Pokud zůstane v platnosti podmínka (C), je však patrné, že odhadované strukturní parametry b[.1] nebudou vyhovovat všem rovnicím soustavy (3B) -- rovnic je jen q-q[1] . Zatímco v algebraickém smyslu nebude soustava řešitelná (počet neznámých parametrů b[.1] je menší než počet rovnic) , lze se při řešení statistického problému omezit pouze na (libovolných) m[1] těchto rovnic (jsou-li lineárně nezávislé). Dostaneme tak až různých statistických řešení, tedy různých odhadů, které se uplatní ve druhém kroku -řešení podsoustavy (3A). Tento poslední případ odpovídá přeidentifikovanosti (první) regresní rovnice, kdy lze odhady strukturních parametrů nalézt, ale ty nejsou určeny jednoznačně. Formální odvození ILS-odhadové funkce Abychom získali tvar ILS-odhadové funkce, musíme vyjít z (úplné) odhadnuté matice parametrů redukovaného tvaru Podotkněme, že pouze prvních m[1]+1 sloupců matice vyjadřuje vztahy mezi parametry první strukturní rovnice. Je to nejlépe vidět z rozpisu (odhadnutých) prvků této matice, které získáme jako[3] (6) neboli - sloučíme-li v zápisu (6) horních a dolníchřádků jedním vyjádřením[4] - . Soustavy (3A), (3B) lze zapsat (při takovém vyjádření, kde parametry redukovaného tvaru, resp. jejich odhady považujeme za známé) ve tvaru (7) Přitom matici levé strany (7) lze zapsat (v pozorovaných v proměnných) jako Všimněme si zde, že skutečně platí , pokud je predeterminovaných proměnných tvořících (po sloupcích) matici posazeno právě v prvníchsloupcích matice . Vektor na pravé straně (7) lze podobně zapsat (v pozorovaných proměnných) jako Pokud obě strany (7) zapíšeme s vyjádřením vektoru parametrů , dostaneme (8) S ohledem na to, že momentová matice je regulární, lze vztah (8) zjednodušit na (9) Odtud je zřejmé, že odhad parametrů nepřímou metodou nejmenších čtverců bude založen na řešení rovnice tvaru (10) čili , kde ( zapsáno v dimenzích: ) Je ale také zřejmé, že s ohledem na výše řečené není zajištěno, že matice bude čtvercová, regulární a že tedy bude existovat matice k ní inverzní. Pokud tomu tak bude (k čemuž je nutné, aby platilo ), pak lze odhad psát jako (11) [ ], Pokud bude platit , pak bude vyjádření odhadnutých parametry neurčitější: (12) [ ], kde symbol "-" znamená označení pseudoinverzní matice. Jak známo, pseudoinverzní matice není určena jednoznačně a tedy také odhad parametrů nebude jednoznačný. Vlastnosti ILS-odhadové funkce Lze ukázat, že ILS-estimátor strukturních parametrů modelu má tyto vlastnosti (v obecném zápise pro i-tou rovnici soustavy) 1) Odhady parametrů [ ] jsou konzistentní, neboť platí [ ]2) Odhady parametrů nejsou nestranné, protože [ ] vzhledem k možné korelovanosti proměnných v [ ]a ( přes e[. i ] ) 3) Odhady parametrů nejsou vydatné ( a to ani v rámci metod s omezenou informací). 4) Odhady parametrů jsou (za stejných předpokladů (e), (f), (g), (h) jako u 2SLS) asymptoticky normální , tedy platí T (r) YEN Konzistentní odhad kovariancí pro jednotlivé rovnice získáme standardně: [ ] , kde za rezidua vezmeme odhady náhodných složek [ ]získané metodou ILS. Ukážeme dále , že Odhadová funkce ILS je speciálním případem IV-odhadové funkce pro volbu matice instrumentálních proměnných ( neboli jinak ) ověření: (v zápise pro první strukturní rovnici) Již víme, že soustavy (3A), (3B) lze zapsat jako: (7) Při vyjádření levé strany (7) jako a pravé strany (7) pomocí výrazu je ILS- odhadová funkce dána vztahy (11) [ ,] pokud je první rovnice přesně identifikovaná, resp. (12) [ ], pokud je první rovnice přeidentifikovaná. IV- odhadová funkce (téže rovnice) je naproti tomu určena jako (13) , kde Odtud je patrné, že volbou (rovnocenně definováním matice instrumentů ) dostaneme čili výraz (11), pokud případně čili výraz (12), pokud . V těchto případech tedy můžeme psát Znamená to tedy, že: 1) ILS-odhadová funkce je speciálním případem IV-odhadové funkce při volbě matice instrumentů jako . 2) ILS-odhadová funkce není na rozdíl od jiných estimátorů určena jednoznačně a její existence resp. počet získaných řešení závisí na řešitelnosti soustavy (3B). Vztah mezi nepřímou metodou nejmenších čtverců (jako užší třídou) a metodou instrumentálních proměnných (jako obecnější třídou) lze charakterizovat asi tak, že v ILS se omezujeme jen na instrumentální proměnné představované prostým výběrem z predeterminovaných proměnných. Výběr těchto proměnných musí být dostatečný (počtem aspoň ), přičemž pokud je příslušná rovnice přeidentifikovaná, musíme se rozhodnout pro vzetí určitých predeterminovaných proměnných ze všech disponibilních. ------------------------------- [1] Jak je patrné, dvě submatice, jmenovitě , se nijak nepodílejí na vztazích mezi parametry 1.strukturní rovnice. (Mají však přirozeně vliv na vztahy mezi strukturními parametry ostatních rovnic). [2] v předchozím i v dalším textu znamená vždy : q[1] .... počet vysvětlujících predeterminovaných proměnných i-té rovnice ( včetně vektoru "1" ) m[1] .... počet vysvětlujících běž. endogenních proměnných i-té rovnice ( pokud je v jiné literatuře uváděn pod m[1 ] počet všech běžných endogenních proměnných i-té rovnice, je nutno podmínky identifikace formulovat jako q + 1 = m[1] + q[1] ) . [3] Veličiny X^(1),Y^(1) vyjadřují pozorování těch proměnných, které nejsou obsaženy v první regresní rovnici ( u X^(1) jde o predeterminované proměnné nepřítomné v X[1] , u Y^(1) jde o běžné endogenní proměnné nepřítomné v Y[1] ). [4] Uváděné dimenze se zde vztahuji vždy k součinům matic v závorce.