Link: OLE-Object-Data OBECNÁ METODA HLAVNÍCH KOMPONENT PC ( Principal Component Method) Metoda hlavních komponent je postup vyvinutý původně jako statistická technika v z psychometrii a sociometrii, kde se uplatňuje jako jedna z metod užitých k výpočtům parametrů modelu faktorové analýzy. Jejím hlavním konceptem je transformace proměnných ( v lineárním regresním modelu jde o vysvětlující proměnné obsažené v matici plánu ) takovým způsobem, aby v nich obsažená informace byla "rozdělena" jiným způsobem než v původních proměnných. Je tím míněna jednak vzájemná "nezávislost" těchto transformovaných proměnných, jednak "ostřejší" rozdělení informace v nich obsažené (oproti původním proměnným). V průběhu nasazení metody se konstruují tzv. hlavní komponenty, což jsou lineární kombinace vysvětlujících proměnných. Nejprve se sestrojí první hlavní komponenta jako taková lineární kombinace vysvětlujících proměnných, která vysvětluje nejvíce variability závisle proměnné. Poté se (ze "zbytku" informace obsažené v matici ) sestrojí druhá hlavní komponenta, která z tohoto zbytku vysvětlí další část variability, poté třetí hlavní komponenta, až konečně poslední k-tá hlavní komponenta. Hlavní komponenty jsou ortogonální, tzn. jsou vzájemně naprosto lineárně nezávislé. Lze je navíc znormovat tak, aby byly dokonce ortonormální, tzn. aby měly jedničkovou normu. Matematicky to lze uskutečnit tak, že jsou hlavní komponenty vzaty jako normované hlavní (charakteristické) vektory příslušné momentové matici . Obvykle se tato matice sestavuje z normovaných vektorů vysvětlujících proměnných ( nebo aspoň z matice , ze které je vynechán první sloupec, protože vektor konstant nemající žádnou variabilitu k vysvětlení rozptylu závisle proměnné přispět nijak nemůže.) Převodem na k hlavních komponent získáme v modelu "jinak rozdělenou", (a to "nerovnoměrněji") informaci obsaženou ve vysvětlujících proměnných. První hlavní komponenta bude obvykle obsahovat větší část "modelové informace", než kterýkoliv sloupec matice uvažovaný samostatně. Představu o rozdělení této informace poskytne nejlépe rozložení hlavních (charakteristických) čísel matice . Obrazně řečeno, podíl informačního obsahu 1. a 2. hlavní komponenty bude dán podílem příslušných dvou (hodnotami největších) charakteristických čísel, analogicky tomu bude u dalších hlavních komponent. Výhody nasazení metody hlavních komponent do lineárního regresního modelu jsou: a) Omezením se na relativně malý počet r hlavních komponent (cca 2-4) dosáhneme úspornějšího provedení kvantitativní analýzy regresní rovnice. Sníží se tak počet "vysvětlujících proměnných", zcela se odstraní riziko multikolinearity (nové proměnné jsou totiž vzájemně ortogonální ) b) Hlavní komponenty jsou typické vždy individuálním přínosem k vysvětlení závisle proměnné, tzn. informace v hlavních komponentách se vzájemně "nemísí". Nevýhodou nasazení metody hlavních komponent v lineárním regresním modelu je : - Interpretace obsahu čistě matematicky zkonstruovaných hlavních komponent je obvykle problematická a často nelze "obsahově pojmenovat" ani první hlavní komponentu. Toto určitě znesnadňuje analytické zkoumání v rámci přijaté modelové specifikace, ale nemusí to vadit při predikčním uplatnění této metody. Metoda hlavních komponent se v ekonometrii uplatňuje ve více oblastech, zejména a) při odstranění problému multikolinearity b) pokud potřebujeme snížit počet vysvětlujících proměnných modelu, tj. když . c) při aplikaci techniky instrumentálních proměnných, a to jak v jednorovnicovém modelu, tak v simultánní soustavě regresních rovnic. Formálně zapsáno : přičemž platí , kde je matice, jejíž sloupce tvoří vlastní (charakteristické) vektory , pro něž platí v důsledku ortonormality vlastních vektorů je diagonální matice, jejíž diagonální prvky tvoří charakteristická čísla (kořeny) matice . Obvykle se tato charakteristická čísla uspořádávají sestupně, aby největší bylo první z nich (v levém horním rohu). Jako jsme označili prvky momentové matice . Pro charakteristická čísla na diagonále D platí uspořádání Původní lineární regresní model lze takto po transformaci proměnných přepsat do tvaru , v němž je matice s po sloupcích uloženými hlavními komponentami je nový ( transformovaný ) vektor parametrů Přitom pro součin matice hlavních komponent platí : Jednotlivé hlavní komponenty jsou obsaženy ve sloupcích matice . Každý sloupec matice může být vyjádřen jako ortogonální lineární kombinace (obecně všech) sloupců matice , kde vlastní vektor určuje váhy v této lineární kombinaci, tj. , přičemž jednotlivá jsou tvořena prvky charakteristického vektoru. Může se přirozeně stát, že některá z charakteristických čísel budou nulová. Tak tomu bude tehdy, jestliže některé sloupce matice budou lineárně závislé a jak matice , tak momentová matice budou singulární. Nalezení hlavních komponent se zpravidla provede nasazením vhodné procedury v matematických softwarových prostředcích -- obvykle tato procedura nese v sobě název eig nebo eigen (vlastní čísla jsou anglicky eigenvalues a vlastní vektory eigenvectors). V MATLABu je syntax této procedury [V,D] = eig (X) , kde Vstupním polem je matice X , u níž se vlastní čísla a vektory vyčíslují V je výstupní matice vlastních vektorů (s uložením po sloupcích) D je diagonální matice vlastních čísel. Vlastní čísla na diagonále matice D poskytují informaci o tom, jak je "rozložena" variabilita proměnných obsažených v matici X. Obvykle k dostatečnému vystižení variability X postačí vzetí 2-4 hlavních komponent, které často obsahují až 98% variability obsažené v matici X.