1 Indexy pro hodnocení prostorové autokorelace plošných jevů * Jsou využitelné pro intervalová a poměrová data * Vhodnější vlastnosti vzhledem k rozdělení hodnot má index I. * Jsou založeny na porovnávání hodnot atributů sousedních ploch. * Mají-li tyto sousední plochy v celé studované oblasti podobné hodnoty, potom obě statistiky budou svědčit o silné pozitivní prostorové autokorelaci a naopak. * Obě statistiky využívají odlišný přístup k porovnávání hodnot sousedních ploch. Moranův (I) a Gearyho (C) index jako míry prostorové autokorelace plošných jevů Moranův (I) index - -- = 2 )( ))(( xxW xxxxwn I i jiij kde xi je hodnota proměnné v ploše i wij jsou váhy, W matice vah Hodnota indexu kolísá od -1 pro negativní prostorovou autokorelaci do +1 pro pozitivní prostorovou autokorelaci. Očekávaná hodnota (případ nulové prostorové autokorelace) )1( 1 - -= n EI Váhy - matice binární či stochastická. Interpretace Moranova I * Budou-li ve zpracovávané oblasti převažovat sousedé s obdobnými hodnotami, Moranův index I bude kladný. * Vypočteme hodnoty I a E(I) a následně musíme zjistit, zda rozdíl mezi nimi je statisticky významný. * Tento rozdíl je opět nutné vztáhnout k míře variability (např. rozptylu) a pomocí ní odvodit standardizovanou hodnotu z-skóre )( )( 2 I IEI Zn - = * Odhady rozptylu se budou lišit podle způsobu, jakým mohou být hodnoty vyšetřovaného atributu přiřazeny k jednotlivým plochám viz. předpoklad normality a předpoklad náhodnosti * Pokud je hodnota Zn(I) menší (resp. větší) než -1,96 (resp. 1,96) je hodnota indexu I statisticky významně negativní (resp. pozitivní) na hladině významnosti =0,05. Gearyho poměr C - -- = 2 2 )(2 )()1( xxW xxwn C i jiij * Jako vah se nejčastěji využívá matice binární či stochastické. * Ve srovnání se vzorcem pro výpočet Moranova indexu Gearyho index porovnává hodnoty atributů přímo mezi sebou. * Pro hodnotu indexu není rozhodující, která z hodnot xi a xj je větší či menší, ale jaký je jejich absolutní rozdíl ­ jejich nepodobnost (ve výrazu je druhá mocnina jejich rozdílu). * Gearyho index nabývá hodnot v intervalu 0 až 2. * Hodnota nula indikuje dokonalou pozitivní autokorelaci (všechny sousední hodnoty atributů jsou stejné). Naopak hodnota 2 indikuje dokonalou negativní prostorovou autokorelaci. Hodnota 1 znamená nulovou prostorovou autokorelaci ­ náhodné uspořádání * Očekávaná hodnota Gearyho indexu nezávisí na počtu posuzovaných ploch n, ale má vždy hodnotu 1. Interpretace Gearyho poměru C * Vypočtené hodnoty indexu C lze porovnat s hodnotou jedna (očekávanou) * Pro prokázání statisticky významného rozdílu je nutné vypočítat hodnotu rozptylu a z-skóre. * Hodnota rozptylu se opět vypočte rozdílně v závislosti na předpokladu normality či náhodnosti. * Z výše uvedeného plyne, že negativní hodnota z-skóre značí pozitivní prostorovou autokorelaci a kladná hodnota z-skóre značí negativní. 2 Příklad 1: Kartogram průměrného příjmu pro sedm států v Ohiu. Z hodnot vypočtených indexů vyplývá, že hodnota Moranova indexu indikuje negativní prostorovou autokorelaci (státy s vysokou hodnotou studovaného atributu jsou blízko států s nízkými hodnotami). Tato tendence však není statisticky významná na hladině 5 %. Omezení globálních měr I, C * rozsah studované oblasti * počet objektů (ploch) I = 0,76 Z = 9,5 Pouze řeší, zda: Podobné blízko sebe ­ pozitivní prostorová autokorelace Nepodobné blízko sebe ­ pozitivní prostorová autokorelace Obecná G - statistika * Indexy I a C mají dobře definované statistické vlastnosti, které popisují prostorovou autokorelaci globálně * Nejsou však efektivní k identifikaci rozdílných shluků prostorového uspořádání uvnitř oblasti. * Identifikují oblasti s podobnými hodnotami atributů, nerozlišují však, zda tyto podobné hodnoty nabývají vysokých či nízkých hodnot. * Shluky ploch (též. místa prostorové koncentrace - spatial concentration) vysokých hodnot vyšetřovaného atributu ve studované oblasti se označují jako ,,hot spots", naopak místa se shluky nízkých hodnot jako ,,cold spots". * Odlišit oby typy shluků lze pomocí tzv. obecné G-statistiky (general G-statistics). Obecná G - statistika = ji jiij xx xxdw dG )( )( * G-statistika je definována vzdáleností d mezi plochou i a plochami sousedními. * Váha wij(d) má hodnotu 1, jestliže se plocha j nachází ve vzdálenosti menší či rovné d od plochy i, jinak je váha rovna 0. * Matice vah je maticí binární a symetrickou, vztahy sousedství jsou definovány vzdáleností d. Suma těchto vah matice se rovná: ji pro= i j ij dwW )( ji pro Interpretace G - statistiky * Vysoké hodnoty G(d) indikují prostorovou asociaci vysokých hodnot (hot spots) zkoumaného atributu, nízké G(d) potom prostorovou asociaci nízkých hodnot (cold spots). * Před výpočtem G(d) je nutné určit vzdálenost d, která definuje plochy, které budou považovány za sousedy plochy posuzované. Musí být vhodně zvolena tak, aby posuzovaná plocha měla alespoň jednoho souseda. * K interpretaci G(d) je nutné vyčíslit očekávanou hodnotu G(d), tedy E(G) a následně standardizovanou hodnotu z-skóre a tedy i rozptyl hodnoty G(d). Očekávaná hodnota G(d) bude: )1( )( - = nn W GE * Očekávaná hodnota odpovídá nulové prostorové asociaci. Např. je-li vypočtená hodnota G(d) větší než očekávaná, můžeme říci, že pozorované uspořádání vykazuje pozitivní prostorovou asociaci. * Statistickou významnost tohoto tvrzení je opět nutné testovat výpočtem hodnoty rozptylu a Z-skóre. Hodnota z-skóre menší než 1,96 indikuje statisticky nevýznamný výsledek na hladině =0,05. Příklad 2: Jsou použita stejná vstupní data jako v případě I a C indexů. Výchozí matice vzdáleností centroidů je převedena na matici binární na základě zvolené vzdálenosti d (d=30 mil) Výchozí matice vzdáleností centroidů Matice sousedství vypočtená pro d=30 Vypočtená hodnota G(d) vykazuje mírnou úroveň prostorové asociace, podle hodnoty z-skóre však výsledek není statisticky významný. Jinými slovy ­ dané uspořádání průměrného příjmu v sedmi státech Ohia je spíše výsledkem náhody než určitého systematického procesu. 3 Lokální statistiky prostorové autokorelace * Výše uvedené indexy jsou příkladem indexů globálních. * Hodnoty prostorové autokorelace se mohou v různých suboblastech měnit. Navíc můžeme očekávat, že pozitivní autokorelaci lze nalézt v jednom sub-regionu a negativní v jiném. * LISA (Local Indicators of Spatial Association) - lokální verze Moranova a Gearyho indexu. * Ke zjištění úrovně prostorové autokorelace na lokální úrovni se vypočte hodnota indexu pro každou plochu zpracovávaného území. Distribution (Quartiles) of the NSDAP 1930 Vote in Percentages Distribution of Local Indicators of Spatial Association for the NSDAP 1930 Vote http://www.colorado.edu/IBS/PEC/johno/pub/nazi_long/Pnazi_long.htm Lokální Moranův index pro jednotku i : = i jijii zwzI kde zi a zj jsou odchylky od průměru nebo )( xx z i i - = kde je směrodatná odchylka xi. * Vysoké hodnoty znamenají kumulaci podobných hodnot atributů (vysokých či nízkých) v sousedních plochách, nízké hodnoty potom kumulaci odlišných hodnot atributů. * Hodnoty wij mohou představovat po řadách standardizovanou matici vah, lze použít i jiných matic vah. Lokální verze Gearyho poměru: -= j jiiji zzwc 2 )( Shlukování podobných hodnot atributů vede k nízkým hodnotám tohoto indexu a naopak. Lokální G-statistika = j j jij i x xdw dG )( )( ji pro I v případě lokálních měr je nutné interpretovat hodnoty indexů pomocí očekávaných hodnot, hodnot rozptylu a standardizovaných skóre Příklad 3: Pro data z příkladu 1 byly vypočteny hodnoty lokálního Moranova indexu I (pro každý stát. Jako matice vah byla použita matice stochastická. Výsledky jsou prezentovány ve formě kartogramu. Interpretace: Vysoké hodnoty indexu I mají ty státy, jejichž sousedé mají velmi podobné hodnoty studované charakteristiky. Podle z-skóre žádná z hodnot není statisticky významná a dané uspořádání průměrných příjmů v sedmi státech lze interpretovat jako náhodný proces. Obdobným způsobem lze vizualizovat a hodnotit výsledky analýzy založené na lokálním indexu C a lokální G-statistice. 4 Moranovo korelační pole (Moran Scatterplot) Lokální statistiky vystihují prostorovou heterogenitu v jednotlivých částech studovaného území. Lze jimi identifikovat oblasti s neobvyklými hodnotami měr prostorové autokorelace, které lze označit jako oblasti s odlehlými hodnotami (outliers). Efektivním nástrojem pro takovouto diagnostiku území je Moranovo korelační pole založené na regresním počtu. Předpokládejme, že x značí vektor hodnot xi vyjádřený v odchylkách od průměru )( xxi Dále W značí po řádcích standardizovanou matici vah. Lze sestavit regresní závislost hodnot Wx na x. Směrnice této regresní závislosti indikuje vzájemný vztah sousedních hodnot atributů. Moranovo korelační pole (Moran Scatterplot) Sestavíme regresní závislost hodnot Wx na x. Směrnice této regresní závislosti indikuje vzájemný vztah sousedních hodnot atributů. IWxax += kde parametr a značí vektor koeficientů (intercept). * Hodnota I je regresní koeficient reprezentující směrnici a také hodnotou Moranova globálního indexu I. * Vynesení regresní závislosti Wx na x umožňuje identifikovat odlehlé hodnoty. Pokud budou mít všechna pozorování podobné hodnoty prostorové autokorelace, v korelačním poli budou body tvořit regresní přímku. * Pokud některá pozorování budou ukazovat lokálně výrazně vysoké či nízké hodnoty prostorové autokorelace ve vztahu k jejich sousedům, tato pozorování budou v grafu tvořit body výrazně nad či pod regresní čarou. Příklad 4: Hodnota Moranova indexu (viz. Příklad 1) indikuje slabou negativní prostorovou autokorelaci (státy s vysokou hodnotou studovaného atributu jsou blízko států s nízkými hodnotami). Parametr b představuje hodnotu Moranova indexu I. Z grafu je patrné že příjem (x) je nepřímo úměrný vážené hodnotě příjmu (Wx). Množinou bodů lze proložit přímku. Body, které se výrazně odchylují od přímky představují ,,outliers" ­ představují oblasti s výrazně odlišnými hodnotami prostorové autokorelace. Příklad prostorového uspořádání atributu, který vykazuje silnou pozitivní autokorelaci a příslušný Moranův diagram Moranovo korelační pole - Interpretace Z Moranova diagramu lze vybrat plochy vykazující stejné tendence v hodnotách měr prostorové autokorelace ­ příklad pozitivní prostorové autokorelace