1
Indexy pro hodnocení prostorové
autokorelace plošných jevů
* Jsou využitelné pro intervalová a poměrová data
* Vhodnější vlastnosti vzhledem k rozdělení hodnot má
index I.
* Jsou založeny na porovnávání hodnot atributů
sousedních ploch.
* Mají-li tyto sousední plochy v celé studované oblasti
podobné hodnoty, potom obě statistiky budou svědčit o
silné pozitivní prostorové autokorelaci a naopak.
* Obě statistiky využívají odlišný přístup k porovnávání
hodnot sousedních ploch.
Moranův (I) a Gearyho (C) index jako míry
prostorové autokorelace plošných jevů
Moranův (I) index


-
--
= 2
)(
))((
xxW
xxxxwn
I
i
jiij
kde xi je hodnota proměnné v ploše i
wij jsou váhy, W matice vah
Hodnota indexu kolísá od -1 pro negativní prostorovou
autokorelaci do +1 pro pozitivní prostorovou autokorelaci.
Očekávaná hodnota (případ nulové prostorové autokorelace)
)1(
1
-
-=
n
EI
Váhy - matice binární či stochastická.
Interpretace Moranova I
* Budou-li ve zpracovávané oblasti převažovat sousedé
s obdobnými hodnotami, Moranův index I bude kladný.
* Vypočteme hodnoty I a E(I) a následně musíme zjistit, zda rozdíl
mezi nimi je statisticky významný.
* Tento rozdíl je opět nutné vztáhnout k míře variability (např.
rozptylu) a pomocí ní odvodit standardizovanou hodnotu z-skóre
)(
)(
2
I
IEI
Zn

-
=
* Odhady rozptylu se budou lišit podle způsobu, jakým mohou být
hodnoty vyšetřovaného atributu přiřazeny k jednotlivým plochám viz.
předpoklad normality a předpoklad náhodnosti
* Pokud je hodnota Zn(I) menší (resp. větší) než -1,96 (resp. 1,96)
je hodnota indexu I statisticky významně negativní (resp. pozitivní)
na hladině významnosti =0,05.
Gearyho poměr C


-
--
= 2
2
)(2
)()1(
xxW
xxwn
C
i
jiij
* Jako vah se nejčastěji využívá matice binární či stochastické.
* Ve srovnání se vzorcem pro výpočet Moranova indexu Gearyho
index porovnává hodnoty atributů přímo mezi sebou.
* Pro hodnotu indexu není rozhodující, která z hodnot xi a xj je
větší či menší, ale jaký je jejich absolutní rozdíl ­ jejich
nepodobnost (ve výrazu je druhá mocnina jejich rozdílu).
* Gearyho index nabývá hodnot v intervalu 0 až 2.
* Hodnota nula indikuje dokonalou pozitivní autokorelaci (všechny
sousední hodnoty atributů jsou stejné). Naopak hodnota 2 indikuje
dokonalou negativní prostorovou autokorelaci. Hodnota 1 znamená
nulovou prostorovou autokorelaci ­ náhodné uspořádání
* Očekávaná hodnota Gearyho indexu nezávisí na počtu
posuzovaných ploch n, ale má vždy hodnotu 1.
Interpretace Gearyho poměru C
* Vypočtené hodnoty indexu C lze porovnat s hodnotou
jedna (očekávanou)
* Pro prokázání statisticky významného rozdílu je nutné
vypočítat hodnotu rozptylu a z-skóre.
* Hodnota rozptylu se opět vypočte rozdílně v závislosti na
předpokladu normality či náhodnosti.
* Z výše uvedeného plyne, že negativní hodnota z-skóre
značí pozitivní prostorovou autokorelaci a kladná hodnota
z-skóre značí negativní.
2
Příklad 1: Kartogram průměrného příjmu pro sedm států v Ohiu. Z hodnot
vypočtených indexů vyplývá, že hodnota Moranova indexu indikuje
negativní prostorovou autokorelaci (státy s vysokou hodnotou
studovaného atributu jsou blízko států s nízkými hodnotami). Tato
tendence však není statisticky významná na hladině 5 %.
Omezení globálních měr I, C
* rozsah studované oblasti
* počet objektů (ploch)
I = 0,76
Z = 9,5
Pouze řeší, zda:
Podobné blízko sebe ­ pozitivní prostorová autokorelace
Nepodobné blízko sebe ­ pozitivní prostorová autokorelace
Obecná G - statistika
* Indexy I a C mají dobře definované statistické vlastnosti,
které popisují prostorovou autokorelaci globálně
* Nejsou však efektivní k identifikaci rozdílných shluků
prostorového uspořádání uvnitř oblasti.
* Identifikují oblasti s podobnými hodnotami atributů,
nerozlišují však, zda tyto podobné hodnoty nabývají vysokých
či nízkých hodnot.
* Shluky ploch (též. místa prostorové koncentrace - spatial
concentration) vysokých hodnot vyšetřovaného atributu ve
studované oblasti se označují jako ,,hot spots", naopak místa
se shluky nízkých hodnot jako ,,cold spots".
* Odlišit oby typy shluků lze pomocí tzv. obecné G-statistiky
(general G-statistics).
Obecná G - statistika

=
ji
jiij
xx
xxdw
dG
)(
)(
* G-statistika je definována vzdáleností d mezi plochou i a
plochami sousedními.
* Váha wij(d) má hodnotu 1, jestliže se plocha j nachází ve
vzdálenosti menší či rovné d od plochy i, jinak je váha rovna 0.
* Matice vah je maticí binární a symetrickou, vztahy sousedství
jsou definovány vzdáleností d. Suma těchto vah matice se rovná:
ji pro=
i j
ij dwW )(
ji pro
Interpretace G - statistiky
* Vysoké hodnoty G(d) indikují prostorovou asociaci vysokých hodnot
(hot spots) zkoumaného atributu, nízké G(d) potom prostorovou asociaci
nízkých hodnot (cold spots).
* Před výpočtem G(d) je nutné určit vzdálenost d, která definuje plochy,
které budou považovány za sousedy plochy posuzované. Musí být vhodně
zvolena tak, aby posuzovaná plocha měla alespoň jednoho souseda.
* K interpretaci G(d) je nutné vyčíslit očekávanou hodnotu G(d), tedy E(G)
a následně standardizovanou hodnotu z-skóre a tedy i rozptyl hodnoty
G(d). Očekávaná hodnota G(d) bude:
)1(
)(
-
=
nn
W
GE
* Očekávaná hodnota odpovídá nulové prostorové asociaci. Např. je-li
vypočtená hodnota G(d) větší než očekávaná, můžeme říci, že
pozorované uspořádání vykazuje pozitivní prostorovou asociaci.
* Statistickou významnost tohoto tvrzení je opět nutné testovat
výpočtem hodnoty rozptylu a Z-skóre. Hodnota z-skóre menší než
1,96 indikuje statisticky nevýznamný výsledek na hladině =0,05.
Příklad 2: Jsou použita stejná vstupní data jako v případě I a C
indexů. Výchozí matice vzdáleností centroidů je převedena na matici
binární na základě zvolené vzdálenosti d (d=30 mil)
Výchozí matice vzdáleností centroidů
Matice sousedství vypočtená pro d=30
Vypočtená hodnota G(d) vykazuje mírnou úroveň prostorové asociace,
podle hodnoty z-skóre však výsledek není statisticky významný.
Jinými slovy ­ dané uspořádání průměrného příjmu v sedmi státech
Ohia je spíše výsledkem náhody než určitého systematického procesu.
3
Lokální statistiky prostorové autokorelace
* Výše uvedené indexy jsou příkladem indexů globálních.
* Hodnoty prostorové autokorelace se mohou v různých suboblastech
měnit. Navíc můžeme očekávat, že pozitivní
autokorelaci lze nalézt v jednom sub-regionu a negativní v jiném.
* LISA (Local Indicators of Spatial Association) - lokální verze
Moranova a Gearyho indexu.
* Ke zjištění úrovně prostorové autokorelace na lokální úrovni se
vypočte hodnota indexu pro každou plochu zpracovávaného
území. Distribution (Quartiles) of the
NSDAP 1930 Vote in Percentages
Distribution of Local Indicators of Spatial
Association for the NSDAP 1930 Vote
http://www.colorado.edu/IBS/PEC/johno/pub/nazi_long/Pnazi_long.htm
Lokální Moranův index pro jednotku i :
=
i
jijii zwzI
kde zi a zj jsou odchylky od průměru nebo

)( xx
z i
i
-
=
kde  je směrodatná odchylka xi.
* Vysoké hodnoty znamenají kumulaci podobných hodnot
atributů (vysokých či nízkých) v sousedních plochách, nízké
hodnoty potom kumulaci odlišných hodnot atributů.
* Hodnoty wij mohou představovat po řadách standardizovanou
matici vah, lze použít i jiných matic vah.
Lokální verze Gearyho poměru:
 -=
j
jiiji zzwc 2
)(
Shlukování podobných hodnot atributů vede k nízkým
hodnotám tohoto indexu a naopak.
Lokální G-statistika

=
j j
jij
i
x
xdw
dG
)(
)( ji pro
I v případě lokálních měr je nutné interpretovat hodnoty
indexů pomocí očekávaných hodnot, hodnot rozptylu a
standardizovaných skóre
Příklad 3: Pro data z příkladu 1
byly vypočteny hodnoty lokálního
Moranova indexu I (pro každý
stát. Jako matice vah byla použita
matice stochastická. Výsledky
jsou prezentovány ve formě
kartogramu.
Interpretace: Vysoké hodnoty indexu I mají ty státy, jejichž sousedé mají
velmi podobné hodnoty studované charakteristiky. Podle z-skóre žádná
z hodnot není statisticky významná a dané uspořádání průměrných příjmů
v sedmi státech lze interpretovat jako náhodný proces.
Obdobným způsobem lze vizualizovat a hodnotit výsledky analýzy založené
na lokálním indexu C a lokální G-statistice.
4
Moranovo korelační pole (Moran Scatterplot)
Lokální statistiky vystihují prostorovou heterogenitu v jednotlivých
částech studovaného území.
Lze jimi identifikovat oblasti s neobvyklými hodnotami měr
prostorové autokorelace, které lze označit jako oblasti s odlehlými
hodnotami (outliers).
Efektivním nástrojem pro takovouto diagnostiku území je
Moranovo korelační pole založené na regresním počtu.
Předpokládejme, že x značí vektor hodnot xi vyjádřený v
odchylkách od průměru )( xxi Dále
W značí po řádcích standardizovanou matici vah.
Lze sestavit regresní závislost hodnot Wx na x. Směrnice této
regresní závislosti indikuje vzájemný vztah sousedních hodnot
atributů.
Moranovo korelační pole (Moran Scatterplot)
Sestavíme regresní závislost hodnot Wx na x. Směrnice této
regresní závislosti indikuje vzájemný vztah sousedních hodnot
atributů.
IWxax +=
kde parametr a značí vektor koeficientů (intercept).
* Hodnota I je regresní koeficient reprezentující směrnici a také
hodnotou Moranova globálního indexu I.
* Vynesení regresní závislosti Wx na x umožňuje identifikovat
odlehlé hodnoty. Pokud budou mít všechna pozorování podobné
hodnoty prostorové autokorelace, v korelačním poli budou body
tvořit regresní přímku.
* Pokud některá pozorování budou ukazovat lokálně výrazně
vysoké či nízké hodnoty prostorové autokorelace ve vztahu k jejich
sousedům, tato pozorování budou v grafu tvořit body výrazně nad
či pod regresní čarou.
Příklad 4: Hodnota Moranova indexu (viz. Příklad 1) indikuje slabou
negativní prostorovou autokorelaci (státy s vysokou hodnotou
studovaného atributu jsou blízko států s nízkými hodnotami).
Parametr b představuje hodnotu Moranova indexu I. Z grafu je patrné
že příjem (x) je nepřímo úměrný vážené hodnotě příjmu (Wx).
Množinou bodů lze proložit přímku. Body, které se výrazně odchylují od
přímky představují ,,outliers" ­ představují oblasti s výrazně odlišnými
hodnotami prostorové autokorelace.
Příklad prostorového uspořádání atributu, který vykazuje silnou
pozitivní autokorelaci a příslušný Moranův diagram
Moranovo korelační pole - Interpretace
Z Moranova diagramu lze vybrat plochy vykazující stejné tendence v
hodnotách měr prostorové autokorelace ­ příklad pozitivní prostorové
autokorelace