1
Modelování prostorového uspořádání bodů s
využitím prostorové autokorelace
(SPATIAL AUTOCORRELATION)
Jak analýza kvadrátů tak analýza vzdálenosti nejbližšího
souseda pracují pouze s polohou bodů. Nerozlišují body
podle hodnot jejich atributů.
Oba parametry (polohu i atributy) hodnotí prostorová
autokorelace (SA) ­ je tedy metodou vhodnější.
Východiska prostorové autokorelace: Většina jevů se
v prostoru mění spojitě. Blízké body budou mít i podobné
hodnoty studovaného jevu a naopak.
(First law of geography - Tobler, 1970)
Koncept prostorové autokorelace
* Prostorová autokorealce udává, do jaké míry hodnoty
atributu v určitém bodě souvisí či nesouvisí s hodnotami v
bodech okolních
* Pravidelné uspořádání hodnot proměnné indikuje
vysokou prostorovou autokorelaci
* Náhodné uspořádání bodů vykazuje nízkou prostorovou
autokorelaci
Prostorová autokorelace
* Pozitivní prostorová autokorelace atributy
sousedních či blízkých bodů mají
podobné hodnoty
* Negativní prostorová autokorelace atributy
sousedních či blízkých bodů mají
odlišné hodnoty
Průměrný příjem
Moran's I: 0,66
Náhodná proměnná
Moran's I: 0,012
Moranův index I - příklad
Koeficienty prostorové autokorelace
Míry prostorové autokorelace kombinují v jednom výrazu
míry podobnosti atributů i míry podobnosti polohy.
Mezi nejpoužívanější koeficienty prostorové autokorelace
náleží:
* Gearyho poměr C (Geary's Ratio)
* Moranův index I (Moran's I)
Lze jich využít pro intervalová a poměrová data.
 = =
n
i
n
j ijijwc1 1
cij ­ podobnost atributu v bodě i a j
wij ­ vzdálenost bodu i a j. wii = 0 pro všechny body
xi ­ hodnota studovaného atributu v bodě i
n ­ počet bodů ve vyšetřovaném vzorku
Míry prostorové autokorelace
2
Koeficient prostorové autokorelace - SAC (spatial
autocorrlelation coefficient) je úměrný vážené míře
podobnosti atributů bodů ­ obecně:
Koeficienty prostorové autokorelace


= =
= =

 n
i
n
j
ij
n
i
n
j
ijij
w
wc
SAC
1 1
1 1
Gearyho poměr C:
V případě Gearyho poměru se podobnost hodnot atributu mezi
dvěma body vypočte podle následujícího vztahu:
2
)( jiij xxc -=




= =
= =
= =
= =

-
=


= n
i
n
j
ij
n
i
n
j
jiij
n
i
n
j
ij
n
i
n
j
ijij
w
xxw
w
wc
C
1 1
2
1 1
2
1 1
2
1 1
2
)(
2 
kde 2 je rozptyl hodnot atributu x s průměrem x
)1(
)(
1
2
2
-
-
=
=
n
xx
n
i
i

Moranův index I
)()( xxxxc jiij --=
V případě Moranova indexu se podobnost hodnot atributu v bodech
i a j vyjádří následovně:




= =
= =
= =
= =
--
=

= n
i
n
j
ij
n
i
n
j
jiij
n
i
n
j
ij
n
i
n
j
ijij
ws
xxxxw
ws
wc
I
1 1
2
1 1
1 1
2
1 1
)()(
kde s2 je v tomto případě výběrový rozptyl:
n
xx
s
n
i
i=
=
1
2
2
)(
Definování míry podobnosti polohy bodů
Podobnost polohy bodů i a j, - hodnota wij. se určí jako inverzní
hodnota vzdálenosti těchto bodů.
Tedy podle výše uvedených předpokladů dáváme malou váhu
hodně vzdáleným bodům a velkou váhu bodům blízkým tedy:
ij
ij d
w 1=
Obor hodnot koeficientů prostorové autokorelace
Rozdíly mezi oběma indexy jsou dány způsobem výpočtu rozdílů mezi
hodnotami atributu. Obor hodnot, kterých mohu oba indexy nabývat se
tedy také liší, jak uvádí následující tabulka:
Prostorové uspořádání Gearyho poměr C Moranův index I
Shlukové uspořádání, sousední body
vykazují podobné hodnoty
0 < C <1 I >E(I)
Náhodné uspořádání, body nevykazují
znaky podobnosti
C ~ 1 I ~ E(I)
Pravidelné uspořádání, sousední body
vykazují rozdílné charakteristiky
1 < C < 2 I < E(I)
kde E(I) = (-1)/(n-1) je očekávaná hodnota indexu
Předpoklad náhodnosti a předpoklad normality
Při studiu prostorového uspořádání, můžeme předpokládat dva základní
způsoby, kterými jsou atributy přiřazeny jednotlivým bodům.
1. Předpoklad náhodnosti (randomization, nonfree sampling) předpokládáme,
že hodnoty atributů v bodech představují pouze jednu
z možných variant uspořádání při použití stejné množiny hodnot.
2. Alternativně můžeme předpokládat, že hodnoty atributů v množině
studovaných bodů jsou pouze jednou z nekonečného množství
možností. Každá hodnota je nezávislá na hodnotách jiných v množině
bodů ­ předpoklad normality (normality, free sampling).
Příklad: Studovaná plocha obsahuje sedm bodů:
Předpoklad náhodnosti ­ může existovat pouze různá konfigurace 4 ,,černých" a 3
,,bílých" bodů.
Předpoklad normality - může existovat různá konfigurace jakéhokoliv (0 až 7) počtu
,,černých" a ,,bílých" bodů.
3
Určení odhadů očekávaných hodnot
* Výše uvedené předpoklady náhodnosti ( R ) a normality (N)
ovlivňují způsob výpočtu očekávaných (E ­ expected) hodnot i
hodnot rozptylu.
* Očekávané hodnoty indexů a hodnoty rozptylů potřebujeme pro
testování, zda se vypočtené hodnoty indexů C a I statisticky
významně liší od náhodného uspořádání.
[ ]
2
2
21
)1(2
4)1)(2(
)(
Wn
WnSS
CVARN
+
--+
=
= =
=
n
i
n
j
ijwW
1 1
2
)(1 1
2
1
 = =
+
=
n
i
n
j jiij ww
S
=
+=
n
i
ii wwS
1
2
..2 )(
2
1
2
1
4
)(
)(






-
-
=


=
=
n
i
i
n
i i
xx
xx
k
Odhad očekávaných hodnot pro náhodné uspořádání
(random pattern) a rozptyly pro Gearyho poměr C
1)( =CEN 1)( =CER
[ ] [ ] [ ]
2
222
2
22
2
2
2
1
)3)(2(
)1(3
)3)(2(4
)2(63)1(
)3)(2(
)1(33)1(
)(
Wnnn
knnW
Wnnn
knnnnSn
Wnnn
knnnSn
CVARR
--
---
+
--
+---+-
-
--
--+--
=
kde
Odhad očekávaných hodnot Moranova indexu I a hodnot
rozptylu pro náhodné uspořádání
( ) ( )
1
1
-
-
==
n
IEIE RN
( ) [ ]2
22
2
21
2
)(
)1(
3
)( IE
nW
WnSSn
IVAR NN -
-
+-
=
( )[ ] [ ] [ ]2
2
2
21
2
2
2
21
2
)(
)3)(2)(1(
3)(
)3)(2)(1(
333
)( IE
Wnnn
WnSSnnk
Wnnn
WnSSnnn
IVAR RR -
---
+--
-
---
+-+-
=
Máme-li vypočteny očekávané hodnoty indexů a jejich rozptyly,
můžeme vyjádřit standardizované hodnoty (Z-skore)
)(
)(
IVAR
IEI
Z
-
=
nebo
)(
)(
CVAR
CEC
Z
-
=
Pro hodnoty Z pak mohou být použity stejné kritické hodnoty, tedy
na hladině významnosti =0,05:
-1,96 < Z < +1,96
Určení standardizovaných hodnot
Příklad výpočtu měr prostorové autokorelace
Interpretace hodnot
koeficientů prostorové
autokorelace:
Pokud zjištěné hodnoty
z-skóre padnou vně
intervalu (-1,96 ; +1,96),
potom se prostorové
uspořádání bodů
statisticky významně liší
(na hladině 5 %) od
uspořádání náhodného.
Alternativy výpočtu
V uvedených vztazích lze modifikovat výrazy pro vyjádření podobnosti
polohy. Hodnoty wij mohou nabývat binárních hodnot 0, 1 podle toho,
zda jde o body sousední či nikoliv. Jako sousední body považujeme
centroidy regionů, které obklopují daný region.
Modifikovat lze také váhy vzdálenosti bodů výrazem:
b
ij
ij
d
w 1=
kde koeficient b může nabývat různých hodnot v závislosti na povaze
studovaného problému (vzdálenost měřená dosažitelností autem a
letadlem je jiná). Hodnota b je často rovna 2.
Uvedených koeficientů prostorové autokorelace lze využít pro výpočet
podobnosti mezi polygony.
4
Příklady použití měr prostorové autokorelace
10 Highest Crash Frequency Intersections in Honolulu
(analýza lokálních a globálních vlivů)
1. Hledání příčin určitého prostorového rozložení jevů
Crime analysis (prostorová analýza kriminality)
http://www.ncjrs.gov/html/nij/mapping/index.html
http://www.icpsr.umich.edu/CRIMESTAT/
Využití měr prostorové autokorelace pro charakterizování
struktury v krajinné ekologii
2. testování předpokladu prostorové
nezávislosti reziduálních hodnot v
regresních modelech
2. testování předpokladu prostorové
nezávislosti reziduálních hodnot v
regresních modelech
Prostorová regrese
DEM
2. testování předpokladu prostorové nezávislosti reziduálních hodnot
5
Sestavení regresní závslosti Pole srážek vytvořené pomocí regresního modelu
R = DEM*0,286 + 421,9
Testování vhodnosti modelu
Analýza reziduálních hodnot
Rezidua jsou vzdálenosti skutečných hodnot yi od modelem odhadnutých
hodnot yj`
Zvolený regresní model považujeme za vhodný, pokud reziduální
hodnoty splňují všechny následující podmínky:
* rezidua jsou náhodná a nezávislá
* mají normální rozdělení s nulovým
průměrem a konstantním rozptylem
* rozptyl reziduí je konstantní.
Pole reziduálních hodnot
Analýza prostorové autokorelace reziduálních hodnot
Moranův Index I
Analýza prostorové autokorelace reziduálních hodnot
Moranův Index I
INTERPRETACE: Reziduání hodnoty jsou prostorově nezávislé,
regresní model závislosti R na DEM je vhodný
6
Jak interpretovat výsledek v případě
prostorové závislosti reziduálních hodnot?
I >> 0 nebo I << 0
* sampling (výběr vzorků) viz. dále
* další nezávisle proměnná
Y = X1*a + X2*b + c
Možná řešení?
Využití měr prostorové autokorelace bodů
3. SAMPLING (vzorkování) testování předpokladu prostorové
nezávislosti výběru bodů pro následnou interpolaci
* řada interpolačních algoritmů vyžaduje nezávislost vstupních hodnot
(náhodnost)
* tuto lze měřit měrami prostorové autokorelace
K ­ funkce (Ripley's K function)
Zjišťuje celkový počet všech bodů, které se kolem bodu vyšetřovaného
vyskytují do určité zvolené vzdálenosti
Je-li tento počet bodů větší než počet bodů, který by odpovídal náhodnému
rozdělení, potom body jeví tendenci se shlukovat.
Další míry prostorové závislosti K - funkce
( ) 
=
ji
ijijdI
n
A
dK 2
A ­ plocha území
n ­ počet bodů
d ­ vzdálenost (zvolený poloměr)
I ­ váha: I = 1 pokud dij < d
I = 0 pokud dij > d
Transformace K - funkce
( )
( )1-
=

nn
dIA
dL ji
ijij

Interpretace:
* při zcela náhodném rozdělení bude
přímka v grafu svírat s osou x úhel 45°
* Bude-li průběh přímky hodnot L
vyšetřovaných bodů nad touto přímkou tendence
ke shlukování
* Bude-li průběh přímky hodnot L
vyšetřovaných bodů pod touto přímkou tendence
k rovnoměrnému rozložení bodů
Možnosti využití prostorové autokorelkace
* popis a identifikace struktury, uspořádání, hledání příčin
* identifikace shluků, odlehlých hodnot (viz. lokální míry)
* odhalení trendu v datech
* testování vhodnosti použitých regresních modelů
* princip vybraných metod interpolace