1
Modelování prostorového uspořádání s
využitím prostorové autokorelace
(SPATIAL AUTOCORRELATION)
Jak analýza kvadrátů tak analýza vzdálenosti nejbližšího
souseda pracují pouze s polohou bodů. Nerozlišují body
podle hodnot jejich atributů.
Oba parametry (polohu i atributy) hodnotí prostorová
autokorelace (SA) – je tedy metodou vhodnější.
Východiska prostorové autokorelace: Většina jevů se
v prostoru mění spojitě. Blízké body budou mít i podobné
hodnoty studovaného jevu a naopak.
(First law of geography - Tobler, 1970)
Koncept prostorové autokorelace
• Prostorová autokorealce udává, do jaké míry hodnoty
atributu v určitém bodě souvisí či nesouvisí s hodnotami v
bodech okolních
• Pravidelné uspořádání hodnot proměnné indikuje
vysokou prostorovou autokorelaci
• Náhodné uspořádání bodů vykazuje nízkou prostorovou
autokorelaci
Prostorová autokorelace
• Pozitivní prostorová autokorelace –
atributy sousedních či blízkých bodů mají
podobné hodnoty
• Negativní prostorová autokorelace –
atributy sousedních či blízkých bodů mají
odlišné hodnoty
Průměrný příjem
Moran’s I: 0,66
Náhodná proměnná
Moran’s I: 0,012
Moranův index I - příklad
Koeficienty prostorové autokorelace
Míry prostorové autokorelace kombinují v jednom výrazu
míry podobnosti atributů i míry podobnosti polohy.
Mezi nejpoužívanější koeficienty prostorové autokorelace
náleží:
• Gearyho poměr C (Geary’s Ratio)
• Moranův index I (Moran’s I)
Lze jich využít pro intervalová a poměrová data.
Obě statistiky lze využít jako globální či lokální míry
prostorové autokorelace
∑ ∑= =
n
i
n
j ijij wc1 1
cij – podobnost atributu v bodech i a j
wij – podobnost polohy bodů i a j. wii = 0 pro všechny body
xi – hodnota studovaného atributu v bodě i
n – počet bodů ve vyšetřovaném vzorku
Míry prostorové autokorelace
2
Koeficient prostorové autokorelace - SAC (spatial
autocorrlelation coefficient) je úměrný vážené míře
podobnosti atributů bodů – obecně:
Koeficienty prostorové autokorelace
∑∑
∑∑
= =
= =
⋅
≈ n
i
n
j
ij
n
i
n
j
ijij
w
wc
SAC
1 1
1 1
Gearyho poměr C:
V případě Gearyho poměru se podobnost hodnot atributu mezi
dvěma body vypočte podle následujícího vztahu:
2
)( jiij xxc −=
∑∑
∑∑
∑∑
∑∑
= =
= =
= =
= =
⋅
−⋅
=
⋅
⋅
= n
i
n
j
ij
n
i
n
j
jiij
n
i
n
j
ij
n
i
n
j
ijij
w
xxw
w
wc
C
1 1
2
1 1
2
1 1
2
1 1
2
)(
2 σσ
kde σ2 je rozptyl hodnot atributu x s průměrem x
)1(
)(
1
2
2
−
−
=
∑=
n
xx
n
i
i
σ
Moranův index I
)()( xxxxc jiij −⋅−=
V případě Moranova indexu se podobnost hodnot atributu v bodech
i a j vyjádří následovně:
∑∑
∑∑
∑∑
∑∑
= =
= =
= =
= =
−⋅−⋅
=
⋅
= n
i
n
j
ij
n
i
n
j
jiij
n
i
n
j
ij
n
i
n
j
ijij
ws
xxxxw
ws
wc
I
1 1
2
1 1
1 1
2
1 1
)()(
kde s2 je v tomto případě výběrový rozptyl:
n
xx
s
n
i
i∑=
−
= 1
2
2
)(
Definování míry podobnosti polohy bodů
Podobnost polohy bodů i a j, - hodnota wij. se určí jako inverzní
hodnota vzdálenosti těchto bodů.
Tedy podle výše uvedených předpokladů dáváme malou váhu
hodně vzdáleným bodům a velkou váhu bodům blízkým tedy:
ij
ij d
w 1=
Obor hodnot koeficientů prostorové autokorelace
Rozdíly mezi oběma indexy jsou dány způsobem výpočtu rozdílů mezi
hodnotami atributu. Obor hodnot, kterých mohu oba indexy nabývat se
tedy také liší, jak uvádí následující tabulka:
Prostorové uspořádání Gearyho poměr C Moranův index I
Shlukové uspořádání, sousední body
vykazují podobné hodnoty
0 < C <1 I >E(I)
Náhodné uspořádání, body nevykazují
znaky podobnosti
C ~ 1 I ~ E(I)
Pravidelné uspořádání, sousední body
vykazují rozdílné charakteristiky
1 < C < 2 I < E(I)
kde E(I) = (-1)/(n-1) je očekávaná hodnota indexu
Předpoklad náhodnosti a předpoklad normality
Při studiu prostorového uspořádání, můžeme předpokládat dva základní
způsoby, kterými jsou atributy přiřazeny jednotlivým bodům.
1. Předpoklad náhodnosti (randomization, nonfree sampling) –
předpokládáme, že hodnoty atributů v bodech představují pouze jednu
z možných variant uspořádání při použití stejné množiny hodnot.
2. Alternativně můžeme předpokládat, že hodnoty atributů v množině
studovaných bodů jsou pouze jednou z nekonečného množství
možností. Každá hodnota je nezávislá na hodnotách jiných v množině
bodů – předpoklad normality (normality, free sampling).
Příklad: Studovaná plocha obsahuje sedm bodů:
Předpoklad náhodnosti – může existovat pouze různá konfigurace 4 „černých“ a 3
„bílých“ bodů.
Předpoklad normality - může existovat různá konfigurace jakéhokoliv (0 až 7) počtu
„černých“ a „bílých“ bodů.
3
Určení odhadů očekávaných hodnot
• Výše uvedené předpoklady náhodnosti ( R ) a normality (N)
ovlivňují způsob výpočtu očekávaných (E – expected) hodnot i
hodnot rozptylu.
• Očekávané hodnoty indexů a hodnoty rozptylů potřebujeme pro
testování, zda se vypočtené hodnoty indexů C a I statisticky
významně liší od náhodného uspořádání.
[ ]
2
2
21
)1(2
4)1)(2(
)(
Wn
WnSS
CVARN
+
−−+
=
∑∑= =
=
n
i
n
j
ijwW
1 1
2
)(1 1
2
1
∑ ∑= =
+
=
n
i
n
j jiij ww
S
∑=
+=
n
i
ii wwS
1
2
..2 )(
2
1
2
1
4
)(
)(






−
−
=
∑
∑
=
=
n
i
i
n
i i
xx
xx
k
Odhad očekávaných hodnot pro náhodné uspořádání
(random pattern) a rozptyly pro Gearyho poměr C
1)( =CEN 1)( =CER
[ ] [ ] [ ]
2
222
2
22
2
2
2
1
)3)(2(
)1(3
)3)(2(4
)2(63)1(
)3)(2(
)1(33)1(
)(
Wnnn
knnW
Wnnn
knnnnSn
Wnnn
knnnSn
CVARR
−−
−−−
+
−−
+−−−+−
−
−−
−−+−−
=
kde
Odhad očekávaných hodnot Moranova indexu I a hodnot
rozptylu pro náhodné uspořádání
( ) ( )
1
1
−
−
==
n
IEIE RN
( ) [ ]2
22
2
21
2
)(
)1(
3
)( IE
nW
WnSSn
IVAR NN −
−
+−
=
( )[ ] [ ] [ ]2
2
2
21
2
2
2
21
2
)(
)3)(2)(1(
3)(
)3)(2)(1(
333
)( IE
Wnnn
WnSSnnk
Wnnn
WnSSnnn
IVAR RR −
−−−
+−−
−
−−−
+−+−
=
Máme-li vypočteny očekávané hodnoty indexů a jejich rozptyly,
můžeme vyjádřit standardizované hodnoty (Z-skóre)
)(
)(
IVAR
IEI
Z
−
=
nebo
)(
)(
CVAR
CEC
Z
−
=
Pro hodnoty Z pak mohou být použity stejné kritické hodnoty, tedy
na hladině významnosti α=0,05:
-1,96 < Z < +1,96
Určení standardizovaných hodnot
Příklad výpočtu měr prostorové autokorelace
Interpretace hodnot
koeficientů prostorové
autokorelace:
Pokud zjištěné hodnoty
z-skóre padnou vně
intervalu (-1,96 ; +1,96),
potom se prostorové
uspořádání bodů
statisticky významně liší
(na hladině 5 %) od
uspořádání náhodného.
Alternativy výpočtu
V uvedených vztazích lze modifikovat výrazy pro vyjádření podobnosti
polohy. Hodnoty wij mohou nabývat binárních hodnot 0, 1 podle toho,
zda jde o body sousední či nikoliv. Jako sousední body považujeme
centroidy regionů, které obklopují daný region.
Modifikovat lze také váhy vzdálenosti bodů výrazem:
b
ij
ij
d
w 1=
kde koeficient b může nabývat různých hodnot v závislosti na povaze
studovaného problému (vzdálenost měřená dosažitelností autem a
letadlem je jiná). Hodnota b je často rovna 2.
Uvedených koeficientů prostorové autokorelace lze využít pro výpočet
podobnosti mezi polygony.
4
Příklady použití měr prostorové autokorelace
10 Highest Crash Frequency Intersections in Honolulu
(analýza lokálních a globálních vlivů)
1. Hledání příčin určitého prostorového rozložení jevů
Příklady použití měr prostorové autokorelace
1. Hledání příčin určitého prostorového rozložení jevů
Spatial distribution 2000–2005 of average
concentrations of each pollutant across the
study area
Distribution of deprivation index in
Greater Strasbourg at the block scale.
Bard, d. et al. Exploring the joint effect of atmospheric pollution and socioeconomic status on selected health outcomes. Environ.
Res. Lett. 2 (October-December 2007) 045003, doi:10.1088/1748-9326/2/4/045003
Využití měr prostorové autokorelace pro charakterizování
struktury v krajinné ekologii
An isotropic measure of spatial autocorrelation (Geary's C) was calculated for vegetation index values
generated from high resolution imagery for seven of nine evapotranspiration monitoring sites. The two sites
shown exhibit the extremes of decay rates for autocorrelation. On average, significant correlation ends at
lengths of about 30 m.
Crime analysis (prostorová analýza kriminality)
http://www.ncjrs.gov/html/nij/mapping/index.html
http://www.icpsr.umich.edu/CRIMESTAT/
2. testování předpokladu prostorové nezávislosti
reziduálních hodnot v regresních modelech
• Byla sestavena mapa prostorové variability výšky
sněhové pokrývky
• Mapa byla sestavena interpolací z bodů (stanic).
• Byl použit regresní model závislosti výšky
sněhové pokrývky na nadmořské výšce
• Na obrázku je mapa reziduálních hodnot – tedy
model – naměřená hodnota
2. testování předpokladu prostorové
nezávislosti reziduálních hodnot v
regresních modelech
5
Prostorová regrese
DEM
2. testování předpokladu prostorové nezávislosti reziduálních hodnot
Sestavení regresní závslosti
Pole srážek vytvořené pomocí regresního modelu
R = DEM*0,286 + 421,9
Testování vhodnosti modelu
Analýza reziduálních hodnot
Rezidua jsou vzdálenosti skutečných hodnot yi od modelem odhadnutých
hodnot yj`
Zvolený regresní model považujeme za vhodný, pokud reziduální
hodnoty splňují všechny následující podmínky:
• rezidua jsou náhodná a nezávislá
• mají normální rozdělení s nulovým
průměrem a konstantním rozptylem
• rozptyl reziduí je konstantní.
Pole reziduálních hodnot
Analýza prostorové autokorelace reziduálních hodnot
Moranův Index I
6
Analýza prostorové autokorelace reziduálních hodnot
Moranův Index I
INTERPRETACE: Reziduální hodnoty jsou prostorově nezávislé,
regresní model závislosti R na DEM je vhodný
Jak interpretovat výsledek v případě
prostorové závislosti reziduálních hodnot?
I >> 0 nebo I << 0
• sampling (výběr vzorků) viz. dále
• další nezávisle proměnná
Y = X1*a + X2*b + c
Možná řešení?
Využití měr prostorové autokorelace bodů
3. SAMPLING (vzorkování) testování předpokladu prostorové
nezávislosti výběru bodů pro následnou interpolaci
• řada interpolačních algoritmů vyžaduje nezávislost vstupních hodnot
(náhodnost)
• tuto lze měřit měrami prostorové autokorelace
K – funkce (Ripley's K function)
Zjišťuje celkový počet všech bodů, které se kolem bodu vyšetřovaného
vyskytují do určité zvolené vzdálenosti
Je-li tento počet bodů větší než počet bodů, který by odpovídal náhodnému
rozdělení, potom body jeví tendenci se shlukovat.
Další míry prostorové závislosti
K - funkce
( ) ∑∑≠
=
ji
ijijdI
n
A
dK 2
A – plocha území
n – počet bodů
d – vzdálenost (zvolený poloměr)
I – váha: I = 1 pokud dij < d
I = 0 pokud dij > d
Transformace K - funkce
( )
( )1−
=
∑∑≠
nn
dIA
dL ji
ijij
π
Interpretace:
• při zcela náhodném rozdělení bude
přímka v grafu svírat s osou x úhel 45°
• Bude-li průběh přímky hodnot L
vyšetřovaných bodů nad touto přímkou –
tendence ke shlukování
• Bude-li průběh přímky hodnot L
vyšetřovaných bodů pod touto přímkou –
tendence k rovnoměrnému rozložení
bodů
7
Možnosti využití prostorové autokorelkace
• popis a identifikace struktury, uspořádání, hledání příčin
• identifikace shluků, odlehlých hodnot (viz. lokální míry)
• odhalení trendu v datech
• testování vhodnosti použitých regresních modelů
• princip vybraných metod interpolace