24
Prostorové uspořádání ploch
Využití prostorové statistiky k popisu měr úrovně a variability geografických jevů spojených
s plochami (polygony) má v řadě geografických disciplín dlouhou tradici (demografie, krajinná
ekologie apod.). Studium prostorových vztahů může být zaměřeno na následující typy úloh:
1) porovnání prostorového uspořádání studovaného jevu s uspořádáním teoretickým
(shlukovým, pravidelným či náhodným)
2) typologie prostorového uspořádání jevů (bez územní souvislosti)
3) regionalizace - seskupování jednotek (polygonů) do vyšších územně souvisejících celků
4) interpolace a vyhlazování areálových dat
Míry prostorového uspořádání ploch
Prostorová autokorelace­ hodnoty atributů ploch spolu korelují v závislosti na jejich vzájemné
poloze. To je v důsledku podobných přirozených (přírodních) podmínek (např. produkce
zemědělských podniků) či v důsledku přirozené spojitosti jevů.
U prostorově autokorelovaných dat nejsou hodnoty atributů v prostoru náhodné, ale prostorově
závislé. Tato vazba (autokorelace) může být pozitivní (shlukové uspořádání - sousední objekty mají
podobné hodnoty) či negativní (u pravidelného uspořádání). V případě náhodného uspořádání ­ slabá
či žádná prostorová autokorelace. Také v případě prostorové autokorelace lze měřit její sílu.
Obr. 4.1 Příklad pozitivní prostorové autokorelace (shlukové uspořádání - vlevo) a negativní
prostorové autokorelace (disperzní uspořádání ­ vpravo)
Prostorová autokorelace je významným ukazatelem k hodnocení dynamiky a časových změn
v prostorovém uspořádání objektů a pro predikce.
Další význam prostorové autokorelace spočívá ve skutečnosti, že řada statistických ukazatelů (např.
regresní modely) požaduje splnění předpokladu náhodnosti výběru objektů a jejich vzájemné
nezávislosti. Míry prostorové autokorelace tak mohou potvrdit či vyvrátit splnění uvedených
předpokladů.
Matice prostorových vah (Spatial weights matrices)
Prostorová autokorelace měří stupeň podobnosti atributů mezi danou plochou a plochami sousedními.
Nejprve proto musí být vztahy sousedství jistým způsobem kvantifikovány.
Máme plochu s n prostorovými jednotkami. Potom můžeme definovat n x n párů sousedství ­ maticí
typu n x n. Každá prostorová jednotka je prezentována jedním řádkem a sloupcem. Každá hodnota
v matici prezentuje prostorový vztah mezi jednotkami prezentovanými daným řádkem a sloupcem
v matici. Buňky matice mohu nabývat různých hodnot v závislosti na způsobu definování sousedství
(např. binární matice s 0 a 1 podle toho, zda jednotky spolu přímo sousedí či nikoliv, nebo ­ buňky
nesou vzdálenost mezi centroidy obou jednotek. Protože hodnoty v buňkách představují váhy při
výpočtu prostorové autokorelace, potom se sestavené matice označují jako matice prostorových vah).
25
Způsoby definování sousedství
Označují se podle pohybu šachových figur (Rook's case ­ věž, Queen's case ­ Dáma) ­ viz. obr. 4.2
Bezprostřední sousedé (se společnou hranicí, i jedním bodem v případě Queens case) jsou sousedé
prvního řádu. Analogicky lze definovat sousedy vyšších řádů.
Obr.4.2 Způsoby definování sousedství
Vedle sousedství je další běžně užívanou mírou prostorové relace objektů jejich vzdálenost. Intenzita
vztahu dvou vzdálených jednotek bude obecně menší než intenzita vztahu jednotek blízkých. Tato
vzdálenost může být arbitrárně určena (na základě zkušenosti či povahy studovaného problému: např.
k danému domu jsou sousedé definováni jako domy do vzdálenosti 1 km, výsledek potom ze vyjádřit
v binární podobě).
Binární matice konektivity (BCM ­ binary connectivity matrix)
Analogicky jako v případě linií ­ binární, čtvercová symetrická matice C s prvky cij, 1 ­ sousedí, 0 -
ne)
Binární matice sousedství
Vlastnosti BCM:
* Prvky na hlavní diagonále mají hodnoty 0
* Matice je symetrická ­ redundance uložené informace
* Suma v řádku nese informaci o počtu sousedů dané jednotky
* Pro větší počet prostorových jednotek obsahuje velké množství nul a je tedy paměťově
náročná
Vhodnější způsob zaznamenání vztahů sousedství je uchovávání ID či názvu sousedů pro každou
plochu, tedy např.:
Polygon Soused1 Soused2 ...
Brno-město Brno-venkov Blansko
Blansko Brno-venkov Vyškov Brno-město
...... ..... ....
Stochastická matice či matice se standardizovanými řádkovými vahami (RSWM)
Zaznamenání sousedství v binární podobě není v řadě případů výhodné ­ váhy jsou stejné bez ohledu
na počet sousedů. Vhodnějším způsobem je nahrazení jedniček vahou wij , vypočtenou jako poměr
mezi hodnotu cij a sumou v řádku ­ tj. počtem sousedů. Tedy má-li jednotka 4 sousedy, bude její váha
rovna 0,25 ­ tak dostaneme z matice C matici W, označovanou jako matici se standardizovanými
řádkovými vahami. Stejně jako matice C má i W na hlavní diagonále nuly, není vak již symetrická.
26
Matice se standardizovanými řádkovými vahami
Vzdálenosti centroidů
Vztahy prostorové závislosti lze charakterizovat také vzdáleností jednotek (viz. první zákon geografie
­ Tobler, 1970: Všechny objekty spolu souvisí, ale blízké objekty spolu souvisejí více). Tedy
vzdálenost je vhodnou váhou pro definování prostorových vztahů.
Existuje několik způsobů definování vzdálenosti dvou polygonů, např. vzdálenost centroidů. Existuje
několik způsobů určení centroidu pro daný polygon. V závislosti na tvaru polygonu nemusí jeho
centroid ležet uvnitř něho.
Jsou-li jako váhy použity vzdálenosti (zde vzdálenosti centroidů), matice se označuje D s prvky dij .
Váhy jsou potom definovány jako převrácená hodnota vzdálenosti:
ij
ij
d
w
1
=
V řadě případů síla vztahu mezi dvěma jednotkami klesá rychleji než se zvětšuje jejich vzdálenost,
proto se váhy definují jako.
2
1
ij
ij
d
w =
Nejbližší vzdálenosti
Na místo vzdáleností centroidů jsou použity vzdálenosti dvou nejbližších částí dvou polygonů. Takto
definované váhy jsou výhodné pro charakterizování prostorových kontaktů či difuze. U takto
sestavené matice buňky s nulami mimo hlavní diagonálu (sousedé) odpovídají buňkám s jedničkami
v binární matici sousedství.
Matice vzdáleností mezi nejbližšími částmi polygonů
Míry prostorové autokorelace
Výše uvedené matice slouží k definování měr prostorové autokorelace (SA). Míry SA mohou být
vztaženy k poli bodů (viz. výše) či ploch. V případě ploch lze zpracovávat data nominální (JCS joint
count statistics ­ Statistika charakteru sousedství), intervalová i poměrová (Moranův index I,
Gearyho poměr C, G-statistika)
Uvedené míry lze označit jako globální míry prostorové autokorelace (asociace). Tedy jedna hodnota
je vypočtena pro celou studovanou oblast. Avšak také prostorová autokorelace se může měnit v rámci
studované oblasti ­ k deskripci prostorové heterogenity prostorové autokorelace lze využít lokálních
měr ­ Local Indicator of Saptial Association (LISA) a lokálmí verze G-statistiky (local G-statistics).
Ke grafickým prostředkům hodnotícím prostorovou autolorelaci patří Moranův scatterplot diagram.
27
Základní notace používaná v následujícím popisu indexů prostorové autokorelace
wij ­ obecně buňka matice vah W pro řádek i a sloupec j. (nejen matice stochastické ­ viz. výše)
Sumace vah daného řádku i přes všechny sloupce (řádková suma):
=
j
iji ww.
Sumace vah daného sloupce j přes všechny řádky (sloupcová suma):
=
i
ijj ww.
Sumace všech buněk matice vah:
=
i j
ijwW
Pro testování významnosti indexů prostorové autokorelace lze váhy v jednotlivých výrazech
sumarizovat do následujících výrazů:
 +=
i j
jiij wwSUM 2
1 )(
2
1
a
2
2    


+=
i j j
jiij wwSUM
SUM1 ­ suma přes váhy. Jsou-li váhy binární a matice symetrická, potom 4)( 2
=+ jiij ww
SUM1 je tedy čtyřnásobek celkového počtu spojů (společných hranic) v celé studované ploše.
Hodnota SUM2 je založena na sumování vah každé plošné jednotky v obou směrech (wij i wji).
Výsledná hodnota je potom získána jejich součtem, umocněním a sumací pro všechny jednotky
studované oblasti.
Nechť n je počet plošných jednotek ve studované oblasti. Existují-li dvě skupiny jednotek
definovaných atributy s hodnotami x a y, potom výrazy nx a ny značí počet jednotek v jednotlivých
skupinách.
Podobně:
)1(...)3()2()1()(
+----= xnnnnnn x
kde n > x
Například, bude-li n=5, potom 345)2)(1()3(
××=--= nnnn a nn =)1(
Jestliže xi je hodnota atributu pro plochu i, můžeme definovat nový parametr mj, založený na
hodnotách xi:
=
=
1i
j
ij xm
kde j = 1,2,3,4. Potom, jestliže j=1, mj je suma xi pro všechna i. Jestliže j=2, mj bude suma všech
čtverců xi.
28
Statistika charakteru sousedství - Joint count statistics (JCS)
Touto metodou lze zjistit, zda uspořádání ploch, které mohou nabývat binárních hodnot vykazuje
prvky náhodnosti. Tedy zda existuje pozitivní (clustered pattern) či negativní (random pattern)
prostorová autokorelace.
Obr. 4.3 Statistika četnosti spojů (JCS)
Podstata metody ­ jednoduchý příklad:
Máme mapu se dvěma kategoriemi landuse: U ­ zástavba, R ­ volná krajina. Potom mohou existovat
čtyři typy sousedských vztahů: UU, RR, UR, RU. V případě čistě náhodného uspořádání se bude
každá kombinace vyskytovat v 25% případů. Dvojice ploch s odlišným atributem se budou vyskytovat
v 50 % případů. Pokud UR + RU < 50%, potom výskyt dvojic ploch se stejným atributem UU a RR
bude vyšší než 50% - což je případ pozitivní prostorové autokorelace. V případě 50 na 50 ­ uspořádání
je náhodné a pokud UR + RU > 50%, pak se jedná o negativní SA, kdy dominují hranice nepodobných
ploch.
Mapu (obr. 1) s pěti plochami můžeme prezentovat také grafem s vrcholy a spoji, zaznamenávajícími
druh povrchu a také bezprostřední sousedství jednotlivých ploch s plochami jinými, jak je patrné
z obr. 4.4
Obr. 4.4 Grafická prezentace druhů spojů
Sestavíme matici sousedství pro jednotlivé plochy. V této matici nula značí, že obě plochy spolu
bezprostředně nesousedí, 1 naopak. Zároveň je barvou buňky v matici naznačeno, o jaký typ spoje se
jedná (obr 4.5).
Obr. 4.5 Binární matice sousedství pro nominální data
Pořadí řádků a sloupců v uvedené matici je určeno abecedním pořadím identifikátorů ploch. Nic
nebrání sestavit matici v jiném pořadí řádků a sloupců ­ například podle typu povrchu ­ viz. obr. 4.6).
29
Obr. 4.6 Binární matice sousedství uspořádaná podle hodnot atributů
Obě matice jsou symetrické, ve druhém případě navíc je možné jednoduše popsat prostorovou
autokorelaci pomocí čtyř sub-matic. Z matice lze zjistit, že 14 buněk obsahuje jedničku, která značí
výskyt hrany (14 párů sousedství). Dále platí, že jednotlivé typy sousedství se na mapě vyskytují
s těmito četnostmi:
UU=2
UR=5
RU=5
RR=2
Z toho plyne, že RU + UR > 14/2 , tedy naše mapa vykazuje negativní autokorelaci, nepodobné
plochy (s odlišným typem povrchu) se shlukují.
Uvedený koncept lze dále rozšířit využitím počtu pravděpodobnosti a statistických testů. Ty nám
umožní testovat statistickou významnost prostorového uspořádání ploch v mapě. V dalším výkladu
jsou používány dvě hodnoty atributů B ­ black, černá, W ­ white, bílá. Tedy bude-li prostorové
uspořádání indikovat uspořádání do shluků, potom můžeme předpokládat více hranic typu BB či WW
než BW nebo WB ­ tedy pozitivní prostorovou autokorelaci.
JCS tedy nejprve určuje počet jednotlivých druhů spojů s cílem testovat četnost jejich výskytu. Pro
plochu s malým počtem polygonů lze počty jednotlivých spojů zjistit manuálně, pro velký počet ploch
je nutné využití metod matematické statistiky. Obecné kroky výpočtu jsou následující:
Nechť xi=1 jestliže polygon i je černý a xi=0 jestliže polygon i je bílý.
Potom pro BB spoje bude:  = i j jiijBB xxwO )(
2
1
Pro WW spoje bude platit: [ ]  --= i j jiijWW xxwO )1)(1(
2
1
Pro BW nebo WB spoje bude platit: [ ]  -= 2
)(
2
1
jiijBW xxwO
Uvedené vzorce představují výrazy pro pozorované (O ­ observed) počty spojů popisující dané
uspořádání.
Vysoké hodnoty OBB či OWW či obou indikují pozitivní prostorovou autokorelaci (slukování).
Pozorované počty spojů však musíme porovnat s náhodným uspořádáním a musíme testovat, zda
eventuelní zvýšené počty OBB či OWW nejsou výsledkem pouhé náhody, zda jsou či nejsou statisticky
významné. Budeme tedy pracovat s počtem pravděpodobnosti.
Způsob určení pravděpodobnosti výskytu B a W polygonů však může významně ovlivnit výsledek
analýzy. Hodnoty atributů mohou byt jednotlivým polygonům přiřazeny na základě předpokladu
normality či náhodnosti (viz. prostorová analýza bodů)
30
Předpoklad normality: (NORMALITY - FREE - SAMPLING) ­ pravděpodobnost, že se jedná o
polygon B či W je založena na teorii či na trendu hodnot atributů odvozeném z větší oblasti.
Pravděpodobnost, že polygon má B či W není ovlivněna celkovým počtem B či W polygonů v oblasti.
Předpoklad náhodnosti: (RANDOMIZATION ­ NONFREE ­ SAMPLING) ­ pravděpodobnost, že
polygon bude mít B či W je omezena či závisí na celkovém počtu B či W polygonů.
Příklad: Plocha obsahující sedm polygonů:
Předpoklad náhodnosti ­ může existovat různá konfigurace 4 ,,černých" a 3 ,,bílých" ploch.
Předpoklad normality - může existovat různá konfigurace jakéhokoliv (0 až 7) počtu ,,černých" a
,,bílých" ploch.
U metody JCS bychom neměli pracovat s předpokladem normality v případě, že informace získané
z teorie, zkušenosti či z trendové funkce z širšího okolí jsou nespolehlivé. Náhodné vzorkování totiž
vyžaduje méně rigorózní podmínky použití.
Normální vzorkování
V obou výše komentovaných případech je nutné vedle pozorovaných (O) počtů jednotlivých typů
spojů či hranic (joint) zjistit počty očekávané (E) a také jejich směrodatné odchylky. Očekávané počty
odrážejí efekt náhodnosti či nevýznamné prostorové autokorelace jakéhokoliv typu (pozitivní či
negativní). Tedy zjistí se diference mezi pozorovanými a očekávanými četnostmi spojů. Tyto
diference jsou následně standardizovány hodnotami příslušných směrodatných odchylek a získáme tak
standardizovaná skóre. Z hodnot těchto skóre můžeme rozhodnout, zda je ve studované oblasti
významná pozitivní či negativní prostorová autokorelace v uspořádání polygonů podle hodnot
atributu. Jinými slovy, je nutné provést tři typy porovnání. Dále je prezentován případ pouze pro
testování negativní prostorové autokorelace.
Pro případ normálního vzorkování jsou vztahy pro očekávané četnosti jednotlivých druhů spojů (joint)
(EBB, EWW, EBW) následující:
2
2
1
WpEBB = 2
2
1
WqEww = WpqEWB =
p ­ pravděpodobnost, že plocha bude B (černá)
q ­ pravděpodobnost, že plocha bude W (bílá)
Pravděpodobnosti p, q musí dávat 100% nebo (p + q = 1). Pokud není k dispozici jiná informace,
potom nnp B= , jsou však i jiné způsoby určení p. Pokud je použitá prostorová matice vah binární,
lze výrazy pro očekávané počty typů spojů zjednodušit:
2
JpEBB = 2
JqEWW = JpqEBW 2=
kde J značí celkový počet spojů ve studované oblasti.
K testování statistické významnosti zjištěného prostorového uspořádání lze využít Z-testu. K němu je
zapotřebí zjistit směrodatné odchylky očekávaných počtů spojů. Směrodatné odchylky se vypočtou
v závislosti na použité váhové matici následovně:
Pro stochastickou matici vah:
[ ]pSqSqpBB 21
2
4
1
+=
[ ]qSpSpqww 21
2
4
1
+=
[ ]{ }pqpqSpqSBW 414
4
1
21 -+=
31
Pro binární matici vah:
( )KJpKpJpBB +-+= 432

( )KJqKqJqWW +-+= 432

( )KJqppqKpqJBW +-+= 22
42
kde  je směrodatná odchylka počtu příslušných spojů
S1, S2, J, p, q byly definovány výše
( ) =
-=
n
i ii LLK 1
1
Hodnota n v tomto výrazu značí celkový počet polygonů a Li je počet spojů mezi polygonem i a jeho
sousedy.
Obecný postup testování (na příkladu negativní prostorové autokorelace (BW spoje) při použití
binární matice):
Pro výpočet očekávaných potřebujeme znát hodnoty pravděpodobností p, q. Rozhodneme se pro určité
pravidlo definující sousedství (rook, queen). Dále určíme J (počet spojů) ­ zjistíme sumováním všech
členů binární matice vah a dělíme dvěma. Odhad správných hodnot p a q ­ ze zkušenosti, z teorie
(např. mortalita v určitém regionu ­ použijeme údaje o mortalitě celého státu. Potom určíme hodnotu
výrazu L(L-1) pro každý polygon a provedeme sumaci pro celou oblast. Potom určíme hodnoty EBW a
BW.
Máme-li k dispozici pozorované počty spojů (OBW), potom můžeme vyjádřit hodnotu z-skóre:
BW
BWBW EO
Z

-
=
Podle pravděpodobnosti rozdělení hodnot Z-skóre platí, že jakákoliv hodnota Z ležící mimo interval (-
1,96; -1,96) má pravděpodobnost výskytu menší něž 5 případů ze 100 (=0,05).
Obr. 4. 7 Příklady prostorového uspořádání černých a bílých polygonů v rámci studované oblasti (a,
b, c) a počty sousedů jednotlivých ploch (d)
32
PŘÍKLAD:
Na obrázku 4.7 je oblast obsahující 7 polygonů. Naším cílem je metodou JCS určit, zda v této oblasti
existuje statisticky významná negativní prostorová autokorelace ve výskytu ,,černých" (B) a ,,bílých"
(W) ploch. Jako vah využijeme prvků binární matice. Podle výše uvedených vzorců musíme vyčíslit
hodnoty OBW, EBW, BW,
1) Spočteme celkový počet všech spojů ve studované oblasti, tedy hodnota J=11.
2) Určíme způsob definice sousedství ­ v tomto případě za sousedy považujeme pouze polygony,
které spolu sousedí hranou (rook's case).
3) Určíme hodnoty pravděpodobností p, q výskytu ,,černé" či ,,bílé" plochy. V tomto případě
předpokládáme, že p=0,3 a q=0,7.
4) Z obr. d určíme pomocí následující tabulky hodnotu ( ) -1LL
Oblast L L-1 L(L-1)
A 3 2 6
B 2 1 2
C 3 2 6
D 5 4 20
E 3 2 6
F 3 2 6
G 3 2 6
 22 52
5) Vyčíslíme hodnoty , EBW, BW:
62,47,0*3,0*11*22 === JpqEBW
BW =2,1
6) Pro jednotlivé varianty na obrázku a, b, c jsou hodnoty pozorovaných počtů spojů (OBW)
OBW = 4, 6 resp 8
7) Pro konfigurace ,,černých" a ,,bílých" poch uvedené na obrázku vyjádříme hodnotu z-skóre:
a) 29,0
1,2
62,44
-=
-
=Z
b) 65,0
1,2
62,46
=
-
=Z
c) 61,1
1,2
62,48
=
-
=Z
8) Interpretace: Žádná z hodnot Z-skóre nepřesahuje prahovou hodnotu 1,96 a tedy uvedená
uspořádání nevykazují statisticky významnou negativní prostorovou autokorelaci na hladině
významnosti =0,05.
Náhodné vzorkování
V tomto případě závisí pravděpodobnost, zda je polygon bílý nebo černý, na celkovém počtu černých
polygonů a počtu bílých polygonů ve studovaném území. Obrázek 4.7. uvádí tři typy prostorového
uspořádání sedmi polygonů ve studované oblasti. Protože ve všech třech případech jsou počty B a W
polygonů stejné (jsou jen jinak uspořádané) hodnoty pravděpodobnosti budou: p=3/7 a q=4/7.
Dále se vypočtou hodnoty očekávaných počtů spojů a jejich směrodatné odchylky. Výpočetní vzorce
jsou jiné než v případě normálního vzorkování (viz. Lee, Wong, 2000, str. 154 ­ 155). Postup výpočtu
je však analogický výše uvedenému příkladu.
33
Obr. 4.8 Příklad výstupu z metody JSC v programu ArcView