Modelování prostorového uspořádání bodů (pattern detectors)
Uspořádání bodů v prostoru
Rozmístění bodů v prostoru je výsledkem určitých procesů či vhodných podmínek (lokace měst je výsledkem působení faktorů jako reliéf, přírodní zdroje, komunikace, atd.)
Cílem studia prostorového rozmístění bodů je zjistit:
• jak daleko má konkrétní rozmístění objektů k rozmístění teoretickému
• jak se liší rozmístění bodů ve dvou různých oblastech
• jak se mění rozmístění bodů v rámci jedné oblasti v čase.
Statisticky prokázaný výskyt určitého prostorového uspořádání může být základem pro zjišťování příčin, které vedly k pozorovanému uspořádání.
Základní typy prostorového uspořádání bodů
• Shlukové (Clustered)
■ Pravidelné (Regular)
■ Náhodné(Random)
Klasifikace prostorového uspořádání bodů
0 1	<>•	0 •	°.	0 •	0 >
0 •	1 •	1 • •	1 1 •	1	• 1
0 ■	0 1	0 ■	0 •	0 •	0 •
0 •	1	• 0	1	0 •	0 •
° •	0 <	p •	0 •	1	0 •
Body-Skóre 0->1
1 ->0
2 -> 1
3- >4
4- >9 5 -> 16
6- >25
7- >36
1 = 8
Klasifikace prostorového uspořádání bodů
I < 16
I=(17;45)
I>45
Pravidelné (Regular) Náhodné(Random) Shlukové (Clustered)
Základní metody statistického popisu prostorového uspořádání bodů
• Analýza kvadrátů - testujeme, zda rozmístění bodů v ploše je náhodné či nikoliv.
• Metoda nejbližšího souseda - porovnává průměrnou vzdálenost mezi nejbližšími sousedy pole bodů
k teoretickému rozmístění.
• Prostorová autokorelace - měří jak podobné či nepodobné jsou hodnoty atributů sousedních bodů.
Problémy spojené s popisem prostorového uspořádání bodů
• měřítko
• rozsah studované oblasti
• kartografická projekce
Měřítko - je nutné vhodně zvolit tak, aby studovaný jev mohl být prezentován body v prostoru.
Rozsah studované oblasti
V závislosti na zvolené oblasti (často vymezené administrativními hranicemi) se mění jak vzdálenosti mezi jednotlivými body, tak také charakteristiky jejich prostorového uspořádání.
Da'jíoíi •Coium&us *■ ......!■
Kartografická projekce
Projekce se volí podle účelu (viz. analýza kvadrátů).
Projekcí se mění tvar, vzdálenosti, vzájemná poloha objektů.
Čím větší studovaná oblast, tím větší bude role zvolené projekce.
Analýza kvadrátů (QUADRAT ANALYSIS)
• Je založena na hodnocení změn hustoty bodů v prostoru. Je porovnáváno, zda rozmístění bodů v prostoru je náhodné, či má blíže k uspořádání shlukovému či pravidelnému.
• Studovaná plocha je rozdělena pravidelnou sítí na buňky a je zjištěn počet bodů v každé buňce.
								
		-j						
								
								
							d	-J
								
					>			
Analýza kvadrátů
• Je analyzováno rozdělení četností buněk s určitým počtem bodů.
• Toto rozdělení je porovnáváno s náhodným rozdělením četností.
• Extrémně shlukové uspořádání-většina bodů v jedné či několika málo buňkách.
• Extrémně pravidelné - ve všech buňkách přibližně stejně
• Buňky se označují jako kvadráty a nemusí jít o čtverce, ale např. i o kruhy či šestiúhelníky - je to dáno empirií.
• V rámci jedné analýzy však tvar a velikost buněk musí být konstantní.
Analýza kvadrátů
	
	1ÉEI
iíĚ?=aii	
	
Modifikace metody - Při analýze lze buňky stejné velikosti také rozmístit náhodně po studované ploše.
Optimální velikost kvadrátů (QS)
n
A - plocha studované oblasti n - počet analyzovaných bodů.
Velikost strany vhodného kvadrátu
Testování výsledků analýzy kvadrátů
Získané rozložení četností bodů v kvadrátech (empirické) je porovnáváno s náhodným rozložením (teoretickým).
Vhodným testem je např. K-S test nebo X2test
Testem můžeme kvantifikovat rozdíl empirického a teoretického (shlukové, pravidelné, náhodné) rozdělení bodů v ploše.
														
														
								1			Počet měst v každém čtverci	jištěné Pravidelné rozdělení  | rozdělení		Shlukové rozdělení
		-i						pt						
											0	36	0	79
		u>.						ú	i		1	17	26	0
											2	10	26	0
							.-■				3	3	26	0
											4	2	2	0
											5	2	0	0
											6	1	0	0
											7	1	0	0
											8	1	0	0
											9	1	0	0
											10	1	0	0
											11	1	0	0
											12	1	0	0
											13	1	0	0
											14	1	0	0
											28	1	0	0
											164	0	0	1
Zjištěné rozdělení četnosti 164 měst v kvadrátech ve studované oblasti a rozdělení četností teoretická														
Praktický postup testování výsledků analýzy kvadrátů
1. (HO) - neexistuje statistiky významný rozdíl (je-li rozdíl malý, může být výsledkem náhody, čím je větší, s tím větší pravděpodobností náhodný není, ale je statistiky významný).
2. Zvolíme hladinu významnosti a = 0,05
3. Vypočteme kumulované četnosti (O - observed, E -expected)
4. Vypočteme testovací kritérium: D = max|0; - Et\
1,36      „    ,     \n\ +
5. Vypočteme kritickou hodnotu: Da=A= Z)„=l,36.
v™ V mrm2
6. Je-li vypočtená hodnota D větší než kritická hodnota Da, potom rozdíl mezi oběma uspořádáními je statisticky významný.
Použití K-S testu: Je rozmístění bodů v prostoru pravidelné?
Počet měst v	Zjištěné	Relativní	Ku m	lativní	Pravidelné	Relativní	Ku mi	lativní	Absolutní
každém čtverci	rozdělení	četnosti	četnosti		rozdělení	četnosti	četnosti		diference
0	36	0,450	0	450	0	0,000	0	00	0,45
1	17	0,213	0	663	26	0,325	0	33	0,34
2	10	0,125	0	788	26	0,325	0	65	0,14
3	3	0,038	0	825	26	0,325	0	98	0,15
4	2	0,025	0	850	2	0,025		00	0,15
5	2	0,025	0	875	0	0,000		00	0,13
6	1	0,013	0	888	0	0,000		00	0,11
7	1	0,013	0	900	0	0,000		00	0,10
8	1	0,013	0	913	0	0,000		00	0,09
9	1	0,013	0	925	0	0,000		00	0,08
10	1	0,013	0	938	0	0,000		00	0,06
11	1	0,013	0	950	0	0,000		00	0,05
12	1	0,013	0	963	0	0,000		00	0,04
13	1	0,013	0	975	0	0,000		00	0,03
14	1	0,013	0	988	0	0,000		00	0,01
28	1	0,013	1	000	0	0,000		00	0,00
164	0	0,000	1	000	0	0,000		00	0,00
Testovací kritérium: D = 0,45
Kritická hodnota pro cc- 0,05: Da= 0,2115
Zamítáme nulovou hypotézu - rozdělení měst se statisticky významně liší od rozdělení pravidelného
Jak porovnat dané rozmístění bodů s rozmístěním náhodným?
Testování pozorovaného rozložení bodů s rozložením náhodně generovaným (podle určitého teoretického rozdělení).
Poissonovo rozdělení (Poisson random process) je určeno průměrnou frekvencí výskytu (Ji) v jednotlivých jednotkách (kvadrátech):
m-počet kvadrátů; n - počet bodů v prostoru L ,______
Je-li xpočet bodů v kvadrátu, potom pravděpodobnost výskytu xbodů v kvadrátu podle Poissonova rozdělení je detinována vztahem:
p(x) =
Z uvedeného vztahu můžeme pro různá xvypočítat pravděpodobnost rozložení bodů, které budou mít Poissonovo (náhodné) rozdělení
Hodnoty průměru a rozptylu Poissonova rozdelení se rovnají hodnotě (k). Interpretace:
Bude-li distribuce bodů v prostoru generována náhodným procesem, potom toto rozdělení má stejný průměr a rozptyl a jejich poměr se bude blížit jedné.
Postup testování:
1. Vypočteme hodnoty průměru a rozptylu pro četnosti bodů v kvadrátech.
2. Hodnoty dáme do poměru, hodnotu porovnáme s 1.
3. Rozdíl lze standardizovat (vyjádřit v násobcích směrodatné odchylky).
4. Vyjde-li hodnota větší než 1,96, potom je rozdíl statisticky významný na hladině a = 0,05.
Test založený na poměru průměru a rozptylu je silnější než K-S test
Lze ho však použít pouze v případě, že předpokládáme Poissonovo rozdělení studované množiny bodů.
Testování výsledků analýzy kvadrátů vůči rozložení generovanému Poissonovým náhodným procesem (pro X = 2,05) s pomocí K-S testu
Počet mést v    Zjištěné Relativní každém čtverci rozdělen četnosti				Kumulativní četnosti		Pravděpodobnosti Kumulativní Poissonova rozd. četnosti			Absolutní diference	
0	36     I 0		450	0	450	01287 0		13	0	32
1	17     1 Ô		213	0	663	0 2639	0	39	0	27
2	10	0	125	0	788	0 2705	0	66	0	12
3	3	0	038	0	825	0 1848	0	85	0	02
4	2	0	025	0	850	0 0947	0	94	0	09
5	2	0	025	°	875	0 0388	0	98	0	11
6	1	0	013	o 0	888	0 0133	0	99	0	11
7	1	0	013		900	0 0039		00	0	10
8	1	0	013	0	913	0,001		00	0	09
g	1	0	013	0	925	0,0002		00	0	07
10	1	0	013	0	938	0		00	0	06
11	1	0	013	0	950	0		00	0	05
12	1	0	013	0	963	0		00	0	04
13	1	0	013	0	975	0		00	0	02
14	1	0	013	0	988	0		00	0 0 0	01 00 00
28	1	0	013	1	000	0		00		
164	0	0	000	1	000	0		00		
Testovací kritérium: D-0,3213
Kritická hodnota pro a = 0,05: D„= 0,1520
Rozdíl mezi oběma uspořádáními je statisticky významný.
Omezení analýzy kvadrátů:
Analýza kvadrátů neřeší otázku rozložení bodů uvnitř kvadrátů.
Analýza nejbližšího souseda
(NEAREST NEIGHBOUR ANALYSIS)
Metoda analýzy kvadrátů je založena na konceptu hustoty (počet bodů v ploše)
Metoda analýzy nejbližšího souseda je naopak založena na konceptu vzdálenosti (spacing - plocha připadající na bod).
Metoda analýzy nejbližšího souseda je založena na porovnání pozorované průměrné vzdálenosti mezi nejbližšími sousedy a této průměrné vzdálenosti u známého (teoretického) prostorového uspořádání (pravidelného či náhodného).
Pravidelné uspořádání bodů
Nepravidelnější uspořádání - studovaná oblast je rozdělena sítí pravidelných šestiúhelníků a body v této oblasti tvoří jejich středy.
Body lze pospojovat do sítě pravidelných trojúhelníků.
Testovací kritérium
Za výše uvedené konfigurace bude vzdálenost mezi body rovna:
kde A je plocha a n počet bodů v ploše.
K testování, zda má určité rozložení bodů v ploše jistý vzorek lze využít R statistiku (R - randomness).
R statistika
Určí se jako poměr mezi pozorovanou a očekávanou průměrnou vzdáleností nejbližších sousedů v určité oblasti:
i*
_ obs
Hodnotu robs zjistíme tak, že určíme vzdálenost mezi daným bodem a všemi jeho sousedy. Dále najdeme nejkratší vzdálenost - tedy nejbližšího souseda. Tento proces se opakuje pro všechny body. Ze všech nejkratších vzdáleností se vypočte průměr.
Hodnotu r   zjistíme ze vztahu:
n/A
Interpretace hodnot R statistiky
Čím je hodnota R < 1, tím více se prostorové rozložení bodů blíží rozložení shlukovému (robs< rexp).
Čím je hodnota R > 1, tím více se prostorové rozložení bodů blíží rozložení pravidelnému (robs > rexp).
R=1.48 PRAVIDELNÉ
R = 0 zcela shlukové uspořádání
R = 1 náhodné uspořádání
R = 2,149       zcela pravidelné uspořádání
K hodnocení rozdílu mezi pozorovanou a očekávanou vzdáleností nejbližšího souseda lze využít tzv. směrodatné chyby (Standard Error -SE)
SE,
0,26136
Směrodatná chyba popisuje pravděpodobnost, že jakýkoliv rozdíl dvou hodnot je výsledkem náhodných vlivů. Je-li zjištěná diference malá ve srovnání s SE, potom rozdíl není statisticky významný a naopak.
Za statisticky významný považujeme rozdíl, který můžeme obdržet v pěti případech ze sta - tedy s pravděpodobností 5 %, a=0,05.
Vyjádřeno v násobcích směrodatné chyby - rozdíl mezi dvěma populacemi považujeme za statisticky významný, jestliže je menší než - 1,96SEr a nebo větší než +1,96SEr:
Pravděpodobnost (<95%) = (-1,96SEr; +1.96SEJ
Standardizace hodnot rozdílů >«"a"a~™	
-4-3-2-101234 Standard Deuiatians Pomocí směrodatné chyby lze vypočítat standardizovanou	
hodnotu (Z-skóre):	
Z     _±-3L	
SEr	
Je-li tedy ZR< -1,96 či ZR> 1,96 potom vypočtený rozdíl mezi	
pozorovaným a náhodným uspořádáním je statisticky významný	
- tedy není náhodný a naopak.	
Problémy spojené s metodou analýzy nejbližšího souseda:
• Nelze spoléhat na vizuální srovnání prostorového rozložení ani na vypočtenou hodnotu R. Ta by měla být doplněna hodnotou ZR pro ověření statistické významnosti pozorovaného rozdílu.
• Výsledky jsou vysoce citlivé k měřítku (lokální vs. regionální)
• V závislosti na studovaném jevu musí být věnována pozornost vymezení studované plochy (administrativní či přirozené hranice).
• Metoda analýzy nejbližšího souseda může být rozšířena na analýzu nejbližších sousedů druhého, třetího a vyšších řádů.
Metoda nejbližšího souseda - problém definice hranic studované oblasti (boundary effect)
Metoda nejbližšího souseda - problém definice hranic studované oblasti (boundary effect)
	-                 \ 3 to
^   , /	
\—2—i	
R0=2.167 R^l.323
R=R0/Re = 1.638
Pomocí SE
převedeme R na 2=2,99 standardizovanou hodnotu (Z skoré)
tendence k pravidelnému rozložení bodů
Zamítáme HO (náhodné rozmístění bodů)
Boundary effect?
Co když nemáme jinou informaci než tu ze studované oblasti?
Simulace
• HO - rozmístění bodů je náhodné
• V prostoru 7x6 simulujeme náhodné rozmístění 6-ti bodů
• Pro každý náhodný pokus vypočteme R0
• Zopakujeme to 10 000 krát, dostaneme průměrné R0=1.62
• R0 > Re (Rg=1,323)
• Body jsou v průměru dále od sebe než očekáváme a to i po 10 000 náhodných pokusech . Proč?
(Body blízko hranice jsou relativně dále od ostatních bodů studované oblasti než by pravděpodobně byly, kdybychom uvažovali body i vně oblasti)
Princip simulace metodou Monte Carlo
• 10 000 hodnot Ro seřadíme od největší po nejmenší
• Najdeme 9 500. největší hodnotu Ra = 2,29 (tedy jen v pěti procentech případů bychom dostali hodnotu R0 větší než 2,29)
• R0 pro našich původních 6 bodů bylo jen 2.176-tedy takovouto hodnotu bychom dostali častěji než jen v 5% případů
• Proto Ho přijímáme.
• Simulací jsme zjistili, že rozdělení bodů ve studovaném prostoru se od rozdělení náhodného významně neliší