Modelování prostorového uspořádání bodů (pattern detectors) Uspořádání bodů v prostoru Rozmístění bodů v prostoru je výsledkem určitých procesů či vhodných podmínek (lokace měst je výsledkem působení faktorů jako reliéf, přírodní zdroje, komunikace, atd.) f". v •• S Místa se škodami po vjchnci Z20./21. prosince 1740 Cílem studia prostorového rozmístění bodů je zjistit: ■ jak daleko má konkrétní rozmístění objektů k rozmístění teoretickému ■ jak se liší rozmístění bodů ve dvou různých oblastech ■ jak se mění rozmístění bodů v rámci jedné oblasti v čase. Statisticky prokázaný výskyt určitého prostorového uspořádání může být základem pro zjišťování příčin, které vedly k pozorovanému uspořádání. Základní typy prostorového uspořádání bodů LJJUUUUU idle Hne □□□□DC unrrr inn nr ' Shlukové (Clustered) ' Pravidelné (Regular) ' Náhodné(Random) Klasifikace prostorového uspořádání bodů 0 1 0 • 0 • 0 » 0 * 1 ■ • 1 • • 1 1 • 1 • 1 0 ■ 0 1 0 ■ 0 • 0 • 0 • 1 • 0 1 0 • 0 • 0 i 0 • 1 0 • Body - Skóre 0 -> 1 1 ->0 2 -> 1 3- >4 4- >9 5 -> 16 6- >25 7- >36 Klasifikace prostorového uspořádání bodů ľ < 16 ľ=(17;45) ľ >45 Pravidelné (Regular) Náhodné(Random) Shlukové (Clustered) Vybrané metody statistického popisu prostorového uspořádání bodů ■ Analýza kvadrátů - testujeme, zda má hustota bodů v ploše blízko k některému teoretickému modelu. • Metoda nejbližšího souseda - porovnává průměrnou vzdálenost mezi nejbližšími sousedy pole bodů k teoretickému rozmístění. • K-funkce (L-funkce) - jak se mění hustota bodů se vzdáleností • Prostorová autokorelace - měří jak podobné či nepodobné jsou hodnoty atributů sousedních bodů. Problémy spojené s popisem prostorového uspořádání bodů 1) Měřítko-je nutné vhodně zvolit tak, aby studovaný jev mohl být prezentován body v prostoru. 2) Rozsah studované oblasti (často vymezené administrativními 'S hranicemi) - mění jak vzdálenosti mezi jednotlivými body, tak také ^ charakteristiky jejich prostorového uspořádání. ;r-;r-... _ 3) Projekce se volí podle účelu (viz. analýza kvadrátů), projekcí se mění tvar, vzdálenosti, vzájemná poloha objektů. Čím větší studovaná oblast, tím větší bude role zvolené projekce Analýza kvadrátů (QUADRAT ANALYSIS) • Je založena na hodnocení změn hustoty bodů v prostoru. Je porovnáváno, zda rozmístění bodů v prostoru je náhodné, či má blíže k uspořádání shlukovému či pravidelnému. • Studovaná plocha je rozdělena pravidelnou sítí na buňky a je zjištěn počet bodů v každé buňce. fl Analýza kvadrátů • Je analyzováno rozdělení četností buněk s určitým počtem bodů. • Toto rozdělení je porovnáváno s náhodným rozdělením četností. • Extrémně shlukové uspořádání - většina bodů v jedné či několika málo buňkách. • Extrémně pravidelné - ve všech buňkách přibližně stejně • Buňky se označují jako kvadráty a nemusí jít o čtverce, ale např. i o kruhy či šestiúhelníky - je to dáno empirií. • V rámci jedné analýzy však tvar a velikost buněk musí být konstantní. • Při analýze lze buňky stejné velikosti také rozmístit po studované ploše náhodně . Optimální velikost kvadrátů (QS) QS = — A - plocha studované oblasti n - počet analyzovaných bodů. Velikost strany vhodného kvadrátu Testování výsledků analýzy kvadrátů Získané rozložení četností bodů v kvadrátech (empirické) je porovnáváno s náhodným rozložením (teoretickým). Vhodným testem je např. K-S test nebo X2 test Testem můžeme kvantifikovat rozdíl empirického a teoretického (shlukové, pravidelné, náhodné) rozdělení bodů v ploše. Testování výsledků analýzy kvadrátů N— 1, tím více se prostorové rozložení bodů blíží rozložení pravidelnému (rots > rexl). R=1.48 PRAVIDELNÉ R = 0 zcela shlukové uspořádání R = 1 náhodné uspořádání R = 2,149 zcela pravidelné uspořádání Interpretace hodnot R statistiky K hodnocení rozdílu mezi pozorovanou a očekávanou vzdáleností nejbližšího souseda lze využít tzv. směrodatné chyby (Standard Error-SEr) 0,26136 Směrodatná chyba popisuje pravděpodobnost, že jakýkoliv rozdíl dvou hodnot je výsledkem náhodných vlivů. Je-li zjištěná diference malá ve srovnání s SE, potom rozdíl není statisticky významný a naopak. Za statisticky významný považujeme rozdíl, který můžeme obdržet v pěti případech ze sta - tedy s pravděpodobností 5 %, a=0,05. Vyjádřeno v násobcích směrodatné chyby - rozdíl mezí dvěma populacemi považujeme za statisticky významný, jestliže je menší než -1,96SEr a nebo větší než +1,96SEr: Pravděpodobnost (<95%) = (-l^ôSE^ +1.96SEJ Interpretace hodnot R statistiky K interpretaci hodnot rozdílů mezi pozorovanými a očekávanými hodnotami R statistiky můžeme | využít princip standardizace 1 Pomocí směrodatné chyby lze vypočítat standardizovanou hodnotu (Z-skóre): SE, Je-li tedy ZR < -1,96 či ZR > 1,96 potom vypočtený rozdíl mezi pozorovaným a náhodným uspořádáním je statisticky významný - tedy není náhodný a naopak. Problémy spojené s metodou analýzy nejbližšího souseda: • Nelze spoléhat na vizuální srovnání prostorového rozložení ani na vypočtenou hodnotu R. Ta by měla být doplněna hodnotou ZR pro ověření statistické významnosti pozorovaného rozdílu. • Výsledky jsou vysoce citlivé k měřítku (lokální vs. regionální) • V závislosti na studovaném jevu musí být věnována pozornost vymezení studované plochy (administrativní či přirozené hranice). • Metoda analýzy nejbližšího souseda může být rozšířena na analýzu nejbližších sousedů druhého, třetího a vyšších řádů. Metoda nejbližšího souseda - problém definice hranic studované oblasti (boundary effect) Metoda nejbližšího souseda - problém definice hranic studované oblasti (boundary effect) 3/ X , / 6 R =2.167 R=1.323 7 R-RJR ~ 1 638 -to- *enc'erice ^ pravidelnému e rozložení bodů Pomoci SE , , . _ _ ^ ^ . __ ^ HO (náhodné rozmístěni převedeme R na Z=2,99 ► Z > 1.96 ► V njnrjnrti bodu) zamítáme standardizovanou ' hodnotu (Z skoré) Boundary effect? Co když nemáme jinou informaci než tu ze studované oblasti? Simulace • HO - rozmístění bodů je náhodné • V prostoru 7x6 simulujeme náhodné rozmístění 6-ti bodů • Pro každý náhodný pokus vypočteme R0 • Zopakujeme to 10 000 krát, dostaneme průměrné R0=1.62 • R0> Re (R =1,323) • Body jsou v průměru dále od sebe než očekáváme a to i po 10 000 náhodných pokusech (Body blízko hranice jsou relativně dále od ostatních bodů studované oblasti než by pravděpodobně byly, kdybychom uvažovali body i vně oblasti) Princip simulace metodou Monte Carlo • 10 000 hodnot Ro seřadíme od největší po nejmenší • Najdeme 9 500. největší hodnotu R0 = 2,29 (tedy jen v pěti procentech případů bychom dostali hodnotu R0 větší než 2,29) • R0 pro našich původních6 bodů bylo jen 2.776-tedy takovouto hodnotu bychom dostali častěji než jen v 5% případů • Proto Ho přijímáme. • Simulací jsme zohlednili tzv. „boundary effect" a zjistili jsme, že rozdělení bodů ve studovaném prostoru se od rozdělení náhodného významně neliší Analýza nejbližšího souseda (příklad) Liší se dané uspořádání bodů od uspořádání náhodného? Clark-Evans test Guard correction Monte Carlo test based on 999 simulations of CSR with fixed n R = 0.84515, p-value = 0.001 alternative hypothesis: clustered (R < 1) Další míry prostorové závislosti K - funkce (Ripley's K function) Zjišťuje celkový počet všech bodů, které se kolem bodu vyšetřovaného vyskytují do určité zvolené vzdálenosti Je-li tento počet bodů větší než počet bodů, který by odpovídal náhodnému rozdělení, potom body jeví tendenci se shlukovat. K - funkce * • , --• g '"• A e C U e F G A ?flij 2\!7 2W 353fi ]!}i5 Alfí n IMS ims -í* ícw 3-é-oi (- Hli 5715 ÍSM 4031 2567 o iiti í Ms ;etn 11 í s 2 51 o i S 3000- • r y&ä 4DfM Z5*'' Síŕfl "n ?4;j.< <3 ««7 3*Sl IJOT 4997 W.S4 3133 K(d) jív/,/ A - plocha území n - počet bodu d- vzdálenost (zvolený poloměr) / - váha: / = 1 pokud dŕ < d 1 = 0 pokud djj > d Příklad K - funkce K - funkce K-funkce pro místa s využitím borovice jako stavebního materiálu na území ČR 18. století. csr K-funkce i/ průběhu K-funkce pro stejný počet bodů, jejichž poloha je náhodně generována (CRS -Spatial Randomness) Complete Transformace K - funkce L(d)-- 1 i(n-\) Interpretace: • při zcela náhodném rozdělení bude přímka v grafu svírat s osou x úhel 45° • Bude-li průběh přímky hodnot L vyšetřovaných bodů nad touto přímkou -tendence ke shlukování • Bude-li průběh přímky hodnot L vyšetřovaných bodů pod touto přímkou -tendence k rovnoměrnému rozložení bodů .•■■iis*'-t •ŕ ^ f- / f. Příklad L - funkce L - funkce \v ;<"'"■*<£•''./' L-funkce pro místa s využitím borovice jako stavebního materiálu na území ČR v průběhu 18. století. CSU L - funkce 1**"'*»** *• *•*>** * *í ** * L-funkce pro stejný počet bodů, jejichž poloha je náhodně generována (CRS - Complete Spatial Randomness)