1 Metody prostorové interpolace Základní pojmy Interpolace ­ skupina metod, které slouží k odhadu neznámých hodnot proměnné v jistých bodech (neměřených) na základě hodnot proměnné v bodech měřených. Prostorová interpolace ­ skupina metod, které slouží k vytváření spojitých povrchů (polí) z bodových měření. Body mohou být lokalizovány v 1, 2 i 3 rozměrném prostoru. Interpolace se může týkat nejenom bodů, ale i linií a ploch. Extrapolace ­ odhad hodnot proměnné vně oblasti definované krajními body měření. Naprostá většina interpolačních postupů je založena na principu prostorové autokorelace ­ tedy na předpokladu, že hodnoty odhadované veličiny v lokalitách blízkých si boudou více podobné něž hodnoty v lokalitách vzdálených. Výběr reprezentativních vzorků (sampling) Je důležitý pro výběr interpolačního algoritmu a úspěšnost vlastní interpolace. Další aspekty ovlivňující úspěšnost interpolace způsob prezentace spojitých polí (grid, TIN, izočáry, areály) dostupné datové zdroje pro interpolaci vymezení studované plochy ­ přirozené a administrativní hranice dostupnost bodů měření vně studované plochy Předpoklady úspěšné prostorové interpolace existence dostatečně reprezentativního vzorku měřených dat vhodné vlastnosti měřené veličiny a typ dat (ordinální, intervalová, poměrová) teoretické i empirické znalosti o povaze prostorové diferenciace studovaného jevu znalost podstaty použitelných interpolačních metod znalost způsobu výběru nejvhodnější metody Průzkumová analýza prostorových dat (ESDA). * EDA ­ Exploratory Data Analysis * ESDA ­ Exploratory Spatial Data Analysis * ESTDA ­ Exploratory Spatio ­ Temporal Data Analysis * Množina statistických metod a speciálních nástrojů, zvláště grafických metod, používaných k lepšímu porozumění datům, k odhalení jejich důležitých vlastností. * Jejím cílem je zjistit základní informace o charakteru vstupních dat v tomto případě za účelem následné interpolace. Průzkumová analýza prostorových dat (ESDA). 2 Základní postupy průzkumové analýzy prostorových dat * výpočet základní popisné statistiky včetně momentů vyššího řádu (asymetrie a špičatosti) * prověření požadavků normality a stacionarity * analýza rozdělení hodnot - analýza histogramu * analýza kvantilového grafu (Q-Q grafu) * zkoumání odlehlých hodnot a jejich případné odstranění * analýza trendu a jeho případné odstranění * případná transformace vstupních dat (log) Základní postupy průzkumové analýzy prostorových dat * ESDA slouží k průzkumu, deskripci, vizualizaci, zvýrazňování základních rysů dat, jejich distribuce (nejen ve smyslu prostorovém). * Postupy ESDA slouží k prověření požadavků normality, stacionarity vstupních dat. * Používá specifických nástrojů (histogram, box plot, scatter plot, Q-Q graf) i statistických charakteristik * Postupy ESDA mohou vést k nutnosti úpravy či transformace původních dat. * Úprava může spočívat v odstranění trendu či odlehlých hodnot, transformace potom např. například v tzv. log-transformaci. * ESDA je nezbytným předstupněm úspěšné aplikace řady interpolačních postupů (např. metod krigingu). Základní nástroje průzkumové analýzy prostorových dat Popisná statistika a ,,mapped histogram" - propojení mapy a grafu Hodnocení polohy a prostorového uspořádání typických resp. extrémních hodnot. Základní nástroje průzkumové analýzy prostorových dat Voronoi map * definování přirozených sousedů k vyšetřovanému bodu * výpočet lokální statistiky (od měr úrovně až po míry entropie) Základní nástroje průzkumové analýzy prostorových dat Voronoi map kde pi je poměr polygonů náležejících do dané třídy z celkového počtu polygonů Minimální entropie ­ všechny buňky patří do stejné třídy Maximální entropie ­ každá z buněk náleží k jiné třídě. Entropie ­ je počítána z hodnot daného polygonu a všech polygonů sousedních. Nejprve jsou všechny polygony roztříděny do pěti tříd. -= ii pLogpEntropie _* Základní nástroje průzkumové analýzy prostorových dat Kvantilové grafy - grafy zobrazující kvantity dvou rozdělení Normální Q-Q graf Slouží jako nástroj k posouzení normality vstupních dat. 3 Základní nástroje průzkumové analýzy prostorových dat Obecný Q-Q graf ­ testuje se podobnost rozdělení dvou datových soborů, vynáší se odpovídající si hodnoty kvantilů Shodu v obou případech indikují v grafech body přimykající se k přímce. Základní nástroje průzkumové analýzy prostorových dat * Box-Cox * Arcsine * Logaritmická Takováto data vyžadují transformaci. Základní typy transformací: Základní nástroje průzkumové analýzy prostorových dat Analýza trendu Definování globálního trendu v datech, jeho odhalení a eventuálního odstranění. Spočívá v projekci hodnot vyšetřovaných bodů do rovin xz a yz a jejich proložení polynomem n-tého řádu. Základní nástroje průzkumové analýzy prostorových dat Krabicové grafy (box plots) * detekce odlehlých či extrémních hodnot * lokální a globální odlehlé hodnoty Základní nástroje průzkumové analýzy prostorových dat Vykreslení množiny hodnot semivariance či covariance * Detekce míry prostorové autokorelace, vystižení míry anizotropie, odhlaení odlehlých hodnot. * Semivariance (semivariogram) ­ empirický semivariogram jako graf míry nepodobnosti. * V úlohách interpolace je tato veličina důležitá pro objektivní definování velikosti a tvaru okolí vyšetřovaného bodu. Základní nástroje průzkumové analýzy prostorových dat Vykreslení množiny hodnot semivariance či covariance Polovina ze sumy čtverců rozdílů hodnot všech dvojic vyšetřovaných bodů vzdálených o určitou hodnotu. Hodnota empirické semivariance proměnné z pro dvojici bodů v poloze xi a xj: Hodnota empirické covariance Hodnota empirické crosscovariance ( )2 )()(5,0 ji xzxz ))()()(( zxzzxz ji -- ))()()(( ytyzxz ji -- 4 Základní nástroje průzkumové analýzy prostorových dat Vykreslení množiny hodnot semivariance či covariance * Každý bod v grafu představuje dvojici bodů v analyzovaném prostoru nacházejících se v určité vzdálenosti (osa x). * Podobnost hodnot interpolované veličiny je vyjádřena semivariancí (osa y). Základní nástroje průzkumové analýzy prostorových dat Základní nástroje průzkumové analýzy prostorových dat Základní nástroje průzkumové analýzy prostorových dat Detekce odlehlých hodnot (outliers) Základní nástroje: * histogram * semivariogram/ covariance cloud * Voronoi map Detekce globální (vlevo) a lokální (vpravo) odlehlé hodnoty. Základní nástroje průzkumové analýzy prostorových dat Vyšetřování tvaru okolí ­ izotropní a anizotropní povrch Detekce globální (vlevo) a lokální (vpravo) odlehlé hodnoty. Explorační analýza prostorových dat (ESDA). 5 Rozdělení metod prostorové interpolace metody interpolace bodů, linií a ploch. metody lokální a globální metody exaktní a aproximující metody spojité a zlomové (abrupt) metody deterministické a stochastické Globální a lokální metody interpolace Exaktní a aproximující metody interpolace Deterministické a stochastické metody interpolace vytváření izolinií na základě spojování míst s obdobnými hodnotami jevu založené na expertním odhadu využívají empirie, obecné teorie a znalosti místních zvláštností expertní systémy Základní omezení (s ohledem na počítačové zpracování): problém zpracování velkého množství bodů problém subjektivního přístupu problém časové náročnosti Metody analogové interpolace (line threading or eye balling) Globální interpolátory využívající klasifikačních modelů a ANOVA analýzy Stacionarita - předpoklad, že míry úrovně a variability výběrového souboru nezávisí na velikosti výběru a rozmístění jednotlivých měřených bodů Klasifikace homogenními polygony - k interpolaci v rámci studovaného území využít externě definovaných prostorových jednotek (regionů). Obecný model ( )z x k0 = + + z - hodnota atributu v lokalitě x0 - celkový průměr atributu na zpracovávaném území k - odchylka mezi a průměrem v regionu k - reziduum, šum 6 Model předpokládá, že v rámci každého regionu (třídy) k mají hodnoty interpolovaného atributu normální rozdělení. Průměrný atribut pro třídu k je roven: + k a je určen z výběrových měření v rámci třídy k. Uvedený přístup vychází z několika předpokladů: * kolísání hodnot z v rámci jednotlivých tříd je náhodné * měřená hodnota v rámci každé mapované třídy se vyznačuje stejně velikou náhodnou složkou * studované atributy mají normální rozdělení * veškeré prostorové změny se dějí na hranicích mezi jednotlivými třídami, změny se dějí skokem, ne postupně Globální interpolátory využívající analýzy trendu Princip - mnohonásobná regrese hodnot atributu vs. geografické souřadnice. Metodou nejmenších čtverců jsou nalezeny nejvhodnější koeficienty pro daný polynom n-tého řádu. Předpokládá se normální rozdělení. lineární trend: z = b0 +b1x + b2y kvadratický trend: z = b0 + b1x+ b2y + b3x2 + b4xy + b5y2 kubický trend: z = b0+ b1x + b2y + b3x2 + b4xy+ b5y2 + b6x3 + b7x2y+ b8xy2 + b9y3 b ­ koeficienty, x, y ­ souřadnice bodů Interpolace trendové složky polynomy 1 až 5 stupně Globální interpolátory využívající regresní analýzy Princip - existuje vazba mezi hodnotami interpolované veličiny a vybranými jinými atributy studovaného prostoru (např. teplota a nadmořská výška,koncentrace znečištění a vzdálenost od zdroje). Forma - empirický model závislosti interpolované veličiny na hodnotách jedné či několika veličinách nezávislých: z(x) = b0 + b1P1 + b2P2 + b0 ...bn - regresní koeficienty P1 ... Pn - nezávisle proměnné Sestavení regresní závislosti je založeno na metodě nejmenších čtverců. Výsledný model může být lineární i nelineární. Jako nezávisle proměnné lze kombinovat geografické souřadnice s jinými atributy. Regresní model závislosti teplotních sum na nadmořské výšce, zápis modelu v prostředí ArcView Map Calculator a vytvořená mapa teplotních sum pro ČR Metody lokální interpolace (lokální interpolátory) Globální interpolátory - lokální efekty = náhodný šum Lokální interpolátory - hledaná hodnota je určena z určitého počtu měření z předem definovaného okolí počítaného bodu. Obecný postup se sestává z následujících kroků: 1. definování velikosti a tvaru zájmového okolí 2. nalezení měřených bodů v tomto okolí 3. nalezení matematické funkce vystihující kolísání hodnot nacházejících se v okolí daného bodu 4. výpočet hodnoty pro uzly regulérní sítě (grid) 7 Pro lokální interpolace jsou důležité následující skutečnosti: druh použité interpolační funkce velikost, tvar a orientace okolí počet bodů v okolí zahrnutých do výpočtu rozložení uvažovaných bodů (regulérní či nepravidelné) možné začlenění externí informace např. o obecném trendu Metoda nejbližšího souseda (thiessenovy polygony) Princip - hodnoty atributů v neměřených místech jsou určeny z hodnot nejbližšího místa měřeného. Zpracovávané území rozděleno na nepravidelné trojúhelníky (Delaunay triangulace) a z nich jsou poté definovány tzv. thiessenovy polygony. Příklad interpolace množiny nepravidelně rozmístěných bodů v ploše metodou thiessenových polygonů Příklad interpolace spojité veličiny metodou thiessenových polygonů Metody konstrukce nepravidelných trojúhelníků (TIN) Exaktní metoda vhodná pro nepravidelně rozmístěné body měření. Body jsou spojeny liniemi a vytváří síť nepravidelných trojúhelníků. Hodnoty v bodech na počátku a konci linií jsou známy, lze použít jednoduchou lineární závislost k interpolaci bodů mezi dvěma body na linie. TIN je metoda interpolace i způsob vizualizace spojitých povrchů. Metoda vhodná pro povrchy vyznačující se náhlými změnami spádu (fluviálně erodované povrchy). Proces vytváření spojitého povrchu metodou TIN zahrnuje: výběr charakteristických bodů (ne z jakékoliv množiny nepravidelně rozmístěných bodů lze vytvořit TIN) způsob propojení bodů do trojúhelníkové sítě způsob modelování povrchu uvnitř trojúhelníků Výběr bodů a algoritmy pro výběr bodů: algoritmus Fowler and Little VIP algoritmus Drop heuristic algoritmus http://www.ncgia.ucsb.edu/giscc/units/u056/ 8 Způsob propojení bodů do TIN - Delaunay triangulace: TIN je model vhodný k následné konstrukci izolinií. Metody není možné použít k extrapolaci ­ výsledný povrch má plochu, která vznikne spojením vnějších měřených bodů (,,hull"). Metoda inverzní vzdálenosti Princip - hodnota atributu v určitém bodě je váženým aritmetickým průměrem hodnot okolních měřených bodů. Váhy jsou určeny pro každý bod jako inverzní vzdálenost měřeného bodu od bodu interpolovaného. Obecný vzorec pro odhad hodnoty Z: = = = n i i n i ii w zw Z 1 1^ Váhy se určují ze vztahu: k d w 1 = Hodnoty vah wi představují funkci vzdálenosti d. Hodnota exponentu k se nejčastěji volí 1 či 2. nebo kd ew - = Odhad hodnoty v bodě metodou inverzní vzdálenosti Metoda inverzní vzdálenosti efekt ,,průměrování"potlačení lokálních extrémů Problém generování koncentrických struktur kolem interpolovaných bodů (tzv. ,,bulls eyes") Způsob definování okolí izotropní povrch - kruhové okolí interpolovaného bodu, pro odhad hodnoty bereme všechny body bez ohledu na směr anizotropie - body v jistém směru mohou mít na interpolovanou hodnotu jinou váhu než ve směru jiném - okolí tvaru elipsy minimální a maximální počet bodů pro výpočet nové hodnoty rozmístění bodů v rámci definovaného okolí (kvadranty, oktanty) IDW je senzitivní na shluky měřených bodů a také na odlehlé hodnoty Příklad interpolace spojité veličiny metodou inverzní vzdálenosti Prostorové klouzavé průměry Modifikace metody IDW Nová hodnota může být prostým průměrem, váženým průměrem, modální hodnotou. Definování velikosti, tvaru a charakteru okolí. Počet bodů v okolí (min, max) - 4 až 12 bodů, optimum 6 až 8 bodů. Metody je vhodné použít za těchto podmínek: existuje nejistota s ohledem na reprodukovatelnost výsledků opakovaných měření v daném bodě (vlastní proměnlivost pole hodnot měření) samotná technická stránka měření je zatížena jistou chybou je známo, že skutečné prostorové pole daného jevu vykazuje kromě obecného trendu také lokální variabilitu. 9 Interpolace metodou prostorových klouzavých průměrů Interpolace metodou lokálních polynomů Lokální interpolátory využívající regresní analýzy Vazba mezi hodnotami interpolované veličiny a jinými vybranými atributy studovaného prostoru je vyjádřena regresní závislostí pouze pro část interpolovaného povrchu. Tato část povrchu má podobu okolí interpolovaného bodu předem definovaného tvaru a velikosti. Body jsou interpolovány s pravidelným krokem a okolí se ,,posouvá" stejně jako v případě klouzavých průměrů (viz. metoda IDW) Splinové funkce Matematicky definované křivky, které po částech a exaktně interpolují jednotlivé body povrchu, jsou lokálním interpolátorem Zajišťují kontinuální spojení jednotlivých částí interpolovaného povrchu. Lze modifikovat část povrchu bez přepočtu celého povrchu (toto neumožňují trendy). Pro interpolování linií se používá tzv. kubických splinů, pro interpolování povrchů se využívá jejich 2D analogie označované jako ,,thin plate splines" Nahrazují části povrchů interpolované přesným splinem lokálně shlazenou průměrnou hodnotou. Povrch je interpolován tak, aby procházel co nejblíže měřeným bodům a také aby zachoval podmínku minimální křivosti. Interpolované povrchy jsou často značně shlazené, jsou vhodné pro interpolaci jevů, které se mění spojitě. Izolinie vytvořené interpolací gridových hodnot přízemního pole tlaku vzduchu splinovými funkcemi ,,Radial basis functions" Exaktní interpolátory využívající splinové funkce a umělé neuronové sítě Analogie ,,přetažení" gumové membrány přes body v prostoru. Porovnání výsledků interpolace metodami splinových funkcí (RBW) a metodou inverzní vzdálenosti (IDW). ,,Radial basis functions" Princip interpolace metodou multiquadric RBF Hodnotu každé RBF v predikovaném bodě můžeme odečíst z grafu jako 1, 2, 3 . Prediktor má podobu váženého průměru, tedy: ...332211 +++ www Váhy w1, w2 w3 jsou nalezeny na základě podmínky, že pokud je odhadován bod v bodě měření, je interpolován přesně. 10 Multiquadric RBF 22 ),(),( RyxdyxB ii += Bi(x,y) ­ radiální funkce vzdálenosti di(x,y) di(x,y) ­ relativní vzdálenost měřeného bodu v místě xi, yi od místa odhadu x, y R2 ­ vyhlazovací parametr Pro funkce Bi(x,y) jsou během výpočtu v každém interpolovaném bodě stanovovány váhy řešením soustavy lineárních rovnic. Čím větší je hodnota R, tím více je shlazený je výsledný interpolovaný povrch. ,,Radial basis functions" Parametry konkrétní interpolující funkce jsou optimalizovány výpočtem chyby RMSPE. RBF jsou exaktní metodou a jsou vhodné pro hladké povrchy generované z velkého počtu bodů (např. modely terénu). Nehodí se pro interpolaci jevů, které se výrazně mění v prostoru a dále pro interpolaci jevů, u nichž existuje jistá míra nejistoty ohledně přesnosti měřených bodů. Kriging Lokální metody interpolace, které optimalizují výběr bodů okolí, ze kterých je odhadována nová hodnota. K této optimalizaci se provádí tzv. strukturní analýza založená na studiu tzv. strukturních funkcí ­ např. semivariogramu. Semivariogram z empiricky zjištěných dat je nahrazen teoretickým modelem a parametry tohoto modelu jsou použity ve vlastním krigování. Kriging je založen na odhadu závislosti průměrné změny v hodnotách studované veličiny a vzdálenosti měřených bodů. Metody prostorové interpolace ploch Mnoho jevů se vztahuje k plošným jednotkám spíše než k bodům (hustota obyvatelstva, kvalita pitné vody...). Metody řeší způsob, jakým lze odhadnout hodnoty jistého jevu na základě hodnot jiného jevu vázaných na plošné jednotky. * plošné jednotky se shodují * zdrojové jednotky jsou podmnožinou jednotek výstupních * metody zachovávající objem studovaného jevu (volume preserving) * metody nezachovávající objem studovaného jevu (non-volume preserving) Metody nezachovávající objem studovaného jevu 1. výpočet hustoty obyvatelstva pro každou plochu 2. určení centroidu každé plochy 3. interpolace hustoty obyvatelstva výše popsanými metodami Jaká je hustota obyvatelstva uvnitř záplavové zóny? Metody zachovávající objem studovaného jevu 1. Provede se překrytí cílových zón (oblastí) přes oblasti zdrojové. 2. Určí se poměrná část cílové zóny, která spadá do zóny zdrojové. 3. Celková hodnota atributu v cílové zóně je určena v závislosti na plošném zastoupení zón zdrojových. ,,pycnophylatic method" * metoda zachovává sumu studovaného prvku * dovoluje kontinuální změnu směrem k hranicím každé třídy. * výrazně mění min a max hodnoty