Stochastické metody interpolace I. Strukturní analýza (variografie) Strukturní analýza a metody krigingu Žádná z dosud zmíněných interpolačních metod neřešila následující problémy: • počet bodů nutných k výpočtu lokálního průměru • velikost orientaci a tvar okolí • zda neexistuje jiná cesta k definování vah než funkce vzdálenosti bodů • jaké jsou chyby a nejistoty spojené s interpolovanými hodnotami Odpovědi poskytují geostatistické postupy založené na tzv. strukturní analýze. Její výsledky jsou využitelné v interpolačních postupech krigingu. Základní komponenty spojitého povrchu I - trendová složka - drift ii - regionalizovaná (prostorová) proměnná iii - náhodná složka Základní komponenty spojitého povrchu Z(x)- fi{x) + s'{x) + s x - pozice v 1, 2 či 3 rozměrném prostoru Z - interpolovaná proměnná Z(x) - hodnota proměnné v bodě x fj(x) - deterministická složka (trend) s'(x) - stochastická složka (regionalizovaná proměnná) - lokálně proměnné, ale prostorově závislé reziduum od fj(x) s" - náhodná, prostorově nezávislá složka, gaussovský šum s nulovým průměrem a s rozptylem a2. Velké písmeno Z značí, že se jedná o náhodnou funkci a ne o měřenou hodnotu proměnné z. Odhad jednotlivých komponent z(x)=ju(x)+s-(x)+s" 1) Trendová složka se odhadne vhodnou funkcí a odečte. Pokud je trend nulový, potom |j(x) bude rovno průměru hodnot z. Průměrný (očekávaný E = expected) rozdíl mezi jakýmikoliv dvojicemi hodnot kde Z(x) a Z(X+h) bude nula E[Z(x)-Z(x + h)] = 0 Z(x) a Z(X+h) jsou odhady hodnot náhodné proměnné z v poloze x, x+h. 2) Rozptyl rozdílů závisí pouze na vzdálenosti mezi místy, ne na poloze (podmínka stacionarity) tedy: e[{Z(x) - Z(x + h)f ] = e[{s' (x) - s\x + h)f ] = 2y(h) Y(h) - semivariance Pokud máme odhad proměnné /j(x), zbývající kolísání má konstantní rozptyl a diference mezi dvěma místy jsou pouze funkcí jejich vzdálenosti: Z(x) = ju(x) + y(h) + £" Strukturní analýza (variografie) • Geostatistická strukturní analýza - procedura zahrnující výpočet strukturálních funkcí, výběr a konstrukci odpovídajících teoretických modelů a jejich aplikace, interpretaci průběhu strukturálních funkcí. • Cílem je popsat takové vlastnosti jako jsou kontinuita, homogenita, stacionarita či anizotropie pole studovaných prostorových proměnných veličin. • Tyto vlastnosti jsou popisovány prostřednictvím měr prostorové autokorelace a prostorové variability. • Ke kvantifikaci prostorové autokorelace, která vyjadřuje skutečnost, že objekty blízké si jsou více podobné než objekty vzdálenější slouží strukturální funkce - měří sílu korelačního vztahu jako funkci vzdálenosti. • Strukturní analýza je výchozím krokem geostatistické ho modelování. • Sama o sobě ale poskytuje řadu velmi důležitých informací o struktuře náhodného pole jako modelu konkrétního objektu v krajinné sféře. Příklad výpočtu měr prostorové variability pro 1D - řadu hodnot i 2 3 4 S 6 7 B průměr - (l+3+6+5+3+l+2+3)/8-3,0 rozptyl-[(l-3)2+(3-3)2+(6-3)2+(5-3)2+(3-3)2+(l-3)2+(2-3)2+(2-3)2]/8-2,75 kovariance(l)-[(l-3) *(3-3) + (3-3)*(6-3) + (6-3)*(5-3) + (5-3)*(3-3) + (3-3)*(l-3) + (l-3)*(2-3) + (2-3)*(3-3)J/7-1,14 semivariance(l)-[(l-3)2+(3-6)2+(6-5)2+(5-3)2+(3-l)2+(l-2)2+(2-3)2]/7-3,43 semivariance(2)-[(l-6)2+(3-5)2+(6-3)2+(5-l)2+(3-2)2+(l-3)2]/6-9,83 semivariance(3)-[(l-5)2+(3-3)2+(6-l)2+(5-2)2+(3-3)2]/5-12,50 Semivariance jako strukturální funkce r(h)=±[z(x)-z(x+h)Y Jsou-li dva body blízko sebe (h je malé), bude rozdíl hodnot studované veličiny Z(x) těchto bodechmalý. S růstem vzdálenosti si budou hodnoty méně podobné. Grafickým vyjádřením závislosti semivariance na vzdálenostije strukturální funkce nazývaná semivariogram. Semivariogram(l) je mírou nepodobnosti. Jinou strukturální funkcí j e kovarianční funkce - taje mírou podobnosti (2). Obě jsou měrami prostorové autokorelace. (1) ,..... (2I c-r.,v Experimentální semivariogram Strukturní analýza - výpočet semivariogramu z naměřených dat: f(h). n - počet dvojic bodů pozorování proměnné s atributem z vzdálených o hodnotu h h - tzv. lag - vzdálenost dané dvojice bodů. r(h) Experimentální semivariogram (+) s charakteristickými hodnotami pro vzdálenosti h (•) a proloženýteoretický model semivariogramu (plná čára) Prvky semivariogramu d - dosah (range), c0 - zbytkový rozptyl (nugget), c=c0 + c1- práh (sill), h - lag (krok vzdálenosti), d - rozpětí Efekt anizotropie Princip grupovaní hodnot semivariancí na základě podobné vzdálenosti a plošný graf semivariance (4). Efekt anizotropie Povrch vykazující efekt anizotropie a odpovídající empirické semivariogramy Anizotropní semivariogram se liší především odlišnou hodnotou dosahu pro specifické směry další charakteristiky semivariogramu (typ, práh, zbytkový rozptyl) se většinou nemění. Takovouto anizotropii označujeme jako geometrickou. V případě, že nelze použít stejný model semivariogramu resp. stejné hodnoty prahu a zbytkového rozptylu hovoříme o tzv. zonální anizotropii. Parametry tzv. směrových semivariogramů ■ úhlová tolerance ■ šířka pásma ■ délková tolerance (lag) Efekt anizotropie je vyjádřením náhodného procesu chování studované veličiny. Nelze ho zaměňovat s trendovou složkou Teoretický semivariogram ?(h) = ±±(z(x,)-z(x,+h)Y 2n ti Je to model, který nejlépe aproximuje průběh experimentálního semivariogramů v okolí počátku a prahu. Právě proces hledání teoretického semivariogramů se někdy označuje jako strukturní analýza. Modely semivariogramů se dělí podle chování v okolí počátku a v „nekonečnu" do několika skupin: • modely přechodového typu - tj. s prahem (sférický, kvadratický, gaussovský, exponenciální), • modely bez přechodu (lineární, logaritmický), • modely s oscilujícím prahem (sinový, cosinový), • čistě náhodný model Sférický model 7„(B d c, S' "AO) c0 y(h) - c0 + c. 3 h _ líh^ la 2\a> pro h < a y(h) = c0 + c, pro h>a Exponenciální model y(h) = c0 +Cj * [l-exp(-/z/íi)] kde a = 3d Lineární model 1(h) Tíhl) --------^ y {H) = CQ + bh kde b je směrnice přímky Sinový model Wh) _d_ s: G Cn h , *. , sin(gA) f(Ä) = c0+c,l--kde g=nlm L g" i Náhodný model y(h) = c0 Složené modely yT{h) = yl{h) + y1{h) + r,{h) + . Indikátorové modely semivariogramů - konstruují se a využívají při strukturální analýze nominálních (kvalitativních) dat (barva, druh horniny). Analýza a interpretace strukturálních funkcí I. • Konstrukci semivariogramů a odvození teoretického modelu by měla předcházet důkladná analýza vstupních dat (ESDA) • Důležitý je počet bodů uvažovaných pro vyjádření hodnot semivariance pro daný lag (h). Značný podíl šumu ve variogramu může být způsoben malým rozsahem vzorku použitého k výpočtu. J.'* "" • K dosažení stabilních hodnot se doporučuje 20-30, v některých případech však až 50-100 hodnot. Je-li jejich počet nízký, stoupá chyba odhadu. • Lag (h) se volí jako průměrná minimální vzdálenost mezi sousedními body. • Výpočet experimentálních semivariogramů se doporučuje provádět do vzdálenosti h < L/2, kde Lje maximální vzdálenost míst pozorovánív poli. • Úroveň prahu se obvykle volí podle hodnoty statistického rozptylu. • Při analýze anizotropie je podle zkušenosti dobré volit pro všechny směrové semivariogramy stejný teoretický model. Analýza a interpretace strukturálních funkcí • Hladší průběh semivariogramů lze docílit zvětšením velikosti vyhledávacího okna (větším h). • Přítomnost trendu způsobuje nárůst hodnot empirického semivariogramů a nemá dobře patrnou hodnotu dosahu Analýza a interpretace strukturálních funkcí Větší či menší proměnlivost dat se promítá do chování variogramu především v jeho počátku WW • Přednost má jednodušší teoretický model semivariogramů, který dobře vystihuje hlavní rysy experimentálních hodnot především v počátku před modelem složitějším. • V případě výpočtu experimentálního semivariogramů z nepravidelně sítě pozorování je nutno počítat s vyšší „rozkolísanosti" stanovených bodů kolem teoretického modelu. Analýza a interpretace strukturálních funkcí • Zbytkový rozptyl (nugget effect) je případ, kdy teoretický model nevychází z počátku • Může být výsledkem chyb měření • Může však vyjadřovat také tzv. mikrovariabilitu - tedy variabilitu na velmi krátké vzdálenosti, kratší než je nejmenší vzdálenost vstupních datových bodů • Při interpolaci metodou krigování bude existence zbytkového rozptylu znamenat, že interpolace již nebude exaktní ale aproximující metodou • V počáteční fázi aplikace geostatistických metod na přírodní objekt se provede podrobná interpretace strukturálních funkcí a v následných fázích se podle získaných zkušeností použije zjednodušený základní model. •Analýza semivariogramů je podstatným krokem k určení optimálních vah pro interpolaci. Jestliže ve semivariogamu dominuje náhodná složka (£"), potom data obsahují takový šum, že interpolace nemá smysl. Jako nejlepší odhad z(x) je vhodné použít průměrnou hodnotu. Charakteristiky pole popsané strukturní analýzou : d- dosah rozpětí ■ zbytkový rozptyl \: c=c0 + c, - práh h- Kontinuita - je vyjádřena hodnotou dosahu. Pole s větší kontinuitou se vyznačuje vyšší prostorovou autokorelací. Nehomogenita - projevuje se tzv. oscilací hodnoty prahu. Délka poloviny periody odpovídá průměrnému rozměru elementů nehomogenity. Nehomogenity na dané úrovni pozorování nepostižitelné se projeví jako zbytkový rozptyl. Nestacionarita - projevuje se zpravidla parabolickým nárůstem křivky semivariogramů. Prokazatelná je případech, kdy dochází k parabolickému růstu křivky až za hodnotou dosahu, tedy na stabilizované části křivky. Nestacionarita pole dokládá změnu průměrné hodnoty proměnné v poli. Anizotropie - lze ji popsat pomocí modelů jednotlivých směrových semivariogramů (tj. semivariogramů vypočtených na různých směrech v poli). Projevuje se změnami parametrů (dosahu, prahu, zbytkového rozptylu), jednak v rozdílech typů směrových semivariogramů. Rozlišujeme geometrickou a zonální anizotropii. Strukturní analýza jako nástroj průzkumové analýzy prostorových dat V explorační analýze slouží strukturní analýza především k • detekování míry prostorové autokorelace • vystižení míry anizotropie, • odhalení odlehlých hodnot. Sernivaiiogram j tovaru™ Základní nástroje průzkumové analýzy prostorových dat Příklad identifikace bodů, které se odlišují od obecného modelu prostorové autokorelace spojité veličiny. Tento model je vyjádřen grafem (semivariogram) Základní nástroje průzkumové analýzy prostorových dat Detekce odlehlých hodnot (outliers) Základní nástroje: p"*V. 1 «r • histogram | ^°V^ • semivariogram/ covariance cloud • Voronoi map Detekce globální (vlevo) a lokální (vpravo) odlehlé hodnoty. Základní nástroje průzkumové analýzy prostorových dat Vyšetřování tvaru okolí - izotropní a anizotropní povrch Hodnoty semivariance pro směr definovaný na obr. vlevo jsou menší (tedy více podobné) než hodnoty semivariance bodů ve směru definovaném na obr. vpravo) To indikuje, že semivariance jako míra podobnosti závisí na směru, kterým je měřena -tzv izotropní povrch. Okolí bodu bude potřeba definovat jako asymetrické.