3. Metody analýzy časových řad v klimatologii 3.1 Periodicita a cykličnost Klima je vyjádřeno různými prvky (např. teplota vzduchu, srážky, indexy), kolísajícími v prostoru a čase: {a, b, c, …} = f (x, y, z, t), a, b, c, … jsou prvky klimatu, x, y, z jsou prostorové souřadnice a t je čas. Při studiu časových změn platí pro dané místo {a, b, c, …} = f (t). Informace o časových změnách je získávána v podobě časové řady {ai, bi, ci, …} = f (ti) s ti+1 – ti = ∆t = konst., i = 1, 2, …, n ∆t je časový interval (např. den, měsíc, rok) a n je délka řady. Typy kolísání v časových řadách Periodická: s periodou T Cyklická (kvaziperiodická, rytmická): s periodou T Transientní: lineární nebo nelineární trend Náhodná (stochastická) Perioda T ← Cyklus T → Náhodnost Cyklus s periodou Tp: ∆t << Tp << n ∆t Vnitřní cykly: Tp < ∆t Vnější cykly: Tp > n ∆t Podmínky aplikovatelnosti statistických metod • nezávislost hodnot časové řady • stacionarita řady, tj. statistické charakteristiky řady Sj (j = 1,2, …, J) jsou časově nezávislé, tedy ∂Sj / ∂t = konst. • ergodicita, tj. průměr dané řady (výběrový soubor) s jejím prodlužováním v časovém intervalu L se blíží střední hodnotě celé řady (základního souboru) Nesplnění podmínek: výsledky analýzy mají platnost pouze pro danou realizaci časové řady (tj. daný výběr), je třeba testovat výsledky se zřetelem na vlastnosti základního souboru. Nestacionarita – přirozená vlastnost klimatických řad (změny a kolísání klimatu). 3.2 Korelační analýza Korelační koeficient Podmínka použití: hodnoty obou řad jsou nezávislé a mají přibližně normální rozdělení. Autokorelační koeficient Autokovariance Autokorelace Křížově-korelační koeficient 3.3 Harmonická analýza Řada spojitá, nekonečná a periodická – superpozice konečného počtu sinových a kosinových funkcí – Fourierova analýza – Fourierova řada: Pro klimatologické řady, nesplňující uvedené podmínky, lze nahradit Fourierovy koeficienty Besselovou formulí, aplikovatelnou pro přibližně periodickou řadu: Počet harmonik hi = P/i je N/2, hmin = 2∆t, hmax = P. Falešný efekt (aliasing effect) – skutečná kolísání s periodou T1 (5/4∆T) mohou být se zřetelem na interval měření ∆t chybně interpretována periodou T2 (5∆T), kde T2 > T1 3.4 Spektrální analýza Interpretace spektra a) Periodická funkce s periodou T1 b) Periodická funkce s periodami T1 a T2 c) Cyklická kolísání se střední periodou T d) Náhodná čísla (tzv. bílý šum nebo bílé spektrum) e) Náhodná čísla s trendem (tzv. rudý šum nebo rudé spektrum) Schéma spektrální analýzy maximální entropie (Maximum Entropy Spectral Analysis – MESA) 3.5 Křížově-spektrální a koherenční analýza Cxy(h) vyjadřuje podíl oscilací různých frekvencí na celkové kovarianci při nulovém posunu. Qxy(h) vyjadřuje podíl různých harmonik na celkové kovarianci (harmoniky řady x jsou posunuty o ¼ periody zpět a řada y je beze změny). 3.6. Filtrace Schéma filtrace časové řady Filtrační funkce a časová řada a) Bez filtrace – výchozí údaje b) Nízkofrekvenční filtrace c) Vysokofrekvenční filtrace d) Pásmová filtrace Pásmový filtr 3.7 Metody klouzavé analýzy - podmínka stacionarity časové řady může být snadněji splněna v jejich kratších realizacích → aplikace metod klouzavé analýzy Schéma výpočtu dynamické (klouzavé) MESA Time series analysis 3.8 Wavelet analýza - časově-frekvenční analýza signálu v nestacionárních řadách Tab. 1. Mateřské wavelety DOC, Paul, Haar, Kotlet Obr. 1. Reálná (plně) a imaginární (přerušovaně) části mateřských waveletů Obr. 2. Generace waveletů – posun a kontrakce mateřského waveletu pro různé σ a λ Výběr mateřského waveletu • Morlet – dobré časové a frekvenční rozlišení • Paul – malý „cone of influence“ (nekorektní výsledky) Zobrazení výsledků • wavelet power spektrum –kvadrát absolutní hodnoty wavelet transformace • globální wavelet spektrum – integrál wavelet power spektra „podél časové osy“ Rekonstrukce testovacího signálu ← původní signál x(t) Pmax určuje hranice největší (vpravo), resp. nejmenší (vlevo) detekované periody. rozdíl původního a rekonstrukce signálu rekonstruovaného signálu (inverzní wavelet transformace) 3.9 Analýza hlavních komponent (Principal Component Analysis) Cílem metody je eliminování duplicit a zhuštění informace obsažené v původních proměnných do menšího počtu vzájemně nekorelovaných proměnných. Tyto nové proměnné (hlavní komponenty) popisují soubor syntetičtěji a úsporněji. Redukce dimenzionality – příliš mnoho proměnných Příklady: • jedna meteorologická proměnná měřená v n případech na p místech • p meteorologických proměnných měřených na n stanicích v jednom případě • p meteorologických proměnných měřených na jedné stanici v n případech. Je-li p proměnných vysoce korelováno, lze vybrat m proměnných (m << p), které poskytují veškerou originální informaci o p proměnných. Strategie výběru m proměnných: • podsoubor z originálních p proměnných • vytvoření nových proměnných z p původních, které jsou od nich typově odlišné (při téže ztrátě informace lze získat větší redukci dimenzionality) Analýza hlavních komponent • p proměnných x1, x2, …, xp • lineární funkce p proměnných: z = a1x1 + a2x2 + … + apxp, kde a1, a2, ..., ap jsou konstanty • změní-li se konstanty, dostaneme odlišnou lineární funkci a lze spočítat její rozptyl • první hlavní komponenta (PC1) je lineární funkcí, která má maximální možný rozptyl, druhá hlavní komponenta (PC2) je lineární funkcí s maximálně možným rozptylem nekorelovatelná s PC2, třetí hlavní komponenta PC3 je lineární funkcí s maximálně možným rozptylem nekorelovatelná s PC1 a PC2, atd. • PCA nabízí m-dimenzionální prezentaci údajů pro m = 1, 2, …, p – 1, tedy pro každé m = 1, 2, …, p – 1 dostáváme m lineárních funkcí proměnných x1, x2, …, xp ukazující maximálně možný podíl originálních variací σ µ− = i i x t Příklad (dvourozměrný): • 50 měření teploty půdy (x1) a teploty vzduchu (x2) • lineární funkce x1 a x2 objasňuje více kolísání než každá proměnná samostatně • lineární funkce, která maximalizuje rozptyl, je první PC – z1, tj. všechna kolísání mohou být nyní vyjádřena s ohledem na z1 • obrázky se shodují s tím, že došlo k rotaci os – druhá PC (z2) jde pak kolmo na z1 • PC minimalizuje sumu čtverců podle vzdáleností kolmých k z1 (předchozí podle vertikálních vzdáleností) Vlastní hodnoty a vlastní vektory (eigenvalues and eigenvectors) • k-tá hlavní komponenta je dána vztahem z1 = ak1x1 + ak2x2 + … + akpxp pro k = 1, 2, …, p • vlastní vektory: první vlastní vektor – koeficienty a11, a12, …, a1p; další vlastní vektory jsou tvořeny koeficienty u proměnných x1, x2, …, xp • vlastní hodnota – rozptyl první hlavní komponenty (míra významnosti objasněných kolísání) Vstupní matice výpočtu a standardizace hodnot • standardizací se přisuzuje proměnným stejná váha (např. proměnné v různých jednotkách) Příklad – typický výstup PCA (I) • pořadové číslo nové proměnné (PC - hlavní komponenty) • vlastní hodnota – část z celkového rozptylu původních dat vysvětlená každou z nových komponent • procentuální vyjádření množství rozptylu vysvětleného komponentou • kumulativní hodnota procentuálního podílu vysvětleného příslušnými komponentani (např. první 4 komponenty vysvětlují 85,68 % celkové variability původních dat) • tzv. sutinový graf sloužící k určení počtu významných komponent Příklad – typický výstup PCA (II) Tzv. zátěže (loadings) - představují míru korelace mezi původními a novými proměnnými. Doporučená literatura: Brázdil, R. (1991): Kolísání vybraných meteorologických prvků ve střední Evropě v období přístrojových pozorování. Národní klimatický program ČSFR, sv. 2, Praha, 56 s. Pišoft, P., Kalvová, J. (2005): Wavelet analýza v meteorologii: teorie a přehled dosavadních výsledků. Meteorologické zprávy, 58, č. 1, s. 1-6. Pišoft, P., Kalvová, J., Brázdil, R. (2004): Cycles and trends in the Czech temperature series using wavelet transforms. International Journal of Climatology, 24, 1661-1670. Schönwiese, C.-D. (1985): Praktische Statistik für Meteorologen und Geowissenschaftler. Gebrüder Borntraeger, Berlin, Stuttgart, 231 s. Storch, H. von, Zwiers, F. W. (1999): Statistical Analysis in Climate Research. Cambridge University Press, Cambridge, 484 s.