3. Metody analýzy časových řad v klimatologii
3.1 Periodicita a cykličnost
Klima je vyjádřeno různými prvky (např. teplota vzduchu, srážky, indexy), kolísajícími v
prostoru a čase:
{a, b, c, …} = f (x, y, z, t),
a, b, c, … jsou prvky klimatu, x, y, z jsou prostorové souřadnice a t je čas.
Při studiu časových změn platí pro dané místo
{a, b, c, …} = f (t).
Informace o časových změnách je získávána v podobě časové řady
{ai, bi, ci, …} = f (ti) s ti+1 – ti = ∆t = konst., i = 1, 2, …, n
∆t je časový interval (např. den, měsíc, rok) a n je délka řady.
Typy kolísání v časových řadách
Periodická: s periodou T Cyklická (kvaziperiodická, rytmická):
s periodou T
Transientní: lineární nebo nelineární trend Náhodná (stochastická)
Perioda T ← Cyklus T → Náhodnost
Cyklus s periodou Tp: ∆t << Tp << n ∆t
Vnitřní cykly: Tp < ∆t Vnější cykly: Tp > n ∆t
Podmínky aplikovatelnosti statistických metod
• nezávislost hodnot časové řady
• stacionarita řady, tj. statistické charakteristiky řady Sj (j = 1,2, …, J) jsou časově
nezávislé, tedy ∂Sj / ∂t = konst.
• ergodicita, tj. průměr dané řady (výběrový soubor) s jejím prodlužováním v časovém
intervalu L se blíží střední hodnotě celé řady (základního souboru)
Nesplnění podmínek: výsledky analýzy mají platnost pouze pro danou realizaci časové řady
(tj. daný výběr), je třeba testovat výsledky se zřetelem na vlastnosti základního souboru.
Nestacionarita – přirozená vlastnost klimatických řad (změny a kolísání klimatu).
3.2 Korelační analýza
Korelační koeficient
Podmínka použití: hodnoty obou řad jsou nezávislé a mají přibližně normální rozdělení.
Autokorelační koeficient
Autokovariance
Autokorelace
Křížově-korelační koeficient
3.3 Harmonická analýza
Řada spojitá, nekonečná a periodická – superpozice konečného počtu sinových a kosinových
funkcí – Fourierova analýza – Fourierova řada:
Pro klimatologické řady, nesplňující uvedené podmínky, lze nahradit Fourierovy koeficienty
Besselovou formulí, aplikovatelnou pro přibližně periodickou řadu:
Počet harmonik hi = P/i je N/2, hmin = 2∆t, hmax = P.
Falešný efekt (aliasing effect) – skutečná kolísání s periodou T1 (5/4∆T) mohou být se
zřetelem na interval měření ∆t chybně interpretována periodou T2 (5∆T), kde T2 > T1
3.4 Spektrální analýza
Interpretace spektra
a) Periodická funkce s periodou T1
b) Periodická funkce s periodami T1 a T2
c) Cyklická kolísání se střední periodou T
d) Náhodná čísla (tzv. bílý šum nebo bílé spektrum)
e) Náhodná čísla s trendem (tzv. rudý šum nebo rudé spektrum)
Schéma spektrální analýzy maximální entropie (Maximum Entropy Spectral Analysis –
MESA)
3.5 Křížově-spektrální a koherenční analýza
Cxy(h) vyjadřuje podíl oscilací různých frekvencí na celkové kovarianci při nulovém posunu.
Qxy(h) vyjadřuje podíl různých harmonik na celkové kovarianci (harmoniky řady x jsou
posunuty o ¼ periody zpět a řada y je beze změny).
3.6. Filtrace
Schéma filtrace časové řady
Filtrační funkce a časová řada
a) Bez filtrace – výchozí údaje
b) Nízkofrekvenční filtrace
c) Vysokofrekvenční filtrace
d) Pásmová filtrace
Pásmový filtr
3.7 Metody klouzavé analýzy
- podmínka stacionarity časové řady může být snadněji splněna v jejich kratších realizacích →
aplikace metod klouzavé analýzy
Schéma výpočtu dynamické (klouzavé) MESA
Time series analysis
3.8 Wavelet analýza
- časově-frekvenční analýza signálu v nestacionárních řadách
Tab. 1. Mateřské wavelety DOC, Paul, Haar, Kotlet
Obr. 1. Reálná (plně) a imaginární (přerušovaně) části mateřských waveletů
Obr. 2. Generace waveletů – posun a kontrakce mateřského waveletu pro různé σ a λ
Výběr mateřského waveletu
• Morlet – dobré časové a frekvenční rozlišení
• Paul – malý „cone of influence“ (nekorektní výsledky)
Zobrazení výsledků
• wavelet power spektrum –kvadrát absolutní hodnoty wavelet transformace
• globální wavelet spektrum – integrál wavelet power spektra „podél časové osy“
Rekonstrukce testovacího signálu
← původní signál
x(t)
Pmax určuje hranice
největší (vpravo),
resp. nejmenší
(vlevo) detekované
periody.
rozdíl původního a rekonstrukce signálu
rekonstruovaného signálu (inverzní wavelet transformace)
3.9 Analýza hlavních komponent (Principal Component Analysis)
Cílem metody je eliminování duplicit a zhuštění informace obsažené v původních
proměnných do menšího počtu vzájemně nekorelovaných proměnných. Tyto nové proměnné
(hlavní komponenty) popisují soubor syntetičtěji a úsporněji.
Redukce dimenzionality – příliš mnoho proměnných
Příklady:
• jedna meteorologická proměnná měřená v n případech na p místech
• p meteorologických proměnných měřených na n stanicích v jednom případě
• p meteorologických proměnných měřených na jedné stanici v n případech.
Je-li p proměnných vysoce korelováno, lze vybrat m proměnných (m << p), které poskytují
veškerou originální informaci o p proměnných.
Strategie výběru m proměnných:
• podsoubor z originálních p proměnných
• vytvoření nových proměnných z p původních, které jsou od nich typově odlišné (při
téže ztrátě informace lze získat větší redukci dimenzionality)
Analýza hlavních komponent
• p proměnných x1, x2, …, xp
• lineární funkce p proměnných: z = a1x1 + a2x2 + … + apxp, kde a1, a2, ..., ap jsou
konstanty
• změní-li se konstanty, dostaneme odlišnou lineární funkci a lze spočítat její rozptyl
• první hlavní komponenta (PC1) je lineární funkcí, která má maximální možný rozptyl,
druhá hlavní komponenta (PC2) je lineární funkcí s maximálně možným rozptylem
nekorelovatelná s PC2, třetí hlavní komponenta PC3 je lineární funkcí s maximálně
možným rozptylem nekorelovatelná s PC1 a PC2, atd.
• PCA nabízí m-dimenzionální prezentaci údajů pro m = 1, 2, …, p – 1, tedy pro každé
m = 1, 2, …, p – 1 dostáváme m lineárních funkcí proměnných x1, x2, …, xp ukazující
maximálně možný podíl originálních variací
σ
µ−
= i
i
x
t
Příklad (dvourozměrný):
• 50 měření teploty půdy (x1) a teploty
vzduchu (x2)
• lineární funkce x1 a x2 objasňuje více
kolísání než každá proměnná samostatně
• lineární funkce, která maximalizuje
rozptyl, je první PC – z1, tj. všechna
kolísání mohou být nyní vyjádřena s
ohledem na z1
• obrázky se shodují s tím, že došlo k
rotaci os – druhá PC (z2) jde pak kolmo
na z1
• PC minimalizuje sumu čtverců podle
vzdáleností kolmých k z1 (předchozí
podle vertikálních vzdáleností)
Vlastní hodnoty a vlastní vektory (eigenvalues and eigenvectors)
• k-tá hlavní komponenta je dána vztahem z1 = ak1x1 + ak2x2 + … + akpxp pro k = 1,
2, …, p
• vlastní vektory: první vlastní vektor – koeficienty a11, a12, …, a1p; další vlastní
vektory jsou tvořeny koeficienty u proměnných x1, x2, …, xp
• vlastní hodnota – rozptyl první hlavní komponenty (míra významnosti objasněných
kolísání)
Vstupní matice výpočtu a standardizace hodnot
• standardizací se přisuzuje proměnným stejná váha
(např. proměnné v různých jednotkách)
Příklad – typický výstup PCA (I)
• pořadové číslo nové proměnné (PC - hlavní komponenty)
• vlastní hodnota – část z celkového rozptylu původních dat vysvětlená každou z
nových komponent
• procentuální vyjádření množství rozptylu vysvětleného komponentou
• kumulativní hodnota procentuálního podílu vysvětleného příslušnými komponentani
(např. první 4 komponenty vysvětlují 85,68 % celkové variability původních dat)
• tzv. sutinový graf sloužící k určení počtu významných komponent
Příklad – typický výstup PCA (II)
Tzv. zátěže (loadings) - představují míru korelace mezi původními a novými proměnnými.
Doporučená literatura:
Brázdil, R. (1991): Kolísání vybraných meteorologických prvků ve střední Evropě v období
přístrojových pozorování. Národní klimatický program ČSFR, sv. 2, Praha, 56 s.
Pišoft, P., Kalvová, J. (2005): Wavelet analýza v meteorologii: teorie a přehled dosavadních
výsledků. Meteorologické zprávy, 58, č. 1, s. 1-6.
Pišoft, P., Kalvová, J., Brázdil, R. (2004): Cycles and trends in the Czech temperature series
using wavelet transforms. International Journal of Climatology, 24, 1661-1670.
Schönwiese, C.-D. (1985): Praktische Statistik für Meteorologen und Geowissenschaftler.
Gebrüder Borntraeger, Berlin, Stuttgart, 231 s.
Storch, H. von, Zwiers, F. W. (1999): Statistical Analysis in Climate Research. Cambridge
University Press, Cambridge, 484 s.