1
Statistické metody a zpracování dat
VIII Analýza časových řad
Petr Dobrovolný
Základní pojmy
nyyy ,,, 21 L
ty , kde t=1, 2, ..., n
y = ukazatel
t = časová proměnná
n = počet členů řady
( )tfyt =
Časová řada je chronologicky uspořádaná posloupnost
hodnot určitého statistického ukazatele.
Pomocí časových řad můžeme zkoumat dynamiku
jevů v čase.
Mají základní význam pro analýzu příčin, které na
tyto jevy působily a ovlivňovaly jejich chování v
minulosti, tak pro předvídání jejich budoucího vývoje.
Vývoj cen akcií
Objem obchodování na burze
Vývoj počtu obyvatelstva určité lokality
Maximální denní srážkové úhrny na určité stanici
Průměrné měsíční teploty vzduchu na určité stanici
Průměrný roční odtok vody z povodí
Příklady časových řad a jejich použití
Obchodní den
0
50
100
150
200
250
300
2 4 6 8 10 12 14 16 18 20
Objem obchodu
(úseková řada)
Kurz akcie
(okamžiková řada)
Základní typy časových řad
Časové řady deterministické - neobsahují prvek náhody
(sin(x)) a stochastické (realizace náhodného procesu)
Časové řady absolutních veličin (přímo zjišťovaných)
* okamžikové (počet obyvatel ­ k datu sčítání)
* intervalové (denní úhrn srážek)
Časové řady odvozené
* průměrných veličin (řada klouzavých průměrů)
* poměrných ­ relativních veličin (řada hektarových výnosů)
Časové řady ekvidistantní a neekvidistantní
* Problém volby časových bodů pozorování
* Problémy s délkou časové řady
* Problémy s kalendářem
* Problémy s nesrovnatelností jednotlivých měření
Problémy při sestavování časových řad
Uvedené problémy mohou vést k
narušení homogenity časové řady
Zásady pro sestavování časových řad
Metadata (data o datech) ­ historie měření
vyšetřovaného prvku na meteorologické stanici, data
výměny přístrojů, změny pozorovatelů, změny
metodiky měření, ...
Homogenita časové řady ­ hodnoty jednotlivých
členů pozorované řady odrážejí jen přirozenou
proměnlivost studované veličiny a nejsou ovlivněny
vnějšími vlivy.
* absolutní homogenita řady
* relativní homogenita řady ­ posuzování
homogenity vůči řadě homogenní (vzorové)
Doplňování chybějících členů řady
Vylučování odlehlých hodnot.
2
b
0
10
20
30
40
50
60
70
80
90
1921 1931 1941 1951 1961 1971 1981 1991
a
10
15
20
25
30
35
40
45
1921 1931 1941 1951 1961 1971 1981 1991
Příklad nehomogenní řady
Maximální denní nárazy větru a počty dnů s nárazy větru na
stanici Praha, Karlov v období 1921-1990
Okamžikové časové řady
Jsou spojité v čase, záleží u nich na rozhodném okamžiku šetření.
Hodnota nezávisí na délce intervalu, za který je znak zjišťován.
Okamžikové ukazatele za několik intervalů nesčítáme. Je však pro
ně typické počítání průměrů v čase. Průměr okamžikové veličiny za
určité období označujeme jako tzv. chronologický průměr.
Nejprve spočteme průměr za časové okamžiky ti-1 a ti, pro i=2 až n.
Z těchto hodnot určíme průměr pro celou řadu:
Uvedený vztah platí v případě, že délka všech intervalů je
konstantní. Pokud ne, je nutné jednotlivé dílčí průměry vážit
délkami intervalů a vypočítat vážený chronologický průměr.
1
2
1
...
2
1
121
-
++++
=
-
n
yyyy
y
nn
Intervalové časové řady
Jednotlivé hodnoty se vztahují k časovým úsekům a přímo závisí
na jejich délce. Za delší časové období lze intervalové ukazatele
shrnovat a vytvářet součtové (kumulativní) řady. Součtová řada
vznikne postupným sčítáním hodnot za sebou jdoucích časových
intervalů. Podle průběhu součtové řady můžeme posoudit
rovnoměrnost vývoje hodnot znaku.
Hodnotu intervalového ukazatele zjištěnou za časový interval (ti-1,
ti) označme qi a přiřazujeme-ji ke středu časového intervalu.
Časovou řadu hodnot qi označujeme intervalovou řadou běžných
hodnot.
Požadavkem sestavování intervalových časových řad je
konstantnost délky časového intervalu. V řadě případů tento
požadavek není splněn (např. počet dnů v měsíci).
Dalším typem součtových časových řad jsou řady klouzavých
úhrnů. Jsou vhodné ke srovnání úrovně řady ve sledovaném
období s úrovní řady období předešlého.
Z - diagram
Řady běžných hodnot, řady kumulovaných hodnot a řady
klouzavých úhrnů lze znázornit v tzv. Z-diagramu
m ěsíc e
tis. K č
0
400
800
1200
1600
1 2 3 4 5 6 7 8 9 10 11 12
řada běžných hodnot
(měsíčních)
řada kumulovaných
hodnot
(od počátku roku)
řada klouzavých hodnot
(za posledních 12 měsíců)
Odvozené časové řady
Jedná se o řady sestavné z průměrů či z relativních
(poměrných) hodnot. V podstatě se jedná o řady okamžikové.
Průměr okamžikového ukazatele je též okamžikovou veličinou.
Nejedná se u nich o závislost na délce intervalu, ale na
hodnotách znaku v daném intervalu (např. průměrné počty
zaměstnanců místo okamžikových údajů či tzv. klouzavé
průměry na místo ročních hodnot ­ viz. obr.)
0
10
20
30
40
50
1961 1966 1971 1976 1981 1986
Odvozené ukazatele časové řady
Při práci s časovými řadami je typické, že často
pracujeme ne přímo s původní časovou řadou, ale
s nějakou její transformací.
Absolutní přírůstek (první diference)
Jsou-li členy v řadě absolutních přírůstků prakticky
konstantní, potom řada má lineární trend.
Relativní přírůstek
Informuje nás o rychlosti (tempu) růstu
1--= ttt yyy
1
11
1
1
-=
-
=

=
--
-
i
i
i
ii
i
i
i
y
y
y
yy
y
y

3
Odvozené ukazatele časové řady
Koeficient růstu (řetězový index): vyjadřuje, o kolik
procent vzrostla hodnota časové řady v okamžiku ti
ve srovnání s hodnotou řady v čase ti-1.
Průměrný koeficient růstu: pro celou řadu se
vypočte jako geometrický průměr jednotlivých
hodnot koeficientů růstu.
Uvedený výpočet je vhodný pouze v případě stálého a
přibližně stejného růstu hodnot řady.
(%)1001
1
=+=
-i
i
ii
y
y
k 
1
1
1
12
3
1
21
121 ...... --
-
-
=== n
n
n
n
nn
n
y
y
y
y
y
y
y
y
kkkk
Odvozené ukazatele časové řady
Pro účely srovnání různých časových řad se jejich
hodnoty převádějí na tzv. bazické indexy (indexy
se stálým základem):
Hodnota yz je obvykle prvním nebo posledním
členem časové řady (základ).
(%)100'
=
z
i
i
y
y
k
Transformace časové řady
Jedná se o úpravu původní časové řady, tak aby
1. splňovala podmínky pro následnou analýzu (např.
linearizace, stacionarita atd.)
2. zvýrazňovala dále analyzovanou složku
* přidání konstanty y = y + C
* linearizace řady y = ln(y)
* odečtení průměru
* standardizace
* odečtení hodnot trendové funkce (viz.
stacionarita)


 -
=
ds
yy
y
yyy -=
Běžné druhy transformací:
Stacionární řada
Časovou řadu považujeme za stacionární, pokud
splňuje následující podmínky:
* má konstantní průměr
* má konstantní variabilitu
* korelace dvou časově posunutých pozorování
(autokorelace) závisí na délce posunu
Stacionarita je jednou z nutných podmínek řady
metod analýzy časové řady
Stacionarity lze docílit transformací na řadu diferencí
či odečtením trendu
Základy analýzy časových řad
Hlavní cíle analýzy časových řad
1. odhalení zákonitostí a příčin
dosavadního vývoje
2. prognóza chování časových
řad
Každá řada může obsahovat čtyři základní složky:
* trend (Tt)
* periodická (sezónní) složka (St)
* cyklická složka (Ct)
* náhodná složka (t)
První tři složky tvoří systematickou část řady.
Trendová složka časové řady
* Trend je obecná tendence vývoje zkoumaného
jevu za dlouhé období.
* Je výsledkem dlouhodobých a stálých procesů (v
měřítku posuzované délky časové řady).
* Trend může být lineární či nelineární.
* Trend může být rostoucí, klesající nebo může
existovat řada bez trendu (s nulovým trendem).
* Časové řady bez trendu se označují jako
stacionární.
4
Periodická složka časové řady
* Periodická složka je pravidelně se opakující
odchylka od trendové složky s pevnou délkou
periody T.
* Perioda této složky je menší než celková velikost
sledovaného období.
* Typickým případem jsou sezónní kolísání a nebo
řady denních, měsíčních, čtvrtletních ukazatelů.
* Příčiny sezónnosti jsou různé, většinou však dobře
definovatelné.
* Sezónnost je typická pro časové řady
ekonomických ukazatelů.
)()( Ttftf ii +=
Cyklická složka
* Cyklická složka udává kolísání okolo trendu v
důsledku dlouhodobého cyklického vývoje.
* Cyklická složka může vykazovat změny v délce a
amplitudě cyklu.
* Délka cyklu je tedy většinou neznámá. (př.
demografický trend, kolísání teploty vzduchu).
* Délka cyklu je tedy delší než 1 rok. V některých
případech se označuje jako ,,střednědobý trend".
* Bývá typickou součástí časových řad meteorologických
prvků (př. problém globálního oteplování) či
hydrologických jevů.
6,0
7,0
8,0
9,0
10,0
11,0
12,0
1961 1966 1971 1976 1981 1986
)()( Ttftf ii +
Náhodná složka časové řady
* Náhodná (stochastická) složka se nedá popsat
žádnou funkcí času.
* "Zbývá" po vyloučení trendu, sezónní a cyklické
složky.
* Jejím zdrojem jsou v jednotlivostech
nepostižitelné jevy.
* Lze ji však popsat pravděpodobnostně.
* Prvotní analýza spočívá v grafickém znázornění průběhu řady.
* Graf slouží k prvotnímu posouzení tendence změn či k hledání
opakujících se jevů (,,patterns").
* I tyto jednoduché metody umožňují velmi krátkodobou
předpověď.
* Graf však velmi dobře může znázorňovat nehomogenity,
porovnávat dvě či více řad mezi sebou, ...
* Slouží k výběru vhodné metody analýzy.
Grafické metody analýzy časových řad
Index severoatlantské cirkulace (NAOI), XII-II
-4
-3
-2
-1
0
1
2
3
1500 1550 1600 1650 1700 1750 1800 1850 1900 1950 2000
Vývoj kurzu akcií ­ příklad výskytu jednoduchých obrazců
(patterns) v časové řadě
Grafické metody analýzy časových řad Modely analýzy časových řad
Časová řada ­ hodnota ukazatele je funkcí času
a náhodné složky:
( )tt tfy ,=
K analýze a popisu časových řad se používá
několika základních modelů:
A. Klasický (formální) model
B. Box-Jenkinsova metodologie
C. Lineární dynamické a regresní modely
D. Spektrální analýza
5
Klasický (formální) model
Klasický model je pouze popisem jednotlivých složek
časové řady jako forem pohybu, ne poznáním příčin.
Jedná se o dekompozici na jednotlivé složky a jejich
formální popis modelem:
* Aditivním
* Multiplikativním
Základem je popis systematické složky (trendu,
cyklických a periodických kolísání).
Vychází se z předpokladu, že jednotlivá pozorování jsou
vzájemně nekorelovaná (viz. také problém stacionarity
časových řad).
Aditivní model
ttttttt CSTYy  +++=+=
Model časové řady s aditivní sezónní složkou
Multiplikativní model
ttttt CSTy =
Model časové řady s multiplikativní sezónní složkou
Analýza trendu
A. Klasický přístup založený na matematickostatistickém
modelování. Modelované parametry jsou
KONSTANTNÍ v čase. Neadaptivní metody ­ např.
regresní modely. Umožňují snadnou předpověď
(spolehlivou?).
B. Adaptivní přístup ­ parametry se v čase VYVÍJEJÍ.
Například charakter lineárního trendu se mění (mění
se směrnice trendu). Za jednoduchou adaptivní
metodu lze považovat i metodu klouzavých průměrů.
Analýza trendu ­ základní metody
vyrovnávání:
* analytické (popis časové řady funkcí)
* mechanické (klouzavé průměry)
* exponenciální vyrovnávání
Přístupy založené na subjektivním
(grafickém) hodnocení trendu v časové
řadě. Často poskytují dostatečně přesný
způsob očištění časové řady, používají se
např. také při rozhodování o volbě
objektivních metod (např. vhodné
křivky).
Analytické vyrovnávání trendu
matematickou křivkou
* Patří mezi neadaptivní metody. Vychází z
předpokladu, že se trend po celou sledovanou dobu
nemění a že je možné ho popsat některým typem
matematické křivky.
* Identifikace trendu se redukuje na výběr správného
typu matematické křivky a odhad jejích parametrů.
* Na problém analýzy trendu lze pohlížet jako na
speciální případ regresní závislosti, kdy nezávisle
proměnnou je čas.
* Časovou řadu vyrovnáváme křivkou, která nejlépe
vystihuje její vývojový trend. Výpočet parametrů křivky
se děje metodou nejmenších čtverců.
ttt ETry +=
6
Lineární trend
Parametr b1 představuje přírůstek hodnoty y
připadající na jednotkovou změnu časové proměnné.
Řada se vyznačuje konstantními absolutními přírůstky
(první diference).
tbbyt 10 +=
2
1
2
1 1
1
tnt
ytty
b n
t
n
t
n
t
tt
-
-
=

 
=
= =
Lineární trend
Hodnoty parametrů b0 a b1 získáme metodou
nejmenších čtverců obdobně jako v případě jednoduché
lineární regrese, tedy:
tbyb 10 -=
Předpověď budoucí hodnoty (bodová předpověď)
má tvar:
TbbyT 10
^ +=
Exponenciální trend
Parametr b1 představuje průměrný přírůstek hodnot yt.
Ty se chovají jako členy geometrické posloupnosti.
Protože se již nejedná o funkci lineární v parametrech,
lze k odhadu exponenciálního trendu využít metody
nejmenších čtverců pouze po její logaritmické
transformaci:
t
t bby 10 =
10 logloglog btbyt +=
Polynomický trend
Při volbě stupně polynomu je třeba postupovat
opatrně. Vyšší stupeň zajišťuje těsnější proložení
empirických hodnot křivkou, vede ale k nestabilitě
trendu.
Vyšší polynomy se většinou vůbec nehodí k
extrapolacím.
K odhadu parametrů lze využít MNČ.
k
kt tbtbtbby ++++= ...2
210
Logistická křivka
Křivka má tři úseky, první je charakterizován
pozvolným vzestupem, druhá v okolí inflexního bodu
prudkým růstem a třetí určitou vrcholovou stagnací.
(patří mezi tzv. S-křivky).
tt
bbk
y
10
1
+
=
Verifikace modelu
Je zapotřebí zhodnotit statistickou významnost
odhadnutých parametrů modelu i modelu jako celku.
MNČ ­ podstatou je, že model vždy vysvětlí pouze část
variability (proměnlivosti) pozorovaných dat.
Je nutné zjistit (testovat), zda model jako celek dává
lepší vysvětlení, než je možné očekávat jako důsledek
náhody a to na jisté hladině významnosti.
Koeficient determinance R2 ­ základní ukazatel
vhodnosti použitého modelu (vzorec a interpretace viz.
korelační počet)
Analýza rozptylu
7
A. Rozptyl empirických hodnot
(celkový)
B. Rozptyl vyrovnaných hodnot
(modelový)
C. Rozptyl reziduální =
- -=
n
t
tiyy yy
n
s
1
22
^ )^(
1
=
-=
n
t
ty yy
n
s
1
22
)(
1
=
-=
n
t
ty yy
n
s
1
22
^ )^(
1
2
^
2
^
2
yyyy sss -+=
Analýza rozptylu
AB
C
y
)( yy Interpretace
výsledků analýzy rozptylu
Interpretace: p < 0,05 - existuje statisticky významný
rozdíl mezi rozptylem vysvětleným regresní přímkou (tedy
modelem trendu) a zbytkovým (reziduálním) rozptylem ­
zvolený model trendu je vhodný
p-hodnota
Model vysvětluje více než 63 % proměnlivosti studované
charakteristiky v čase
Kritéria pro volbu vhodného
modelu trendové funkce I.
A. Volba vhodné trendové funkce by v prvé řadě měla
vycházet z věcné analýzy zkoumaného jevu.
Ta nám umožní zaměřit se na určité typy (skupiny)
funkcí či některé jiné předem vyloučit ­ jde o
funkci rostoucí či klesající, má inflexní bod či je
nekonečně rostoucí.
Pro použitou trendovou funkci je důležité, zda má
(logistický trend) či nemá (lineární trend ­ růst
řady není ničím omezen) asymptotu. Je to důležité
pro předpovídání chování časové řady.
Kritéria pro volbu vhodného modelu
trendové funkce II.
B. Analýza grafu časové řady a analýza reziduí.
-
yt
­ empirické hodnoty
­ teoretické hodnoty ­
vyrovnané trendovou
funkcí
ty^
ty^
Objektivní kritéria pro volbu vhodného
modelu trendové funkce I
Spočívají v minimalizaci předem zvoleného kritéria
(jako v případě regresní analýzy). Za toto kritérium
se nejčastěji bere součet čtverců odchylek
empirických hodnot yt od hodnot vyrovnaných
(součet čtvercových chyb):
Z uvažovaných funkcí se vybírá ta s nejmenší
hodnotou reziduálního součtu čtverců.
POZOR ­ jde o formální kritérium. Např. použijeme-li
polynom vysokého stupně, může být reziduální součet
čtverců i nulový, avšak zcela nepoužitelný.
( )=
-=
n
t
tt yySSE
1
2
^
ty^
Objektivní kritéria pro volbu
vhodného modelu trendové funkce II
Druhým kritériem je tzv. index korelace, jehož
vzorec lze zapsat následujícím způsobem:
Za nejvhodnější se považuje funkce s největší hodnotou
indexu korelace. K jeho používání však platí stejné
výhrady jako k výše uvedenému kritériu
Čitatel zlomku ­ suma odchylek vyrovnaných hodnot od hodnot
empirických
Jmenovatel zlomku - suma odchylek vyrovnaných hodnot od
průměru empirických hodnot
( )
( )

-
-=
2
2
^
1
yy
yy
I
t
tt
8
Objektivní kritéria pro volbu vhodného
modelu trendové funkce III
Počítačové programy obvykle nabízejí následující
míry úspěšnosti zvolené trendové funkce:
Střední chyba odhadu (M.E. ­ Mean Error)
( )
n
yy
EM
n
t
tt=
=
1
^
..
( )
n
yy
ESM
n
t
tt=
=
1
2
^
...
Střední čtvercová chyba odhadu (M.S.E. ­ Mean
Square Error)
Je to nejpoužívanější kritérium.
Střední absolutní chyba odhadu (M.A.E. ­ Mean
Absolute Error)
Střední absolutní procentní chyba odhadu (M.A.P.E.
­ Mean Absolute Percentage Error)
n
yy
EAM
n
t
tt=
=
1
^
...
ny
yy
EPAM
t
tt 100^
.... 


 =

ny
yy
EPM
t
tt 100^
... 


 =

Střední procentní chyba odhadu (M.P.E. ­ Mean
Percentage Error)
Informativní testy pro volbu vhodné
trendové křivky:
Podíly (log yt+2 ­ log yt+1)/(log yt+1 ­ log yt) jsou
přibližně konstantní
Gompertzova
křivka
Křivka prvních diferencí (yt+1-yt) se podobá křivce
normální hustoty, podíly (1/yt+2 - 1/yt+1)/(1/yt+1 1/yt)
jsou přibližně konstantní
logistický
Podíly sousedních hodnot (yt+1/yt) resp. První
diference logaritmů tvaru (log yt+1 - log yt) jsou
přibližně konstantní
exponenciální
Druhé diference (yt+2 - 2yt+1 + yt) jsou přibližně
konstantní
kvadratický
První diference (yt+1 - yt) jsou přibližně konstantnílineární
Informativní testTrend
Mechanické vyrovnávání trendu
metodami klouzavých průměrů
Používá se v případě, že se trend mění a nelze ho
vyrovnat ,,globálně" jednou matematickou křivkou.
Metoda je vhodná pro neperiodické řady, neumožňuje
extrapolaci hodnot.
Vlastní průměry se používají jako prosté či vážené.
V některých případech lze použít klouzavých mediánů.
Klouzavé průměry mohou být necentrované a centrované
Metody klouzavých průměrů
Jako klouzavé průměry obecně označujeme lineární
kombinace členů původní řady, např.:
)222(
8
1
2112 ++-- ++++ ttttt yyyyy
Patří mezi tzv. adaptivní přístupy k trendové složce
časové řady.
Tzv. polynomické klouzavé
průměry umožňují vyrovnání
hodnot na počátku a konci
časové řady
Volba řádu klouzavých průměrů
* Subjektivní posouzení charakteru dat
* Délka klouzavých průměrů by měla odpovídat
periodě sezónních či cyklických fluktuací
* Vzorce pro výpočet optimální délky
Obsahuje-li řada sezónní složku, je vhodné volit řád klouzavých
průměrů tak, aby zahrnoval celou délku periody sezónní složky.
9
Centrované klouzavé průměry
Ve většině případů se používají klouzavé průměry liché
délky, u sudé délky je problém s přiřazením hodnot
časovému okamžiku.
V ekonomických časových řadách, které často obsahují
sezónní složku délky 4 (řady čtvrtletních hodnot) či 12
(řady měsíčních hodnot), se tento problém řeší tzv.
centrováním.
Výsledné klouzavé průměry pro sudou délku klouzavé
části vypočteme jako průměry dvou sousedních
klouzavých průměrů liché délky.
Centrované klouzavé průměry
Příklad: Abychom vystihli roční chod určitého
ukazatele, chceme pro řadu měsíčních hodnot použít
klouzavých průměrů délky 12.
Shlazená hodnota však spadá doprostřed mezi
,,červen" a ,,červenec". Další shlazená hodnota pak
mezi ,,červenec" a ,,srpen".
Tyto dva jednoduché klouzavé průměry vezmeme a
zprůměrňujeme. Výsledek pak už můžeme přiřadit k
,,červencové" hodnotě. Tedy vytváříme klouzavé
průměry o délce 13:
)2...22(
24
1
))...(
12
1
)...(
12
1
(
2
1
^
65456
645556
++---
+--+--
+++++
=+++++++=
ttttt
ttttttt
yyyyy
yyyyyyy
Centrované klouzavé průměry
Obecně místo jednoduchých klouzavých průměrů délky
2m vytváříme centrované klouzavé průměry délky 2m+1
podle tohoto obecného vzorce:
)...2(
4
1
^ 11 mtmtmtmtt yyyy
m
y +-++-- ++++=
Vážené klouzavé průměry
* Jednotlivé členy úseku řady přiřazeny váhy.
* Tyto váhy většinou lineárně klesají směrem od
středního (vyrovnávaného) členu.
* Váhy mohou mít také např. podobu tzv. gaussova filtru.
0,014yt+4
0,048yt+3
0,117yt+2
0,201yt+1
0,241yt
0,201yt-1
0,117yt-2
0,048yt-3
0,014yt-4
váhaČlen
řady
Gaussův filtr pro m=4
Analýza sezónní složky časových řad
(sezónní očišťování)
1. klasický přístup k sezónní dekompozici
2. úvod do autokorelační analýzy
Sezónní složka St je typická pro časové řady, jejichž interval
pozorování je kratší než jeden rok (sezóna může mít délku týden,
měsíc, roční období).
Objevuje se v řadách ekonomických (tržby, produkce, ...), ale i
v řadách meteorologických prvků (roční chod teploty vzduchu).
Řada obsahující sezónní složku se vyznačuje pravidelným
opakováním hodnot kolem trendu a toto opakování může mít
délku např. 7 dnů (do týdne), 12 měsíců či 4 roční období (do
roku).
Sezónní složka může mít aditivní resp. multiplikativní charakter
Obecný model řady při sezónním
očišťování
Trendovou a cyklickou složku považujeme za jeden
celek. Cyklickou složku označujeme jako
,,střednědobý" trend:
aditivní model:
multiplikativní model:
tttt STCY ++=
tttt STCY =
Yt je pozorovaná hodnota časové řady v čase t.
10
Jednotlivé kroky analýzy sezónní složky
1. Z originální řady obsahující
sezónní složku je vypočtena
řada klouzavých průměrů
s délkou klouzavých průměrů
rovnou délce sezónní složky.
2. Vytvoříme novou řadu jako
rozdíl (aditivní model) resp.
podíl (multiplikativní model)
řady původní a řady shlazené.
Jednotlivé kroky analýzy sezónní složky
3. Tzv. sezónní komponenty
jsou vypočteny jako průměr pro
každý člen v rámci sezóny.
Výsledné hodnoty představují
průměrnou sezónní složku
v časové řadě.
4. Sezónně očištěná řada (tedy
řada obsahující vedle náhodné
složky ještě složku TCt) se potom
vyjádří jako rozdíl (resp. podíl)
řady originální a sezónní
komponenty.
Jednotlivé kroky analýzy sezónní složky
5. Složka TCt se většinou
aproximuje řadou shlazenou
váženým klouzavým
průměrem délky 5 se
symetrickými vahami (1, 2,
3, 2, 1).
6. Obdobně lze izolovat
náhodnou složku jako rozdíl
(resp. podíl) řady sezónně
očištěné a řady se zvýrazněnou
složkou TCt ( viz. bod 5).
Autokorelace časových řad
Autokorelační analýza - metoda, kterou lze zkoumat
vzájemné vztahy mezi hodnotami jedné časové řady.
Může sloužit jako metoda k definování sezónní a
cyklické složky časových řad.
Jejím základem je výpočet autokorelačního
koeficientu, resp. autokorelační funkce.
Autokorelační koeficient
Autokorelační koeficient rk je relativní míra
proměnlivosti členů časové řady posunutých o určitou
hodnotu k. Definuje vztah mezi členy časové řady yt a
yt+k.
Posun k se z angličtiny označuje jako lag. Je to tedy
korelační koeficient vypočtený mezi jednotlivými členy
časové řady, mezi kterými je k-1 jiných pozorování tedy
lag = k a označujeme ho jako autokorelační koeficient ktého
řádu.
Pro k = 0 je hodnota r0 = 1 - je to vlastně hodnota
korelačního koeficientu.
Základní pojmy
Rozptyl (variance) ­ míra variability
(proměnlivosti) statistického znaku x 1
)(
1
2
2
-
-
=
=
n
xx
s
n
i
i
x
Kovariance ­ absolutní míra
vzájemné variability dvou
statistických znaků x; y 1
))((
1
-
--
=
=
n
yyxx
s
n
i
ii
xy
Korelace - relativní míra vzájemné
variability dvou statistických znaků
x; y yx
xy
xy
ss
s
r

=
11
Základní vztahy
Autokorelační funkce ­
hodnoty ry(k) pro k=1,2,...M,
kde M < N/2, N ­ délka řady
Autokorelace ­ relativní míra
proměnlivosti členů časové řady y
posunutých o určitou hodnotu k.
Autokovariance ­ absolutní míra
proměnlivosti členů časové řady y
posunutých o určitou hodnotu k. 1
))((
1
--
--
=

-
=
+
kn
yyyy
c
kn
i
kii
k
2
0
)(
y
kk
y
s
c
c
c
kr ==
Autokorelační funkce
Autokorelační funkce (ACF) je potom závislost mezi
hodnotami autokorelačního koeficientu a hodnotami
posunu k.
Vyjadřuje se formou grafu ­ tzv. korelogramu (viz.
obrázek). Na ose x jsou hodnoty lag (k), na ose y
hodnoty autokorelačního koeficientu.
Hodnoty autokorelační funkce se pohybují v intervalu ­
1,1.
ACF je vhodným nástrojem k posouzení, zda časová
řada obsahuje cyklickou či periodickou složku a také
zda je či není řadou náhodných čísel ­ tedy do jaké míry
je možné ji extrapolovat (předpovídat).
Interpretace ACF I
Korelogram bývá doplňován intervaly spolehlivosti,
kterými lze hodnotit statistickou významnost
autokorelačních koeficientů.
95 % interval
spolehlivosti ACF lze z
dostatečnou přesností
zkonstruovat ze
vztahu:
N
2
N ­ délka časové řady
Časová řada náhodných čísel (bílý šum) a její
autokorelační funkce
Časová řada bez periodické složky se silnou
autokorelací a její autokorelační funkce
Časová řada obsahující výraznou sezónní
složku a její autokorelační funkce