ANALÝZA ČASOVÝCH ŘAD Radka Vokřálová Ústav matematiky a statistiky Masarykova univerzita, Brno Seminář z finanční matematiky Analýza časových řad březen 2013 1/27 Obsah Q Náhodné procesy • Časové řady • Popis časových řad Q Klasická dekompozice časových řad • Modelování trendu Q Box-Jenkinsonova metodologie • Odhady v ARMA procesech • Autokorelační funkce Q Spektrálni analýza časových řad • Spektrální hustota • Odhady spektrálni hustoty Analýza časových řad Náhodné procesy Časové řady Náhodné procesy • Náhodný proces je reálnou funkcí dvou proměnných -elementárního jevu a jedné reálné proměnné, kterou obvykle bývá čas. Značení {Y(u,í),weíl,íeT}azkráceně {Yt,t e T}. • Náhodný proces, kde indexová množina T = Z nebo je T c Z, se nazývá proces s diskrétním časem nebo náhodná posloupnost nebo také časová řada. • Příklady náhodných procesů v ekonomice • Změny poptávky po určitém výrobku • Analýza vývoje kurzu akcií na burze • Objem zemědělské produkce Analýza časových řad březen 2013 3/27 Náhodné procesy Popis časových řad Popis časových řad • Časové řady lze popsat pomocí tzv. aditivního modelu: Yt = Trt + Szt + et (1) nebo multiplikativního modelu: Yt = Trt ■ Szt ■ et, který se ovšem může logaritmováním transformovat na aditivní model. • Jednotlivé složky jsou Trt - trend, který odráží dlouhodobé působení vlivů • Szt - sezónní složka, která popisuje periodické změny, např. vliv ročních období • et - náhodné fluktuace (kolísání), které modeluje vlivy, které působí nepravidelně Analýza časových řad březen 2013 4/27 Klasická dekompozice časových řad I. Klasická dekompozice časových řad • Mezi základní přístupy analýzy časových řad patří klasická dekompozice, která je založena na regresní analýze. Vychází z předpokladu, že náhodný proces, který generuje časovou řadu, je závislý pouze na čase. • Jednotlivá pozorování se obvykle považují za navzájem nekorelovaná, tj. {et,t e Z} se chápe jako bílý šum s nulovou střední hodnotou a varianční maticí (C(£j,£j))™1= • Dekompozicí rozumíme rozklad na deterministickou a stochastickou (náhodnou) složku, kde deterministickou složku ještě dále rozkládáme na sezónní složku a trend. Analýza časových řad březen 2013 5/27 Klasická dekompozice časových řad Modelovaní trendu I. Klasická dekompozice časových řad MODELOVÁNÍ TRENDU • Trend v časové řadě představuje tendenci dlouhodobého vývoje sledovaného ukazatele v čase. V rámci ekonomického využití časových řad je trend nejdůležitější složkou, která nás zajímá jak z hlediska současného stavu, tak i predikce budoucího vývoje. • Klasická dekompozice trend modeluje pomocí regresních modelů, kde se do trendu obvykle zahrnují i cyklické složky s periodou. • Ke stanovení trendů lze v závislosti na typu a charakteru náhodného kolísání použít dva různé přístupy: O Parametrický přístup, který předpokládá určitý typ rozdělení, obvykle pak normální rozdělení bílého šumu Q Neparametrický přístup, kam patří různé metody založené na jádrových odhadech Analýza časových řad březen 2013 6/27 Klasická dekompozice časových řad Modelovaní trendu I. Klasická dekompozice časových řad MODELY GLOBÁLNÍHO TRENDU • Regresní modely dále můžeme rozdělit na modely globálního trendu a modely postupného lokálního trendu. • U modelu globálního trendu, uvažujeme časovou řadu {Yt, í g T} a n pozorování této řady v časových okamžicích íi < t2 < ... < tn. Předpokládáme, že jednotlivá pozorování v čase u vyhovují modelu Yti = f(ti)+ei, i = l,...,n (2) kde f (t i) je neznámá trendová funkce vybraná z předem dané třídy funkcí, tj. jedná se o parametrický přístup. Analýza časových řad březen 2013 7/27 Klasická dekompozice časových řad Modelovaní trendu MODELY GLOBÁLNÍHO TRENDU Regresní model trendu • Předpokládáme, že trendová funkce je určena konečným počtem parametru f (t) =Po+/31i(i),.. -,0 = 1-a Neznámé parametry (3 odhadneme pomocí metody nejmenších čtverců (MNČ), kde platí 3 = (X'X)_1X'Y (4) Analýza časových řad březen 2013 8/27 Klasická dekompozice časových řad Modelovaní trendu MODELY GLOBÁLNÍHO TRENDU Regresní model trendu • Příkladem trendové funkce, která vede na lineární regresní model, je tzv. polynomický trend /(*) = /30 + /31t + --- + /3píp (5) kde kromě neznámých parametrů (3 musíme ještě určit vhodný stupeň polynomu p. • Pro odhad stupně polynomu můžeme využít různé metody. Například metodu „od nejnižšího stupně k nejvyššímu", penalizační metodu nebo Akaikeovo informační kritérium. Viz. [1, str. 66] Analýza časových řad březen 2013 9/27 Klasická dekompozice časových řad Modelovaní trendu Ukázka časové řady Počty zemřelých osob po dopravním úrazu v CR v letech 1980-2005 1700 j-1-1-1-1- 1985 1990 1995 2000 2005 Vstupní data spolu s polynomickým trendem 6. řádu. Analýza časových řad 12013 10/27 Klasická dekompozice časových řad Modelování trendu I. Klasická dekompozice časových řad MODELY LOKÁLNÍHO POSTUPNÉHO TRENDU • Hlavní myšlenka lokální metody nejmenších čtverců spočívá v tom, že provedeme odhad trendu Trt polynomem na lokálním intervalu (t-s,t + s) na rozdíl od klasické metody, kdy trend odhadujeme polynomem na celém intervalu možných hodnot parametru t. « Parametr s > 0 se nazývá šířka vyhlazovacího okénka a jeho vhodná volba hraje při odhadu důležitou roli. Analýza časových řad březen 2013 11/27 Klasická dekompozice časových řad Modelování trendu I. Klasická dekompozice časových řad MODELY LOKÁLNÍHO POSTUPNÉHO TRENDU Lokální metoda nejmenších čtverců se někdy nazývá klouzavá polynomická metoda, protože kolem bodu t, v němž má být trend odhadnut, je umístěno vyhlazovací okénko a odhad trendu se mění (pohybuje) spolu s t. • Uvnitř intervalu aproximujeme trend polynomem stupně m m Q{x) = YlPÁt)(x-t)J (6) j=0 a neznámé koeficienty /3,(t) odhadujeme metodou nejmenších čtverců (případně váženou MNČ), tyto koeficienty budou pro každé t jiné. Analýza časových řad březen 2013 12/27 Klasická dekompozice časových řad Modelování trendu I. Klasická dekompozice časových řad MODELY LOKÁLNÍHO POSTUPNÉHO TRENDU • Různé metody, které jsou založené na lokální metodě nejmenších čverců, jsou například - klouzavé průměry, jednoduché klouzavé průměry, centrované klouzavé průměry • Dále například modely exponenciálního vyrovnávání vychází z lokální vážené metody nejmenších čtverců, kde jednotlivým údajům v časové řadě jsou přiřazeny rozdílné váhy, které směrem do minulosti exponenciálně klesají. Analýza časových řad březen 2013 13/27 Box-Jenkinsonova metodologie II. Box-Jenkinsonova metodologie • Box-Jenkinsonova metodologie na rozdíl od klasické dekompozice předpokládá, že všechny složky časové řady tj. trend i cyklická složka, mají náhodný charakter. A jejím těžištěm je korelační analýza. • Výhodou této metody je její flexibilita a to, že se rychle adaptuje na změnu v charakteru modelovaného procesu. 9 Nevýhodou bývá požadavek na dostatečně dlouhé realizace časové řady. Ztrácí se také možnost jednoduché interpretace výsledných modelů. Analýza časových řad březen 2013 14/27 Box-Je n k i n so nova metodologie II. Box-Jenkinsonova metodologie • V dalším předpokládejme, že náhodná posloupnost {Yt,t e Z} je stacionární, centrovaná a druhého řádu, tj. je stacionární ve střední hodnotě, která je rovna nule, je kovariančně stacionární, a má konečné druhé momenty. • Základní modelová schémata: • Autoregresní procesy AR(p) • Procesy klouzavých průměrů MA(q) • Případně kombinace předchozích, ARMA(p, q) a ARMA proces řádu p, q je definovám vztahem Yt - tpxYt-!-----^PpYt-p = St + OlSt-l + • • • + QqSt-q, (7) kde st ~ WN(0,al) Analýza časových řad březen 2013 15 / 27 Box-Jenkinsonova metodologie Odhady v ARMA procesech Odhady v ARMA procesech • Určení vhodného ARMA(p, q) modelu pro danou realizaci stacionárního procesu v sobě zahrnuje O výběr řádu modelu paq, tj. provedení identifikace modelu Q odhad parametrů ipi,..., ipp, 9i,..., 9q a erf O ověření vhodnosti modelu. • Před provedením identifikace modelu se doporučuje vykreslit graf řady a pokud by byla střední hodnota nenulová, tak provést centrování řady. • Představu o struktuře studovaného procesu získáme na základě zkoumání průběhu odhadnuté autokorelační funkce (ACF) a odhadnuté parciální autokorelační funkce (PACF). Analýza časových řad březen 2013 16/27 Box-Jenkinsonova metodologie Autokorelační funkce Autokorelační funkce • Na základě teoretických výpočtů známe základní vlastnosti ACF a PACF v procesech AR, M A a ARMA • AR proces • ACF funkce exponenciálně klesá k nule pro t ->• oo a PACF pro t > k0, kde k0 je tzv. identifikační faktor, se výrazně neliší od nuly • M A proces • Chování ACF a PACF je opačné oproti funkcím v AR procesu « ARMA proces • ACF i PACF exponenciálně klesají k nule pro t ->• oo, ovšem nelze určit identifikační bod, od kterého by se některá z korelačních funkcí výrazně lišila od nuly. Analýza časových řad březen 2013 17/27 Box-Je n k i n so nova metodologie Autokorelační funkce Příklad AR(p) procesu y, = o,5yt_i + o,2yt_2 + et, £t~JV(0,l), 50 100 150 200 250 Simulovaná data pro kauzální AR{2) proces. Odhad ACF : p{t) Odhad P ACF : S(t) ít lihli, IľJJIil'ii'" I0 20 30 40 50 0 10 20 30 Odhady ACF a PACF pro simulovaná data z AR{2) procesu. Analýza časových řad Box-Jenkinsonova metodologie Autokorelační funkce Příklad MA(q) procesu Yt = tt- 0,5«,_i - 0,2et_2, Et ~ N(0,1), 4|-1-r 0 50 100 150 200 250 300 Simulovaná data pro invertibilní MA(2) proces. Odhad ACF: p(ť) ^ Odhad PACF: S(i) 0.5 0.5 0 10 20 30 40 50 ' 0 10 20 30 40 50 Odhady ACF a PACF pro simulovaná data z MA{2) procesu. Analýza časových řad březen Box-Jenkinsonova metodologie Autokorelační funkce Příklad ARMA(p, q) procesu y, = 0,5y,_i + 0,2Yt-2 + e« - 0,4e,_1 + 0,3e,_2, st ~ JV(0,1), 0 50 100 150 200 250 300 Simulovaná data pro invertibilní ARMA(2,2) proces. Odhad ACF: p(t) ^ Odhad PACF ■ a(t) 0 10 20 30 40 50 0 10 20 30 40 50 Odhady ACF a PACF pro simulovaná data z ARMA(2,2) procesu. -n-HT Analýza časových řad březen 2013 Spektrální analýza časových řad III. Spektrální analýza časových řad • Klasická dekompozice a Box-Jenkinsonova metodologie jsou základní přístupy k analýze časových řad v časové doméně. Ve spektrální doméně patří mezi základní přístupy spektrální analýza, která je založena na Fourierově analýze. • Spektrální analýza časových řad předpokládá, že lze časovou řadu vyjádřit pomocí funkcí sin(x) a cos(x) o rozličných amplitudách a frekvencích. Stěžejním faktorem zde není časová proměnná, ale faktor frekvenční. • Vhodná při srovnávání chování několika řad, kdy můžeme porovnat řady v rámci jednotlivých frekvencí. Analýza časových řad březen 2013 21 /27 Spektrální analýza časových řad III. Spektrální analýza časových řad • Předpokládejme opět, že náhodná posloupnost {Yt,t e Z} je stacionární, centrovaná a druhého řádu, tj. je stacionární ve střední hodnotě, která je rovna nule, je kovariančně stacionární, a má konečné druhé momenty. • Důležitou vlastností stacionární náhodné posloupnosti je vlastnost, že její autokovarianční funkci lze vyjádřit jako nespočetný součet harmonických funkcí s různými amplitudami a frekvencemi. Analýza časových řad březen 2013 22/27 Spektrální analýza časových řad Spektrální hustota III. Spektrální analýza časových řad Spektrální hustota • Podle Herglotzovy věty [1, str. 28] známe spektrální rozklad autokovarianční funkce stacionární posloupnosti 7(í) = ľ eitxdF(X), (8) J — 7t kde funkce F(X) se nazývá spektrální distribuční funkce a je-li absolutně spojitá, pak existuje taková funkce /(A), že pro náhodné stacionární posloupnosti platí F(X) = ŕ f(x)dx (9) J — 7t a funkce /(A) se pak nazývá spektrální hustota. Analýza časových řad březen 2013 23 / 27 Spektrální analýza časových řad Spektrální hustota III. Spektrální analýza časových řad Spektrální hustota • Existuje-li spektrální hustota, pak můžeme psát 7(í) = f euxf(X)dX 9 Pomocí Fourierovy transformace lze pak vyjádřit spektrální hustotu pomocí autokovarianční funkce oo = ^ E e"ťíA7(t) 2tt t— — OO Analýza časových řad březen 2013 Spektrální analýza časových řad Odhady spektrální hustoty Spektrální hustota Odhady spektrální hustoty • PERIODOGRAM • Periodogram je funkce definovaná pro n pozorování náhodné posloupnosti vztahem ín(w) = i te t=i (12) In{uj) se dá považovat za empirický odhad spektrální hustoty, který je asymptoticky nestranným odhadem, ovšem není konzistentním - jeho rozptyl nekonverguje k nule, pokud vzrůstá délka posloupnosti pozorování. Díky svým vlastnostem je užitečným prostředkem pro vyhledávání významných periodických složek v časové řadě. 4 □ ► ► 4 -š ► 4 -š ► -š "O^O Analýza časových řad březen 2013 251 27 Spektrální analýza časových řad Odhady spektrální hustoty %i [1] FORBELSKÁ, Marie. Stochastické modelování jednorozměrných časových řad. Brno: Masarykova univerzita, 2009. % [2] KRIŠTOF, Aleš. Nové metody a přístupy k analýze a prognóze ekonomických časových řad. Praha, 2006. Disertační práce. Česká zemědělská univerzita v Praze. Analýza časových řad březen 2013 26/27 Spektrální analýza časových řad Odhady spektrální hustoty Děkuji za pozornost. Analýza časových řad