Trendy s konstantními parametry Obecně lze trendové funkce lze rozdělit v podstatě do dvou skupin: A. trendy lineární v parametrech ( a nelineární pouze v proměnných ) V tomto případě lze trendovou složku psát ve tvaru funkce lineární v parametrech (1) tzn . ve tvaru lineárně-aditivního schématu případně (2) Vztah (2) se nazývá tvar lineární v parametrech po transformaci vysvětlované proměnné nebo také (podle W.Eichhorna) zobecněná kvazilineární funkce.[1] Výpočet parametrů trendových funkcí lineárních v parametrech (1) nečiní problém a provádí se prostou metodou nejmenších čtverců MNČ/OLS. Protože všechny vysvětlující proměnné jsou nestochastické, je situace s respektováním podmínek standardního lineárního regresního modelu usnadněna: a) Přítomnost jedničkového vektoru zajišťuje nulovou střední hodnotu náhodných složek . (Konstantu lze interpretovat jako výchozí úroveň ukazatele v čase 0) b) Je automaticky zajištěna nestochastičnost všech vysvětlujících proměnných (jde zpravidla o jednoduché transformace trendu). Není proto třeba ověřovat pro konzistenci odhadové funkce nutnou podmínku , protože ta je zde splněna vždy. c) V „matici plánu„ se nemohou vyskytnout přesné lineární závislosti mezi „vysvětlujícími„ proměnnými (takže nemůže vzniknout problém multikolinearity)[2]. Pokud navíc nevolíme funkce příliš „blízké“ (např. a ), nehrozí ani multikolinearita přibližná. V obou předchozích případech přijímáme aditivní připojení náhodné složky , takže stochastický/regresní tvar trendové (1) funkce je tedy (1St) a obdobně Stochastický/regresní tvar trendové (2) závislosti je (2St) . Standardní OLS-kritérium pro výpočet trendových parametrů má tvar pro případ (1St) přes , ale pro případ (2St) V jednom i ve druhém případě lze užít prostou metodou nejmenších čtverců MNČ/OLS bez korekcí, avšak za uvědomění stojí, že v případě (4) OLS-kritérium neminimalizuje rozdíl prostých, nýbrž transformovaných (funkcí ) pozorovaných a vyrovnaných hodnot časové řady.[3] B. trendy nelineární v parametrech ( případně nelineární i v proměnných ) . V tomto obecném případě lze trendovou funkci psát ve tvaru (3) případně ještě obecněji (4) . Odpovídající stochastická specifikace tvar trendové (3) funkce je následně (3St) a obdobně Stochastický/regresní tvar trendové (4) závislosti je pak (4St) . V tomto případě již nelze k výpočtu parametrů (tzn. k jejich konzistentnímu odhadu) použít standardní OLS-odhadovou funkci. K minimalizaci výrazu (4) je zapotřebí (s výjimkou ojedinělých příznivých podob nelinearity) uplatnit některou z metod nelineární optimalizace, jako je NLLS (nelineární metoda nejmenších čtverců) nebo NLLAD (nelineární metoda nejmenších absolutních odchylek) s kritérii pro specifikaci (4St) a NLLS přes resp. pro specifikaci (4St) a NLLAD přes Poznámka: Vůbec nejobecnější myslitelný tvar trendové nelineární specifikace je (4St) . Ten je však natolik neurčitý a výpočetně problematický, že se neužívá. Je patrné, že konzistentní odhad trendových parametrů dostaneme v prvém případě nasazením prosté metody nejmenších čtverců OLS, zatímco ve druhém je nutné uplatnit nelineární prostou metodu nejmenších čtverců NLLS. Alternativním postupem pro výpočet trendových parametrů může dále být např. metoda nejmenších absolutních odchylek LAD, jejíž minimalizační kritérium je pro případ (3) pro případ (4) . Nejpoužívanější matematické funkce při trendovém vyrovnání/extrapolaci 1. Lineární trend indikace přítomnosti: první diference jsou přibližně konstantní 2. Kvadratický trend indikace přítomnosti: druhé diference jsou zhruba konstantní 3. Kubický trend indikace přítomnosti: třetí diference jsou zhruba konstantní 3. Polynomický trend s-tého stupně indikace přítomnosti: diference s-tého stupně jsou přibližně konstantní 4. Mocninný trend indikace přítomnosti: 5a Logaritmický trend indikace přítomnosti: 5. Exponenciální trend [ ] indikace přítomnosti: podíly sousedních hodnot [ ]resp. první diference logaritmů jsou přibližně konstantní. 6. Modifikovaný exponenciální trend indikace přítomnosti: podíly sousedních prvních diferencí jsou přibližně konstantní 7. Logistický trend s parametry indikace přítomnosti: a) histogram prvních diferencí [ ]je tvarem podobná křivce (hustotě) normovaného normálního rozdělení . b) podíly sousedních prvních diferencí reciprokých hodnot jsou přibližně konstantní. Inflexní bod logistické křivky je v bodě 8. Gompertzův trend nebo ekvivalentně [ ] indikace přítomnosti: podíly prvních logaritmovaných diferencí jsou přibližně konstantní Inflexní bod má Gompertzova křivka v bodě 4a. Odmocninný trend indikace přítomnosti: 4b. Hyperbolický trend 1A) výpočet parametrů lineárního trendu Pro jejich určení lze nejsnáze uplatnit výraz pro OLS-minimalizační kritérium z výchozí regresní specifikace (3) , zde konkretizované na (21) . a) Uplatněním standardního postupu – derivováním (21) podle obou neznámých parametrů dostaneme soustavu dvou nutných podmínek extrému (22A,B) , resp. a po očividných úpravách , resp. neboli (23A,B) , resp. Přeskupením výrazů na obou stranách dospějeme k soustavě normálních rovnic pro odhadnuté parametry - zde značené - ve tvaru (24A) (24B) , jejímž řešením je dvojice (25A,B) Po úpravách součtových výrazů , a vydělením čitatele i jmenovatel dostaneme pro (26) a následně pro b) Ke stejným výrazům dospějeme aplikací standardního vzorce pro OLS-odhady parametrů , tedy , pokud v něm konkretizujeme matici X jako . Potom máme Zřejmě máme , . Výpočtem (řešením pro neznámé ) dostaneme dvojici odhadů (25A,B). Že jde skutečně o minimum, se snadno přesvědčíme stejně snadno jako v případě minimalizace pro lineární regresní model. Předpověď budoucí hodnoty má tvar (27) . Příslušný procentní předpovědní interval (při neznalosti ) je (28) , kde je vyrovnaná hodnota závisle proměnné je počet stupňů volnosti (rozdíl mezi počtem pozorování a počtem trendových parametrů) je 1-p/2 (.100) % kvantil Studentova t-rozdělení o n-3 stupních volnosti * je hodnota : , přičemž je matice nestochastických „regresorů“. S ohledem na specifický výraz pro momentovou matici v daném případě dostaneme (29) je směrodatná odchylka reziduí (rozdílu mezi pozorovanými a vyrovnanými hodnotami časové řady) (30) . 1B) výpočet parametrů kvadratického trendu Aplikace standardního vzorce pro OLS vede k výrazům (31) Odtud vyplývá soustava normálních rovnic ve tvaru (32A,B,C) Někdy je výhodné pracovat s vyjádřením trendu ve tvaru (33) , kde , kde Předpověď budoucí hodnoty má tvar (34) . Příslušný procentní předpovědní interval je (35) , kde je vyrovnaná hodnota závisle proměnné je počet stupňů volnosti (rozdíl mezi počtem pozorování a počtem trendových parametrů) je kvantil Studentova t-rozdělení o n-3 stupních volnosti * je hodnota: (36) , přičemž je matice nestochastických „regresorů“. je směrodatná odchylka reziduí (rozdílu mezi pozorovanými a vyrovnanými hodnotami časové řady) (36) 1C) výpočet parametrů reciprokého/hyperbolického trendu Aplikace standardního vzorce pro OLS vede k výrazům (41) 1D) výpočet parametrů logaritmického trendu Aplikace standardního vzorce pro OLS vede k výrazům (42) 1E) výpočet parametrů exponenciálního trendu (51) zpravidla Trend je charakteristický tím, že koeficient růstu tj. podíl dvou sousedních hodnot a současně podíl dvou sousedních diferencí má konstantní hodnotu . Parametr se uvažuje kladný. Růstová tendence nastává v případě , tendence poklesu v případě , K výpočtu parametrů exponenciálního trend je vhodné uplatnit váženou metodu nejmenších čtverců WLS s vhodně transformovaný vahami. (Nelze totiž předpokládat multiplikativní tvar a logaritmicko-normální rozdělení náhodné složky v původním modelu před transformací) . V konkrétním případě exponenciálního trendu se aplikuje WLS pro minimalizaci výrazu (52) , v němž jsou předem zvolené váhy. Minimalizace se však v této metodě vztahuje k výrazu (53) , kde váhy závisí na vahách tak, abychom minimalizací obou výrazů dostali aspoň přibližně shodné odhady parametrů . Ukazuje se, že pro přijatou logaritmickou transformaci je vhodné položit (54) K nejčastější volbě vah přistupujeme tehdy, jestliže nemáme důvod preferovat v minimalizačním kritériu některá jednotlivá pozorování, takže pak pro transformované váhy bude platit . Minimalizací výrazu s těmito vahami obdržíme soustavu normálních rovnic (55A) (55B) Ta má explicitní řešení pro oba parametry ve tvaru (56A) (56B) Oba parametry získáme exponenciálním povýšením výrazů na pravých stranách. 1F) výpočet parametrů modifikovaného exponenciálního trendu (61) zpravidla také Tento trend je tříparametrickým zobecněním předchozího případu (parametry ). Hodí se pro modelování trendu s konstantním podílem sousedních diferencí, pokud je navíc tento trend asymptoticky omezen (přibližuje-li se k saturační úrovni). Jedna z orientačních metod odhadu parametrů modifikovaného exponenciálního trendu (pokud nemůžeme použít exaktní iterační postupy nelineární optimalizace), spočívá v tomto postupu: Rozdělíme soubor pozorovaných hodnot na tři stejně velké třetiny o délce m. Pokud není přesně dělitelné třemi, pak vynecháme jedno nebo dvě počáteční pozorování. Pak sečteme pozorování v jednotlivých třetinách, přičemž dostaneme (62A) (62B) (62C) , kde indexování „1“ v resp. v značí součet pozorovaných hodnot, případně trendových hodnot z první třetiny časové řady. Řešením této soustavy pseudonormálních rovnic dostaneme postupně jednotlivé odhady parametrů ve tvaru (63A) (63B) (63C) Vzhledem k tomu, že při pevně zvoleném parametru se model stane lineárním modelem, lze také použít takový postup, že se odhadnou parametry pro různé hodnoty a následně se zvolí taková varianta, která minimalizuje SSE. � . ověření indikace přítomnosti modifikovaného exponenciálního trendu: podíly sousedních 1. diferencí jsou zhruba konstantní: 1G) výpočet parametrů logistického trendu Tento opět tříparametrický trend je popsán schématem (71) , při Logistický trend má inflexi (tj. bod, ve kterém přechází konvexní průběh trendu v konkávní a naopak) v bodě a je asymptoticky omezen (se saturační úrovní ). Jeho zderivováním podle časové proměnné t (tu pro derivování považujeme za spojitou) , dostaneme (72) , což je další důležitý ukazatel růstu trendové křivky (tato první derivace trendové křivky se v tomto kontextu nazývá růstová funkce). Je zřejmé, že rychlost růstu logistického trendu závisí přímo úměrně na dosažené úrovni a na vzdálenosti úrovně trendu od saturační úrovně , tj. . Derivace je přitom symetrická kolem bodu inflexe . Z toho, co bylo řečeno, plyne, že logistickou křivku lze přiřadit k tzv. S-křivkám symetrickým kolem inflexního bodu . Pokud jde o odhad parametrů logistického trendu, lze použití několik odlišných metod: a) protože logistický trend lze považovat za reciprokou hodnotu modifikovaného exponenciálního trendu, lze aplikovat výše popsanou odhadovou proceduru pro odhad modifikovaného exp. trendu na časovou řadu s reciprokými hodnotami . b) Použijeme diferenčního parametrického odhadu, kdy se místo s původní čas.řadou pracuje s řadou prvních diferencí . Přitom se postupuje takto: Aproximuje se v derivačním výrazu (72) trendová složka skutečnými pozorováními , takže se dostane: (73) Jestliže dále přijmeme aproximaci (74) , v níž označuje řadu prvních diferencí, pak z (73) snadnou úpravou dostaneme Pomocí metody nejmenších čtverců pak získáme v lineárním regresním modelu (modelu s jediným regresorem) (75) Odhady pro a pro a odtud snadno odhady parametrů . Abychom získali odhad , aproximujeme ve vztahu (31) trendovou složku skutečnými pozorováními a upravíme tento vztah do tvaru (76) Po zlogaritmování a sečtení přes dostaneme nakonec vztah (77) který se nazývá Rhodesův vzorec. Z něho se už snadno vypočte odhad parametru „vyexponováním„. Ověření lokalizace inflexního bodu u logistické křivky Vzhledem k tomu, že inflexe je místem, kde konvexnost přechází v konkávnost (nebo vice versa) , odkud odvodíme polohu inflexního bodu □ . ověření indikace přítomnosti logistického trendu: podíly sousedních 1. diferencí reciprokých hodnot jsou zhruba konstantní. 1H) Gompertzův trend a výpočet jeho parametrů Trend ve tvaru této křivky vzniká (ostatně stejně jako logistický trend) transformací modifikovaného exponenciálního trendu. (81) resp. ekvivalentně při [ ] Obvykle – pro udržení charakteristického tvaru křivky – přijímáme: Pro hodnoty parametrů z tohoto intervalu má Gompertzův trend inflexi v bodě (82) První derivace této křivky (tzv. růstová funkce) ale tentokrát není symetrická kolem inflexního bodu, ale je sešikmená (protáhlejší) doprava. Z tohoto důvodu se Gompertzův trend řadí mezi tzv. S-křivky nesymetrické kolem inflexního bodu. Odhad parametrů se provede způsobem obdobným jako v případě modifikovaného exponenciálního trendu, místo původní řady se ale použije logaritmovaná původní řada (s hodnotami [4]) Ověření lokalizace inflexního bodu u Gompertzovy křivky ověření indikace přítomnosti Gompertzova trendu: indikace přítomnosti: podíly prvních logaritmovaných diferencí jsou přibližně konstantní 1J) výpočet parametrů odmocninného trendu V případech, kdy je levostranná regresní proměnná transformací původní veličiny časové řady , lze aplikovat metodu nejmenších čtverců OLS jen s výhradou. Minimalizace reziduí prováděná pomocí OLS nebude totiž založena na kritériu , nýbrž na kritériu , kde je použitá transformující funkce, nejčastěji logaritmická funkce nebo exponenciála. Pro takovéto případy by měla být užita nelineární (prostá) metoda nejmenších čtverců NLLS (Non-Linear Least Squares Method), jejímž minimalizačním kritériem je právě . Výpočet je ale nutné provést některou z numerických iteračních metod, protože výsledný vzorec pro odhadnuté parametry nelze vyjádřit explicitně. Hlavní zásady pro výběr výstižného trendu 1) Zpravidla preferujeme trendovou křivku s co nejmenším počtem parametrů (obvykle do 3). Zásadou je úspornost (parsimony), která je zde ještě více opodstatněná než v klasické regresní analýze, neboť vodítka pro tvar nelinearity zde až na ojedinělé výjimky nemůžeme vyvodit z ekonomické teorie. Jednou z možností, jak otestovat potřebu/nepotřebu nutnosti zařazení další trendové transformace může být výpočet korigovaného koeficientu determinace . Jinou racionální úvahu lze založit na určení statistické významnosti příslušného trendového parametru (k tomu lze užít klasické testování pomocí t-testu). V trendové analýze není zdaleka tak osudové riziko specifikační chyby spočívající ve vynechání některé z relevantních proměnných jako je tomu v analýze regresní. 2) Před první volbou trendové křivky je vhodné se podívat na graf pozorovaných hodnot časové řady, který bývá prvotním vodítkem výchozí trendové specifikace. Z něho lze dost často vyvodit řád nestacionarity např. tím, že vytvoříme řadu prvních nebo druhých diferencí. Pokud ani diference vyšších řádů nevedou ke stacionární řadě a řada vykazuje monotónní akcelerující růst, je to indikací pro volbu exponenciálního trendu (s případným posunem výchozí úrovně. Určitým indikátorem je pak graf průběhu reziduálních hodnot, z něhož lze často vyvodit další transformující funkci času, která byla v základní specifikaci opomenuta (např. mnohočlen 2. nebo 3 stupně). 3) Nesmíme zapomenout na to, že trendová analýza slouží především ke krátkodobým predikcím. Vzhledem k tomu, že polynomy 4. a vyšších řádů se vyznačují značnou citlivostí při predikcích, je to důvodem pro jejich vynechání z oboru možných trendových funkcí. (Ekonomické ukazatele se chování principiálně ustáleněji než např. fyzikální/technické, kde může být účelné nasazení např. splinových funkcí). 4) Pokud ekonomický ukazatel vykazuje evidentně rozdílný průběh ve sledovaném minulém období, obvykle to velmi komplikuje rozhodnutí o výběru trendu. V takovémto případě – pokud se nevzdáme pokusu o predikci vůbec – přistupujeme zpravidla k prolongování chování z údajů posledního období nebo z údajů toho minulého období, o němž lze důvodně předpokládat, že vývoj zde pozorovaný se vyskytne i v nejbližší budoucnosti. 5) Přítomnost heteroskedasticity (standardně testované v regresní analýze) není v případě trendové analýzy časové řady zpravidla vážnějším problémem.[5] U testování konvenčními testy nevzniká specifický problém, jen u Whiteova testu je větší než obvyklá pravděpodobnost výskytu součinové kombinace dvou elementárních trendových funkcí s některou z dalších zařazených (vznikla by dokonalá multikolinearita). U Goldfeld-Quandtova testu se zřejmě nemůžeme opřít o obsahovou vazbu variability reziduí s proměnlivostí některé z vysvětlujících proměnných, takže jeho nasazení ztrácí původní význam. V testování převažují prvky technické nad věcnými. 6) Naopak, důležitým prvkem trendové analýzy je vyšetřování síly a stupně autokorelace náhodných složek sledované časové řady. Náhodné složce časové řady je vůbec věnována značná pozornost. Proto také obvykle první pohled na výsledky směřuje k vyšetření reziduálních hodnot, přičemž základní představu o jejich případné autokorelovanosti poskytne Durbin-Watsonův koefiecient autokorelace 1.řádu. 7) Další z průvodních problémů standardní lineární regrese – multikolinearita – se v trendové analýze vyskytnout nemůže: K dokonalé multikolinearitě nemůže vést žádná lineární kombinace elementárních trendových komponent (jsou-li tyto rozdílné) a eventualita výskytu přibližné multikolinearity nemůže pocházet ze stochastičností „vysvětlujících proměnných„ (jsou-li elementární trendové komponenty svou povahou nestochastické). 8) Případný přínos apriorní informace: Je poměrně skromný počet případů, kdy lze k výběru nejvhodnější trendové funkce uplatnit poznatky plynoucí z externí ekonomické reality. Přece však některé existují: Ve vývoji průměrné mzdy jako nejcharakterističtějším případ lze pozorovat tendenci pravidelného každoročního procentního nárůstu (který ovšem nemusí být každoročně stejný). Je to přímým důsledkem „zvyklostí“, které jsou zažité při mzdovém vyjednávání odborářů ( a od nichž se sekundárně odvíjí i mzdový nárůst pracovníků ve státních podnicích a státní správě). Kritéria posuzování přesnosti předpovědí Střední chyba odhadu [mean error] ME Jde o obvykle velmi malou hodnou (řádů a níže) indikující „míru nelinearity“ při výpočtu. Střední čtvercová chyba odhadu [mean squared error] MSE Odmocninová střední čtvercová chyba [root mean squared error] RMSE Výhodou oproti MSE je vyjádření ve stejných jednotkách jako mají původní data. Střední absolutní chyba odhadu [mean absolute error] MAE Její předností je – zejména v datových souborech s výraznými odchylkami některých pozorování od „standardních“ (tzv.outliers) - že nepenalizuje tak silně jako MSE či RMSE tyto „extrémní“ odchylky. Dále uváděné míry již na měřítku hodnot předpovídané proměnné nezávisejí: Střední absolutní procentuální chyba odhadu [mean absolute percentage error] MAPE Zpravidla nabývá hodnot mezi 0-100%, přičemž výsledek menší/lepší než 100%, že daný předpovědní modle je lepší než model náhodné procházky s předpověďmi trvale na nulové úrovni, tj. trvale s MAPE=100%. Kritérium je však problematicky použitelné, pokud hodnoty časové řady jsou příliš malé (oscilují kolem 0). Korigovaná Střední absolutní procentuální chyba odhadu [adjusted mean absolute percentage error] AMAPE Koriguje asymetrii kritéria MAPE: dává totiž stejný výsledek i při prohození skutečných a předpovídaných hodnot: Skutečná hodnota 0,6 a předpověď 0,8 přispějí do součtu v AMAPE stejně jako skutečná hodnota 0,8 a předpověď 0,6. Střední procentní chyba odhadu [mean percentage error] MPE Je víceméně doplňkovým kritériem k ME, kdy v součtu vystupují relativní odchylky místo absolutních. Theilův koeficient nesouladu [Theil’s U-coefficient] ThU[6] , kde n…….. délka původní časové řady (užité pro odhad modelu) h…….. délka předpovídaného období [ h>0 ] n +h ... délka původní časové řady prodloužená o předpovídané období Někdy je ovšem toto kritérium formulováno obecněji, přičemž odchylky jsou brány vůči nějakému jednoduchému či naivnímu modelu- tzv. benchmark. Hodnota U leží vždy mezi 0 a 1, přičemž hodnota 0 značí perfektní shodu předpovědí se skutečností. Publikace Hindls R., Hronová S, Novák, I.: Metody statistické analýzy pro ekonomy uvádí jinou verzi Theilova koeficientu (zde označenou ThC) Theilův koeficient nesouladu [Theil’s C-coefficient] ThC , kde n…….. délka původní časové řady (užité pro odhad modelu) r…….. délka časové řady po zkrácení [r < n] o q pozorovaných hodnot q…….. délka zkrácení , tzn. q = n – r extrapolovaná hodnota na i období dopředu, a to modelem odhadnutým na základě prvních r pozorování časové řady . Pokud se hodnota nachází v rozmezí 3-5%, lze mluvit o velmi uspokojivém výsledku. Model lze s velkou pravděpodobností považovat za použitelný k předpovědím. Pokud se hodnota nachází v rozmezí 5-10%, lze mluvit o jakžtakž uspokojivém výsledku. Model lze s mírnou nadějí považovat za použitelný k předpovědím Pokud se hodnota nachází nad hladinou 10%, nelze mluvit o uspokojivém výsledku. Model lze téměř s jistotou zavrhnout z hlediska použitelnosti k předpovědím. K předchozím kritériím lze přidat ještě dvě další míry, u nichž se omezujeme na posouzení toho, jak model předpovídá znaménka budoucích hodnot (tj. zda tyto hodnoty budou kladné nebo záporné) nebo změny ve směru vývoje budoucích hodnot (zda růst přejde v pokles apod.) Někdy – při strategických úvahách – jde o důležitější aspekty než číselné co nejpřesnější vyjádření předpovídaných hodnot Procento správných předpovědí znaménka PCPS , kde Procento správných (jednokrokových) předpovědí změn směru vývoje PCPD , kde ________________________________ [1] Kvazilineární funkce může být zapsána schématem , kde je spojitá monotónní funkce a dále , jsou vhodné konstanty ( nenulové). Zobecněnou kvazilineární funkci lze zapsat ve tvaru: , kde jsou vesměs spojité a ryze monotónní funkce. Oproti kvazilineární funkci se nevyžaduje symetrie vnitřních funkcí , vůči jednotlivým argumentům. [2] S přirozenou podmínkou, že funkce jsou vzájemně různé. [3] Odhady parametrů získané pomocí jednoho a druhého kritéria tedy nebudou obecně shodné. [4] Je tímto zřejmé, že postup nelze uplatnit na ekonomickou časovou řadu s některými hodnotami zápornými. [5] Pracujeme s časovou řadou, jejíž hodnoty – aspoň v nedlouhém časovém období – jsou zpravidla dosti vzájemně blízké a rozptyl náhodných složek obvykle významněji nekolísá. [6] Henri Theil byl významný nizozemský ekonometr a matematický ekonom [1924-2000], následník Jana Tinbergena na Erasmus University v Rotterdamu, později působil na universitě v Chicagu a na University of Florida.