1 Praktické poznámky k analýze časových řad v programu STATISTICA. Dále popsané příklady lze vyzkoušet se souborem trend.sta, který nejprve otevřete v programu STATISTICA. V souboru jsou uloženy průměrné roční teploty vzduchu v Žatci za období 1961-1990. Program obsahuje speciální modul pro vlastní analýzu časových řad. Tento modul se spouští sekvencí příkazů: Statistika - Pokročilé lineární/ nelineární modely - Časové řady predikce Zde jsou obsaženy především v přednášce zmiňované nástroje pro úpravu (transformaci) časové řady, její shlazování (klouzavé průměry, exponenciální vyrovnávání) a dále pro analýzu sezónní složky (např. Sezónní rozklad) a cyklické složky (např. Spektrální analýza). Mimo to zde naleznete řadu dalších metod (např. ARIMA ­ Box ­ Jenkinsovy metody) Nejsou zde však obsaženy nástroje pro analýzu trendu. Tu je možné provádět postupy dále popsanými. 1. Možnosti analýzy trendu v programu Statistica 1.1 Vyrovnávání trendu matematickými křivkami - 1. možnost Posloupnost příkazů: Grafy - 2D grafy - Spojnicové grafy (Proměnné) Zadáte jméno proměnné Na kartě Detaily lze zadat různá proložení (lineární trend, exponenciální, polynom n-tého řádu atd.) Na kartě Možnosti1 lze zadat Popisy případů proměnnou (rok) Proložení polynomem n-tého stupně ­ zvolte Polynomiální proložení na kartě Detaily a na kartě Možnosti 2 zvolte požadovaný stupeň polynomu 1.2 Vyrovnávání trendu matematickými křivkami - 2. možnost Posloupnost příkazů: Grafy - bodové grafy Zadat proměnné: x: čas - 1,2,3,... (ve vzorovém souboru proměnná t) y: prokládaná řada (ve vzorovém souboru proměnná yt) Nabídka výstupů je stejná jako v 1. možnosti Navíc : na kartě Detaily lze zadat výpočet Statistik (koeficient determinance, rovnice regresní čáry) a také zobrazit pásy spolehlivosti. 2 1.3 Vyrovnávání trendu matematickými křivkami - 3. možnost Posloupnost příkazů Statistika - Pokročilé lineární/ nelineární modely - Nelineární odhady - Vlastní regrese (MNČ) - Odhadovaná funkce Modul dovoluje zapisovat rovnice různých trendových funkcí. Do okna Odhadovaná funkce můžete zapsat například: yt=a+b*t lineární trend yt=a+b*t+c*t^2+d*t^3 polynom třetího stupně yt=a+b^t exponenciela kde proměnná yt - časová řada, kterou prokládáme trendovou funkci proměnná t - čas (1,2,3, ...) a,b,c, ... ­ parametry modelu, jejichž odhady program vypočte Dále následuje proces volby odhadu parametrů ­ není nutné nic měnit. V úvodním okně výsledků jsou pro interpretaci nejdůležitější: Koneč. hodn.: (např. pro lineární trend 84,63463203) - toto číslo dělené počtem členů řady n je M.S.E. - střední čtvercová chyba odhadu. Podíl rozptylu vysvětlený modelem : (např. pro lineární trend 84,63463203) ,9916731 R =,99582785) ­ hodnoty koeficientu determinance (R2 ) a koeficientu korelace Všechny tyto charakteristiky hodnotí vhodnost modelu. Ve výsledkovém okně na kartě Základ jsou nejdůležitější tyto položky - Souhrn - odhady parametrů (červené hodnoty se statisticky významně liší od nuly) - Analýza rozptylu - t.j. statistický test vhodnosti použitého modelu. Testuje nulovou hypotézu H0 ­ rozptyl vysvětlený modelem (Regrese) a rozptyl reziduální (Rezidua) jsou stejné. Hodnota p<0,05 (červeně) značí statisticky významný výsledek - Graf proložení 2D funkce a pozorovaných hodnot 2. Transformace a shlazování časových řad Posloupnost příkazů: Statistika - Pokročilé lineární/ nelineární modely - Časové řady predikce Zvolte proměnnou (časovou řadu) a klikněte vpravo nahoře na OK (transformace, autokorelace, kříž. korelace, grafy) V horní části okna se budou podle vámi prováděných operací postupně vytvářet transformace (modifikace) původní časové řady, která je v seznamu na prvním místě a nelze ji smazat ( L ­ lock ­ zámek) V přednášce zmíněné analýzy se nacházejí na těchto kartách: Karta Vyhlazování ­ různé typy klouzavých průměrů a metod shlazování 3 Karta x=f(x) ­ různé typy transformací, např., odečtení lineárního trendu Karta Přehledy a grafy ­ konstrukce grafů jedné či několika časových řad ze seznamu Karta Autokorelace ­ analýza sezónní a cyklické složky, vykreslení autokorelační funkce 3. Vlastní analýza časových řad Posloupnost příkazů: Statistika - Pokročilé lineární/ nelineární modely - Časové řady predikce Zvolte proměnnou (časovou řadu) a nebo klikněte na některou z transformovaných řad původní proměnné. Řada dále prováděných metod předpokládá, že jste vstupní data předem upravili v oddílu Transformace (viz. odstavec výše) Dále můžete mimo jiné spustit jednu ze tří metod zmíněných v přednášce: Exponenciální vyrovnávání & předpověď ­ model jednoduchého (nulový trend, žádná sezónnost), dvojitého (trend) a trojitého (trend a sezónnost). Metody je vhodné vyzkoušet na souboru Series_G.sta, který se nachází v adresáři Examples\Datasets. Vhodný model pro analyzovanou řadu se vybere podle podobnosti průběhu řady s ikonami pro různé modely. K odhadům potřebných parametrů lze využít Síťové resp. Automatické hledání. Vykreslení původní a shlazené řady zadáte na kartě Přehled řad. Spektrální (Fourierova) analýza. Hledá cykly neznámé délky obsažené v časové řadě. Metodu je vhodné vyzkoušet na souboru Sunspot.sta, který se nachází v adresáři Examples\Datasets. Metoda nevyžaduje předchozí transformaci pokud na kartě detaily zatrhnete Odečíst prům. a Bez trendu. Spusťte Fourierovu analýzu jednoduchých řad. Hlavní výsledky ­ především graf hodnot (Periodogramu a Spektrální hustoty) najdete na kartě Základ. Na kartě Detaily lze výhodně zobrazit N (například 10) nejvyšších frekvencí (resp. period). Pro testování významnosti je na kartě Přehled & Graf možné porovnat Histogram hodnot periodogramu s křivkou exponenciálního rozdělení. Sezónní rozklad (Census_1). Provádí tzv. sezónní očištění řady se známou délkou sezónní složky. Metodu je vhodné vyzkoušet na souboru Retail.sta, který se nachází v adresáři Examples\Datasets a metoda nevyžaduje předchozí transformaci řady. Zvolíte nejprve proměnnou (SALES), vhodný model (v tomto případě multiplikativní) a délku sezónní složky (12, protože se jedná o měsíční data). Pod seznamem u položky Počet záloh na proměnnou (řadu) zadejte 6 (umožní to uložit v pracovní oblasti 6 nově vypočtených řad). Na kartě detaily zatrhněte všech šest možností v oddílu Poklepání na OK přidá komponenty do prac. oblasti. Výpočet jednotlivých složek řady spustíte kliknutím na Shrnutí (Sezónní rozklad). Vykreslení jednotlivých složek řady dosáhnete tak, že na kartě přehled řad vyberete ze seznamu sedmi řad (jedna původní a šest nových) požadovanou položku (položky) a kliknete na graf. ­ viz. podklady k přednášce.