Metoda exponenciálního vyrovnávání[1]

                                           [Brown-Meyer]

Je dalším z  přístupů, který je řazen (vedle metody klouzavých průměrů) k adaptivním technikám
určení trendové složky časové řady .

Výchozí úvahou této techniky je, že se k predikci nové hodnoty časové řady :

a)  berou v úvahu všechna dostupná pozorování časové řady

b)  starší pozorování jsou z hlediska síly ovlivnění aktuálních předpovědí

      brána  s nižší významností než pozorování nová (aktuální).

Váhová struktura, která je při Brownově exponenciálním vyrovnávání uplatněna, je představována
geometrickým rozdělením. Váhy jsou tedy stanoveny podle vzorce

(1)                                                   ^

Je patrné, že váhy splňují podmínku  , neboť

                                                .

Nechť nepřekvapí, že váhová struktura se řídí rozdělením, které je definováno na neomezeném oboru,
přestože počet pozorování časové řady, kterým jsou váhy přiřazovány je vždy konečný -
z matematického hlediska nepředstavuje tato okolnost žádný problém.

Název exponenciální by odpovídal zespojitění situace, neboť obdobou diskrétního geometrického
rozdělení je ve spojitém případě rozdělení exponenciální. Název tedy nemá nic společného
s exponenciálním průběhem trendu.

Podobně jako metoda klouzavých průměrů je i exponenciální vyrovnávání  založeno na lokáním
vyrovnání časové řady jednoduchou matematickou křivkou (na rozdíl od metody klouzavých průměrů se
však vzatá pozorování neváží „symetricky„).

Podle typu vyrovnávající křivky rozlišujeme tři základní verze  tohoto postupu :

1. Jednoduché (konstantní) exponenciální vyrovnávání (lokálně vyrovnávající

     křivkou je po částech konstantní funkce).

2. Dvojité (také lineární)  exponenciální vyrovnávání (zde je lokálně vyrovnávající

    křivkou lineární funkce).

3. Trojité (také kvadratické) exponenciální vyrovnání (uplatňuje se parabola 2.

    stupně lokálně  vyrovnávající  křivkou kvadratická funkce)

Všechny verze exponenciálního vyrovnávání se opírají o následující úvahu :

V kterémkoliv bodě (pevně zvoleném okamžiku t ) máme k dispozici jednak :

-  poslední pozorování analyzované časové řady, tedy

-  předpověď téhož pozorování  (určenou dříve na základě předtím, tj. do

   času  t-1 dostupných pozorování, tedy do hodnoty [ ]včetně).

Předpověď pro “opravenou hodnotu“  tedy nyní vytvořme pomocí váženého průměru

(2)

tzn. že nová předpověď je konstruována jako vážený aritmetický průměr skutečné hodnoty “nového”
pozorování  a „staré„ předpovědi tohoto pozorování y[t]* (při informaci dostupné do okamžiku t-1
včetně). Hodnota “váhové” konstanty a rozhoduje o tom, které z obou uplatňujících se informací
přisoudíme větší význam (resp. v jaké proporci budeme tyto informace brát).

Opakovanou substitucí dostáváme ze vztahu (2)  výraz


                atd., až

(3)

Při dostatečně velkém n (teoreticky pro n ® ¥ ) dospějeme k nekonečnému součtu

(4)                                               ,  což je

vlastně aritmetický průměr (o nekonečném počtu členů) „vyrovnaných hodnot“ s vahami ve tvaru (1) .

Výraz (2)  lze dále jednoduchou úpravou přepsat na tvar

(2´)                               , kde

což lze interpretovat tak, že novou předpověď  pro  dostaneme jako součet

skutečné hodnoty pozorování   a  určitého (100xa) procentního podílu chyby předpovědi  téže
veličiny   určené na základě informací známých jen do minulého období t-1 (predikce je sestrojená
toliko z hodnot [ ]) .

Důležitou otázkou je v tomto kontextu volby „vyrovnávající konstanty„ a -  zpravidla se omezujeme
na rozsah mezi (0,7 – 0,9). Někdy je však  pojímáno jako doplněk do 1, stanoví se tedy . Čím je
hodnota   blíže k 1 tím váhy přiřazované jednotlivým pozorováním směrem do minulosti klesají
pomaleji.


O rychlosti klesání dává představu toto srovnání:

k =                   1       2         3           4          5
6                                     10

Srovnejme:    0,9   0,81   0,729  0,6561   0,59049   0,531441 ………………...  0,34868

                        0,7   0,49,  0,343  0,2401   0,16807   0,117649 ……………….... 0,02709

Zatímco podíl vah u nejčerstvějších (nezpožděných) pozorování je 9/7 = 1,2857 : 1, je u desátých
pozorování (tj. se zpožděním  9) tento poměr již         0,3487/ 0282 tj. 12,34/1


                                                                                                0,7

                                                                                               0,49

                                                                                              0,343

                                                                                             0,2401

                                                                                            0,16807

                                                                                           0,117649

                                                                                           0,082354

                                                                                           0,057648

                                                                                           0,040354

                                                                                           0,028248

                                                                                                0,9

                                                                                               0,81

                                                                                              0,729

                                                                                             0,6561

                                                                                            0,59049

                                                                                           0,531441

                                                                                           0,478297

                                                                                           0,430467

                                                                                            0,38742

                                                                                           0,348678

Přirozenou otázkou je, zda existují užitečná vodítka pro určení konstanty a :

a)  Pravidla vyvozená ze statistických požadavků na odhady obecně :

a1)  Jedna možnost vychází z volby vyrovnávací konstanty ze vztahu

(5)                             odkud pro dané n dostaneme

a2) Další z možností vychází z variantního modelu (vyrovnání parabolou k-tého řádu), na základě
kterého se volí a[0]  tak, aby vyhovovalo vztahu

(6)                  ^    a[k]  je tzv. ekvivalentní vyrovnávací konstanta.

a3) Ještě jiná možnost vychází z nejlépe vyrovnávajícího (pozorované hodnoty časové řady)
klouzavého průměru délky .  Pak se stanoví  jako

pro  konstantní/jednoduché exponenciální vyrovnávání  a stejně tak

(7A)  pro  dvojité exponenciální vyrovnávání (klouzavý průměr)

(7B)   pro trojité exponenciální vyrovnávání ^2         , kde

*   je délka (počet členů) nejlépe vyrovnávajícího klouzavého průměru .

b) Simulační způsob: interval 0,7 - 1 se rozdělí např. na 30 úseků po 0,01, provedou se predikce na
několik kroků dopředu, spočte se průměrná nebo střední kvadratická chyba predikce a vyhledá se
taková hodnota , při které je tato chyba predikce nejmenší.

Poznámka: Výpočtové vzorce (zejména u trojitého exponenciálního vyrovnávání) jsou již natolik
(technicky) složité, že je uživatel zpravidla odkázán na některý ze softwarových produktů určených
k analýze časových řad, které zpravidla všechny tři verze exponenciálního vyrovnávání obsahují.
Proto je daleko vhodnější pořídit si příslušné software (STATGRAPHICS, SPSS, RATS apod.), než
pracně počítat hodnoty vyrovnání a předpovědí (rekurentně) tabulkovými procesory, kalkulačkou nebo
dokonce ručně.

Komparační zhodnocení: čím je vyrovnávací konstanta  vzdálenější od 1 (tedy blíže k nule), tím je
vyrovnání flexibilnější a provedená následná predikce vykazuje vyšší rozkolísanost.

Podobný rys vykazuje také trojité exponenciální vyrovnávání ve srovnání s dvojitým a zejména vůči
jednoduchému, které dává velmi rigidní předpovědi (tj. po částech konstantním trendem) .

1. Jednoduché (konstantní) exponenciální vyrovnávání

Formulace modelu je založena na představě, že pro dané pevné  a hodnoty zpoždění  lze uplatnit
konstantní trend tvaru

(11)                                            pro  j = 0, 1, 2, 3, ….

 [ ]je (jediný) neznámý parametr. Tato domněnka (o konstantnosti vývoje) není příliš realistická,
avšak jednoduchost modelu (11) umožňuje přiblížit postup odhadu parametrů [.  ]i u složitějších
modelů. Výchozím předpokladem modelu (11) je tedy trend ve tvaru po částech konstantní funkce.

Minimalizační kritérium má zde tvar

(12)

ve kterém se uplatňuje trendový model tvaru [  ]( tedy konstantní trend ).

Odhad [  ]parametru [ ]realizovaný váženou metodou nejmenších čtverců (WLS) je pak dán vztahem

(13)

ověření:  Derivací výrazu (12) podle  dostaneme:

(12A)

Upravíme-li krácením  a položíme-li derivaci rovnou nule, dostaneme

(12A)

 s využitím toho, že součet řady , obdržíme (13).                         � .

U tohoto typu mohou být vysloveny námitky, že model s konstantním trendem (11) je pro většinu
reálných situací stěží použitelný, poněvadž trend časové řady se zpravidla vyvíjí jiným způsobem
než po částech konstantní funkcí.

(14)  vyrovnání pro aktuální období      :

(15)   predikce na t období dopředu      :

Předpovídané hodnoty na libovolné období dopředu jsou tedy shodné s poslední pozorovanou hodnotou
(je zřejmé, že tato zásada není vhodná pro situace, kdy časová řada vykazuje jakýkoliv znatelný
trend).

Lze ještě užít tzv. chybový vzorec:

(14A)

V případě dvojitého a trojitého exponenciálního vyrovnávání je užitečné definovat dvě tzv.
"vyrovnávací statistiky" :

(16a)

(16b)

Pro tyto vyrovnávací statistiky platí následující rekurentní vztahy :

(17a)                                              []

(17b)                                            [    ]

ověření (17a),(17b):

Levou stranu (17a) lze vyjádřit jako

[            ], přičemž[  ]

Levou stranu (17b) lze vyjádřit jako

[][  ]□[.]

Výpočet těchto statistik se provádí rekurentně počínaje  ^ .

Volba vyrovnávací konstanty  pro  jednoduché exponenciální vyrovnávání: Omezujeme se zde zpravidla
na interval  a podobně jako pro jednoduché se užívá

a)  fixní volba  nebo  .

b) volba  , kde  je délka klouzavých průměrů adekvátní této řadě (odvozena z požadavku, aby tzv.
střední věk vah jednoduchých klouzavých průměrů této délky, tj.  a střední věk vah jednoduchého
exponenciálního vyrovnávání, tj.  byly shodné. Přístup ale není ideální, protože stejně musíme
vyjít z vhodné délky klouzavého průměru.

c) Jako možné hodnoty  se vezmou hodnoty z intervalu  a vybere se ta hodnota, která nejlépe
predikuje ve smyslu míry SSE.

 předpovědní interval pro jednoduché exponenciální vyrovnávání

V případě, že rozdělení náhodné složky uvažované řady je alespoň přibližně normální, lze v rámci
exponenciálního vyrovnávání vedle bodových předpovědí konstruovat také předpovědní intervaly. Jako
 předpovědní interval pro jednoduché vyrovnávání se doporučuje konstruovat interval ve tvaru

                      , kde

libovolné  je

 .... kvantil normovaného normálního rozdělení

 definováno jako  sloužící k převodu  na .

 je střední absolutní chyba, tedy


2. Dvojité (lineární) exponenciální vyrovnávání

Formulace modelu je založena na představě, že pro dané pevné  a hodnoty zpoždění  lze uplatnit
konstantní trend tvaru

(21)                                                 pro  j = 0, 1, 2, 3, ….

Minimalizační kritérium  má v tomto případě tvar

(22)

ve kterém se uplatňuje trendový model tvaru [][. ]Výchozím předpokladem modelu (22) je tedy trend
ve tvaru po částech lineární funkce.

V tomto případě jsou předmětem odhadu dva parametry [ ]- jako odhad [  ]- a  [ ]-[ ]jako odhad
parametru   .

Odhad obou parametrů v (22)  získáme řešením soustavy normálních rovnic

(25A)

(25B)

ověření (25A), (25B):    Derivací výrazu (22) podle  dostaneme

(23A)

Podobně, derivací výrazu (22) podle  dostaneme:

(23B)

Upravíme-li (23 A) a položíme-li příslušnou derivaci rovnou nule:

(24A)                                      , neboli

(24A*)

a s využitím toho, že součet řady   a součet řady

obdržíme                      a  vynásobením

získáme (25A) .


Krátíme-li (23B) výrazem  a položíme-li levostrannou derivaci rovnou nule:

(24B)                                     .

Výrazy s neznámými  přemístíme nalevo

 (24B*)

a s využitím toho, že součty řad ,  máme

                                                         , což

po vynásobení  dává (25B).
�.

Soustavu dvou normálních rovnic pro výpočet parametrů ,

(25A)

(25B)

můžeme vyjádřit v maticovém tvaru

                            , takže

                             , kde

determinant matice soustavy je roven   . Takže

                     .

                    .

Odtud máme


Pokud pracujeme s konečným počtem pozorování, dostaneme soustavu

(35A)

(35B)

Ta je srovnatelná s (25A), (25B) , protože pokud n je dostatečně velké, lze nahradit

(36A)

(36B)                              .          tj.

(37A)

(37B)                              , což po vynásobení

první rovnice  a druhé rovnice  dává přesně

(25A)

(25B)                                  .                          � .

Zavedeme-li pomocné veličiny

(51a)

(51b)        ,  nebo též


lze zapsat výsledné  odhady parametrů    také jako

(26A)                                              ^

(26B)                                                ^

ověření (26A), (26B):

(25A)

(25B)

Vyjděme z (25A), (25B) a vyjádřeme z obou těchto vztahů :

(25A)

(25A)

Porovnáme obě strany a máme


        , odečteme

        ,         O.K.


Máme dostat                                    ^

tj.                              ^                                        □ .


vyrovnání pro aktuální období     :

(24)                                                  ^

predikce na t období dopředu     je dána vztahy

(25)                                                       neboli

(25a)                            ^

Model dvojitého exponenciálního vyrovnávání (21) je pro řadu situací dobrým predikčním nástrojem,
pokud se při volbě vyrovnávací konstanty řídíme některým z výše uvedených pravidel.

Při výpočtu statistik  postupujeme rekurentně, přičemž jejich počáteční hodnoty pro  získáme ze
vztahů :

(26A)                                            [         ]

(26B)                        [                                       ]

Počáteční hodnoty odhadů [ ] získáme prostou lineární regresí tak, že několik (cca 6-10)
počátečních pozorování řady proložíme regresní přímkou. [ ]je příslušná úrovňová konstanta, [  ]je
parametr sklonu regresní přímky.

(22)

Derivací výrazu (22) podle  a jeho anulováním dostaneme:

                      krátíme výrazem


                                                                  � .

Výrazy s neznámými přemístíme nalevo

                                    což zapíšeme jako


Protože dle (52) , u neznámé  máme člen

Dále dle (53)  u neznámé  máme


Tedy

   (12B)


Volba vyrovnávací konstanty : omezujeme se zde zpravidla na interval  a podobně jako pro jednoduché
se užívá

a) fixní volba , kde  je délka klouzavých průměrů adekvátní

b) pro danou řadu (vyplývá opět z porovnání středních věku vah jednoduchých klouzavých průměrů a
vah dvojitého exp. vyrovnávání).

c)Jako vhodné hodnoty  se vyšetří hodnoty z intervalu  a vybere se ta hodnota, která nejlépe
predikuje ve smyslu míry SSE.

Jako  předpovědní interval se doporučuje konstruovat ve tvaru

                      , kde pro

libovolné  je  definováno jako


jiné odvození odhadu parametrů

(25A)

(25B)

(25A)

(25A)


        , odečteme

        ,


                   �

Pak. Dle (25A)


3. Trojité (kvadratické) exponenciální vyrovnávání

 je třetím užívaným typem exponenciálního vyrovnávání, které se uplatňuje především u časových řad
vyznačujících se ve svém dosavadním vývoji úseky se zřetelnou akcelerací nebo naopak decelerací
průběhu v čase.

Minimalizační kritérium má u toho typu vyrovnání tvar

(31)

ve kterém se uplatňuje trendový model tvaru

(32)                                                      [ ]

Zde máme co do činění již se třemi konstantami  coby s odhady trojice neznámých  parametrů
kvadratické funkce [ ].

Odhady těchto parametrů se opět obdrží vyvozením ze soustavy (tří) normálních rovnic.  Ve výrazech
se tentokrát uplatňují již tři vyrovnávací statistiky :

jednoduchá vyrovnávací statistika

dvojitá vyrovnávací statistika

(33)

s vlastností

trojitá vyrovnávací statistika

Pomocí nich se dají vyjádřit jak vyrovnané, tak předpovídané hodnoty :

vyrovnání pro aktuální období    :

(34)

predikce na t období dopředu    :

(35)

Predikce pomocí trojitého exponenciálního vyrovnání jsou (zejména při nízké volbě konstanty  - tj.
blízké 0,7) značně citlivé na chování posledních 2-3 pozorovaných hodnot řady. Vykazují-li tato
pozorování zřetelný odklon oproti předchozímu průběhu časové řady, poskytne kvadratické vyrovnání
zpravidla nepoužitelné předpovědi (tyto se vychylují buď příliš nahoru nebo příliš dolů podle směru
vychýlení právě posledních nejčerstvějších pozorování).

Při  určování počátečních odhadů  [  ]se v tomto případě doporučuje volit delší úsek (až 1/2 počtu
všech pozorování). Vyrovnání se zde provádí (pomocí prosté metody nejmenších čtverců) kvadratickým
trendem.

Derivací výrazu (31) podle  a jeho anulováním dostaneme:

                                    neboli

(41A)

Derivací výrazu (31) podle  a jeho anulováním dostaneme:

                                      neboli

(41B)

Derivací výrazu (31) podle  a jeho anulováním dostaneme:

                                      neboli

(41C)

 (41A) upravíme na

Po vyčíslení sumací  máme

(41B) upravíme na

Po vyčíslení sumací  máme

(41C) upravíme na

Po vyčíslení sumací  máme


Poznámka: Při výpočtech součtů konvergentních nekonečných řad, které se vyskytují v normálních
rovnicích u různých verzí exponenciálního vyrovnávání, lze užitečně uplatnit poznatky odvozené z
teorie  mocninných řad.

Máme-li pro argument   definovánu funkci resp. mocninnou řadu

(51)                                   , pak

výpočet derivací této funkce (do čtvrté derivace včetně) vede k těmto výsledkům:

(52)

(53)

(54)

(55)

Všimněme si, že sumace derivovaných prvků mocninné řady (výrazy v součtech v (51,52,53,54) se
získají velmi prostým způsobem tím, že derivujeme funkci  . Platí to pro první, druhou i třetí
(případně i vyšší) derivaci.

Vezmeme-li za argument z  vyrovnávací konstantu  - to je přípustné, neboť její hodnoty rovněž leží
v intervalu (0,1) - dostaneme :

(61)                                    ,

(62)          ,

(63)                           což vypočteme z rozvoje

Dále máme ještě


                                        □ .

Uvedené vztahy se aktivně uplatňují při výpočtu výrazů, které vedou v jednotlivých typech
exponenciálního vyrovnávání k určení odhadů parametrů  .


Holtova vyrovnávací metoda[2]

Jistým zobecněním dvojitého exponenciálního vyrovnávání je tzv. Holtova metoda, ve které se
uplatňují dvě vyrovnávací konstanty

      pro vyrovnání úrovně

      pro vyrovnání směrnice   téže řady

(71)

Vyhlazení úrovně je tedy definováno jako konvexní kombinace poslední pozorované hodnoty  v čase  a
odhadu této hodnoty vzatého v předchozím čase .

(72)

Pro vyrovnání, resp. predikci zde platí předpisy:

(73)

(74)                                              pro

Jako volby počátečních hodnot se doporučují:

(75A)

(75B)

Za pozornost stojí, že Holtova metoda byla nejprve navržena jako ad hoc postup  na základě prosté
logické úvahy. Teprve později bylo prokázáno, že Brownovo dvojité exponenciální vyrovnávání se
zvolenou  vyrovnávací konstantou  je speciálním případem Holtova metody , jejíž vyrovnávací
konstanty jsou pak

(76)                                       ,     .
________________________________

[1]  Postup všech typů exponenciálního vyrovnávání je zevrubně popsán v monografii:

Brown,R.,G.: Smoothing, forecasting and prediction of discrete time series. London, Prentice-Hall
1963.  popř. v článku

Brown,R.,G.,Meyer, R.,F.“: The fundamental theory of exponential smoothing. Operations Research
9/1961 str. 673-684.


[2] Postup je popsán v textu: Holt, C.,C: Forecasting seasonal and trends by exponentially weighted
moving averages . Res. mem. No 52. Carnegie Institute of technology. Pittsburg 1957.