Metoda klouzavých průměrů

Patří (spolu s metodou exponenciálního vyrovnávání) k adaptivním přístupům při analýze trendové
složky. Tyto přístupy pracují se systematickými složkami (např. trendem), které v průběhu plynutí
času mění svůj globální  charakter, což mj. znamená, že pro ně nelze použít žádnou matematickou
křivku s neměnnými (v čase konstantními) parametry. Na druhé straně se předpokládá, že takovéto
vyrovnání je možné lokálně (v dílčích, krátkých úsecích řady), přičemž parametry tohoto – lokálního
-vyrovnání mohou být v jednotlivých úsecích odlišné. V těchto případech se omezujeme pouze na
lokální vyrovnávání (či jeho odstranění) trendu.

Nelze –li tedy vyrovnat časovou řadu pomocí paraboly 2.stupně

(2.1)                                            ,

omezíme se na vyrovnání v krátkých úsecích, pro jejichž středy v časových  bodech t  lze použít
vyrovnání pomocí lokálních trendů

(2.2)                                     .

Proces eliminace trendové složky se tedy adaptuje vůči okamžitému lokálnímu průběhu řady. Stupeň
tohoto přizpůsobování lze (za jistých okolností) vědomě řídit.

Další výhodou adaptivních technik je konstrukce předpovědí, které mohou pružně reagovat na časové
změny v charakteru řady a někdy také výpočetní nenáročnost.

Název klouzavý průměr [moving average] je spojen s lineární kombinací členů původní řady
s jednotkových součtem koeficientů/vah , např. typu

(2.3)                                      ,

někdy se zkráceným zápisem (jako operátor)

Vytváření takových konečných kombinací hodnot řady je totiž ekvivalentní právě s lokálním
vyrovnáváním řady určitými matematickými křivkami.


Jde o postup, který může být využit k identifikaci dvou složek časové řady :

- trendové složky

- sezónní složky

Obecněji můžeme zapsat klouzavý průměr jako

(2.4)

Číslo m nazveme poloměrem, hodnotu  délkou klouzavého průměru. Z hlediska praktických účelů je
vhodnější lichý počet členů průměru (lze však pracovat i se sudým počtem členů, pokud se postup
doplní centrováním[1]).


Předpokládejme např., že hodláme danou časovou řadu vyrovnat polynomem 3. řádu, tzv. kubickou
parabolou. Pro vyrovnání zvolíme , klouzavý průměr tedy sestavujeme z  hodnot uvažované časové
řady, které označíme jako

                                            , pro    .

Koeficienty vyrovnávajícího polynomu – s argumenty v , tzn. v bodech, ve kterých řadu vyrovnáváme)
odhadneme metodou nejmenších čtverců OLS standardně tak, že minimalizujeme výraz

(2.6)

Derivováním podle jednotlivých koeficientů polynomu a anulováním příslušných derivací pro
minimalizaci získáme pro hledané čtyři odhady  koeficientů  soustavu čtyř normálních rovnic, které
lze obecně zapsat jako


            neboli

(2.7A)

(2.7B)

(2.7C)

(2.7D)

              tj. ve standardním tvaru soustavy čtyř normálních rovnic

(2.8A)                .

(2.8B)                .

(2.8C)                .

(2.8D)                .        ,

jinak vyjádřitelných v souhrnném zápisu

(2. 9)       .

Uvedenou soustavu lze dále zjednodušit, protože pro liché  platí

(zde se uplatňuje výhoda volby lichého počtu členů řady)

(2.10A)               neboli

(2.10B)              neboli

(2.10C)            neboli

(2.10D)            neboli     .

V předchozím jsme využili toho, že , , ,  .

Nás přitom zajímá toliko odhad , neboť je to hodnota vyrovnávajícího polynomu  v bodě  a v
rozvíjené metodě ji budeme brát za hledanou vyrovnanou hodnotu řady ve středu zkoumaného úseku.

K určení odhadu  stačí tedy použít první a třetí rovnici soustavy (2.10A), (2.10C), pomocí nichž
dostaneme :

(2.10A)

(2.10C)                                           .

Z první rovnice (2.10A) získáme


Ze druhé rovnice (2.10C) pak máme


Komparací pro :        a vydělením 2 :


(2.11)                                                         s rozvedením

, takže

odhadnutá trendová složka  a současně vyrovnaná hodnota řady v čase t je rovna

(2.12) , resp.

(2.12A)            .                       � .

Ve zkráceném symbolickém zápisu můžeme výsledek zapsat jako

(2.12B)                                   .

Obecně můžeme vyrovnávat úsek o délce  polynomem r-tého řádu a tak obdržet klouzavé průměry délky
  a řádu r.

Vyrovnaná hodnota  v bodě t je lineární kombinace výrazů   se sudými , což lze odvodit zobecněním
soustavy (2.12). Po algebraické úpravě je to lineární kombinace hodnot  s pevně určenými
koeficienty, které se nazývají váhy klouzavého průměru.

Ilustrace:

Uplatněme předchozí pravidlo pro aproximaci hodnot paraboly 3.stupně

Vyjádřeme třetí mocniny přirozených čísel od 1 do 10 :

       t     =         1          2          3        4            5            6
7          8           9           10

       =       1        8        27     64       125      216    343    512      729     1000

a použijeme vzorec (2.12A) pro výpočet vyrovnané hodnoty této řady v bodě t = 3

                              .                .

v konkretizaci                        .                   , tzn.

ve vyčíslení                   .

Podobně dostaneme:           .

                                          .

                                          .

Vyrovnávali jsme zde kubickou řadu polynomem3.stupně (shodný výsledek bychom též dostali, pokud
bychom vyrovnávali polynomem řádu vyšším než 3, což ukážeme na dalším příkladě).

Příklad1  Modifikace pro polynomickou křivku 4.stupně se stejnou délkou průměru:

(2.14)

Derivováním podle jednotlivých koeficientů polynomu a anulováním příslušných derivací pro
minimalizaci získáme pro hledané čtyři odhady  koeficientů  soustavu pěti normálních rovnic, které
lze obecně zapsat jako


neboli


tj. ve standardním tvaru soustavy pěti normálních rovnic:

(2.15A)               .

(2.15B)               .

(2.15C)               .

(2.15D)               .        ,

(2.15E)                .        ,

jinak vyjádřitelných v souhrnném zápisu

(2.16)

S ohledem na nulovost členů s lichými mocninami u  dostaneme dále:

(2.17A)                     .

(2.17B)                     .

(2.17C)                     .

(2.17D)                     .                           ,

(2.17E)                      .           ,

Po vyčíslení členů se sudými mocninami  máme zjednodušení:

(2.18A)

(2.18B)

(2.18C)

(2.18D)

(2.18E)                                                ,

K určení parametrů ,  máme nyní k použití 3 rovnice: (2.18A),  (2.18C), (2.18E), které lze souhrnně
zapsat maticově

(2.19)   , tedy

Pomocí těchto tří rovnic lze vypočíst všechny parametry , , ,zatímco k určení zbývajících dvou
parametrů lze uplatnit vztahy vyjádřené rovnicemi (2.17B), (2.17D). Jak patrno, obě (rekursívní)
„podsoustavy„ zahrnují disjunktní množiny parametrů.

Inverzi matice v (2.19) získáme následovně:

(2.20)

                                         , odtud máme

(2.21A)                            , po rozepsání

  a odtud

Váhový vektor pro  má tedy tvar .

Podobně pro  dostaneme


(2.21C)

Konečně pro  dostaneme


(2.21E)                             .

Analogicky pro podsoustavu dvou rovnic (2.18B), (2.18D), ze které můžeme odvodit parametry  , ,
obdržíme maticové vyjádření

(2.19)   , tedy


(2.21A)

(2.21A)


Příklad2  Modifikace pro polynomickou křivku 2.stupně se stejnou délkou průměru:

(2.31)

Derivováním podle tří parametrů polynomu a anulováním příslušných derivací získáme pro odhady
koeficientů  soustavu tří normálních rovnic, které lze obecně zapsat


Po snadné úpravě


tj. ve standardním tvaru soustavy tří normálních rovnic

(2.32A)                           .

(2.32B)                          .

(2.32C)                           .

jinak vyjádřitelných v souhrnném zápisu

(2.33)                           .

S ohledem na nulovost členů s lichými mocninami u a po vyčíslení členů se sudými mocninami u :

(2.33A)                       .

(2.33B)                       .

(2.33C)                       .

Pro výpočet parametrů  dostáváme tedy tytéž vzorce jako v (2.10A,C), zatímco výpočet  je dán
vztahem  .

Snadno lze dokázat následující vlastnosti těchto klouzavých průměrů:

(1) Součet vah klouzavého průměru je roven 1:  aplikujeme-li totiž klouzavý průměr na řadu stejných
hodnot, pak vyrovnanou hodnotou musí být původní konstanta.

(2)  Váhy jsou symetrické kolem prostřední hodnoty , neboť ve výrazech typu

(2.37)

mají pro sudé j členy  symetrické koeficienty.

(3) Je-li r sudé číslo, pak klouzavé průměry řadů r a r+1 se stejnou délkou 2m+1 jsou totožné:
prohlédneme-li si pozorně soustavu (2.12), pak pro  dostaneme stejné řešení, ať jsou v soustavě
zahrnuty členy s neznámou  nebo nejsou.

Poznámka 1 Vyrovnáním řady pomocí techniky klouzavých průměrů získáme vyrovnané hodnoty pouze pro .
Ztratíme tedy m hodnot na začátku a m hodnot na konci řady, které zůstanou nevyrovnány.

Poznámka 2 Pokud bychom chtěli  k vyrovnání používat úseky se sudým počtem 2m členů: vyrovnaná
hodnota by pak patřila doprostřed časového intervalu mezi okamžiky původních pozorování, což není
právě výhodné vzhledem k interpretaci výsledků. Uspokojivé řešení situace bude uvedeno níže.

V následující tabulce 1 jsou uvedeny váhy klouzavých průměrů až do pátého řádu včetně při různých
délkách. Vzhledem k symetrii je uvedena někdy jen první polovina vah včetně prostřední. Podle dříve
uvedené vlastnosti jsou váhy pro druhý a třetí řád stejné, stejně jako jsou stejné pro čtvrtý a
pátý řád. Průměry řádu 0 a 1 nejsou uvedeny, protože jde o prosté aritmetické průměry spočtené z
členů řady

(2.38)

Pro úplnost tabulka obsahuje váhy klouzavých průměrů druhého nebo třetího řádu a délky 3, přestože
zde platí  .

Tabulka 1

délka/ řád                           2. a 3.
4. a 5.

3

5

7

9

11

13

Zatím jsme pominuli otázku, jak určit vyrovnané hodnoty pro prvních m a posledních m pozorování
časové řady a jak získat příslušné predikce pro budoucí období.

V ilustrativním příkladě jsme vyrovnávali kubickou parabolou vždy 5 sousedních hodnot řady. Nechť
je těmito hodnotami pět posledních hodnot řady .

Na rozdíl od předchozího nás budou nyní zajímat i ty dříve ignorované hodnoty kubické paraboly
vyrovnávající tento úsek pro . K tomu ale potřebujeme znát i odhady koeficientů  této křivky.
(dříve nám stačil koeficient ).  Ze soustavy (2.12A-D) se zjistí, že příslušné odhady budou mít
tvar

(2.39B)

(2.39C)

(2.39D)                            .

Ověření např. pro :  z předchozího víme, že , přičemž

                                 .    Proto máme

                        neboli


Po sdružení členů

závěrem dospějeme k               .

Výsledek (2.39C)  po rozvedení dává :


Tedy platí                                                               □.

(2.39B)

(2.39D)   .

(2.39B)

              O.K.

(2.39D)   .

(2.39D)   .

(2.39D) .  O.K.

Získání odhadů koeficientů (kromě ) pro  (2.39B-2.39D) spolu s (2.36A) pro umožní získat pro
poslední dvě pozorování  jejich vyrovnané hodnoty. Dostaneme je dosazením nalezených odhadů do
obecného predikčního schématu

(2.40)

Po dosazení   a  získáme tyto vyrovnané koncové hodnoty :

Při dosazení  :


 (2.41A)                                   , neboli

vyrovnanou hodnotu pro  získáme jako vážený průměr této pětice hodnot:

                (se součtem vah 1)


Podobně při dosazení pro  dostaneme z (2.40) :


 (2.41B)                                           ,  tzn.

                       (se součtem vah 1)


Vzhledem ke zřejmé symetrii také podobně dostaneme vyrovnanou první a druhou hodnotu ze začátku
řady jako

(2.41C)                                      , neboli

                         (se součtem vah 1)

 (2.41D)                                          , tzn.

                                (se součtem vah 1)


Uvedený postup navíc dokonce umožňuje konstruovat předpovědi v dané řadě: např. předpověď hodnoty
získáme tak, že do (2.40) dosadíme . Dostaneme:

(2.42)                                    .

ověření:


Uvedený postup lze ale použít jen pro konstrukci krátkodobý předpovědí – čím je předpovídaná
hodnota vzdálenější od časového bodu předpovědi  (tj. čím delší je horizont předpovědi), tím lze
očekávat přirozeně menší spolehlivost predikce.

Poznámka: Při výpočtech vah v klouzavých průměrech se uplatňuje znalost těchto dvou vztahů

Při   :                   ,     .

Klouzavé průměry, které jsme takto popsali, se nazývají počáteční, koncové a předpovědní, podle
toho, zda vyrovnáváme počáteční hodnoty řady, koncové hodnoty řady nebo pomocí nich předpovídáme.
Poznamenejme, že tyto klouzavé průměry již nemají tak výhodné vlastnosti jako klouzavé průměry pro
vyrovnání středních členů řady: jejich váhy nejsou obecně symetrické kolem prostřední hodnoty a
váhy klouzavých průměrů např. druhého a třetího řádu již nejsou totožné.

Avšak i pro klouzavé průměry tohoto typu jsou příslušné váhy v literatuře tabelovány.

Např. předpověď o jeden krok dopředu při použití klouzavých průměrů prvního řádu a délky 3 má podle
prvního řádku tabulky tvar

(2.43)                             .

Pro metodu klouzavých průměrů musíme řešit otázku, jaký řád a jakou délku klouzavých průměrů pro
analyzovanou časovou řadu zvolit.

Obvykle se rozhodujeme na základě subjektivního posouzení charakteru dat s tím, že preferujeme
jednoduché průměry co nejnižšího řádu a délku volíme podle požadovaného stupně vyhlazení řady: čím
je větší délka klouzavého průměru, tím je větší vyhlazení časové řady.

Jednou z důležitých zásad pro volbu délky průměru je, že tato délka by měla odpovídat periodě
sezónních nebo cyklických fluktuací, které chceme z řady vyhladit.

Nesprávně: Např. v časové řadě ročních měření budou k vyhlazení cyklické složky s dvouletou
periodou užity klouzavé průměry délky 3 a 5.

V prvém případě je výsledkem vyhlazení „inverzní cyklus“: ve skupině tří sousedních hodnot
vyrovnávané řady jsou buď dva horní a jeden dolní bod zvratu nebo naopak.

Ve druhém případě nastává opačná situace: vyrovnaná řady následuje původní řadu vzhůru do horních
bodů zvratu a dolů do dolních bodů zvratu.

Pokud jde o volbu řádu klouzavých průměrů, lze vyvodit objektivní kritérium:

Předpokládejme, že uvažovaná řada    má tvar , kde  je polynom r-tého řádu  a  je bílý šum
s rozptylem .  Budeme postupně diferencovat, čímž polynom vytvářející řadu  bude postupně při každé
diferenci snižovat svůj řád o 1, protože např. v rozdílu

      .

je  nejvyšší mocnina proměnné t s nenulovým koeficientem. Konečně při řádu  se tento polynom úplně
vynuluje. Při řádu  je diferencí konstanta obvykle různá od nuly. Bílý šum vytvoří při k-té
diferenci veličinu

(2.44)                               ,

která má nulovou střední  hodnotu a rozptyl roven

(2.45)                        .

Označíme-li tedy , pak  pro  je  odhadem rozptylu  bílého šumu.


                                Metoda vážených klouzavých průměrů

Nevylučuje to ovšem možnost, že pozorování lze vyrovnat lokálně, tzn. v různých úsecích časové řady
různými křivkami (třeba téhož typu, ale s různými, v čase se měnícími parametry).

K pozorované hodnotě  konstruujeme vyrovnanou hodnotu , jíž nahrazujeme tuto pozorovanou hodnotu
takto :


tj. prostým klouzavým průměrem ,                                                     resp.

tj. váženým klouzavým  průměrem                     pro každé

                                                                               ( n je počet
pozorování )

Je patrné, že prostý aritmetický průměr je speciálním případem váženého aritmetického průměru
s rovnoměrně rozdělenými vahami  pro všechna .

Vyrovnání časové řady pomocí klouzavého průměru závisí na :

a) počtu členů, které zahrneme do průměru; ten tedy může být :

    lichý - : pak hodnotu spočteného průměru přiřadíme prostřednímu

                                   členu průměru

    sudý -  :     provádíme tzv. centrování, kterým hodnotu spočteného

                                   průměru přisoudíme okamžiku mezi dvěma prostředními

                                   pozorováními časové řady

b) vahách přiřazených pozorovaným hodnotám ekonomického ukazatele

    Ty mohou být :

   - symetrické  platí , atd.

      index "0" označuje prostřední pozorování, „střed“ průměru

   - nesymetrické: zpravidla podle speciálního účelu klouzavého průměru

pro hodnoty vah platí podmínky:   (vždy, dá se zajistit normováním)

                                                              (obvykle, existují však výjimky)

Tímto způsobem však nelze nahradit pozorované hodnoty v krajních bodech :

- u lichého počtu členů průměru ztratíme vždy  krajních členů

 ( po   na každé straně)

- u sudého počtu členů průměru ztratíme  rovněž  krajních členů

(získané hodnoty centrujeme do „meziobdobí“ ležících vždy uprostřed dvou pozorování )

Poznámka: Můžeme ovšem použít některý ze způsobů "dodefinování" hodnot v krajních bodech (nějakým
vhodným algoritmem).
________________________________

[1] Centrování (sladění polohy výsledného vyhlazení  s polohou původních pozorování) lze provést
např. tak, že se procedura klouzavých průměrů se sudým počtem členů provede dvakrát (nebo obecně
2k-krát)  po sobě.