Popisná statistika II Zdeněk Mikulášek, Ústav teoretické fyziky a astrofyziky Dříve než přikročíme k analýze časových řad a regresím, vyplatí se provést důkladný rozbor naměřených dat, abyste pak mohli zvolit optimální způsob dalšího zpracování. K tomu slouží nástroje popisné statistiky nastíněné v předmětu Praktická astrofyzika -základy. I zde budeme předpokládat, že máme k dispozici soubor n naměřených hodnot vytvářející datový soubor D = {xí}. Vhodné je též přisoudit každému měření nebo skupině měření přisoudit jistou váhu, která by měla souviset s nejistotou, s níž jednotlivá měření zjišťujeme. Je-li odhad nejistoty i-tého měření Sxí, pak bychom takovému měření měli přisoudit váhu Wi, kde w,i = n (ôxí)~2/ Y^=i($xi) 2■ Pokud se domníváme, že nejistoty všech měření jsou stejné, pak klademe váhu každého z měření rovnu 1 (wí = 1), takže součet vah je roven n. Jednotkovou váhu používáme i tehdy, je-li rozdíl v kvalitě jednotlivých měření malý, nebo je-li očekávaná vnitřní nejistota jednotlivých měření viditelně menší než jejich celkový rozptyl v rámci souboru. Naopak použití vah je deklarováno vždy, pokud máte informaci o nejistotě určení dané veličiny, zejména pak v případě, že měřené veličiny nejdříve transformujete nějakou nelineární funkcí (logrr, l/x) nebo při robustní regresi. V dalším zavádíme následující konvenci: n xk = x\ w-i/n. (1) 1 Nástroje pro normální rozdělení. Průměr, standardní odchylka Pro prvotní popis pozorovaných dat je dobré uvést dvě charakteristiky - nějakou hodnotu, kolem níž se pozorovaná data kupí - nějaký střed datového souboru, a pak veličinu, která popisuje charakteristickou vzdálenost pozorovaných dat od tohoto středu. Z hlediska nejčastějšího z nástrojů zpracování datových souborů - metody nejmenších čtverců, je přirozenou mírou popisující střed studovaného datového souboru veličina a nazývaná též aritmetický průměr, respektive průměr, obecně váhovaný průměr. Pro tuto veličinu platí, že suma váhovaných čtverců odchylek jednotlivých měření od centra a, S (a), je minimální: S (a) = y^^Xj a)2 Wí n {x n ar 2ax i=l dS(a) da 0 x. (2) Ze vztahu (2) plyne, že tímto aritmetickým průměrem a je váhovaná střední hodnota x definovaná ve smyslu konvence (1) pro k = 1. Pro popis míry rozptýlení od aritmetického průměru a zavedeme váhovanou standardní odchylku s, jejíž kvadrát odhadujeme vztahem: S(x) n(x — x)2 n(x2 — 2xx + x) n(x2 x n n n n (3) 1 -2.5 -2 -1.5 -1 -0.5 0 0.5 1 1.5 2 2.5 -0.5 0 0.5 1 1.5 2 2.5 3 Fig. 1. Simulace výsledků odhadů centra v aritmetickém průměru (vlevo) a standardní odchylky (vpravo) pro normální rozdělení s centrem v 0 a standardní odchylkou 1 při výběru pouhých 5 bodů. Tento výběr byl ovšem opakován 100 OOOkrát. Zatímco odhad průměru se chová tak, jak bychom čekali, v případě standardní odchylky vidíme, že rozdělovači křivka se dosti liší od očekávaného normálního rozdělení. Aritmetický střed odhadu je systematicky menší. Pokud byste ze standardní odchylky přešli na její čtverec, pak sice obdržíte lepší shodu průměru rozdělení s běžně používaným vztahem, ale rozdělovači funkce bude ještě daleko odchylnější od normálního rozložení. Závěr: Běžný odhad velikosti standardní odchylky je nutno pro malý počet měření brát s velkou rezervou. Při pokusech se simulovanými daty se ukázalo, že pokud chceme pro odhad standardní odchylky s užít prostou odmocninu střední odhadu podle rovnice (3) pro soubory s "malým počtem měření" n, dostáváme systematicky menší menší hodnoty, než bychom měli. Zavádíme proto tzv. modifikovanou standardní odchylku smod s upraveným jmenovatelem ■^mod n (x X) ' n (x2 x* n 1.46 n 1.46 (4) který i pro 4 < n < 15 poskytuje patřičné výsledky. Příčinu této diskrepance, na kterou učebnice neupozorňují, je skutečnost, že rozdělovači funkce pro standardní odchylku se pro malá malá n citelně odchylují od normálního - názorně je to patrno na Fig. 1. Pokud je rozptyl pozorování určen zejména náhodnými ději (statistika fotonů, atmosférická scintilace atp.), je dáno rozdělení odchylek kolem centra symetrickou normální rozdělovači funkcí (Gaussovou). Funkce hustoty pravděpodobnosti f(x), normovaná na laje popsána dvojicí parametrů - středem rozdělení // a disperzí a: exp (x — /i)2 2 a2 (5) 2 • : • • . • • • i • • • i i • i 1 : j . j i ! j j il 5 f ; t -> i i • • • • • • • ; • • ! • :......■ : s ľ i i . • • • i 1 • • i • : • : ! • i ! j : : : í i f ! ; t» • 1 • . 1 • 1 - . i s • : • ...... • • • • • • i j : s « 1 1 ■ i i ■ * • i i -• ' . * ' • • 1 1 ' 1 1 O 5 10 15 20 25 Fig. 2. Simulace výsledků 26 měření pro normální rozdělení s centrem v 0 a standardní odchylkou 1. Jednotlivá měření jednotlivých sad jsou znázorněna nad sebou plnými kotoučky, průměr s jeho nejistotou je naznačen větším prázdným kroužkem a chybovou úsečkou. Povšimněte si jak odlišné může být rozložení těchto bodů v jednotlivých sadách, rovněž tak, že body s odchylkou 3 a jsou zcela běžné - v tomto případě tedy nejde o odlehlé body. Prostudujte i obr. 3, který je dalším zpracování této simulace. Abychom tyto parametry určili, museli bychom mít k dispozici nekonečné množství pozorování. Pokud máme k dispozici jen n pozorování, může učinit jen odhad zmíněných veličin a odhadnout jejich neurčitost, 5fi a 5a. a = x; 5a = —■=, a = s; 5a = . (6) Vn v 2n To, proč zde hovoříme jen o odhadech příslušných veličin, dostatečně ilustrují obrázky 2 a 3 pořízené na základě počítačových simulací. Znovu ovšem uvádíme, že výše uvedené vztahy fungují zcela správně jen tehdy, je-li reálná rozdělovači funkce blízká normální. Metody, jak si to ověřit, jsou uvedeny v následující kapitole. Poznámka: Relativní přesnost určení rozptylu a chyby průměru p = l/V 2 n primárně závisí na počtu měření n, a to tak, že 10% činí pro 50 měření, 3% pro 560 a pro 1% již 5000 měření. Těmto skutečnostem byste měli podřídit počet míst a způsob zaokrouhlování (v těchto případech se přimlouvám zaokrouhlovat vždy spíše nahoru). 2 Odchylky od normálního rozdělení V astronomické praxi se ovšem často setkáváme s tím, že rozdělovači funkce naměřených veličin se více či méně odlišuje od ideálního normálního rozdělení. Projevuje se to tím, že rozdělovači funkce jeví asymetrii (tedy nenulovou šikmost) nebo odlišné proporce než Gaussova křivka (odlišná špičatost). Příčin odchylek od normálního rozdělení je celá řada, 3 1.5 0.5 - 0 -0.5 - 0 5 10 15 20 25 Fig. 3. Simulace výsledků měření pro normální rozdělení s centrem v 0 a standardní odchylkou 1. Každý z 25 výsledků byl zkonstruován z 26 individuálních měření. Je patrné jak kolísání polohy aritmetického průměru kolem nuly, tak i kolísání hodnoty naměřené směrodatné odchylky. velmi často je to výskyt odlehlých bodů (angl. outliers) zvyšujících šikmost nebo reálná proměnnost zkoumaného zdroje, případně přístrojové efekty nejrůznějšího charakteru. 2.1. Šikmost a špičatost Asymetrii rozdělovači funkce vyjadřuje jednoduchá bezrozměrná veličina nazývaná šikmost (angl. skewness). Označuje se nejčastěji jako 71. Nulová šikmost značí, že hodnoty náhodné veličiny jsou rovnoměrně rozděleny vlevo a vpravo od střední hodnoty. Kladná šikmost značí, že vpravo od průměru se vyskytují odlehlejší hodnoty nežli vlevo (rozdělení má tzv. pravý ocas) a většina hodnot se nachází blízko vlevo od průměru. U záporné šikmosti je tomu naopak. Symetrická rozdělení, včetně normálního rozdělení, mají šikmost nula. Pro rozdělení s kladnou šikmostí obvykle platí, že jeho modus (nejčastěji se vyskytující hodnota) je menší nežli medián a ten je menší nežli střední hodnota. Pro zápornou šikmost je tomu opět naopak. kde n je počet hodnot a Č71 je odhad neurčitosti pro případ normálního rozdělení. Tento odhad je důležitý pro to, abyste mohli kvalifikovaně rozhodnout, zda příslušná rozdělovači funkce je či není asymetrická. U mnohých funkcí může být zjevná asymetrie jen dílem náhody. Odhad neurčitosti šikmosti je například u stovky bodů zatížen střední neurčitostí 0,24, takže jisti byste si mohli být jen pro šikmosti, větší než 0,7 a menší -0,7. Tento příklad jen ukazuje na to, že šikmost je dobrým instrumentem jen v případě, že máte co do činění se soubory mnoha tisíci měření. Koeficient špičatosti (excesu) (angl. excess kurtosis) je rovněž bezrozměrné číslo, které charakterizuje rozdělení náhodné veličiny tím, že jej porovnává s normálním rozdělením pravděpodobnosti. Koeficient špičatosti se obvykle označuje 72. Normální rozdělení má 7i = Č7i 2.4 (7) 4 špiěatost Fig. 4. Simulace výsledků odhadů špičatosti (vlevo) (vpravo) pro normální rozdělení s centrem v 0 a standardní odchylkou 1 při výběru pouhých 5 bodů (vlevo) 100 bodů (vpravo). Tento výběr byl ovšem opakován lOOOOOkrát. Je zřejmé, že ani při stovce bodů není rozdělovači křivka normální, což je dokazuje, že bychom měli být při odhadvání špičatosti obezřetní, nebo lépe, neměli bychom tuto funkci používat vůbec. špičatost nula. Kladná špičatost značí, že většina hodnot náhodné veličiny leží blízko její střední hodnoty a hlavní vliv na rozptyl mají málo pravděpodobné odlehlé hodnoty. Křivka hustoty je špičatější, nežli u normálního rozdělení. Záporná špičatost značí, že rozdělení je rovnoměrnější a jeho křivka hustoty je plošší než-li u normálního rozdělení. n + 1 (x - xY 4.65 72 =---t--3; = (8) n — 1 s4 J n kde 5^2 je odhad neurčitosti pro případ normálního rozdělení. Tento odhad je důležitý pro to, abyste mohli kvalifikovaně rozhodnout, zda se příslušná rozdělovači funkce odchyluje či neodchyluje od normálního rozdělení. U mnohých funkcí může být zjevná odchylnost jen výsledkem souhry náhod. Odhad neurčitosti koeficientu špičatosti je například u stovky bodů zatížen střední neurčitostí 0,47, takže jisti byste si mohli být jen pro rozdělovači funkce s excesem špičatosti, větší než 1.2 a menší -1.2. Tento příklad dokazuje, že pro soubory s menším počtem měření bychom tento, jinak velmi užitečný instrument měli používat s jistou obezřetností. Budiž poznamenáno, že parametr excesu špičatosti 72 v tvaru (8) nejspíš nikde nenajdete, protože jde o tvar modifikovaný, který platí v rozsahu od n > 4. Běžně uváděný vztah pro exces špičatosti dává systematicky nižší hodnoty než by měl a platit začne až pro soubory od několika set prvků výše! Modifikace spočívá ve vložení multiplikativního členu s n. 2.2. Odlehlé body a jejich eliminace 5 Astrofyzikální data se dosti často musí potýkat s fenoménem odlehlých bodů. Vznikají nejčastěji v důsledku nedostatků a nestabilit v měřící aparatuře, hrubých chyb a dalších příčin nesouvisejících se zkoumaným objektem. Odlehlé body mají jiný, obecně větší, rozptyl než reálná nepoškozená měření a mění koeficient excesu špičatosti na záporný. Jejich vliv na statistiku vedenou běžnými nástroji, jako je průměr a standardní odchylka, bývá zničující. Astrofyzikální data ovšem trpívají i opačným neduhem, kdy jsou v rámci neodborné závěrečné "kosmetizace"datových souborů nenávratně odstraněna i některá měření, která mají tu smůlu, že se zdají být příliš odchýlena od centra. Rada i zkušených astronomů se domnívá, že všechny body vzdálené od centra více než 3 a jsou automaticky odlehlé body a lze je tedy beztrestně vymazat. Bohužel, tak jednoduché to není, obrázek 2 sestrojený výlučně z dat s normálním rozdělením, obsahuje takových nepravých "odlehlých"bodů několik. V průměru sice představují o něco méně než 0.3% (náhodně jich ale může být i několikrát víc), jejich odmazání ale má za následek neoprávněné snížení standardní odchylky v průměru o 1.5%. K eliminaci vlivu odlehlých bodů bylo vypracováno několik postupů. Nej triviálnější je ten, že si např. sestrojíte histogram naměřených hodnot a identifikujete body viditelně se odchylující od normálního rozdělení. Tyto body buď opravíte, je-li zřejmé, jak ona odlehlost povstala (nesprávný řád, chybějící číslice, nesprávný formát atp.) nebo je jednoduše vymažeme ze souboru. Tento postup byste ale neměli používat pro body vzdálené od centra jen o 3.5 a, protože ty bývají v souborech dat docela běžné (viz. Obr. 2). Jinou možností je tzv. robustní regrese, což je nejčastěji iterativní metoda přisuzující bodům vzdáleným od centra menší váhu než bodům v blízkosti centra - více v podkapitole 2.4. Další možnost představuje zpracování nástroji, které nejsou tak citlivé na přítomnost odlehlých bodů jako jsou medián a veličina mad. 2.3. Medián, střední velikost odchylky Medián (označován med(x) nebo x) je hodnota, jež dělí řadu podle velikosti seřazených výsledků na dvě stejně početné poloviny. Ve statistice patří mezi míry centrální tendence. Platí, že nejméně 50% hodnot je menších nebo rovných a nejméně 50% hodnot je větších nebo rovných mediánu. Pro nalezení mediánu daného souboru stačí hodnoty seřadit podle velikosti a vzít hodnotu, která se nalézá uprostřed seznamu. Pokud má soubor sudý počet prvků, obvykle se za medián označuje aritmetický průměr hodnot na místech n/2 a n/2+1. To ovšem platí pro případ, kdy jsou si váhy jednotlivých měření rovny, v opačném případě je nalezení váhovaného mediánu složitější. Postup má tyto kroky: • Seřadíme všechny hodnoty i s jejich váhami x podle velikosti, takže x\ < x2... < Xfc • spred = 1.498, střední odchylka s centrem v mediánu md(x,x) = 1.140 =>• spred = 1.498 =>• spred = 1.428. Konečně nej robustnější odhad s mediánem střední odchylky mad(x,x) = 0.687 =>• spred = 1.019! Je tedy zjevné že v tom třetím případě odhad reálných charakteristik nebyl přítomností odlehlého bodu takřka vůbec ovlivněn. Jako počáteční odhad pro robustní regresi je optimální a ušetří spoustu zdlouhavých iterací, pokud se ovšem nespokojíme se samotným odhadem. 2.4. Robustní regrese 7 Fig. 5. Robustní regrese. Plnou čarou je naznačena normální rozdělovači funkce, čerchovanou čarou je naznačen filtr robustní regrese, čárkovaně je znázorněn součin filtru a normální rozdělovači funkce. Metoda nej menších čtverců právem patří mezi ty nej používanější metody zpracování astrofyzikálních dat. Pomocí ní lze velice dobře určit parametry různých modelů, kterými se snažíme popsat pozorovanou realitu, přičemž je lhostejné, zda jde o modely fyzické nebo jenom fenomenologické. Bohužel častá přítomnost odlehlých bodů tuto metodu silně poškozuje a způsobuje, že mnohé výsledky bývají sporné, zejména pak není možné se spolehnout na odhad neurčitostí parametrů modelu a na neurčitost předpovědí. Aby bylo možné zachovat komfort poskytovaný MNC a současně přitom eliminovat vliv odlehlých bodů i chybějících neprávem vymazaných bodů, se používá řady metod, které se řadí do kategorie robustních regresí, které jsou jen minimálně citlivé na hrubé chyby a přítomnost odlehlých bodů. Popíšu zde svou vlastní metodu, která je jednoduchá, rychle iteruje a mám ji dobře odzkoušenou na řadě reálných i simulovaných úloh. Nechť {xí,Wí} je soubor sestávající z proměnné veličiny (nejčastěji jde o rozdíl mezi pozorovanou veličinou a modelovanou funkcí), která by měla mít povahu náhodné veličiny s rozdělení blízkým normálnímu, a vahou jednotlivých bodů určenou na základě jejich očekávaných individuálních neurčitostí. Nechť x0 a s0 jsou počáteční odhady váženého průměru a standardní odchylky získané nejlépe pomocí nástrojů zmiňovaných v předcházející podkapitole. V dalším kole iterace se váhy upraví multiplikativním faktorem Šíj (i je číslo měření v souboru, j je pořadové číslo iterace) podle vztahu: Šíj = 1-06 exp / 1-23 T2j Et=l (Xi ~ Xj)2 Šij wi Dle zkušenosti stačí šest iterací, pak už se výsledky nemění. Během iterací se postupně zpřesňují hodnoty parametrů žj, s j a n j, což odhad reálného počtu měření (bez odlehlých 2.5 So—i (14) 0.12; e: iWi Wí 8 a s body neoprávněně vyřazenými), tak, aby se rozdělovači funkce co nejvíce podobala normální. Vyzkoušíme robustní regresi na náš příklad z předchozí podkapitoly, střední hodnota vychází jako přesná nula, disperze je 0.995. Ze statistických simulací vyplývá, že střední nejistota určení parametru rij, ônj = 0.10y/ň. Při stovce bodů je tedy přesnost 1%, při n = 10000 pak desetkrát méně! Je-li rij > n lze očekávat, že v datovém souboru nějaká měření chybějí, v opačném případě, že soubor obsahuje odlehlé body. Pokud jde o relativní přesnost určení standardní odchylky, tak platí ôsj/sj = 0.81/\/H, což je jen pněkud horší, než při standardním postupu (viz vztahy ve (13)). Důvod je zřejmý - příspěvek bodů vzdálených centra, které především určují rozptyl, je v této verzi robustní regrese potlačen. 2.5. Testy normality pozorovaných rozdělovačích funkcí Pokud je jasnost hvězdy konstantní, pak by měla být rozdělení normální. Normálnost (normalitu) rozdělovači funkce lze nejsnáze testovat pomocí šikmosti 71 a excesem špi-čatosti 72, jen je třeba rozvážit, zda jsou tyto diagnostické nástroje dostatečně jemné a účinné. Zmíněné nástroje v sobě obsahují třetí nebo dokonce i čtvrtou mocninu vzdálenosti od centra, takže "nadržují"nejvíce vzdáleným bodům. Těch je relativně málo, takže jejich statistika bývá vrtkavá. 2.6. Indexy normality Pro exces špičatosti lze zkonstruovat tzv. index normality rozdělovači funkce Akurt, vycházející z poměru 72 a jeho neurčitosti £72 (viz vztah 8), tedy Akurt = 72M2 = 0.22 - 3 j . (16) Leží-li index normality A v intervalu od -2.5 do 2.5, pak je rozdělení nejspíš normální, je-li větší, pak jsou v datech zastoupeny odlehlé body, v opačném případě rozdělovači funkce naznačuje, že buď v datovém souboru někdo odmazal nějaká měření nebo že zdroj je proměnný. Index normality spojený s excesem špičatosti lze úspěšně nahradit robustnějším indexem Ama(j, vycházejícím z poměru robustní míry rozptýlení mad(x) a standardní odchylka std(x). Je-li rozdělení normální, pak je bezrozměrný střední poměr f = mad(x)/std(x) = 0.6744. Standardní odchylka tohoto poměru daná náhodným rozložením bodů závisí na počtu bodů: std(r) = 0.622/-v/ň. f — r ( 1.608 mad(rr)\ , * A- = iďw=^(L084--Sďw )" <17) Obdobně lze definovat index normality ARR pomocí parametru rij vycházejícího z robustní regrese popsané v podkapitole 2.4 n — Ha 10.0 (tia — n) . . Arr = —t-^t = -K-j=-18 Na řadě konkrétních příkladů lze ukázat, že naposled zmiňovaný index je ze všech tří zmiňovaných indexů normality nejcitlivější. 9 Normal Probability Plot 0.999 0.997 0.99 0.98 0.95 0.90 0.75 ž? !Ď ro JD 0.50 o 0.25 0.10 0.05 0.02 0.01 0.003 0.001 / /Í ŕ ŕ1 j / ŕ" J 3.37 16.38 16.39 16.4 16.41 16.42 16.43 16.44 16.45 R [mag] 16.37 16.38 16.39 16.4 16.41 16.42 16.43 16.44 R [mag] Fig. 6. Vlevo: Histogram naměřených světelných změn jedné hvězdy ve Velkém Magellanově mračnu podezřelé z příslušnosti k CP hvězdám. Naznačená křivka je pokusem o proložení normální rozdělovači funkce. Rozdělovači funkce je však zjevně špičatější s množstvím odlehlých bodů, což svědčí o tom, že tato hvězda bude nejspíš neproměnná. Vpravo: Do velkých detailů lze odchylky od normální funkce vysledovat na grafu s normální pravděpodobností. Všimněte si například výskytu odlehlých bodů na horní a dolní části grafu: vzhledem k tomu, že pravděpodobnost jednotlivých bodů je pevně dána počtem měření, graf ukazuje, že při normálním rozdělení by měly být body na okrajích více přimknuty ke středu. 2.7. Další metody testování normality Názorným prostředkem umožňujícím posoudit případné odchylky rozdělovači funkce od normální funkce je funkce v Matlabu označovaná 'normplot.m'. Je to v podstatě kumulativní distribuční funkce s upravenou osou y. Na x-ovou osu vynášíme naměřenou veličinu (třeba hvězdnou velikost) a na osu y pak pravděpodobnost, že daná veličina naměří. Zobrazení na ose y je takové, že pokud je rozděleni normální, pak jsou jednotlivé body rozloženy podél přímky. Parametry normálního rozdělení se přitom určují z medián a me-zikvartilního rozpětí, což je robustní míra rozptýlení založena na vzdálenosti mezi 1. a 3. kvartilem. 3 Diagnostika proměnnosti Na proměnnost zkoumaných objektů lze usuzovat z řady okolností. Především, pokud zjistíte, že rozptyl hodnot sledované veličiny je zjevně větší, než by vyplývalo z nejistoty jejího měření, lze to nejpřirozeněji vysvětlit tak, že kromě náhodných chyb jsou tu ve hře i reálné časové změny zkoumané veličiny. Je však třeba se mít na pozoru, pokud na nejistotu měření usuzujete pouze na základě udávané vnitřní chyby měření. Tyto údaje občas bývají podceněné, což občas mívá tu příčinu, že udávaná nepřesnost sice dobře vystihuje relativní kvalitu jednotlivých pozorování, ale v absolutní velikosti neodpovídají. Zde je pomoc snadná - zjistíme-li, že rozptyl veličin korelace s udanou neurčitostí jednotlivých měření, 10 Fig. 7. Vlevo: Histogram naměřených světelných změn jedné trpasličí cefeidy ve Velkém Magellanově mračnu. Naznačená křivka je pokusem o proložení normální rozdělovači funkce. Rozdělovači funkce je však zjevně bimodální, což jasně svědčí o tom, že nejspíš jde o periodicky proměnnou hvězdu. Vpravo: Do velkých detailů lze odchylky od normální funkce vysledovat na grafu s normální pravděpodobností. Zde si povšimněte velké odchylnosti výsledné křivky od ideálu normálního rozdělení jak v okolí centra, tak i v křídlech. Typický vzhled pro periodickou světelnou křivku. je třeba udané neurčitosti modifikovat vynásobením vhodnou konstantou. Jiné to ovšem je, pokud zjistíme, že tu korelace není nebo je slabá, pak to může být způsobeno jak tím, že dotyčný zdroj se skutečně mění nebo se při stanovení vnitřní chyby nevzaly v úvahu veškeré příčiny pozorovaného rozptylu. Zde zase může hodně napovědět to, jak se chovají srovnávací objekty - tedy nejčastěji jasnosti srovnávací a kontrolní hvězdy. Pokud zjistíte, že diskrepance mezi pozorovaným a udávaným rozptylem existuje jen u objektu podezřelého z proměnnosti, pak je skoro jisté, že dotyčný objekt je z proměnnosti podezřelý právem. Mnohé ovšem napoví i povaha závislosti dané veličiny na čase. Především se zjistí v jaké časové škále se pozorované změny odehrávají, tedy zda jde o dlouhodobé změny, nazývané jako trendy, nebo jde o periodické změny nejrůznějších příčin nebo změny epizodické, kataklizmické. Hodně informací v sobě ale obsahuje i sama distribuční funkce pozorované veličiny, jejíž analýza by měla předcházet další pokusy o výklad povahy proměnnosti. V dalším se proto budeme zamýšlet nad tím, jak rozdělovači funkce a její charakteristiky, zejména pak špičatost a šikmost souvisejí s povahou časových změn zkoumané veličiny. Ve valné většině případů bývají proměnné hvězdy odhaleny na základě jejich světelných změn, budeme proto v dalším hovořit o světelných změnách, i když ony závěry je možné aplikovat i na proměnnost jiných veličin, jako je třeba magnetická indukce, radiální rychlost nebo intenzita spektrálních čar. 11 600 -400 - -1.5 -1 0.5 1 Fig. 8. Vlevo: Histogram sinových světelných změn se semifinalistkou 1 a rozptylem s a = 3/4. Vpravo: U-histogram sinových světelných změn se semiamplitudou 1 a rozptylem s a = 1/4. 0.2 jí -0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5 fáze -0.1 -0.05 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 hvizdná velikost [mag] Fig. 9. Vlevo: Simulace světelné křivky zákrytové dvojhvězdy mírně zašumění. Vpravo: Asymetrický histogram charakteristický pro zákrytovou dvojhvězdu. Reference 12