STATISTICKÉ METODY V GEOGRAFII Karl Friedrich Gauss 1777-1855 Teoretická rozdělení Základní pojmy l náhodná veličina spojitá l Může teoreticky nabývat nekonečného množství hodnot z určitého intervalu např.teplota) l náhodná veličina nespojitá l Nabývá jen konečného množství hodnot urč. Intervalu. Např. počet měsíců s teplotou nad…) l Každé hodnotě je možno přiřadit pravděpodobnost jejího výskytu, součet všech dílčích pravděpodobností je 1 Teoretická rozdělení l histogram – grafické znázornění četností l rozsah souboru se blíží k nekonečnu + náhodná veličina je spojitá l – frekvenční funkce / hustota pravděpodobnosti l kumulativní relativní četnost tj. součtová čára - l distribuční funkce l obr. Normální rozdělení / Gaussovo, Laplaceovo- Gaussovo l Normální rozdělení se univerzálně používá k aproximaci (k přibližnému vyjádření) rozdělení pravděpodobnosti velkého množství náhodných veličin (v biologii, technice, ekonomii atd.) Normální rozdělení l Normální rozdělení s parametry: l stejný průměr, různé směrodatné odchylky l čím větší odchylka , tím „plošší tvar rozdělení l Normální rozdělení l různé průměry, stejná směrodatná odchylka l Normální křivka a osa x vymezují plochu 100%, l tj. lze stanovit pravděpodobnosti, s nimiž leží hodnoty v určitém intervalu, l hranice intervalu tvoří průměr a násobky směrodatné odchylky l obr. V normálním rozdělení: l 68, 27% leží v intervalu: l (průměr + - směr. odchylka) l 95% leží v intervalu: l (ar. průměr +- 1,96 směr. odchylky) l 99% leží v intervalu: l (ar. průměr +- 2,576 směr. odchylky) IQ (v bodech) stupeň inteligence procento zkoumaných případů (v %) méně než 20 idiocie 0,1 20 - 49 imbecilita 0,5 50 - 69 debilita 1,9 70 - 79 tzv. lehká debilita 5,0 80 - 89 podprůměrná 14 90 - 109 průměrná 48 110 - 119 nadprůměrná 18 120 - 139 vynikající 11 140 a více genialita 1,5 Příklady Př.1 l Populace má v daném testu průměr 100, směrodatnou odchylku 15. l Vypočítejte hranice intervalů, v kterém se nachází 68 % populace. l Výška v populaci chlapců ve věku 3,5 - 4 roky má normální rozdělení s průměrem 102 cm a směrodatnou odchylkou 4,5 cm. l Vypočítejte hranice intervalu hodnot výšky , ve kterých se nachází l A)70% l B) 95% l C)99% l příslušné populace Příklad 3 l zadání: l Výška v populaci chlapců ve věku 3,5 - 4 roky má normální rozdělení s průměrem 102 cm a směrodatnou odchylkou 4,5 cm. l Spočtěte, jaké procento chlapců v uvedeném věku má výšku menší nebo rovnou 93 cm. Řešení 3 l Pravděpodobnost, že výška nabude hodnoty menší nebo rovné 93 cm, je vyjádřena hodnotou distribuční funkce F (93) pro parametry normálního rozdělení 102;4,5 Příklad 4 l Psychologickými testy bylo zjištěno, že hodnota IQ populace je náhodnou veličinou s normálním rozdělením, jehož střední hodnota je 104 a směrodatná odchylka 8. l Určete hodnotu IQ, kterou podle uvedených pravděpodobnostních předpokladů: l meze, ve kterých bude 50% populace, l Řešení 4 l a) meze pro 50 % mužské populace l Pro normované normální rozdělení zavedeme označení N (0, 1). Binomické rozdělení Binomické rozdělení l pro diskrétní náhodné proměnné, l které mohou nabývat pouze dvou hodnot ( např. ano, ne) l pravděpodobnost, že nastane alternativa ANO označme π l pravděpodobnost, že nastane NE …q = 1 – π), protože l platí π +q = 1 (100 %) l k výpočtu se používá binomický rozvoj Příklad 1 – binomické rozdělení l Předpokládejme, že pravděpodobnost narození dívky je 0,49. l Jaká je pravděpodobnost toho, že mezi třemi dětmi v rodině je právě jedna dívka? Řešení 1 Příklad 2 Jaká je pravděpodobnost, že v rodině s 8 dětmi jsou právě 3 dívky? Pravděpodobnost narození dívky je 0,49. Příklad 2, binomické rozdělení l Vypočítejte pravděpodobnost, se kterou se vyskytne určitý počet měsíců v roce hodnocených jako „ suché“. l Konkretizace: l oblast Oxford, l období 1851 – 1943, tj. 1116 měsíců l Suchý měsíc - tj. méně srážek v měsíci než je dlouhodobý průměr tohoto měsíce. l 617 měsíců hodnocených jako suché l 499 – vlhké měsíce Jak bude vypadat situace pro „vlhké“ měsíce? Poisson - příklad Poissonovo rozdělení l – pro rozdělení vzácných případů l (zimní bouřka, výskyt mutace apod.). l Je-li pravděpodobnost nějaké výjimečné události (např. určité mutace genu) relativně malá a rozsah výběru poměrně velký, pak Poissonovo rozdělení v podstatě splývá s binomickým, ale je mnohem výhodnější pro počítání . Poisson - příklad l Předpokládejme, že v určité populaci krys se vyskytuje albín s pravděpodobností l p = 0,001 , ostatní krysy jsou normálně pigmentované. l Ve vzorku 100 krys náhodně vybraných z této populace určete pravděpodobnost, že vzorek l a) neobsahuje albína, l b) obsahuje právě jednoho albína. Řešení Řešení 3 Další rozdělení Pearsonova křivka III. typu l Na empirické rozdělení mnoha statistických souborů s nimiž v geografii pracujeme, nelze aplikovat normální rozdělení. l Platí to například v těch případech, kdy studovaná náhodná veličina nemá teoreticky zdůvodněnou možnost nabývat nekonečných hodnot nebo je-li omezena konečnými čísly V takovýchto případech lze aplikovat na studovaný soubor některou ze dvanácti křivek Pearsonova systému. Pearsonova křivka III. typu l Pearsonova křivka III. typu l - obvykle pro veličiny s omezeným množstvím hodnot, které může nabývat l - z křivky lze např. vyčíst pravděpodobnost se kterou bude hodnota sledovaného statistického znaku dosažena l v hydrologii se počítá Pearsonova křivka ve variantě součtová čára četností jako l tzv. čára překročení l příklad l Konstrukce čáry překročení z průměrných ročních průtoků vodního toku Lažánka za říjen 2002. rozdělení χ2 l rozdělení χ2 – náhodný výběr n prvků ze základního souboru (počet vybíraných prvků = počet stupňů volnosti) l dostaneme n hodnot, součtu druhých mocnin daného počtu vybraných prvků odpovídá určitá křivka, Studentovo/t/ rozdělení l Studentovo/t/ rozdělení – hodnocení odchylek aritmetického průměru základního souboru a výběrových souborů, odchylkám přísluší Studentovo rozdělení