STATISTICKÉ METODY V GEOGRAFII Odhady parametrů intervaly spolehlivosti Základní pojmy l základní soubor, l statistický soubor l výběrový soubor l náhodný výběr l k základnímu jednomu souboru lze získat více výběrových, různé charakteristiky l U dobré výběrové metody - dílčí směrodatné odchylky se kompenzují l reprezentativnost výběru – kvalita výběru l prostý náhodný výběr ( s opakováním a bez opakování) l oblastní náhodný výběr ( výběr z každé dílčí části) l systematický náhodný výběr ( podle pravidla, které nesouvisí se sledovaným znakem, např. sledovaný znak - počet obyvatel obce, seřadit obce podle abecedy a vybrat vždy každou pátou obec) Intervaly spolehlivosti l normální rozdělení, l interval spolehlivosti hranice (μ + - 2σ), l hodnoty, které leží mimo interval, v tzv. kritickém oboru se považují za nepřípustné, jejich odchylky od průměru za významné l lze použít i jiné intervaly spolehlivosti l např. pro 95 % (μ + - 1,960σ), l pro 99 % (μ + - 2,576σ), Testování statistických hypotéz l jak ověřit předpoklady o charakteristikách statistických souborů? l Je soubor A výběrem ze souboru B? l Do jaké míry se soubory shodují v rozdělení četností, podle aritm. Průměru, podle směrodatné odchylky apod. Příklad Rozdělení četností souborů A , a l STATISTICKÁ HYPOTÉZA: l předpoklad: průměrná výška studentek PdF MU je shodná s průměrnou výškou žen ve věku 20 - 25 let v ČR l NULOVÁ HYPOTÉZA l Průměry obou souborů jsou shodné l zvolíme hladinu významnosti l např. 5% , tj. p= 0,05, tj. shoda je s pravděpodobností 95 % l aplikace testovacího kritéria l je výsledek testování významný ? l podle výsledku přijmeme nebo odmítneme nulovou hypotézu Závislost náhodných veličin Závislost náhodných veličin l Do jaké míry závisí změna prvku jednoho statistického souboru změnu prvku druhého statistického souboru? l Jak podmiňuje změna prvku x změnu prvku y? l Jak těsně na sobě závisí prvky dvourozměrného statistického souboru? l Např. l vztahy teplota a nadm. výška, l srážky a odtok v povodí l váha a výška člověka, Vztahy náhodných veličin l Jednostranné ( nezávislá hodnota x jednoho stat. souboru podmiňuje hodnotu y druhého stat. Souboru l Vzájemné (nelze rozlišit závislou a nezávislou proměnou) Vztahy náhodných veličin l Podle stupně závislosti l Funkční ( pevnou) l ( určité hodnotě x odpovídá jediná hodnota y, vztah x a y lze tedy vyjádřit mat. funkcí), l např. l Konkrétní teplotě odpovídá jedna hodnota stupně nasycení vodní párou Vztahy náhodných veličin l Statistická l ( jedné hodnotě x odpovídá více hodnot y, hodnoty y mají své rozdělení s průměrem, tento průměr hodnot y je i pro různá x shodný) l Vztahy náhodných veličin l Korelační l Se změnou hodnot x se mění soubory hodnot y, které mají své rozdělení a různých průměrech l např. pro určitou těl výšku existuje více hodnot hmotnosti, které budou mít normální rozdělení, l různým výškám odpovídají hmotnosti s normálním rozdělením, ale s různým průměrem l Př. Pro 170 cm existuje norm. rozdělení hmotností o průměru 68 kg, pro 180 cm opět normální rozdělení hmotností s průměrem 76 kg Korelační závislost l Určení těsnosti korelační závislosti l (jak těsný je vztah mezi výškou a hmotností člověka) l Korelační počet – snaha vyjádřit tendenci změny hodnoty závislé proměnné na nezávislé proměnné pomocí matematické funkce l Tuto regresní funkci lze graficky znázornit regresní čárou l Korelace je druh závislosti mezi prvky dvou souborů l Regresní čára znázorňuje graficky tuto korelační závislost Určení korelační závislosti l 1. Korelační závislost vyjádřená lineární regresní přímkou ( lineární regrese) l Jedna nezávislá proměnná x a jedna závislá proměnná y´ ( ta je průměrem možných hodnot – viz. definice korelace) l X = 170 cm a y´ = 68 kg ( 68 kg zastupuje možné hodnoty hmotnosti pro 170cm) l Regresní přímku lze analyticky vyjádřit jako l y´ = bx + a, kde b je koeficient regrese a l a dopočítáme po pomocném výpočtu průměrů souborů a dosazením jedné dvojice hodnot do rovnice l y´ - y = b(x – x) + a Intervaly a pásy spolehlivosti pro lineární regresní závislost l Kolem regresní přímky lze sestrojit l interval spolehlivosti, l který určuje pro vybrané x l interval, ve kterém se budou s určitou pravděpodobností nacházet hodnoty y Př. lineární regrese l Vypočítejte parametry lineární regrese pro vztah délky slunečního svitu a teploty na datech meteorol. stanice Tuřany, 2002 l l Regresní parametr b= 0,9 l Určení parametru a l Rovnice: l y´ - y = b(x – x) + a l 1. Vypočítám aritm. průměr z hodnot x a y l x = 156,6 a y = 9,6 l 2. Dosadíme z tabulky dvojici např. (82,7 ; 3,6 l 3. řeším rovnici o jedné neznámé l 3,6 – 9,6 = 0,9 * ( 82,7 - 156,6)+ a l a = - 60 Časové řady Bazické a řetězové Z - diagram časová řady – základní pojmy l statistická řada l posloupnost hodnot znaku uspořádaných podle určitého hlediska l časová řada l statistická řada upořádaná podle času l časová řada=dynamická=chronologická = vývojová Sestavování časových řad l dodržovat zásady: – stejně dlouhá časová období l ( přepočet na „standardizovaný“ měsíc se 30 dny, přepočet na počet shodný počet pracovních dní v měsíci p – stejně velká území, příp. stejná úroveň (shodná rozloha, povodí řádu toku, administrativní jednotka) – stejné jednotky l časová řada OKAMŽIKOVÁ – sleduje se hodnoty znaku k určitému okamžiku – např. počet obyvatel ČR k 31.12. 2000, 2001, l časová řada INTERVALOVÁ – sleduje se hodnota znaku v intervalu , období – denní úhrn srážek, průměrná denní teplota, měsíční těžba… l pouze k této řadě se vztahuje požadavek stejného intervalu zvláště u sledování ekonomických ukazatelů Klouzavé úhrny l zvláštní typ součtové čáry l vhodné pro porovnávání dvou či více řad hodnot za po sobě následující období l např. kolísání ročního chodu srážek l postup viz. např. skripta Brázdil. a kol. str. 147 Z - diagramy l GRAFICKÉ ZNÁZORNĚNÍ – řada běžných hodnot, – součtová čára, – řada klouzavých úhrnů l společné body Z - diagramu( tj. spol. hodnoty) – výchozí bod součtové č. a řady běžných hodnot – poslední hodnota součtové čáry a poslední hodnota klouzavého úhrnu Z - diagramy Analýza časových řad l cíle analýzy: – zjistit hlavní rysy průběhu časových řad a analyzovat je l podle průběhu časové řady: l stacionární nebo s trendem l s periodickým opakováním výkyvů nebo bez výkyvů l všechny možné kombinace Charakteristiky časových řad l přírůstky: l absolutní přírůstek – rozdíl hodnot po sobě následujících ( „druhá“ – „ první“) [l ]x [i ]– x [i-1] [ ] l relativní přírůstek [l ] podíl x [i ]– x [i-1 ]/ x [i-1 ] [ ] Řetězové a bazické indexy l bazický index l podíl x [i] / x [z ]* 100, l x [z - ]první „ základní „ hodnota časové řady l změny k jedné základní ( bazické) hodnotě l řetězový index (koeficient růstu ) l podíl x [i] / x [i-1 ]* 100 l podíl v procentech po sobě následujících hodnot l ( změny např. z měsíce na měsíc“ – řetězení) Témata přednášek k samostudiu l Geografická metodologie l Definice geografie l Geografičnost studia l Formy geogr. studia l Obecný přístup k VŠ studiu – Literatura: skripta MEČIAR, J. Úvod do studia geografie, od. str. 107 do konce