I. Budínová, R. Blažková: DM2, přednáška 6 19.5.2016 1 STATISTIKA A PRAVDĚPODOBNOST NA ZŠ Irena Budínová, Růžena Blažková STATISTIKA Původ slova „statistika“ pochází z latiny (status – stát) a nejprve představovala nauku o státu. Blíže k dnešnímu pojetí statistky měla tzv. anglická politická aritmetika (zakl. J. Graunt a W. Petty), která se zabývala shromažďováním číselných údajů o ekonomických a demografických jevech. Počátky moderní statistiky jsou kladeny do 19. století a jsou spojovány se jménem Belgičana Adolfa Quételéta, který se zabýval číselně vyjádřitelnými vlastnostmi společnosti. I. Budínová, R. Blažková: DM2, přednáška 6 19.5.2016 2 Další význam pro rozvoj statistiky mělo založení anglické statistické školy (aplikace v biologii, zemědělství – F. Galton, K. Pearson, R. A. Fischer). Na vývoji metod matematické statistiky mají od počátku 20. století významný podíl B. Gosset (pseudonym Student), P. Čebyšev, A. Ljapunov, A. Markov, Kolmogorov, Bernstejn, Romanovskij a další. Ve vývoji statistika nastala významná proměna ve 30. letech, kdy vzniká moderní, analytická, induktivní statistika, jejímž základním pojmem je výběr. S použitím matematických metod se stala samostatným vědním oborem. ZÁKLADNÍ POJMY Statistika je vědní obor, který se zabývá hromadným zkoumáním, pozorováním či šetřením určitých objektů a jevů. Statistika je soubor metod, které nám umožňují činit různá rozhodnutí, založená na pozorování, porovnávání, posuzování a zhodnocení množství informací. I. Budínová, R. Blažková: DM2, přednáška 6 19.5.2016 3 Statistické šetření se provádí na statistickém souboru. Statistický soubor je množina – skupina prvků (objektů, osob, událostí aj.), které mají společné vlastnosti. Rozlišujeme statistické soubory základní a výběrové. Vymezení základního souboru může někdy přinášet problémy, šetření na celém souboru může být časově náročné nebo i nemožné, proto v praxi používáme soubor výběrový (podmnožina statistického souboru). Tento soubor by měl vypovídat o základním souboru, z kterého byl odvozen (jinak dochází ke zkreslení výsledků). Statistický soubor lze rozdělit na dvě části: Na část, ve které nastává zkoumaný jev a část, ve které zkoumaný jev nenastává. Základním statistickým úkonem je třídění, které provádíme podle jistých kriterií (rozklad množiny na třídy). Respektujeme zásadu úplnosti (každý prvek statistického souboru musí být v některé třídě), a zásadu jednoznačnosti (žádný prvek nesmí být současně ve dvou třídách). Třídění může být dichotomické, trichotomické, obecně multitonické (např. hledání v klíči pro určování rostlin). I. Budínová, R. Blažková: DM2, přednáška 6 19.5.2016 4 Prvky statistického souboru se nazývají statistické jednotky. Počet jednotek statistického souboru se nazývá rozsah souboru. Každá statistická jednotka je nositelem určitých vlastností. Ty vlastnosti, které jsou důležité z hlediska účelu provádění určitého statistického zkoumání, se nazývají statistické znaky. Statistické jednotky tedy vyšetřujeme z hlediska určitého znaku nebo několika znaků, které si zvolíme. Statistické znaky dělíme na kvantitativní (číselné) a kvalitativní (slovní). Některé kvantitativní znaky mohou nabývat pouze jednotlivých izolovaných hodnot - diskrétní znaky (např. počet obyvatel obce), nebo nabývají libovolných reálných hodnot z určitého intervalu – spojité znaky (např. hektarové výnosy). V případě, že kvantitativní znak nabývá pouze dvou variant, hovoříme o znaku alternativním (např. muž, žena), nabývá-li více variant, hovoříme o znaku multiplikativním (např. kvalifikace, státní příslušnost). I. Budínová, R. Blažková: DM2, přednáška 6 19.5.2016 5 Číslo, které udává, kolikrát se daná hodnota znaku ve statistickém souboru vyskytuje, se nazývá absolutní četnost hodnoty znaku. Součet jednotlivých četností sledovaného znaku je roven rozsahu souboru. Poměrná – relativní četnost jevu je poměr absolutní četnosti a rozsahu souboru. Součet relativních četností je roven jedné. Relativní četnosti lze vyjadřovat také v procentech, pak je jejich součet 100 %. Úloha: K následujícím statistickým souborům určete statistickou jednotku a statistické znaky: Všichni žáci třídy Všechny dopravní prostředky, které projedou kolem určitého stanoviště Všechny hody hrací kostkou Všechna slova na jedné straně knihy Všechny dopravní nehody v jednom roce v ČR I. Budínová, R. Blažková: DM2, přednáška 6 19.5.2016 6 DIAGRAMY Rozdělení četností znaků vyjadřujeme buď v tabulce nebo graficky pomocí diagramů. Diagram vyjadřuje vzájemný vztah mezi dvěma či více proměnnými veličinami pomocí přehledných grafických symbolů. Rychle a názorně poskytne obrazovou informaci o studovaném jevu. Rozlišujeme diagramy obrázkové, bodové, sloupkové (histogramy), hůlkové (úsečkové), spojnicové (polygon četností), kruhové. CHARAKTERISTIKY POLOHY Aritmetický průměr je definován jako podíl součtu hodnot znaku zjištěných u všech jednotek souboru a počtu všech jednotek souboru: I. Budínová, R. Blažková: DM2, přednáška 6 19.5.2016 7 Vlastnosti aritmetického průměru: Matematické vyjádření aritmetického průměru je jednoduché a snadno použitelné pro odvození dalších vztahů. Výpočet je založen na všech pozorovaných hodnotách. Součet všech odchylek jednotlivých hodnot od aritmetického průměru je vždy roven nule. Aritmetický průměr je ovlivňován krajními hodnotami. Modus znaku x je hodnota s největší četností. Udává, který výsledek je zastoupen nejvíce, nepodává informace o krajních hodnotách. Medián je prostřední hodnota znaku, jsou-li hodnoty uspořádány podle velikosti. Harmonický průměr můžeme využít např. při výpočtu průměrné rychlosti. I. Budínová, R. Blažková: DM2, přednáška 6 19.5.2016 8 Úloha: Automobil jede do kopce průměrnou rychlostí 50 km/h, s kopce průměrnou rychlostí 120 km/h. Délka dráhy do kopce je stejná jako s kopce. Jaká byla jeho průměrná rychlost na celé dráze? Geometrický průměr se používá např. při výpočtu průměrného tempa růstu za jedno období. Úloha: Hrubý domácí produkt (HDP) nějaké země měl v následujících pěti letech následující vývoj: +5 %, +4 %, +1 %, -1 %, +2 %. Jaký je průměrný růst HDP? I. Budínová, R. Blažková: DM2, přednáška 6 19.5.2016 9 Úloha: Vypočítejte délku hrany krychle, která má stejný objem jako kvádr o rozměrech a, b, c. Vždy platí, že geometrický průměr je menší nebo roven než aritmetický průměr. Vážený průměr se používá např. při řešení slovních úloh o směsích nebo výpočtu průměrné známky žáka. ZÁKLADY STATISTIKY NA ZŠ Žáci by se na ZŠ měli setkat se statistikou ve formě zpracování dat. Na konkrétních příkladech se učí potřebné pojmy, učí se data zaznamenávat do tabulek a diagramů. Pracují s programem MS Excel a rovněž s Internetem. I. Budínová, R. Blažková: DM2, přednáška 6 19.5.2016 10 Příklad: zaznamenávají domácí mazlíčky všech žáků třídy. Mohou je zapsat do tabulky: Kůň // Kočka ///// Rybičky // Pes /////// Myš // Morče / Želva // Žádný mazlíček /// Data je také možné zaznamenat do obrázkového diagramu, kde je každá položka znázorněna jedním křížkem. Kůň Kočka Rybičky Pes Myš Morče Želva Žádný mazlíček I. Budínová, R. Blažková: DM2, přednáška 6 19.5.2016 11 Žáci jsou schopni z tabulky či diagramu určovat různé charakteristiky souboru: absolutní četnosti a relativní četnosti jednotlivých jevů. Úloha: Ve třídě s 20 žáky byly naměřeny následné tělesné výšky žáků. Určete, co je statistický soubor, statistické jednotky, statistický znak a vytvořte tabulku relativních četností. Výška / cm 132 133 135 136 137 139 140 141 142 Četnost 2 1 2 4 3 4 2 1 1 Údaje zaznamenáme do histogramu. 0 0,5 1 1,5 2 2,5 3 3,5 4 132 133 135 136 137 139 140 141 142 Četnost Výška / cm I. Budínová, R. Blažková: DM2, přednáška 6 19.5.2016 12 Spojnicový diagram se nejlépe hodí na průběžně se měnící data, např.: Příklad: Na následujícím spojnicovém diagramu vidíme vývoj nezaměstnanosti v ČR od ledna 2014 do ledna 2015. Nezaměstnanost je uvedena v procentech. Kruhový diagram dobře slouží, chceme-li opticky porovnat procentuální zastoupení jednotlivých položek. Např. následující kruhový diagram znázorňuje zastoupení známek z písemky z matematiky v jedné třídě: 5 7% 4 13% 1 20% 2 27% 3 33% Výsledky písemné práce I. Budínová, R. Blažková: DM2, přednáška 6 19.5.2016 13 ZÁKLADY PRAVDĚPODOBNOSTI NA ZŠ Úvahy o náhodě spadají do renesance, kdy obchodníci a finančníci chtěli znát míru rizika nebo zisku zamýšlených obchodních transakcí. Také Galileo Galilei se zajímal o míru přesnosti svých, mnohokrát opakovaných pokusů. Hazardní hráči tušili, že do her zasahuje kromě osudu a podvodů také něco zákonitého. Právě hazardní hry měly rozhodující vliv na vývoj nové disciplíny – teorie pravděpodobnosti. Počátky jsou spojeny se jménem Luca Pacioloho (1445 - 1514), o rozvoj teorie pravděpodobnosti se zasloužili Girolamo Cardano (1501 – 1576), Galileo Galilei (1564 – 1642), Blaise Pascal (1623 – 1662), Pierre de Fermat (1601 – 1665), Christiaan Huyghens (1629 – 1695), Jacob Bernoulli (1654 – 1705). Klasickou definici pravděpodobnosti vyslovil Abraham Moivre (1667 – 1754) a zdokonalil Pierre Simon de Laplace (1749 – 1827). I. Budínová, R. Blažková: DM2, přednáška 6 19.5.2016 14 Teorie pravděpodobnosti proniká do mnoha dalších vědních oborů – teorie her, teorie informací, kybernetiky, psychologie, sociologie, pojišťovnictví, finančnictví, statistiky, biologie, zemědělství aj. Základy pravděpodobnosti jsou důležité pro každého člověka. Je potřebné umět odhadnout, jaká je pravděpodobnost např. výhry v loterii či výhry na výherním automatu. PROPEDEUTIKA PRAVDĚPODOBNOSTI Na základní škole jde zejména o rozvoj pravděpodobnostního myšlení. Při výuce pravděpodobnosti bychom měli respektovat dvoustupňový přístup. V první části uvádět kvalitativní hodnocení – úsudky o pravděpodobnosti některých jevů. Ve druhé etapě provádět kvantitativní ohodnocení, uvést pravděpodobnost jako číslo. Pravděpodobnost chápeme v klasickém slova smyslu a uvádíme ji jako poměr počtu jevů příznivých ku počtu všech možných jevů I. Budínová, R. Blažková: DM2, přednáška 6 19.5.2016 15 Příklad: Následující jevy umísťujte na pravděpodobnostní osu. V únoru bude sněžit. Prase bude létat. 1. 5. bude zavřená škola. Autobus nezastaví na zastávce. Slunce bude svítit o půlnoci. Při házení šesti kostkami nastane jev: padnou všechny počty ok, tzv. postupka alespoň na dvou kostkách padne stejný počet ok nenastane žádný z jevů A, B padne součet 7 Nemožné Nepravděpodobné Pravděpodobné Jisté ZÁKLADNÍ POJMY Náhoda je něco, co nemůžeme ovlivnit. V praktických činnostech, ve vědě nebo ve výzkumu se často setkáváme s pokusy, které i při dodržení předepsaných podmínek mohou vést k různým výsledkům, výsledky těchto pokusů se mohou od jednoho provedení pokusu k provedení druhého měnit. Výsledky těchto pokusů závisí nejen na předepsaných podmínkách, ale také na náhodě. Nazýváme je náhodné pokusy. I. Budínová, R. Blažková: DM2, přednáška 6 19.5.2016 16 Uvažujme, že u každého náhodného pokusu jsme schopni předem určit všechny jeho možné výsledky, a to tak, že se navzájem vylučují, tj. nastane-li jeden, nenastane druhý a že jeden z nich nastane vždy. Množinu všech takto stanovených výsledků nazýváme množina všech možných výsledků pokusu a značíme ji Ω. Prvky této množiny značíme ω. Podmnožiny množiny všech možných výsledků nazýváme jevy. Označujeme je zpravidla písmeny A, B, C, … V daném pokusu můžeme rozlišit tolik jevů, kolik má množina všech možných výsledků podmnožin. Prázdná množina charakterizuje jev nemožný, množina Ω charakterizuje jev jistý. I. Budínová, R. Blažková: DM2, přednáška 6 19.5.2016 17 Pravděpodobnost P(A) jevu A je definována jako součet pravděpodobností příznivých jevu A kde m(A) je počet výsledků příznivých jevu A a m je počet všech možných výsledků. Pravděpodobnost jevu nemožného je rovna nule: P(ø) = 0 Pravděpodobnost jevu jistého je rovna jedné: P(Ω) = 1 Pro pravděpodobnost libovolného jevu A platí: 0 ≤ P(A) ≤ 1. I. Budínová, R. Blažková: DM2, přednáška 6 19.5.2016 18 SČÍTÁNÍ PRAVDĚPODOBNOSTÍ Pravděpodobnost sjednocení dvou navzájem vylučujících se jevů je rovna součtu pravděpodobností těchto jevů: P (A∪B) = P(A) + P(B), jestliže A∩B = ø. Pravděpodobnost sjednocení jevů, které se navzájem nevylučují, tj. A∩B ø, je rovna P (A∪B) = P(A) + P(B) – P(A∩B). Pravděpodobnost jevu opačného je rovna rozdílu P(A´) = 1 – P(A). NEZÁVISLOST JEVŮ Nezávislostí dvou jevů rozumíme to, že nastání jednoho jevu nemá vliv na nastání nebo nenastání druhého jevu. Matematicky to vyjádříme tak, že pravděpodobnost současného nastání nezávislých jevů je rovna součinu jejich pravděpodobností: P(A∩B) = P(A) . P(B) I. Budínová, R. Blažková: DM2, přednáška 6 19.5.2016 19 Úkol: Najděte příklady pravděpodobnosti sjednocení jevů (slučitelných i neslučitelných) a pravděpodobnosti nastání dvou nezávislých jevů. Vypočtěte pravděpodobnost nastání takového jevu. ÚLOHY Určete množinu všech možných výsledků, jestliže házíte: třemi rozlišitelnými mincemi, dvěma rozlišitelnými hracími kostkami. Jaká je pravděpodobnost že ze součtů, které mohou padnout při hodu dvěma kostkami, hodíme součet, který je dělitelný třemi? I. Budínová, R. Blažková: DM2, přednáška 6 19.5.2016 20 Z osudí, ve kterém je 10 kuliček červených a 5 kuliček modrých vybíráme jednu modrou kuličku, dvě modré kuličky, jednu červenou nebo modrou kuličku. Vypočítejte pravděpodobnosti těchto jevů. Ze skupiny pěti mužů a tří žen má být vybrána dvojice, ve které jsou: Jeden muž a jedna žena Dva muži Máme tři osudí. V prvním jsou 2 žluté, 3 červené a 1 černá kulička, ve druhém jsou 3 žluté a jedna černá kulička, ve třetím 3 červené, 1 modrá, 1 černá kulička. Náhodně vybereme jedno osudí a jednu kuličku. Znázorněte pomocí stromu a vypočítejte pravděpodobnosti, že bude vybrána: Modrá kulička Černá kulička Červená kulička Žlutá kulička I. Budínová, R. Blažková: DM2, přednáška 6 19.5.2016 21 LITERATURA Bílková, D., Budinský, P., Vohánka, V.: Pravděpodobnost a statistika. Plzeň, A.Čeněk, 2009. Budíková, M., Mikoláš, Š., Osecký, P.: Teorie pravděpodobnosti a matematická statistika. Brno: MU 2001. Calda, E., Dupač, V.: Matematika pro gymnázia. Kombinatorika, pravděpodobnost, statistika. Praha: Prometheus, 1993. Kuřina F. a kol.: Matematika a porozumění světu. Praha: Academia, 2009. Kuřina, K., Půlpán, Z.: Podivuhodný svět elementární matematiky. Praha: Academia, 2006. Mareš, M.: Příběhy matematiky. Příbram: Pistorius, Olšanská, 2008. Plocki, A.: Pravděpodobnost kolem nás. Ústí nad Labem: UJEP, 2001 Plocki, A., Tlustý, P.: Pravděpodobnost a statistika pro začátečníky a mírně pokročilé. Praha: Prometheus, 2007.