Téma 8: Ilustrace empirického zákona velkých čísel Empirický zákon velkých čísel: Se vzrůstajícím počtem pokusů se relativní četnost úspěchu ustaluje kolem pravděpodobnosti úspěchu. Modelová situace: Provádíme n nezávislých hodů mincí. Padnutí líce považujeme za úspěch. Tento pokus budeme simulovat pomocí programu STATISTICA a budeme sledovat závislost relativní četnosti úspěchu na počtu pokusů. (Počet pokusů volíme 2, 5, 10, 20, 50, 100, 200, 500, 1000, 2000.) Postup: Pomocí funkce Rnd vygenerujeme n náhodných čísel mezi 0 a 1. Nabude-li náhodné číslo hodnotu z intervalu <0,5; 1>, pokus považujeme za úspěšný - tzn., že padl líc. Zjistíme relativní četnost úspěchu. Postup opakujeme pro různá n a nakonec znázorníme graficky závislost relativní četnosti úspěchu na počtu pokusů. Návod: File ­ New ­ Number of variables 2, Number of cases 2000 ­ OK. 1. proměnnou přejmenujeme na NC, do Long Name napíšeme =Rnd(1), OK. (Funkce Rnd(1) vygeneruje náhodné číslo mezi 0 a 1.) 2. proměnnou přejmenujeme na POCET. Data ­ Recode - Category 1: Include If NC >=0,5, Category 2: Include If NC < 0,5, New Value 2, value 0, OK. (Proměnná POCET indikuje, zda nastal úspěch nebo neúspěch.) Vypočítáme průměr proměnné POCET (tj. relativní četnost úspěchu). Poznamenáme si počet pokusů n a relativní četnost úspěchu p. Nyní vymažeme posledních 1000 případů. Edit ­ Delete ­ Cases - From Case 1001 To Case 2000, OK. Znovu naplníme proměnné NC a POCET a spočteme průměr proměnné POCET. Postup opakujeme, až nám zbudou jen dva případy. Pak vytvoříme nový datový soubor o dvou proměnných n a p a 10 případech, kam zapíšeme hodnoty n a p. Nakonec nakreslíme dvourozměrný tečkový diagram závislosti p na n. Frequency table: POCET (Ezvc) Category Count Cumulative Count Percent Cumulative Percent 0 1 Missing 1005 1005 50,25000 50,2500 995 2000 49,75000 100,0000 0 2000 0,00000 100,0000 Frequency table: POCET (Ezvc) Category Count Cumulative Count Percent Cumulative Percent 0 1 Missing 510 510 51,00000 51,0000 490 1000 49,00000 100,0000 0 1000 0,00000 100,0000 Frequency table: POCET (Ezvc) Category Count Cumulative Count Percent Cumulative Percent 0 1 Missing 256 256 51,20000 51,2000 244 500 48,80000 100,0000 0 500 0,00000 100,0000 Frequency table: POCET (Ezvc) Category Count Cumulative Count Percent Cumulative Percent 0 1 Missing 100 100 50,00000 50,0000 100 200 50,00000 100,0000 0 200 0,00000 100,0000 Frequency table: POCET (Ezvc) Category Count Cumulative Count Percent Cumulative Percent 0 1 Missing 42 42 42,00000 42,0000 58 100 58,00000 100,0000 0 100 0,00000 100,0000 Frequency table: POCET (Ezvc) Category Count Cumulative Count Percent Cumulative Percent 0 1 Missing 23 23 46,00000 46,0000 27 50 54,00000 100,0000 0 50 0,00000 100,0000 Frequency table: POCET (Ezvc) Category Count Cumulative Count Percent Cumulative Percent 0 1 Missing 8 8 40,00000 40,0000 12 20 60,00000 100,0000 0 20 0,00000 100,0000 Frequency table: POCET (Ezvc) Category Count Cumulative Count Percent Cumulative Percent 0 1 Missing 6 6 60,00000 60,0000 4 10 40,00000 100,0000 0 10 0,00000 100,0000 Frequency table: POCET (Ezvc) Category Count Cumulative Count Percent Cumulative Percent 0 1 Missing 4 4 80,00000 80,0000 1 5 20,00000 100,0000 0 5 0,00000 100,0000 Frequency table: POCET (Ezvc) Category Count Cumulative Count Percent Cumulative Percent 0 1 Missing 1 1 50,00000 50,0000 1 2 50,00000 100,0000 0 2 0,00000 100,0000 n 2000 1000 500 200 100 50 20 10 5 2 p 0,4975 0,4900 0,4880 0,5000 0,5800 0,5400 0,6000 0,4000 0,2000 0,5000 Dvouroz měrný tečkový diagram. Závislost relativní četnosti úspěchu na počtu pokusů. -200 0 200 400 600 800 1000 1200 1400 1600 1800 2000 2200 n 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,55 0,60 0,65 p Komentář: Při každém provedení tohoto úkolu dostaneme trochu jiné četnosti úspěchů a neúspěchů, neboť postup je založen na generování náhodných čísel. Z grafu závislosti relativní četnosti úspěchu na počtu pokusů je patrno, že s rostoucím počtem pokusů se hodnoty relativní četnosti ustalují ve stále užším pásu kolem 0,5.