Téma 1: Bodové zpracování četností Vzorový příklad: U 20 studentů 1. ročníku byly zjišťovány známky z matematiky, angličtiny a údaje o pohlaví (viz skripta Popisná statistika, příklad 2.4). Příslušný datový soubor se jmenuje znamky.sta. Proveďte bodové zpracování četností. Postup ve STATISTICE: 1. Do programu STATISTICA načtěte datový soubor znamky.sta. 2. Znaky nazvěte X, Y, Z, vytvořte jim návěští (X - známka z matematiky, Y - známka z angličtiny, Z - pohlaví studenta) a popište, co znamenají jednotlivé varianty (u znaků X a Y: 1 - výborně, 2 - velmi dobře, 3 - dobře, 4 - neprospěl, u znaku Z: 0 - žena, 1 - muž). Soubor uložte. Návod: Kurzor nastavíme na Var1 ­ 2x klikneme myší ­ Name X ­ Long Name známka z matematiky, Text label ­ výborně, Numeric ­ 1, velmi dobře, Numeric - 2, dobře, Numeric ­ 3, neprospěl, Numeric ­ 4, OK. U proměnné Y lze text label okopírovat z proměnné X ­ v Text Labels Editor zvolíme Copy from variable X. (Přepínání mezi číselnými hodnotami a jejich textovým popisem se děje pomocí tlačítka s obrázkem štítku.) 3. U znaků X a Y vypočtěte absolutní četnosti, relativní četnosti a relativní kumulativní četnosti. Návod: Statistics - Basic Statistics/Tables ­ Frequency tables ­ OK ­ Variables X, Y, OK ­ Summary. (Obě tabulky se uloží do workbooku a listovat v nich můžeme pomocí stromové struktury v levém okně.) Řešení: Frequency table: X: známka z matematiky (zn Category Count Cumulative Count Percent Cumulative Percent výborně: velmi dobře: dobře neprospěl: Missing 7 7 35,00000 35,0000 3 10 15,00000 50,0000 2 12 10,00000 60,0000 8 20 40,00000 100,0000 0 20 0,00000 100,0000 Frequency table: Y: známka z angličtiny (znam Category Count Cumulative Count Percent Cumulative Percent výborně: velmi dobře: dobře neprospěl: Missing 4 4 20,00000 20,0000 4 8 20,00000 40,0000 7 15 35,00000 75,0000 5 20 25,00000 100,0000 0 20 0,00000 100,0000 Komentář: Vidíme např., že jedničku z matematiky mělo 7 studentů, tj. 35%. Zkoušku z angličtiny složilo 15 studentů, tj. 75%. 4. Vytvořte sloupkový diagram absolutních četností znaků X a Y. Návod: Graphs ­ Histograms ­ Variables X, Y ­ OK- vypneme Normal fit ­ Advanced ­ zaškrtneme Breaks between Columns, OK. Vytvořte výsečový diagram absolutních četností znaků X a Y. Návod: Graphs ­ 2D Graphs ­ Pie Charts ­ Variables X, Y ­ OK ­ Advanced ­ Pie legend Text and Percent (nebo Text and Value) ­ OK. Vytvořte polygon absolutních četností znaků X a Y. Návod: ve workbooku vstoupíme do tabulky rozložení četností proměnné X. Pomocí Edit ­ Delete - Cases vymažeme řádek označený Missing. Nastavíme se kurzorem na Count a kliknutím pravého tlačítka vstupíme do menu Line Plot: Entire Columns. Vykreslí se polygon četností. Řešení: Sloupkový diagram. výborně velmi dobře dobře neprospěl známka z matematiky 0 1 2 3 4 5 6 7 8 9 Sloupkový diagram. výborně velmi dobře dobře neprospěl známka z angličtiny 0 1 2 3 4 5 6 7 8 Výsečový graf. známka z matematiky výborně; 35% velmidobře; 15% neprospěl; 40% dobře; 10% Výsečový graf. známka z angličtiny výborně; 20% velmidobře; 20% neprospěl; 25% dobře; 35% Polygon absolutních četností. známka z matematiky výborně velmi dobře: dobře neprospěl: 1 2 3 4 5 6 7 8 9 Polygon absolutních četností. známka z angličtiny výborně velmi dobře: dobře neprospěl: 3,5 4,0 4,5 5,0 5,5 6,0 6,5 7,0 7,5 5. Vytvořte graf empirické distribuční funkce znaku X. Návod: Při tvorbě histogramu zadáme v Advanced volbu Showing Type Cumulative, Y axis % - 2x klikneme myší na pozadí grafu ­ otevře se okno All Options ­ vybereme Plot: Bars ­ Type Rectangles. Vytvořte graf četnostní funkce znaku X. Návod: Při tvorbě histogramu zadáme v Advanced Y axis % - 2x klikneme myší na pozadí grafu ­ vybereme Plot General ­ zaškrtneme Markers ­ vybereme Plot: Bars ­ Type Lines. Řešení: Empirická distribuční funkce. 0 výborně velmi dobře dobře nevyhovující 5 známka z matematiky -20 0 20 40 60 80 100 120 Graf četnostní funkce. výborně velmidobře dobře neprospěl známka z matematiky 0% 5% 10% 15% 20% 25% 30% 35% 40% 45% Percentofobs Komentář: Z grafu empirické distribuční funkce bohužel nelze jednoduše odstranit svislé čáry. Stojí za povšimnutí, že výška ,,schodu" v grafu empirické distribuční funkce ve variantách ,,výborně", ,,velmi dobře", ,,dobře" a ,,neprospěl" odpovídá hodnotě četnostní funkce v příslušné variantě. 6. Z datového souboru vyberte pouze ženy (pouze muže) a úkol 3 proveďte pro ženy (pro muže). Návod: Statistics - Basic Statistics/Tables ­ Frequency tables ­ OK ­ Variables X, Y, OK ­ Select Cases ­ zaškrtneme Selection Conditions ­ Include cases ­ zaškrtneme Specific, selected by Z = 0, OK. Řešení: Variační řady známek z matematiky a angličtiny pro ženy. Frequency table: X: známka z matematiky Category Count Cumulative Count Percent Cumulative Percent výborně: velmi dobře: dobře neprospěl: Missing 5 5 50,00000 50,0000 2 7 20,00000 70,0000 1 8 10,00000 80,0000 2 10 20,00000 100,0000 0 10 0,00000 100,0000 Frequency table: Y: známka z angličtiny Category Count Cumulative Count Percent Cumulative Percent výborně: velmi dobře: dobře neprospěl: Missing 4 4 40,00000 40,0000 2 6 20,00000 60,0000 1 7 10,00000 70,0000 3 10 30,00000 100,0000 0 10 0,00000 100,0000 Variační řady známek z matematiky a z angličtiny pro muže. Frequency table: X: známka z matematiky Category Count Cumulative Count Percent Cumulative Percent výborně: velmi dobře: dobře neprospěl: Missing 2 2 20,00000 20,0000 1 3 10,00000 30,0000 1 4 10,00000 40,0000 6 10 60,00000 100,0000 0 10 0,00000 100,0000 Frequency table: Y: známka z angličtiny Category Count Cumulative Count Percent Cumulative Percent velmi dobře: dobře neprospěl: Missing 2 2 20,00000 20,0000 6 8 60,00000 80,0000 2 10 20,00000 100,0000 0 10 0,00000 100,0000 7. Nadále pracujte s celým datovým souborem. Vytvořte kontingenční tabulku absolutních četností znaků X a Y a graf simultánní četností funkce. Návod: Statistics - Basic Statistics/Tables ­ Tables and banners ­ OK ­ Select cases ­ All ­ OK ­ Specify tables - List 1 X, List 2 Y, OK, Summary. Vytvoření grafu simultánní četnostní funkce: Návrat do Crosstabulation Tables Result ­ 3D histograms ­ vybereme Axis Scaling ­ Mode Manual ­ Minimum 0 (a totéž provedeme pro Axis Y) ­ dále vybereme Graph Layout ­ Type ­ Spikes ­ OK. Graf lze natáčet pomocí Point of View. Vytvořte kontingenční tabulku sloupcově a řádkově podmíněných relativních četností znaků X a Y. Návod: Návrat do Crosstabulation Tables Result ­ Options - zaškrtneme ve sloupci Compute tables volbu Percentages of column counts (resp. Percentages of row counts). Řešení: Kontingenční tabulka absolutních četností známek z matematiky a z angličtiny. Summary Frequency Table (znamky) Marked cells have counts > 10 (Marginal summaries are not marked) X Y výborně Y velmi dobře Y dobře Y neprospěl Row Totals výborně 4 1 2 0 7 velmi dobře 0 2 1 0 3 dobře 0 0 1 1 2 neprospěl 0 1 3 4 8 All Grps 4 4 7 5 20 Komentář: Z tabulky je patrno, že např. 4 studenti měli z obou předmětů známku ,,výborně", 1 student měl z matematiky ,,výborně" a současně z angličtiny ,,velmi dobře" atd. Simultánní četnostní funkce. Kontingenční tabulka sloupcově a řádkově podmíněných relativních četností. Summary Frequency Table (znamky) Marked cells have counts > 10 (Marginal summaries are not marked) X Y výborně Y velmi dobře Y dobře Y neprospěl Row Totals Count Column Percent Row Percent Count Column Percent Row Percent Count Column Percent Row Percent Count Column Percent Row Percent výborně 4 1 2 0 7 100,00% 25,00% 28,57% 0,00% 57,14% 14,29% 28,57% 0,00% velmi dobře 0 2 1 0 3 0,00% 50,00% 14,29% 0,00% 0,00% 66,67% 33,33% 0,00% dobře 0 0 1 1 2 0,00% 0,00% 14,29% 20,00% 0,00% 0,00% 50,00% 50,00% neprospěl 0 1 3 4 8 0,00% 25,00% 42,86% 80,00% 0,00% 12,50% 37,50% 50,00% Komentář: Podívejme se např. na druhý sloupec tabulky. V prvním řádku je číslo 25%. Znamená to, že 25% těch studentů, kteří měli ,,velmi dobře" z angličtiny, dostali známku ,,výborně" z matematiky. Nyní se podíváme např. na čtvrtý řádek tabulky. Ve třetím sloupci je číslo 37,5%. Znamená to, že 37,5% těch studentů, kteří neprospěli z matematiky, dostalo známku ,,dobře" z angličtiny.