Metodologie pro ISK II ¡Zlaté pravidlo pro induktivní statistiku: ¡vysoká hodnota testu signifikance (tj. naměřená hodnota > 0,05) à držíme nulovou hypotézu ¡nízká hodnota testu signifikance (tj. naměřená hodnota £ 0,05) à zamítáme nulovou hypotézu ¡ jaká je pravděpodobnost, že by testovací kritérium dosáhlo své hodnoty, případně hodnot ještě více svědčících proti , pokud by opravdu platila H_0 H_0 jaká je pravděpodobnost, že by testovací kritérium dosáhlo své hodnoty, případně hodnot ještě více svědčících proti , pokud by opravdu platila H_0 H_0 jaká je pravděpodobnost, že by testovací kritérium dosáhlo své hodnoty, případně hodnot ještě více svědčících proti , pokud by opravdu platila H_0 H_0 jaká je pravděpodobnost, že by testovací kritérium dosáhlo své hodnoty, případně hodnot ještě více svědčících proti , pokud by opravdu platila H_0 H_0 jaká je pravděpodobnost, že by testovací kritérium dosáhlo své hodnoty, případně hodnot ještě více svědčících proti , pokud by opravdu platila H_0 H_0 H_0 H_0 Co znamená naměřená hodnota? Jaká je pravděpodobnost, že by testovací kritérium dosáhlo své hodnoty, případně hodnot ještě více svědčících proti, pokud by opravdu platila. ¡Řada testovacích kritérií – pro různé druhy hypotéz různé testy ¡My nejčastěji upotřebíme: ¡Porovnávání průměrů §Dvou populačních průměrů §Více populačních průměrů ¡Porovnávání očekávaných a naměřených hodnot kategorizovaných proměnných (zobecnění Crosstabs) ¡Např. zkoumáme vztah mezi vzděláním a počtem dětí ¡ ¡Nulová a alternativní hypotéza: ¡H0: Neexistuje rozdíl mezi počtem dětí u jednotlivých vzdělanostních skupin. ¡Ha: Existuje rozdíl mezi počtem dětí u jednotlivých vzdělanostních skupin. ¡Nejprve si zjistíme rozdíly v naměřených průměrech ¡Analyze – Compare Means Porovnání průměrů ukazuje, že v naměřených hodnotách jsou rozdíly. Jsou však rozdíly i v populaci? ¡1. krok: Analyze – One way ANOVA ¡Options: Descriptives ¡2. krok: statistika F a její signifikance Podíl variability mezi skupinami (between groups) a variability uvnitř skupin (within groups), konkrétně jejich průměrů součtu druhých mocnin směrodatných odchylek. Pokud platí nulová hypotéza, že rozdíly mezi průměry jsou nulové, musí být obě průměrné hodnoty druhých mocnin podobné a jejich vzájemný poměr (F) tedy musí být blízko 1. Hodnota je signifikantní (menší než 0,05). Pravděpodobnost podržet nulovou hypotézu je nízká (0,01) à zamítáme (tj. průměry v populaci nejsou stejné) ¡3. krok: Chceme vědět, mezi kterými skupinami statisticky významný rozdíl existuje SPSS potvrdilo statisticky významný rozdíl pouze mezi skupinou SŠ s vyučením a VŠ mgr/ing. U ostatních skupin nemůžeme s jistotou říci, že rozdíl existuje i v populaci ¡Speciální případ analýzy rozptylu ¡Typicky u pohlaví (porovnáváme dva průměry) ¡ ¡Studentův t-test (William Gosset) §směrodatná odchylka (s), která sama podléhá variabilitě výběru, již nemusí být spolehlivým odhadem populační směrodatné odchylky (zdroj) ¡ ¡Pro nás relevantní: Independent Samples T-test ¡Např. zkoumáme vztah mezi pohlavím a počtem dětí (v populací třicátníků) ¡ ¡Nulová a alternativní hypotéza: ¡H0: Neexistuje rozdíl mezi počtem dětí u skupin podle pohlaví. ¡Ha: Existuje rozdíl mezi počtem dětí u skupin podle pohlaví. ¡Krok 1: Analyze – Compare Means – Independent Samples T-test ¡Krok 2: Podíváme se, jaké rozdíly jsme naměřili na vzorku Existují rozdíly i v populaci? ¡Krok 3: Interpretujeme test ve dvou krocích: §1. podíváme se na výsledky F testu o shodě variací ▪Signifikance u F > 0,05 à použijeme T-testu pro případ EQUAL VARIANCES ASSUMED ▪Signifikance u F < 0,05 à použijeme T-testu pro případ EQUAL VARIANCES NOT ASSUMED §2. v příslušném sloupci čteme významnost Je-li menší než 0,05, nulovou hypotézu o shodě populačních průměrů lze zamítnout – rozdíl pravděpodobně existuje i v populaci ¡Crosstabs už umíme J ¡Např: Jak se liší frekvence čtení u skupin podle vzdělání? ¡Opět formulujeme nulovou a alternativní hypotézu: §H0: Neexistuje rozdíl ve frekvenci čtení mezi skupinami třicátníků s různým vzděláním. §Ha: Existuje rozdíl ve frekvenci čtení mezi skupinami třicátníků s různým vzděláním. § ¡Analyze – Descriptive Statistics – Crosstabs ¡1. krok: uděláme si tabulku četností a zvolíme vhodně procenta Taková tabulka je pro nás moc jemná à rekódujeme si proměnné na hrubší kategorie ¡Analyze – Descriptive Statistics – Crosstabs ¡1. krok: nová tabulka četností Vidíme poměrně zajímavé rozdíly! Můžeme je zobecnit? ¡Analyze – Descriptive Statistics – Crosstabs ¡1. krok: nová tabulka četností a graf ¡2. krok: provedeme Test nezávislosti chí-kvadrát (c2) 1.Zhodnotíme H0 pomocí sig. Chí kvadrátu 2.Podíváme se na adjustované reziduály naměřených četností Je rozdíl způsoben výběrovou chybou, anebo můžeme zamítnout nulovou hypotézu, že v základním souboru bude tento podíl lidí, kteří čtou podle vzdělanostních skupin stejný? ¡Chí-kvadrát – založený na srovnávání naměřených a očekávaných proměnných §Očekávaná četnost: počet jednotek, který by do dané kategorie spadl při náhodném rozložení §Naměřená četnost: počet jednotek, které jsme v dané kategorii ve vzorku naměřili §Reziduál: rozdíl mezi OČ a NČ §Adjustované reziduály: koeficient determinace (AR mají přibližně normální rozložení s průměrem 0 a standardní odchylkou 1) ¡Chí-kvadrát – Analyze – Crosstabs: Statistics ¡Chí-kvadrát – Analyze – Crosstabs: Statistics Hodnota významnosti 0 à zamítáme hypotézu o neexistenci rozdílu v populaci Pozor! Chí-kvadrát se dá použít jen pokud více než 20 % políček má očekávanou četnost menší než 5 a minimální očekávaná četnost nesmí být menší než 1 • Naměřené hodnoty • Očekávané hodnoty • Reziduály • Adjustované reziduály Pokud je hodnota AR vyšší než 2,00, můžeme si být s 95% pravděpodobností jisti, že v daném políčku je rozdíl mezi empirickou a očekávanou četností významný a že tedy nevznikl výběrovou chybou vyskytuje se i v populaci ¡Jak se liší počet dětí u skupin podle velikosti místa bydliště? ¡Zhodnoťte nulové hypotézy: §Neexistuje rozdíl mezi čtením bulvárních deníků u různých skupin dle vzdělání §Neexistuje rozdíl mezi názorem na používání lehkých drog u skupin podle pohlaví §Neexistuje rozdíl mezi současným ekonomickým postavením a nejvyšším dosaženým vzděláním. §Plus jednu hypotézu z vašich dle vlastního výběru ¡