PSY117/454 Statistická analýza dat v psychologii ­ přednáška 9 Statistické testování hypotéz Posuzování platnosti hypotéz Testování hypotéz je založeno na pravděpodobnosti známe-li pravděpodobnostní rozložení statistik můžeme usuzovat, jak pravděpodobná je určitá výběrová statistika vzhledem k hypotéze: P(D |H) je-li P(D |H) vysoká, je tím hypotéza podpořena je-li P(D |H) nízká, je tím hypotéza ,,činěna méně p-nou" Příklady (statistických) hypotéz H: = 100 : Populační průměr je roven 100. H: = 0 : Populační průměr je roven 0. H: = 10 : Populační směrodatná odchylka je 10. H: 1 ­ 2 = 0 : Populační průměry 1 a 2 jsou stejné. H: 2 m ­ 2 ž= 0 : Populační rozptyly 2 m a 2 ž jsou stejné. H: xy= 0 : Proměnné X a Y spolu nekorelují ? jak ,,vysokánízká" je vysokánízká pravděpodobnost? ve výzkumné praxi nás obvykle napadají jiné hypotézy AJ: statistical hypotheses testing, hypothesis, hypothesis supported by data Jak vysoká P(D|H) je nutná k přijetí H? Bayesovský přístup ­ otázka není relevantní s H je spojena určitá p-nost a ta se díky P(D|H) zvyšuje či snižuje Bayesův teorém ­ P(H|D) = P(H)*P(D|H) / P(D) Fisher, Pearson, Neyman ­ otázka je relevantní Popper ­ princip falzifikace ­ H nelze potvrdit, pouze vyvrátit My ale nechceme své hypotézy vyvracet, spíš potvrzovat P-N: princip vzájemně se doplňujících konkurenčních hypotéz Vytvořme takovou H, kt. bude logickou negací naší vědecké hypotézy a říkejme jí nulová H. Když se nám podaří nulovou H vyvrátit, znamená to jakousi podporu pro naší vědeckou hypotézu. Vyvrácení H0: P(D |H0) < 0,05; 0,01; 0,001; 0,0001 podle zvyku Terminologická vložka H0 : nulová (statistická) hypotéza logická negace (doplněk) vědecké hypotézy H1 : vědecká, alternativní hypotéza ta, o kterou nám primárně jde P (H0 v H1) = 1 P (D |H0), kdy H0 zamítáme: úroveň/hladina statistické významnosti (průkaznosti) , udává se často v procentech: 5%, 1% p-nost chybného zamítnutí H0 - chyba prvního typu chyba, jejíž velikost jsme ochotni tolerovat AJ: null hypothesis, scientific/alternative hypothesis, level of statistical significance, type I error Postup testování statistické hypotézy 1. Formulujte statistickou hypotézu, kterou budete testovat (vyvracet) (H0: = 0) 2. Zvolte hladinu statistické významnosti, tj. míru rizika, že dojde k chybě 1. typu (např. = 0,05) 3. Hledáme p-nost získání naší výběrové statistiky, za předpokladu, že H0 je pravdivá: P(D|H0), p, Sig. např. m = 0,5. P(m=0,5|=0) 4. Vyneseme rozhodnutí o H0: zamítnutí či přijetí je-li P(D|H0) < , pak H0 zamítáme je-li P(D|H0) > , pak H0 nezamítáme Příklad ­ jednovýběrový t-test Terapie nevhodného chování. Rozdíl před-po: m=2,7; s=3,5; n=10 H: Terapie má efekt. ( 0) 1. H0: Terapie nemá efekt: = 0 2. V sociálních vědách běžně =0,05 3. P(m=2,7|=0). sm=3,5/odm(10)=1,1 t=(m-)/sm=2,7/1,1= 2,45 TDIST(2,45;9;2)=0,04 4. P(m=2,7|=0) < 0,05 >> zamítáme H0 Protože při m=2,7 je velmi málo pravděpodobné, že by rozdíl byl 0, tak připouštíme, že nějaký rozdíl je. Dichotomizace výsledků výzkumu Výsledek výzkumu je testováním zredukován na ano-ne Čím nižší je , tím vyšší je . Přesná podoba vztahu závisí na použitém testu. i mohou být nízké pouze při vysokých n. Síla testu viz Hendl 401-411. AJ: type-I error, type-II error, (statistical) power H0 přijata H0 zamítnuta H0 pravdivá (žádný efekt) OK chyba 1. typu (její pravděpodobnost) H0 nepravdivá (efekt) chyba 2. typu OK Síla (1-) Problémy statistického testování H Největší problém: dichotomizace stejná velikost efektu dává při různých N jiné rozhodnutí o H0 komplikuje až znemožňuje kumulativní budování znalostní báze Problém interpretace p= P(D|H0) a nikoli P(H |D) Jak z jich ven? VŽDY udávat velikost efektu (Cohenovo d, r, R 2, 2, 2 ) používat intervalové odhady testování hypotéz používat pouze doplňkově