Zamyšlení nad komunikováním statistiky v médiích PSY117 Statistická analýza dat Tomáš Nováček UČO 78882, Psychologie Datum odevzdání: 1. 5. 2015 Fakulta sociálních studií MU, 2014/2015 2015 Titulek článku z české mutace webových stránek National Geographic mě zaujal na první pohled. Zní: „Psychologové: muži jsou vtipnější než ženy (ale jen o trošku)“ (Nd, 2012). (Dvakrát jsem zkontroloval, jestli jsem stále na stejném webu. Měl jsem podezření, že jsem se omylem octl na nějakých bulvárních stránkách, což se bohužel nepotvrdilo.) Úvodní odstavec přichází s tvrzeními: “Ženy jsou méně vtipné než muži, ale jen o trošku. A mužským vtipům se smějí hlavně muži.” V následujícím odstavci ovšem článek popírá svůj titulek a přichází s jinou interpretací výsledků studie, na kterou se odkazuje. Rozdíl mezi smyslem pro humor je podle studie “tak malý, že rozdíl mezi pohlavími v tomto směru téměř neexistuje”. Prezentuje zde fakt, že mužský humor byl jen o 0,11 procent lépe než ženský. Shrnutí původní studie Výše uvedený článek odkazuje na výzkum (Mickes, Walker, Parris, Mankoff, & Christenfeld, 2012), který se zabýval stereotypem, že jsou muži vtipnější než ženy. Kladl si otázku, zda je tento stereotyp postaven na reálném základě, nebo zda se jedná o předsudek. Navazoval na teorii, že humor je evolučním nástrojem našich předků, kteří využívali svůj smysl pro humor pro získávání partnerek. Autoři stanovují několik hypotéz, které následně ověřují ve dvou studiích. První hypotéza je postavena na předpokladu, že pokud bychom se takto evolučně vyvíjeli, muselo by se to skutečně projevovat tím, že muži budou vtipnější. Vzhledem k limitovanému rozsahu práce zde není prostor věnovat se dalším hypotézám, i když by to mohlo být zajímavé. Podrobněji k vybrané otázce. Účastníci výzkumu byli studenti psychologie. Šestnáct mužů a šestnáct žen. Dostali za úkol doplnit text ke kresleným vtipům. Pro hodnocení míry vtipnosti bylo najato 81 studentů psychologie (34 mužů a 47 žen). Ti postupně posuzovali jednotlivé vtipy všech účastníků formou vyřazovací soutěže po dvojicích. Za každé kolo, ve kterém postoupil vtip do dalšího kola dostal od hodnotitele bod. Pro vtipy od mužů a od žen se spočítalo průměrné skóre za všechna kola všech hodnotitelů. Podle závěru studie dosáhly vtipy vymyšlené muži o 0,11 bodu více než ženy t(79) = 7,85, p<0,01, SD=0,46, d=0,24. Problematika interpretace a výzkumu a otazníky k výzkumu jako takovému Za největší nedostatek článku National Geographic považuji to, že je v něm kromě spousty nepřesností nesprávně prezentováno už to hlavní zásadní sdělení. V článku se uvádí, že muži jsou vtipnější o 0,11 procenta, přitom ve správě se mluví o 0,11 bodech! Dále se práce odvolává na studie, které v práci nejsou obsaženy a prohlášení, které se ke studii vůbec nevztahují. Zásadní připomínku bych měl také k faktu, že článek vztahuje výsledky studie na populaci. Výzkum se ale věnoval pouze srovnání průměrů dvou nezávislých výběrů (mužů a žen). Pro vztahování výsledku na populační parametry je vzorek malý a úzce vymezený studenty jedné vysoké školy v USA. Celkově to na mě dělá dojem, že redakce National Geographic odkaz na práci uvedla jen ve snaze o vytvoření dojmu vyšší důvěryhodnosti. Čísla a fakta jsou nicméně v článku uvedená naprosto chybně. Důvěryhodnost článek letmým nahlédnutím do studie a chybnou interpretací rozhodně nezískal. Uvedený fakt vlastně dost relativizuje smysluplnost dalších úvah k článku. V rámci cvičných důvodů bych se dále rád věnoval diskusi ke studii samotné. Již při prvním nahlédnutí do studie mě zaujaly dvě věci. Za prvé, proč byly dva nezávislé výběry různě velké (34 mužů a 47 žen)? Za druhé, kritická hodnota t vycházela poměrně vysoká (7,85) k prezentované standardní odchylce (0,46) a rozdílu průměrů (0,11). K důvodu rozdílné velikosti vzorků jsem nenašel ani v diskusi žádný komentář. Vede mě to k myšlence, že větší počet jednoho vzorku by mohl ovlivnit variabilitu vzorku a celkově tak snížit srovnatelnost rozdílu průměrů. Výsledek t-testu jsem se na prezentovaných datech pokusil spočítat. Překvapilo mě, že se ve studii uvádějí jen rozdíly průměrů, ne jejich hodnota. Napadá mě, jestli to nebylo z důvodu, že by jejich hodnota mohla poukazovat například na šikmost rozložení, které by mohlo vést k diskusím o použité metodě testování. Pro mě to každopádně znamenalo, že jsem nebyl schopen určit interval spolehlivosti pro definovanou hladinu spolehlivosti. Protože ve studii nebyly uvedené směrodatné odchylky pro jednotlivé výběry, odvodil jsem si je z prezentovaného Cohenova d a vypočítal směrodatnou chybu pro dva nezávislé výběry se stejným rozptylem. V mém výpočtu vyšla ovšem kritická hodnota t naprosto jinak než autorům studie: t(79) = 1,068, p>0,05 (p=0,29). Z tohoto pohledu bychom museli podržet nulovou hypotézu. Oceňuji, že autoři uvedli k datům hodnotu Cohenova d, ale nechápu, že se k němu nijak nevyjádřili. Efekt Cohenova koeficientu účinku d = 0,24, bývá podle konvence považován za malý efekt. I kdyby byl naměřený rozdíl mezi průměry obou skupin statisticky významný, věcně významný by ale nebyl. Při převodu na korelační koeficient můžeme potvrdit, že korelace mezi pohlavím a výsledným hodnocením je poměrně nízká (r=0,12). I kdyby byl mezi průměry skupin byl statisticky významný rozdíl, intervenují zde pravděpodobně další proměnné. Ve své práci s článkem a odkazovaným výzkumem jsem došel k závěru, že otázky k diskusi jsou v popularizačním článku i ve vědecké studii, na kterou se článek odkazuje. Použitá literatura Mickes, L., Walker, D. E., Parris, J. L., Mankoff, R., & Christenfeld, N. J. S. (2012). Who’s funny: gender stereotypes, humor production, and memory bias. Psychonomic Bulletin & Review, 19(1), 108–112. doi:10.3758/s13423-011-0161-2 Nd. (2012). Psychologové: Muži jsou vtipnější než ženy (ale jen o trošku) - National Geographic. Retrieved May 1, 2015, from http://www.national-geographic.cz/clanky/psychologove-muzi-jsou-vtipnejsi-nez-zeny-ale-jen-o-trosku .html#.VUOpbM7OCbk Parádní text, děkuji. Za podstatné považuji i to, že ono autory zjištěné Cohenovo d a jeho průkazonst je důsledkem použitého postupu skrz kola hodnocení – které vlastně zvětšuje rozdíly. 10b