Seminář k diplomové práci I: Východiska a metodologie Kvantitativní metodologie a statistika David Lacko Výuka metodologie na KISKu •Podzim: ISKB06 Metodologie informačních studií a knihovnictví •Jaro: ISKB15 Seminář k bakalářské práci: metodologie ISK Doporučená literatura •Hendl J. (2015). Přehled statistických metod: analýza a metaanalýza dat. Praha: Portál. •Hendl J. (2008). Kvalitativní výzkum: základní teorie, metody a aplikace. Praha: Portál. •Reichel, J. (2009). Kapitoly metodologie sociálních výzkumů. Praha: Grada. •Pickard, A. J. (2013). Research methods in information. London: Facet publishing. •Novotná, H., et al. (2020). Metody výzkumu ve společenských vědách. Praha: Karlova univerzita. • • • Doplňující literatura •Mareš, P., Rabušic, L., & Soukup, P. (2015). Analýza sociálněvědních dat (nejen) v SPSS. Brno: Masarykova univerzita. •Urbánek, T., Denglerová, D., & Širůček, J. (2011). Psychometrika: měření v psychologii. Praha: Portál. •Disman, M. (1993). Jak se vyrábí sociologická znalost. Praha: Karolinum. •Ferjenčík, J. (2000). Úvod do metodologie psychologického výzkum. Praha: Portál. •Švaříček, R., & Šeďová, K. (2014). Kvalitativní výzkum v pedagogických vědách. Praha: Portál. • Struktura přednášky •Kvantitativní metodologie –Co je to věda a metodologie –Kvantitativní metodologie –Typy kvantitativních výzkumů –Hodnocení metod –Testování hypotéz •Úvod do statistiky –Popisná statistika –Inferenční statistika –Klíčové pojmy –Statistické testy • Část I. Kvantitativní metodologie • Poznání •Zdroje poznání (Charles Peirce) –Metoda tradice –Metoda autority –Metoda a priori –Metoda vědy • • •Vztah kritického myšlení a vědeckého poznání? • Obsah obrázku muž, osoba, zeď, interiér Popis byl vytvořen automaticky Obsah obrázku muž, osoba Popis byl vytvořen automaticky Věda •Vědecké poznání: předmětné, systematické, empirické, kritické, kontrolovatelné, reprodukovatelné a sociálně a kulturně podmíněné. •Každá věda je tvořena metodou a předmětem zkoumání (Auguste Comte) • Metodologie •Věda o metodách. Předmětem jejího zkoumání je filosofie vědy (tj. studium metod a vědeckých postupů). •Vědecká metoda je systematickým, promyšleným a objektivním postupem k získání poznatků a dosažení cíle. Kvantitativní metodologie Kvalitativní Kvantitativní Základní typy výzkumů v kvantitativní metodologii •Orientační výzkum •Korelační výzkum •Kvaziexperimentální výzkum •Experimentální výzkum Korelační výzkum •Kvantifikace a zkoumání míry vztahů (těsnosti) mezi proměnnými. •Odpoví nám na otázku: Souvisí jev A s jevem B? •Rozvoj souvisí s rozvojem statistických procedur (korelace, regrese, faktorová analýza, strukturální modelování) •3 výsledky korelací –Mezi korelovanými proměnnými neexistuje žádný vztah. –Mezi proměnnými existuje kladný vztah – např. čím více …, tím více … –Mezi proměnnými existuje záporný vztah – např. čím více …, tím méně … • • Třetí proměnná v korelacích • Korelace ≠ Kauzalita Více zde: http://tylervigen.com/spurious-correlations Obsah obrázku mapa Popis byl vytvořen automaticky • C:\Users\ladav\Desktop\korelace vs kauzalita.png Kvaziexperimentální výzkum •Snaha o odhalení kauzálních vztahů •= Ex post facto výzkum •problémem je většinou faktické či z etických důvodů nemožné náhodné rozřazení osob do experimentální a kontrolní skupiny •Nelze také manipulovat s nezávislou proměnnou (např. pohlaví, onemocnění) •kvaziexperiment se často používá v přirozeném prostředí v rámci aplikovaného výzkumu •Slabé omezení intervenujících proměnných (na rozdíl od experimentu) -> má nižší vnitřní validitu Experimentální výzkum •Hlavní nástroj empirického výzkumu – „Zlatý standard“ •Laboratorní metoda, obtížně proveditelný v kontextu „normálního života“ •Velice vysoká interní validita, ale může být nižší externí (ekologická) validita (na rozdíl od kvaziexperimentu) •Etické problémy •Slavné experimenty v sociálních vědách –Zimbardo – Stanfordský vězeňský experiment (jednalo se spíše o kvazi-experiment) –Milgram – respekt k autoritě –Aschův experiment - konformita • Hodnocení metod •Vznikají v důsledku nepřímosti měření –Málokdy měříme daný konstrukt přímo, většinou pouze pomocí nějakých projevů -> stoupá chyba měření •Většina metod v humanitních a sociálních oborech bude mít tzv. chyby měření kvůli nepřímosti měření •Konstantní chyby -> validita •Osobní chyby -> standardizace I (objektivita) •Proměnné chyby -> reliabilita •Interpretační chyby -> standardizace II (normalizace) •Celý tento proces se nazývá standardizace (III) metody • Vztah validity a reliability •Validita = odmocnina z reliability –Bez reliability nemůže být validita! –Bez validity může být reliabilita (např. frenologie)! Hledání vědeckých důkazů •Induktivní přístup: Důraz na verifikaci •Problém indukce –Sextus Empiricus –Francis Bacon •Východ slunce –David Hume – Problém indukce –Bertrand Russell •Krocan-vědec • • • Snaha o „vyřešení“ problému indukce •Karl Popper – Kritický racionalismus (hypoteticko-deduktivní metoda) –Černá labuť •Logik der Forschung •1. Indukce neexistuje. •2. Hypotézy lze jen falsifikovat, nikoli verifikovat - verifikace neexistuje. •3. Demarkační kritérium - vědecká je jen falsifikovatelná teorie. •4. Smyslem vědy je falsifikace. • Hypotéza •Z řeckého hypóthesis – předpoklad, domněnka •Je psána výrokovou formou, je velice konkrétní. •jednoduchost, verifikovatelnost, falsifikovatelnost, srozumitelnost. Testování hypotéz •Proces rozhodování o tom, jestli přijmeme, nebo zamítneme hypotézu •Podobně jako indukce, snaha o generalizaci výsledku získaného ze vzorku na populaci. •Nulová vs. Alternativní hypotéza Testování hypotéz Disproved = reject Obsah obrázku text Popis byl vytvořen automaticky Obsah obrázku kreslení Popis byl vytvořen automaticky Operacionalizace a dělení proměnných •Nezávislá proměnná •Závislá proměnná •Intervenující proměnné • •Úrovně měření 2. Část – Úvod do statistiky • 3 části statistiky •1) Získávání dat (výběr populace) •2) Analýza dat (deskriptivní/popisná statistika) –Snaha o popis dat, jejich distribuci, atd. •3) Statistické usuzování (inferenční/indukční statistika) –Snaha rozhodnout, jestli (a s jakou pravděpodobností) platí zjištění ze vzorku na populaci –Testování hypotéz a)Parametrická statistika b)Neparametrická (a robustní) statistika Typy výběrů Reprezentativní Nereprezentativní Pravděpodobnostní Nepravděpodobnostní Prostý náhodný Kvótní Snowball (sněhová koule) Systematický náhodný Teoretický Náhodný stratifikovaný Výběr typických či kritických případů Náhodný skupinkový Příležitostný výběr Náhodný vícestupňový výběr Účelový výběr Příprava dat pro analýzu •1) Export dat •2) Koding a kontrola dat •3) Import dat •4) Čištění dat •5) Analýza outlierů • C:\Users\ladav\Desktop\e5c40dd06a9cdda2ac88101897606543.gif Deskripce •Typické charakteristiky popisovaných proměnných: –Rozdělení hodnot –Míry centrální tendence –Míry variability –Grafy (vizualizace dat) • Distribuce • C:\Users\ladav\Desktop\Nový rastrový obrázek.bmp C:\Users\ladav\Desktop\Nový rastrový obrázek.bmp vs. Míry centrální tendence •Aritmetický průměr, medián, modus, suma, … Míry variability •Popisují kolísání v rozdělení hodnot •Informace o tom, jak dalece jsou data kolem středové hodnoty nakupena či naopak rozptýlena •Nejčastější míry variability: rozpětí, mezikvartilové rozpětí, rozptyl, směrodatná odchylka, medianová směrodatná odchylka, variační koeficient Proč je důležité reportovat také míru variability? •Např. Průměr obou vzorků je stejný, ale SD je jiná C:\Users\ladav\Downloads\Comparison_standard_deviations.svg.png https://lh3.googleusercontent.com/UtXp5HOCZOn20deo_Prgs-Blqn3fqUuzS_avxZDha0tlJhpHA5xWjIcbXThS9mmKq 28AyN1xqvHDhpbe9C54aSlrsB5MYPdgwm4AXJ9IeIT5_CYqEYBDj2nh1nguTB59m7gWDvGY Grafy Induktivní statistika –cílem induktivní statistiky je odhadnout parametry populace z charakteristik vzorku (výběrového souboru) –Umožňuje testovat hypotézy –Snaha o generalizaci výsledků získaných ze vzorku na populaci –Rozlišujeme parametrickou a neparametrickou statistiku –Je založena na teorii pravděpodobnosti • Pravděpodobnost - příklady •Jaká je šance, že padne v ruletě červená barva? (ruleta má 18 červených, 18 černých, 1 bonusové políčko) –18/37 = 0,4864 = 48,64 % • Pravděpodobnost - příklady •Lindě je 31 let, je svobodná, upřímná a velmi bystrá. Vystudovala filosofii. Jako studentka se hluboce zajímala o problémy diskriminace a sociální spravedlnosti a také se účastnila protijaderných demonstrací. •Co je pravděpodobnější? –A) Linda je bankovní úřednice. –B) Linda je bankovní úřednice a je aktivní ve feministickém hnutí. Pravděpodobnost - příklady –Z logiky Vennových diagramů -> A) je správně –Chybují i matematici, mluví se o tzv. intuitivní statistice a heuristikách –viz Kahneman, Myšlení pomalé a rychlé Chyba 1. a 2. typu Nulová hypotéza (H0) je pravdivá Nulová hypotéza (H0) je nepravdivá Zamítneme nulovou hypotézu Chyba typu I Falešně pozitivní Správný výsledek Pravdivě pozitivní Nezamítneme nulovou hypotézu/ selžeme ve snaze zamítnout nulovou hypotézu Správný výsledek Pravdivě negativní Chyba typu II Falešně negativní 1. Typ - příklad Usvědčení nevinného člověka 2. Typ - příklad Neusvědčení viníka Chyba 1. a 2. typu • C:\Users\Admin\Desktop\Type-I-and-II-errors1-625x468.jpg Hladina významnosti •Hladina významnosti je úroveň pravděpodobnosti, kterou používáme při rozhodování, zda zamítnout nebo přijmout nulovou •označuje se alfa (α) •obvyklá hladina významnosti je 5% (0,05) nebo 1% (0,01) - volíme podle vlastního uvážení hypotézu P-hodnota •P-hodnota je nejmenší hladina významnosti, na které zamítáme nulovou hypotézu. •„pravděpodobnost, že data v rámci specifického statistického modelu (...) budou stejná, nebo extrémnější než pozorovaná hodnota“ •Ve statistických SW často označována jako sig. (=signifikance), proto se užívá terminologie, že něco je/není statisticky signifikantní/ významné P-hodnota •pokud je p menší než hladina významnosti a nebo stejná, pak můžeme nulovou hypotézu zamítnout •Nejčastěji (a pro nás de facto dostačující) –p < 0,05 = zamítáme nulovou hypotézu –p > 0,05 = nezamítáme nulovou hypotézu •Reportuje se také p <0,001 (v některých SW se zobrazí pouze 0,000) •Hodnota 0,05 = historická konvence •Jeden z nejčastěji nepochopených termínů ve statistice – a to i odborníky! Stejná p-hodnota, jiná velikost účinku • C:\Users\Admin\Desktop\effectsize.png Korelace - ukázka Obsah obrázku text Popis byl vytvořen automaticky Jednovýběrový t-test - ukázka Obsah obrázku text Popis byl vytvořen automaticky ANOVA – ukázka I ANOVA – ukázka I Obsah obrázku stůl Popis byl vytvořen automaticky • C:\Users\Admin\Desktop\JPharmNegativeResults_2010_1_2_61_75708_f1.jpg Děkuji za pozornost J •