Seminář k diplomové práci I: Východiska a metodologie
Kvantitativní metodologie a statistika
David Lacko

Výuka metodologie na KISKu
•Podzim: ISKB06 Metodologie informačních studií a knihovnictví •Jaro: ISKB15 Seminář k bakalářské
práci: metodologie ISK

Doporučená literatura
•Hendl J. (2015). Přehled statistických metod: analýza a metaanalýza dat. Praha: Portál.
•Hendl J. (2008). Kvalitativní výzkum: základní teorie, metody a aplikace. Praha: Portál.
•Reichel, J. (2009). Kapitoly metodologie sociálních výzkumů. Praha: Grada.
•Pickard, A. J. (2013). Research methods in information. London: Facet publishing.
•Novotná, H., et al. (2020). Metody výzkumu ve společenských vědách. Praha: Karlova univerzita.
•
•
•

Doplňující literatura
•Mareš, P., Rabušic, L., & Soukup, P. (2015). Analýza sociálněvědních dat (nejen) v SPSS. Brno:
Masarykova univerzita.
•Urbánek, T., Denglerová, D., & Širůček, J. (2011). Psychometrika: měření v psychologii. Praha:
Portál.
•Disman, M. (1993). Jak se vyrábí sociologická znalost. Praha: Karolinum.
•Ferjenčík, J. (2000). Úvod do metodologie psychologického výzkum. Praha: Portál.
•Švaříček, R., & Šeďová, K. (2014). Kvalitativní výzkum v pedagogických vědách. Praha: Portál.
•

Struktura přednášky
•Kvantitativní metodologie
–Co je to věda a metodologie
–Kvantitativní metodologie
–Typy kvantitativních výzkumů
–Hodnocení metod
–Testování hypotéz
•Úvod do statistiky
–Popisná statistika
–Inferenční statistika
–Klíčové pojmy
–Statistické testy
•

Část I. Kvantitativní metodologie
•


Poznání
•Zdroje poznání (Charles Peirce)
–Metoda tradice
–Metoda autority
–Metoda a priori
–Metoda vědy
•
•
•Vztah kritického myšlení a vědeckého poznání?
•
Obsah obrázku muž, osoba, zeď, interiér Popis byl vytvořen automaticky

Obsah obrázku muž, osoba Popis byl vytvořen automaticky
Věda
•Vědecké poznání: předmětné, systematické, empirické, kritické, kontrolovatelné, reprodukovatelné a
sociálně a kulturně podmíněné. •Každá věda je tvořena metodou
a předmětem zkoumání
(Auguste Comte)
•

Metodologie
•Věda o metodách. Předmětem jejího zkoumání je filosofie vědy (tj. studium metod a vědeckých
postupů). •Vědecká metoda je systematickým, promyšleným a objektivním postupem k získání poznatků a
dosažení cíle.

Kvantitativní metodologie
Kvalitativní
Kvantitativní

Základní typy výzkumů v kvantitativní metodologii
•Orientační výzkum
•Korelační výzkum
•Kvaziexperimentální výzkum
•Experimentální výzkum

Korelační výzkum
•Kvantifikace a zkoumání  míry vztahů (těsnosti) mezi proměnnými.
•Odpoví nám na otázku: Souvisí jev A s jevem B?
•Rozvoj souvisí s rozvojem statistických procedur (korelace, regrese, faktorová analýza,
strukturální modelování)
•3 výsledky korelací
–Mezi korelovanými proměnnými neexistuje žádný vztah.
–Mezi proměnnými existuje kladný vztah – např. čím více …, tím více …
–Mezi proměnnými existuje záporný vztah – např. čím více …, tím méně …
•

•



Třetí proměnná v korelacích
•


Korelace ≠ Kauzalita
Více zde: http://tylervigen.com/spurious-correlations
Obsah obrázku mapa Popis byl vytvořen automaticky

•
C:\Users\ladav\Desktop\korelace vs kauzalita.png


Kvaziexperimentální výzkum
•Snaha o odhalení kauzálních vztahů
•= Ex post facto výzkum
•problémem je většinou faktické či z etických důvodů nemožné náhodné rozřazení osob do
experimentální a kontrolní skupiny
•Nelze také manipulovat s nezávislou proměnnou (např. pohlaví, onemocnění)
•kvaziexperiment se často používá v přirozeném prostředí v rámci aplikovaného výzkumu
•Slabé omezení intervenujících proměnných (na rozdíl od experimentu) -> má nižší vnitřní validitu

Experimentální výzkum
•Hlavní nástroj empirického výzkumu – „Zlatý standard“
•Laboratorní metoda, obtížně proveditelný v kontextu „normálního života“
•Velice vysoká interní validita, ale může být nižší externí (ekologická) validita (na rozdíl od
kvaziexperimentu)
•Etické problémy
•Slavné experimenty v sociálních vědách
–Zimbardo – Stanfordský vězeňský experiment (jednalo se spíše o kvazi-experiment)
–Milgram –  respekt k autoritě
–Aschův experiment - konformita
•

Hodnocení metod
•Vznikají v důsledku nepřímosti měření
–Málokdy měříme daný konstrukt přímo, většinou pouze pomocí nějakých projevů -> stoupá chyba měření
•Většina metod v humanitních a sociálních oborech bude mít tzv. chyby měření kvůli nepřímosti
měření
•Konstantní chyby -> validita
•Osobní chyby -> standardizace I (objektivita)
•Proměnné chyby -> reliabilita
•Interpretační chyby -> standardizace II (normalizace)
•Celý tento proces se nazývá standardizace (III) metody
•

Vztah validity a reliability
•Validita = odmocnina z reliability
–Bez reliability nemůže být validita!
–Bez validity může být reliabilita (např. frenologie)!

Hledání vědeckých důkazů
•Induktivní přístup: Důraz na verifikaci
•Problém indukce
–Sextus Empiricus
–Francis Bacon
•Východ slunce
–David Hume – Problém indukce
–Bertrand Russell
•Krocan-vědec
•
•
•

Snaha o „vyřešení“ problému indukce
•Karl Popper – Kritický racionalismus
(hypoteticko-deduktivní metoda)
–Černá labuť
•Logik der Forschung
•1. Indukce neexistuje.
•2. Hypotézy lze jen falsifikovat, nikoli verifikovat
- verifikace neexistuje.
•3. Demarkační kritérium - vědecká je jen
falsifikovatelná teorie.
•4. Smyslem vědy je falsifikace.
•

Hypotéza
•Z řeckého hypóthesis – předpoklad, domněnka •Je psána výrokovou formou, je velice konkrétní.
•jednoduchost, verifikovatelnost,
falsifikovatelnost, srozumitelnost.

Testování hypotéz
•Proces rozhodování o tom, jestli přijmeme, nebo zamítneme hypotézu •Podobně jako indukce, snaha o
generalizaci výsledku získaného ze vzorku na populaci.
•Nulová vs. Alternativní hypotéza

Testování hypotéz



Disproved = reject
Obsah obrázku text Popis byl vytvořen automaticky


Obsah obrázku kreslení Popis byl vytvořen automaticky
Operacionalizace a dělení proměnných
•Nezávislá proměnná
•Závislá proměnná
•Intervenující
proměnné
•
•Úrovně měření

2. Část – Úvod do statistiky
•


3 části statistiky
•1) Získávání dat (výběr populace)
•2) Analýza dat (deskriptivní/popisná statistika)
–Snaha o popis dat, jejich distribuci, atd.
•3) Statistické usuzování (inferenční/indukční statistika)
–Snaha rozhodnout, jestli (a s jakou pravděpodobností) platí zjištění ze vzorku na populaci
–Testování hypotéz
a)Parametrická statistika
b)Neparametrická (a robustní) statistika




Typy výběrů
Reprezentativní
Nereprezentativní
Pravděpodobnostní
Nepravděpodobnostní
Prostý náhodný
Kvótní
Snowball (sněhová koule)
Systematický náhodný
Teoretický
Náhodný stratifikovaný
Výběr typických či kritických případů
Náhodný skupinkový
Příležitostný výběr
Náhodný vícestupňový výběr
Účelový výběr




Příprava dat pro analýzu
•1) Export dat
•2) Koding a kontrola dat
•3) Import dat
•4) Čištění dat
•5) Analýza outlierů

•
C:\Users\ladav\Desktop\e5c40dd06a9cdda2ac88101897606543.gif


Deskripce
•Typické charakteristiky popisovaných proměnných:
–Rozdělení hodnot
–Míry centrální tendence
–Míry variability
–Grafy (vizualizace dat)
•

Distribuce
•
C:\Users\ladav\Desktop\Nový rastrový obrázek.bmp C:\Users\ladav\Desktop\Nový rastrový obrázek.bmp
vs.

Míry centrální tendence
•Aritmetický průměr, medián, modus, suma, …


Míry variability
•Popisují kolísání v rozdělení hodnot
•Informace o tom, jak dalece jsou data kolem středové hodnoty nakupena či naopak rozptýlena
•Nejčastější míry variability: rozpětí, mezikvartilové rozpětí, rozptyl, směrodatná odchylka,
medianová směrodatná odchylka, variační koeficient

Proč je důležité reportovat také míru variability?
•Např.
Průměr
obou
vzorků
je
stejný,
ale SD
je jiná
C:\Users\ladav\Downloads\Comparison_standard_deviations.svg.png

https://lh3.googleusercontent.com/UtXp5HOCZOn20deo_Prgs-Blqn3fqUuzS_avxZDha0tlJhpHA5xWjIcbXThS9mmKq
28AyN1xqvHDhpbe9C54aSlrsB5MYPdgwm4AXJ9IeIT5_CYqEYBDj2nh1nguTB59m7gWDvGY
Grafy

Induktivní statistika
–cílem induktivní statistiky je odhadnout parametry populace z charakteristik vzorku (výběrového
souboru)
–Umožňuje testovat hypotézy
–Snaha o generalizaci výsledků získaných ze vzorku na populaci
–Rozlišujeme parametrickou a neparametrickou statistiku
–Je založena na teorii pravděpodobnosti
•

Pravděpodobnost - příklady
•Jaká je šance, že padne v ruletě červená barva? (ruleta má 18 červených, 18 černých, 1 bonusové
políčko)
–18/37 = 0,4864 = 48,64 %
•

Pravděpodobnost - příklady
•Lindě je 31 let, je svobodná, upřímná a velmi bystrá. Vystudovala filosofii. Jako studentka se
hluboce zajímala o problémy diskriminace a sociální spravedlnosti a také se účastnila
protijaderných demonstrací.
•Co je pravděpodobnější?
–A) Linda je bankovní úřednice.
–B) Linda je bankovní úřednice a je aktivní ve feministickém hnutí.

Pravděpodobnost - příklady
–Z logiky Vennových diagramů -> A) je správně
–Chybují i matematici, mluví se o tzv. intuitivní statistice a heuristikách
–viz Kahneman, Myšlení pomalé a rychlé

Chyba 1. a 2. typu
Nulová hypotéza (H0) je pravdivá
Nulová hypotéza (H0) je nepravdivá
Zamítneme nulovou hypotézu
Chyba typu I
Falešně pozitivní
Správný výsledek
Pravdivě pozitivní
Nezamítneme nulovou hypotézu/ selžeme ve snaze zamítnout nulovou hypotézu
Správný výsledek
Pravdivě negativní
Chyba typu II
Falešně negativní
1. Typ - příklad
Usvědčení nevinného člověka
2. Typ - příklad
Neusvědčení viníka

Chyba 1. a 2. typu
•
C:\Users\Admin\Desktop\Type-I-and-II-errors1-625x468.jpg

Hladina významnosti
•Hladina významnosti je úroveň pravděpodobnosti, kterou používáme při rozhodování, zda zamítnout
nebo přijmout nulovou
•označuje se alfa (α)
•obvyklá hladina významnosti je 5% (0,05) nebo 1% (0,01) - volíme podle vlastního uvážení hypotézu

P-hodnota
•P-hodnota je nejmenší hladina významnosti, na které zamítáme nulovou hypotézu. •„pravděpodobnost,
že data v rámci specifického statistického modelu (...) budou stejná, nebo extrémnější než
pozorovaná hodnota“ •Ve statistických SW často označována jako sig. (=signifikance), proto se užívá
terminologie, že něco je/není statisticky signifikantní/ významné

P-hodnota
•pokud je p menší než hladina významnosti a nebo stejná, pak můžeme nulovou hypotézu zamítnout
•Nejčastěji (a pro nás de facto dostačující)
–p < 0,05 = zamítáme nulovou hypotézu
–p > 0,05 = nezamítáme nulovou hypotézu
•Reportuje se také p <0,001 (v některých SW se zobrazí pouze 0,000)
•Hodnota 0,05 = historická konvence
•Jeden z nejčastěji nepochopených termínů ve statistice – a to i odborníky!

Stejná p-hodnota, jiná velikost účinku
•
C:\Users\Admin\Desktop\effectsize.png

Korelace - ukázka
Obsah obrázku text Popis byl vytvořen automaticky


Jednovýběrový t-test - ukázka
Obsah obrázku text Popis byl vytvořen automaticky


ANOVA – ukázka I



ANOVA – ukázka I
Obsah obrázku stůl Popis byl vytvořen automaticky


•
C:\Users\Admin\Desktop\JPharmNegativeResults_2010_1_2_61_75708_f1.jpg


Děkuji za pozornost J
•