Stationery anabnr2 •1 Kapitola 1: Úvod do statistické analýzy nProč studovat statistiku? (3) nPoužití statistické analýzy (4) nZákladní metodologické pojmy (5-) nÚrovně měření nÚrovně měření a analýza dat nDalší klasifikace měření nKategorie (druhy) statistické analýzy nShrnutí a otázky pro studium Stationery anabnr2 •2 Proč studovat statistiku v našem oboru? nPraktikující provádějí výzkumné studie (jak sbírat, třídit, organizovat data a učinit závěry) např. v oblasti faktorů motivace a spokojenosti na praacovišti n n..přispívají ke znalostní základně profese šířením nálezů svých výzkumů (prokázat důvěryhodnost zjištění) n n..v praxi se opírají o výsledky cizích výzkumů (Porozumění výsledků statistické analýzy zvyšuje pravděpodobnost zvolení správné intervence) n n..potřeba zhodnotit efektivitu své intervence (efektivita a odpovědnost intervence) • Stationery anabnr2 •3 Použití statistické analýzy nVýběr, design a úprava nástrojů sběru dat nVýběr a velikost výzkumného vzorku nZhodnotit zda nástroje měření produkují validní a reliabilní výsledky nShrnout vlastnosti specifického výzkumného vzorku nebo populace nOdhadnout vlastnosti populace, z které jsme vybrali vzorek nRozhodnout zda vztahy a souvislosti nalezené ve vzorku mohou být zobecněny na populaci n Stationery anabnr2 •4 Základní statistické pojmy nPopulace vs. Vzorek nParametr vs. statistika nDeskriptivní vs. Inferenční statistika nData nProměnné a konstanty n Stationery anabnr2 •5 Vzorek vs. populace nSbíráme informace (data) o vzorku nebo o populaci nOba termíny nepředstavují jen lidi nebo události, ale i sadu naměřených hodnot o těchto lidech / událostech nnaměřené hodnoty všech klientů obsloužených v průběhu jednoho roku v konkrétním zařízení soc. služeb = populace nVzorek = podskupina hodnot z větší populace hodnot. Údaje o vybrané polovině klientů obsloužených v průběhu jednoho roku Stationery anabnr2 Parametr vs. statistika nparametr = údaj (hodnota) o všech klientech (zaměstnancích) – např. průměrná pracovní doba všech zaměstnanců firmy ABC nStatistika=údaj o vzorku zaměstnanců – např. průměrná pracovní doba do vzorku vybraných zaměstnanců firmy ABC n •6 Stationery anabnr2 •7 Deskriptivní vs. Inferenční statistika nDeskriptivní (=popisná) = používáme pokud je našim cílem pouze popsat a interpretovat sadu hodnot (data) která držíme v ruce (ať už vzorek nebo populaci) nInferenční (=deduktivní, usuzovací) = používáme pokud je naším záměrem použít data která držíme k tomu, abychom se pokusili porozumět většímu množství dat (děláme odhady o vlastnostech populace na základě vzorku). Stationery anabnr2 •8 Data nVznikají měřením jevů (sběrem dat) n= naměřené hodnoty sesbírané při výzkumu ještě před tím než byly jakkoli analyzovány (př. skóre škály spokojenosti klientů) nNástroje sběru dat = např. dotazníky, rozhovory, obsahové analýzy, přímé a zúčastněné pozorování atd. nAnalýza dat posbíraných někým jiným pro jiné účely: analýza sekundárních dat n Stationery anabnr2 •9 Proměnná vs. konstanta nZ dat vytváříme kódováním proměnné nZ jedněch dat lze vytvořit více proměnných nPři výzkumu limitujeme sběr dat pouze na takové data, které jsou nezbytné a užitečné pro náš výzkumný problém n= vlastnost která se liší v kvantitě nebo kvalitě u lidí které zkoumáme nPř. úroveň vzdělání, pohlaví, sexuální orientace, etnicita, úroveň sebedůvěry atd. nKonstanta = vlastnost která se neliší v kvantitě nebo kvalitě u lidí které zkoumáme nPř. Smrtelnost (lidé) nebo národnost (Češi) nPř. Vzorek adolescentních dívek závislých na kokainu n Stationery anabnr2 •10 Kategorie a hodnoty proměnných nRůzná změření proměnných mohou být vyjádřena buďto slovně nebo čísly nKategorie proměnné (categories) = různé formy které proměnná může nabývat, vyjádřené slovně př. Pohlaví: muž / žena nHodnoty proměnné (values) = různá změření proměnné vyjádřená čísly, která reflektují kvantifikovatelný rozdíl př. Věk: 20, 24, 60 Stationery anabnr2 •11 Frekvence kategorií a hodnot n= Četnost (=kolikrát) s jakou se vyskytuje daná hodnota nebo kategorie ve zkoumaném skupině osob (vzorku) nPř. ve skupině máme 12 mužů a 16 žen: frekvence pro kategorii „muž“ proměnné „pohlaví“ je 12, zatímco frekvence pro kategorii „žena“ stejné proměnné je 16 Stationery anabnr2 •12 Úrovně měření nČtyři úrovně měření: nominální, ordinální, intervalová, poměrová nUrčení úrovně měření proměnné – nezbytnost k výběru statistické metody analýzy n Stationery anabnr2 •13 Nominální (nominal) nProměnná je rozdělena do kategorií (podtříd), které jsou nespojité (vzájemně se odlišují) nMezi podtřídami neexistují kvantifikovatelné rozdíly, pouze kvalitativní – tudíž nelze řadit podle velikosti nPř. Pohlaví, rasa, rodinný status nHodnoty (čísla) přidělená kategoriím reflektují pouze kvalitativní rozdíly (Př. Jaké je vaše pohlaví? 1. muž 2. žena) nPodmínky: kategorie musí být rozdílné, vzájemně neslučitelné (každý respondent pasuje pouze do jediné kategorie) a vyčerpávající (pro každého respondenta je k dispozici odpověď/kategorie) Stationery anabnr2 •14 Ordinální (ordinal) nKategorie proměnné představují nejen rozdílnost, ale mají i kvantitativní význam – lze je smysluplně seřadit (rank-order) od největší po nejmenší. nPř. Stupeň vzdělání, účinnost intervence, úroveň klientovy spokojenosti se službou (škály) nPř.Otázka: Jak byste ohodnotil práci svého sociálního pracovníka? 1.velmi dobrý, 2.Dobrý, 3.Slušný, 4.Slabý, 5.velmi slabý nebo Jaký je váš nejvyšší stupeň vzdělání v oboru sociální práce? 1. Vyšší odborný, 2. Bc, 3. Mgr., 4. PhD nPozor: protože intervaly mezi jednotlivými kategoriemi nejsou stejné, nelze říci, že rozdíl mezi 1. a 3. je stejný jako mezi 2. a 4. n Stationery anabnr2 •15 Intervalová (interval, SPSS=scale) nUmisťuje hodnoty proměnné na pravidelně rozdělené kontinuum, kde jednotlivé hodnoty jsou od sebe stejně vzdáleny – má shodnou jednotku měření např. jeden rok, teplotní stupeň nMůžeme říct nejen že jeden respondent má určité proměnné více než druhý (ordinální) ale i o kolik nRozdíl mezi 1 a 4 je významově stejný jako mezi 3 a 6, a sice 3. Rozdíl v inteligenci mezi IQ 105 a 100 je stejný jako mezi IQ 125 a 120. nAle: nemá absolutní nulu - nelze identifikovat bod, ve kterém neexistuje žádné (nulové) množství proměnné, a proto nelze říct, že 2 je dvakrát více než 1, ale pouze o jednotku více n Př. Protože 0 stupňů Farenheita neznamená absenci tepla, nelze říct že při 60 stupních F je dvakrát tepleji než při 30 stupních F. nAritmetické operace: sčítání a odčítání n n Stationery anabnr2 •16 Poměrová (ratio, SPSS=scale) nExistence fixní, absolutní a nelibovolně zvolené nulové hodnoty nHodnoty proměnné představují skutečné množství vlastnosti nMůžeme říct nejen o kolik má jeden respondent více jednotek vlastnosti než druhý, ale také kolikrát více nPř. Věk, počet dětí v rodině, počet případů kolikrát klient absolvoval skupinovou terapii nAbsolutní nula umožňuje všechny aritmetické operace: n +, -, *, / nPř. Země s ø porodností 4 děti/pár má 2x větší porodnost než země s ø porodností 2 děti/pár nIntervalová nebo poměrová? Pokud je logicky možné jít do mínusu, pak intervalová, pokud nelze, pak poměrová. n Stationery anabnr2 •17 Úroveň měření a analýza dat nJak přesně je proměnná naměřena ovlivňuje možnosti použití statistických technik nNěkdy ač proměnná vypadá jako intervalová, je pouze ordinální. Př. Schopnost řídit auto operacionalizovaná jako počet dopravních nehod za 10 let: poměrová? n Ne, protože ačkoli má opravdovou nulu a stejně veliké intervaly, tak nelze říci, že rozdíl ve schopnostech mezi osobou která měla 4 nehody a osobou se 3 nehodami je stejný jako rozdíl mezi osobou s 1 nehodou a žádnou nehodou. Co dělat? Lze vytvořit skupiny kde 0-2 nehody, 3-5 atd. a užívat proměnnou jako ordinální. nPřesnější proměnné lze transformovat na méně přesné n (př. Věk na Věk_skupiny (Starší a Mladší)), ne však opačně. n n Stationery anabnr2 •18 Jiné klasifikace proměnných nNespojité (discrete) = může nabývat jen konečné množství hodnot př. Počet sourozenců, člověk může mít 2 nebo 3 sourozence, ale ne 2,16 nSpojité (continuous) = může teoreticky nabývat jakékoli hodnoty př. výška studentů soc.práce. Mezi jakýmikoli dvěma naměřenými hodnotami může být teoreticky další hodnota n Stationery anabnr2 •19 nDichotomické (dichotomous) =druh nespojité proměnné, která má pouze dvě kategorie př. Pohlaví (muž nebo žena) nebo výsledek voleb (vyhrál nebo prohrál) nVícekategoriální = nespojitá proměnná s více než dvěma kategoriemi např. rodinný stav (svobodný, ženatý/vdaná, rozvedený/á, vdovec/vdova) Jiné klasifikace proměnných (2) Stationery anabnr2 •20 Druhy statistické analýzy nPodle počtu proměnných n a) univariační/jednorozměrná (univariate) = zkoumá distribuci hodnot jediné proměnné nb) bivariační/dvourozměrná (bivariate) = zkoumá vztah mezi dvěma proměnnými nc) multivariační/vícerozměrná (multivariate) = zkoumá vztah mezi třemi a více proměnnými zároveň n n Stationery anabnr2 •21 Druhy statistické analýzy (2) nPodle účelu na) deskriptivní n= pomocí tabulek a grafů shrnuje základní informace ze syrových (původních) dat a pomáhá tak jejich interpretaci a komunikaci navenek nnepřekračujeme hranice vzorku §b) inferenční §= určuje jak bezpečné je zobecňovat (odhadovat, usuzovat) výsledky ze vzorku (statistiky) na charakteristiky populace (parametry) §- jak je pravděpodobné že výsledek ze vzorku platí i v populaci n n n