overovali nové a nové varianty našich textů - dík za to, že to s námi vydrželi a že nám dávali důležité podněty o slabých místech v těchto textech. Dále patří velký dík našim dvěma recenzentům, prof. Janu Hendlovi a doc. Janu Řehákovi, za jejích detailní a cenné připomínky k našemu rukopisu - pokud však v textu čtenáři naleznou nedokonalosti, případně i chyby, není to v žádném případě vina recenzentů, ale pouze a toliko vina naše. A budeme pochopitelně našim čtenářům vděčni za jakékoliv podněty pro další zkvalitňování textu. Konečně velice poděkování patří našim kolegům, kteří svými opakovanými otázkami typu Tak kdy už to konečně vydáte? přispěli k tomu, že jsme původní soubor našich jednotlivých učebních textů vtělili do jednolitého celku a učebnici skutečně KONEČNĚ vydali. Petr Mareš, Ladislav Rabušic, Petr Soukup V Brně a Praze v listopadu 2014 lez začneme Jasnost je intelektuální hodnota; ne však přesnost a preciznost. Absolútni preciznost je nedosažitelná; je neúčelné chtít být přesnější, než to vyžaduje naše problémová situace. Karl R. Popper Aforismus o statistice aneb tři druhy lži: lež prostá, lež sprostá, statistika. Benjamin Disraeli :;: Memento na začátek V tomto učebním textu se budeme pohybovat v diskurzu kvantitativního výzkumu, v tzv. kvantitativním paradigmatu. Připomínáme, že sociální vědy jsou vědami multi- : paradigmatickými, což znamená, že vedle sebe koexistují různé vzorce a pravidla, jak dělat vědu, jak řešit její hlavolamy. Různost těchto vzorců je v podstatě dána tím, jak si jednotlivá paradigmata odpovídají na tři základní otázky: ontologickou, episte-mologicko'i a metodologickou. 1) Ontologická otázka se ptá, jaká je povaha reality, kterou zkoumáme. 2) Epistemologická otázka řeší, jaká je podstata poznání a jaký je vztah mezi tím, kdo poznává, a tím, co je poznáváno, 3) Metodologická otázka se pídí : po tom, jakým způsobem se produkuje vědění, porozumění a pochopení. Na tomto zá- :'kládě se dnes definují tři základní skupiny paradigmat: pozitivistické, interpretativní : a emancipativni (Mertens, 1998).3 Kvantitativní paradigma má svůj vzor v přírodních vědách. Vychází z přesvěd- : čení, že realita je vnější a objektivně poznatemá. Klade velký důraz na měření vlastností, to je na jejich kvantifikaci. Jelikož převážná většina vlastností lidského chování V literatuře najdeme i další názvy: synonymicky s interpretativmm paradigmatem se objevují výrazy etnografické, fenomenologické, hermeneutické nebo naturalistické paradigma. Vedle emancipativniho paradigmatu nacházíme také výrazy feministické, participativní nebo kriticky teoretické paradigma. MASARYKOVA UNiVEilZJTA KAPITOLA 1 a lidského světa, jimiž se sociální vědy zabývají, jsou složitými konstrukty a entitami, musíme se ve výzkumu velmi často spokojit s měřením ne přímo těchto vlastností (nejsou totiž přímo pozorovatelné), ale s měřením jejich pozorovatelných indikátorů. Nemůžeme například přímo změřit vzdělanost jedinců, ale na jejich vzdělanost můžeme usuzovat z výše dosaženého vzdělání. Vzdělanost je v tomto případě vlastností, úroveň dosaženého vzdělání jejím indikátorem. Nemožnost přímého měření vlastností sociálního světa je v sociálněvědním výzkumu zdrojem j istých potíží. Mnozí metodologové proto zdůrazňují - a my s nimi -, že jedním z klíčových momentů kvantifikace a měření v sociálních vědách je opera-cionalizace, tedy převod abstraktních konstruktů do měřitelných znaků. S operacio-nalizací je spojen důležitý prvek, a to otázka validity těchto operací, což je posouzení, zdali námi vytvořený měřitelný znak (indikátor) je dobrým a skutečným reprezentantem vlastnosti, kterou chceme změřit - proto se také validita definuje jako schopnost měřit to, co skutečně měřit chceme. Operacionalizace je náročným tvůrčím procesem, v němž od sociálněvědních konceptů a jejich nominálních definic postupujeme přes odhalování jejich dimenzí a subdimenzí ke konkrétním operacím (operacionálním definicím), které nám říkají, co vlastně máme ve výzkumu zjišťovat a měřit. Názornou ukázkou nechť je příklad schématu operacionalizace, které použil de Vaus (1990) pro koncept (pojem) depri-vace - viz obrázek 1.1. Co z něj rozhodně stojí za zapamatování, je, že při zjišťování míry deprívace nevystačíme pouze s jedním indikátorem - de Vaus jich navrhuje zjišťovat devět, a to ještě použití škály introverze/extroverze a škály asertivity obsahuje zjišťování řady dalších údajů.'1 Operacionalizaci a měření vnímáme jako ústřední metodologické téma kvantitativního výzkumu. Jak konstruovat dobré, tedy validní a samozřejmě i dostatečně spolehlivé (reliabilní) měřicí nástroje a jakým způsobem měřit sociální vlastnosti, to jsou kardinální otázky kvantitativního paradigmatu. Podle zastánců paradigmatu kvalitativního jsou také zásadními - a z jejich pohledu jen obtížně překonatelnými -překážkami vědecké práce.5 Problém měření se navíc umocňuje tím, že velkou část našich kvantitativních dat získáváme na základě standardizovaných výpovědí, to je na základě standardizovaných rozhovorů tazatele se subjekty výzkumu. Standardizovanými výpověďmi rozumíme (i v dalším textu) výpovědi, které lze vyjádřit čísly (věk, příjem apod.) nebo číslicemi (přiřazenými jednotlivým variantám možných odpovědí), umožňujicími Zájemce o detailnější vysvětlení problematiky koneeptualizace a operacionalizace odkazujeme např. na pasáže v učebnici E. Babbieho (Babbie, 2001, s. 119-145). Není cílem tohoto textu tento spor posuzovat, dodejme potíže, že po letech původně nesmiřitelných diskuzí v poslední čtvrtině minulého století došlo nyní mezi oběma tábory ke smím a ke koexistenci, především prostřednictvím tzv. mixed metliods research, neboli metod smíšeného výzkumu, který kombinuje (směšuje) relevantní metody kvantitativního a kvalitativního výzkumu. Pro zájemce o metody smíšeného výzkumu může být dobrým úvodem kniha Advances in Mixed Methods Research: Theories and Applications editovaná Manfredem Maxem Bergmanem (Sage, 2008). .almí v;. Deprivatioi Specification of what constitutes social isolation Measures of soda! isolation ?. Number of friends 2. Contact with family 3. Number of organisation involvements 4. Contact with neighbours 1 f Absence □f socially vaiued roles Specification of socially valued roles r Question to determine the roles of a particular respondent e.g. 1. Gender 2. Occupation 3. Marital status etc Physic 7K Lack Df social skills Specification of what social skills are Question to determine respondents skiiis e.g. 1. Introversion/extroversion scale 2. Assertiveness scale Nomina! definition Sub-dimensions Operational definitions Concept Podie: de Vaus (1390), str. 52. Obr. 1.1 Schéma procesu operacionalizace pojmu„deprivace" jejich statistické zpracování. Klasickým příkladem standardizovaného rozhovoru je ■použití dotazníku, v němž jsou všem zkoumaným subjektům kladeny stejné otázky o ve stejném pořadí, přičemž je na ně možno odpovědět jen volbou (většinou) jedné z předložených variant možných odpovědí, označených číslicemi (např. otázka , jaké je vaše nejvyšší dosažené vzdělání" s možností zatrhnout jednu z nabízených variant: 1 - základní, 2 = středoškolské; 3 = vysokoškolské).6 Zde je dobré si připomenout, žc při takovém způsobu měření může docházet k celé řadě poruch, neboť zaznamenáváme pouze tzv. verbální (neboli symbolické) chování, z něhož usuzujeme na chování skutečné. Při práci s takto získanými daty je proto nutné si neustále uvědomovat, že mezi skutečným předmětem výpovědi (to je jeho vlastnostmi) a tím, co je obsahem výpovědi (co se sděluje), může být obrovský rozdíl. Platí zde proto základní poučka, kterou si dobře pamatujme: Výpovědi o realitě zdaleka nemusejí být realitou samotnou! Metodologové sociálních věd se ovšem snaží tyto potíže intenzivně překonávat a snad můžeme konstatovat, že se to daří. Nicméně při formulaci jakýchkoliv závěrů z k víintitativního výzkumu musíme mít neustále na mysli (a musíme to i v našich publikacích sdělovat), že naše závěiy mohou být zatíženy nedokonalostmi naší operacio-nali/;ice a našeho měření. Permanentně tuto skutečnost reflektujme! Permanentní reflexe však není úplně jednoduchá. Ve hře je totiž naše psychika. Po převodu vlastností do znaků (proměnných) a po záznamu jejich hodnot - tedy Blíže viz oddíl 1.4.2, v němž hovoříme o proměnných. KAPITOLA 1 NEZZAČNRMF po vytvoření čísel a jejich nahrání do statistického softwaru počítače- dochází postupně k tomu, že těmto číslům začneme bezmezné věřit. Nastává jev, který označil Petrasek (1993, s. 92) jako tzv. durifikaci (ztvrzení) dat. Což znamená, že s daty postupně začneme pracovat jako s naprosto přesnými čísly, bezmezné jim věříme a výsledky neproblematizujeme. Může to vést dokonce až k jakési hyper-přes.nosti, kdy začneme uvádět (nereflektované!) výsledky na několik desetinných míst. Např.: „58,36 % respondenta nesouhlasilo s přijímáním imigrantů do zaměstnám"; „průměrná mírä pocitu anomie byla 2,856"; „souvislost mezi úrovní dosaženého vzdělání a příjmem respondenta měřená Spearmanovým pořadovým koeficientem je 0,4681". Osvícený výzkumník by samozřejmě hovořil o 58 %, průměr anomie by uvedl najedno desetinné místo (2,9) a hodnotu koeficientu asociace zaokrouhlil na 0,47 - a nedopustil by se přitom žádné redukce informace, spíše naopak, Z metodologického hlediska je základem pro kvantitativní výzkum metodologie přírodních věd. Organickou součástí sociálněvědního kvantitativního výzkumu je statistická analýza dat. Jsme přesvědčeni o tom, že právě ve statistické analýze spočívá značná síla tohoto přístupu: umožňuje víceméně exaktně (samozřejmě při vědomí všech možných omezení, litera Icvantitativní paradigma v sobě skrývá) popisovat zkoumané fenomény, navíc často v jejich vývoji, prostřednictvím analýzy časových řad; skýtá možnosti explorovat fenomény nové a umí ověřovat teorie - to vše za pomoci exaktního matematicko-statistického aparátu. Jelikož často pracuje s výběrovými soubory, dokáže s relativně malými náklady zobecňovat (generalizovať) své závěry na velké populace, a přinášet tudíž zobecnitelné poznatky, jež je možné využívat v praxi. Rozvoj sofistikovaných postupů statistické analýzy, jejich přepis do počítačových programů a obecná dostupnost osobních počítačů vede k tomu, že i ty nejmodernější postupy jsou dnes přístupny prakticky každému výzkumníkovi, včetně studentů. Právě zde leží podle našeho názoru obrovská potence, neboť moderní postupy statistické analýzy pomáhají odkrývat vztahy a souvislosti, které bychom jinak v datech nebyli schopni vidět. Jdou do latentních datových struktur, odhalují efekty působení nezávislé proměnné na proměnnou závislou, očištěnou od efektů dalších proměnných, umí smysluplně pracovat s kategorizovanými daty a tak dále, a to vše ve velmi krátkém čase. Tyto postupy pak vedou k výsledkům, které dříve nebylo možné nalézt a formulovat. Hlavní směr rozvoje postupů moderní statistické analýzy v sociálních vědách byl veden několika záldadními cíli: popsat a vysvětlit nějaký sociální jev znamená odhalit paralelní působení řady faktorů, které často mají hierarchický charakter.' Proto byly zavedeny nejrůznější modelovací techniky. Jelikož sociálněvědní data jsou velmi často data kategorizovaná - a s těmi toho statistika zatím mnoho nesvedla —, 7 V dalších pasážích této úvodní kapitoly čtenář možná nalezne pojmy, které mu nebudou zcela jasné. Není to jeho chyba, prosíme o strpení, postupně budou všechny vysvětleny v dalších kapitolách. Věříme, že to není ani chyba didaktická, jak by se v takovém případě u učebního textu mohlo zdát. Považovali jsme prostě za nutné na úvod sdělit naše zásadní stanovisko k problematice kvantitativní analýzy dat, byť s vědomím, že mnohé bude jasnější až po přečtení celého textu. Doporučujeme vrátit se k první kapitole po přečtení celé učebnice. byly vyvinuty nové postupy pro analýzu kategorizovaných dat, které tento hen-dikcp překonávají (např. binární a logitová regrese, loglineární analýza). Většina těchto postupuje součástí běžně dostupných statistických programových balíku (sta-itisticalpackages). Možnosti statistické analýzy jsou tedy značné. Otázkou ovšem je, zdali je umíme dobře používat. A v tom spočívá, domníváme se, kardinální limit české ■ kvantitativní sociální vědy, sociologii nevyjímaje. V Cechách, na Moravě a ve Slezsku působí zatím jen nemnoho badatelů, kteří umějí možnosti současné statistické analýzy plně využívat. Jednou z příčin je, že statistika bývá při studiu sociálních věd často obávaným předmětem, kterým je potřeba „nějak projít", bez ambice pochopit její smysl a kouzlo. Studenti se statistiky obávají - čísla jsou pro humanitně orientované osoby strašákem - a mnozí učitelé statistiky studenty tohoto strachu nejenom nezbavují, ale ještě jej zvyšují. A přitom, jak věříme, je možné naučit statistickou analýzu i ty studenty, kteří šli studovat sociální vědy právě z důvodu, že se báli čísel a - jak oni říkají - „matematiky". Možná právě způsob, jakým se v Česku učí kvantitativní metody výzkumu a analýzy, vede k tomu, že se dnes mezi studenty sociálních věd stal do značné míry módou výzkum kvalitativní (kvali-výzkum). Studenti se domnívají, zeje to výzkum lehčí, neboť je založen na analýze slov namísto analýzy čísel. Hluboce se však mýlí - takový výzkum není lehčí, neboť stejně jako kvanti- výzkum klade obrovské nároky na schopnost sociologické imaginace. Jsme pevně přesvědčeni o tom, že student, který nezvládne metodologii výzkumu kvantitativního a analýzu jeho dat, nebude ani dobrým výzkumníkem kvalitativním. Aualýza studentských prací by nám jistě odhalila i to, že v českých sociálních vědách panují některé obsese, jichž je potřeba se urychleně zbavit. Uvádíme je níže -a jelikož jsme je s úpravami převzali od anglického kolegy, který má podobné pocity a zkušenosti (viz Blaikie 2003, s. 6-7), s jistou škodolibou útěchou konstatujme, že V.tom asi nejsme v Česku tak úplně sami, a) Sociálněvědní výzkum musí vždy začínat s hypotézami. b) Testy statistické významnosti (statistické sígnifikance) jsou esenciálním rysem analýzy dat. c) : Zjištěná míra asociace nebo korelace mezi dvěma znaky (proměnnými) postačuje k vysvětlení zkoumaného jevu. ::; Tyto poněkud radikální teze nyní rozviňme. Ad a) Musí sociálněvědní výzkum začínat s hypotézami? Jednoduchá odpověď zní: jak kdy. Argumenty jsou následující: - Kažeý sociálněvědní výzkum musí mít na svém počátku nějaký problém, který je přeložen do zkoumatelné podoby formou výzkumné otázky (nebo několika vý-■;. zkiini vch otázek). ■-. Existuje několik typů výzkumných otázek: otázky „co", „kolik", „do jaké míry" po-pisují věci a jsou tedy typické pro deskripce. Otázka „proč" je otázkou na příčiny a je KAPITOLA 1 i Nľ7 7AC'NľMr typická pro explanační (vysvětlující) výzkum. Otázka ,jak" je otázkou na sociálni mechanismy a je typická pro akční výzkum, pro intervenci. - Pouze otázka „proč" vede badatele k výzkumu, který je založen (deduktivně) na teorii, a proto vyžaduje hypotézy. - Existují dva druhy hypotéz: teoretické hypotézy, které jsou odvozovány z teorie a které nabízejí předběžné vysvětlení otázky typu „proč". Vedle toho jsou zde hypotézy statistické, které se používají k zobecňování výsledků z reprezentativního výběrového souboru na cílovou populaci,8 z níž byl výběrový soubor získán. - Tento rozdíl mezi statistickou a teoretickou (výzkumnou) hypotézou není často akceptován a vede ke zmatku u začínajících výzkumníků. - Teoretické hypotézy jsou relevantní pouze v případě, kdy hledáme odpovědi na otázku „proč"; statistické hypotézy j sou relevantní, když data pocházejí z pravděpodobnostního (náhodného) či randomizovaného9 výběru, při kterém mají všechny osoby v dané populaci na začátku výběru stejnou pravděpodobnost, že budou do zkoumaného výběrového souboru vybrány.10 Některý druh výzkumu může vyžadovat oba druhy hypotéz, některý může vyžadovat pouze jeden z typů; značná část výzkumu ovšem nevyžaduje ani jeden z nich. Co však každý výzkum musí mít, je výzkumná otázka! - Určitý druh výzkumu hypotézami končí, místo aby jimi začínal (tzv. explorační výzkum). Ad b) Jsou testy významnosti esenciálním rysem analýzy dat? Nejdříve opět jednoduchá odpověď: ne, nejsou. Avšak v českých sociálních vědách (a nejen v nich) bohužel velmi často bývají. Testy signiíikace jsou pravděpodobně nejhůře pochopeným aspektem statistické analýzy dat. Jsou součástí tzv. statistické indukce (nebo také inferenční analýzy či statistického usuzování) a používají se tehdy a jen tehdy, když pracujeme s pravděpodobnostním výběrovým souborem. Slouží k tomu, abychom z charakteristik výběru odhadli charakteristiky populace. Inferenční analýza se využívá pro dva typy úloh: a) k odhadu charakteristik populace z dat výběrového souboru (odhadujeme např. průměrný příjem); b) ke zjištěním, zdali vztah (či rozdíl) nalezený ve výběru je možné také očekávat v populaci, z níž byl Je zvykem hovořit často spíše o základním souboru než o cílové populaci, ale spolu s řadou daSších autorů rozlišujeme mezi cílovou populací jakožto souborem jednotek, na které chceme zobecnit své závěry, a základním souborem tuto cílovou populaci zastupujícím (ne všechny jednotky této cílové populace jsou totiž ve všech případech v daném okamžiku výzkumu dostupné). Randomizace jako náhodné přiřazování osob do zkoumaných skupin (experimentální a kontrolní) se často používá v klinickém výzkumu v medicíně či v psychologii, ale i v ekonomii, méač často v sociologii. Nikoliv tedy nahodilého! vybírán (toto je důležité). Např. odhadujeme, zdali i v populaci platí, že existuje vztah mezi vzděláním respondenta a jeho intencí účastnit se kurzů celoživotního vzdělávání. 1'ivní typ infereněních úloh není v sociologii příliš častý; výzkumníci málokdy počítají pravděpodobnou hodnotu populační charakteristiky; často se používá tzv. bodového odhadu, kdy se prostě předpokládá, že hodnota výběrové charakteristiky bude stejná i v populaci (což ovšem není úplně v pořádku, měly by se počítat intervaly spolehlivosti). Druhému způsobu inferenční analýzy, testům statistické významnosti (jimiž jsou, jak uvidíme později, např. test chí-kvadrát pro nominální znaky, test významnosti pořadových koeficientů, t-test pro rozdíl dvou průměrů, analýza rozptylu pro rozdíl více průměrů) je naopak věnována velká pozornost a podle našich zkušeností jsou tyto postupy dokonce v české sociální vědě nadužívány, zneužívány a používány špatně (blíže k tomu viz Soukup & Rabušic, 2007). Je to proto, že je špatně pochopen jejich účel a smysl, takže se používají k operacím, pro které nejsou vhodné. Badatelé a badatelky se zkrátka setrvačně domnívají, že jim testy významnosti řeknou, co je v datech důležitého, a že jim pomohou odhalit těsnost vztahu dvou proměnných. Dále jsou přesvědčeni, že tyto testy musejí být aplikovány na všechny výsledky bez ohledu na to, zdali data pocházejí z vyčerpávajícího zjišťováni (z censu), ■/. pravděpodobnostního (náhodného) výběru nebo z výběru nenáhodného (kvótního, záměrného, samovýběru). Nic l toho ovšem statistická infercnce neumí. Z toho tedy vyplývá, že testy významnosti: - nemohou v žádném případě sloužit k rozhodnutí, zdali je zjištěný výsledek vědec-ky nebo prakticky důležitý; - nej sou míry asociace; - jsou použitelné pouze tehdy, testujeme-li statistické hypotézy, a ty používáme :; pouze tehdy, když z dat pravděpodobnostního (náhodného) výběrového souboru odhadujeme charakteristiky populace; - mohou být aplikovány pouze tehdy, pracuj eme-li s výběrovým souborem, který byl vybrán z populace za pomoci postupů pravděpodobnostního (náhodného) výběru a návratnost (např. dotazníků) je relativně vysoká - měla by se, jak nabádá ■ Blaikie (2003, s. 167) pohybovat kolem 85%;" - je mylné a chybné používat v případech, kdy výběr není pravděpodobnostní. A už .. žádný smysl nemá jejich použití v případě, kdy nemáme výběr, ale náš soubor je i\. populací (např. když provedeme výzkum na všech žácích gymnázia v městě X); -r nemohou být použity k testování teoretických hypotéz; nemohou sloužit ke generalizujícím výpovědím za populaci, z nichž nebyl soubor vybrán. Například pokud provedeme pravděpodobnostní (náhodný) výběr V současnosti se bohužel talc vysoké návratnosti dosahuje poměrně obtížně - k tomu viz např. článek J. Krejčího „Problém nízké návratnosti výběrových dotazovacích šetření" (SDA info 2, v listopad 2006 - dostupný z: http://archiv.soc.cas.cz/articles/cz/14/SDA-Info.html) nebo obsáhlejší Krejčí, J. (2007). Non-Response in Probability Sample Surveys in the Czech Republic. Sociologický časopis / Czech Sociological Review, 43(3), 561-587. KAPITOLA 1 NrŽľAČKTMr z populace všech studentů gymnázií v Brně (ze seznamu všech brněnských gymnázií bychom si udělali seznam všech tříd a z tohoto seznamu bychom vylosovali takový počet tříd, aby náš výběrový soubor měl dostatečný počet jednotek), naše závěry nemůžeme zobecňovat na všechny studenty brněnských středních škol (my jsme totiž dělali výzkum pouze na gymnáziích, přičemž víme, že existují ještě další typy středních škol), a už vůbec ne na studenty v jiných městech. Ad c) Je zjištěná dvourozměrná míra asociace nebo korelace postačující pro vysvětlení? Ne, není. Důvody jsou následující: - Vysvětlením říkáme, proč něco existuje. Nalezení těsnosti vztahu mezi dvěma proměnnými je součástí deskriptivního výzkumu, neboť cílem deskripce je určit charakteristiky nějakého sociálního fenoménu, popsat jeho vývoj v čase a typické vzorce vazby na jiné fenomény. - Nalezení vztahu mezi proměnnými a jeho změření prostřednictvím měr asociace a korelace je formou vyšší míry deskripce. - Ačkoliv tato deskripce může posloužit k pochopení fenoménu (a někteří i tvrdí, že může sloužit jako základ k predikci), míry asociace nemohou přinést odpověď na otázku „proč", neboť otázka „proč" se ptá na příčiny. Asociace vyjadřuje pouze stochastickou (pravděpodobnostní) souvislost, nikoliv však souvislost příčinnou, kauzální. - Nicméně, chceme-li vysvětlit nějaký jev, musíme nejdříve najít asociaci - neboť tam, kde není žádná stochastická asociace, nemůže být ani kauzální spojení. Jak je vidět, dobře pochopená a osvojená statistická analýza dat může být klíčem k badatelsky platným výsledkům. Statistická analýza je mocným nástrojem, ale samozřejmě pouze v takových rukách, které vědí, jak na to. Při provádění kvantitativního výzkumu proto mějme stále na paměti zásady, na nichž musí být každý dobrý - f kvantitativní výzkum založen (viz Blahuš, 2000): \ 1) Vědecká průkaznost výsledků výzkumu spočívá v logicky správném a metodologicky čistém designu výzkumu. 2) Design výzkumu nemohou nahradit žádné dodatečné statistické, byt' téměř akrobatické cviky s daty. 3) Vědecká průkaznost výsledků výzkumu nespočívá v jejich „statistické významnosti". 1.1 Logika kvantitativního výzkumu V kvantitativním výzkumu pracujeme s hromadnými daty. Tato data jsme získali na základě designu výzkumu, který se odvíjí od naší výzkumné otázky. Ta vzniká většinou na základě naší touhy vysvětlit nějaký problém. Výzkumná otázka určuje, co sledovat, jaké vlastnosti měřit. V sociologii tato hromadná standardizovaná data (viz dále) získáváme většinou dotazníkovým šetřením na výběrových souborech (viz dále), kdy jednotkou dotazování je většinou jedinec, nebo ze statistických výkazů. T)otazujeme-li se jedince, chceme: zjistit jeho stav, identifikovat jeho měřitelné vlastnosti (například: je to muž, nebo žena?; jakou stranu volí?...) a míru těchto vlastností (jaké má vzdělání?; jakou mírou anomie se vyznačuje?; do jaké míry souhlasí s určitým názorem?...); - klasifikovat jedince podle těchto zjištění do obecnější kategorie jednotek (volí le-vici, nebo pravici?; je liberál, nebo etatista?..,);12 - usuzovat z výskytu nějaké vlastnosti (intenzity vlastnosti) na jinou vlastnost (respektive její intenzitu); - sledovat vývoj kvantifikovaných vlastností jedinců v čase. Vlastnostmi neboli charakteristikami, kterými je jedinec popisován, nejsou jen jeho psychické Ht-ibuty a stavy dysy osobnosti, inteligence, neurotické stavy, emoční vyladění, frustrečni toie-M-ice), demografické rharaktpristiky (pohlaví, vek, pořrt drtí) a john zařazení do sori.ilní Mnilc rtury (sociální třída;; profese, velikost místabydlištěK či výrazy tohoto zařazení (sociální status, prestiž), alei jeho postoje a preference (volební preference, hodnotové orientace, míraxenofobie : či Fašismu, distance od jir.ych osob čí. sociálních skupin,;obliba určitých TV programů, religiozita či náboženská konfese, etati.smus či liberalismus, způsob tráveni dovolené), aktivity či jed nání (náplň volného času, účasť v sociálních hnutích, návštěvy kulturních akcí, účast na stávce),: vědomosti či míra informovanosti a stavy či podmínky, jimž je vystaven (nezaměstnanost, agónie, nemoc, dlouhodobý stres, deprivace) atd. Rámeček 1.1 Vlastnosti jedince V sociologii jsou ovšem údaje o jedincích jen přechodnou informací a slouží k Lomu, abychom získali informace o sociálních útvarech (skupinách, kategoriích, institucích), jejichž členy/členkami tito jedinci jsou. Nezajímají nás tedy ani tak naměřené 12 Na to se lze v prvním případě zeptat přímo (předložením škály se stupnicí a póly levice/pravice se žádostí, aby se na ni respondenti zařadili podle svých politických názorů), ale zařazení lze také opřít o klasifikaci jednotlivých politických stran jako levicových, pravicových či středových a jedince přiřadit k levici, středu či pravici podle jím volené strany. V druhém výše uvedeném případě se ptát přímo nemůžeme nejen proto, že mnozí z dotazovaných by neměli představu, na co se jich vlastně ptáme. Problémem by bylo i to, že ti znalejší by mohli používat vlastní definice liberalismu a etatismu - a my bychom nevěděli, co si vlastně pod těmito pojmy jednotliví respondenti představovali. Výzlaimník musí mít vlastni definici obou postojů a z ni odvozené otázky indikující jejich přítomnost u daného jedince. Na tuto skutečnost ovšem nesmi zapomínat ani při interpretaci svých výsledků. Nejde o liberalismus/etatismus obecně, abstraktně, ale o liberalismus/etatismus jím konkrétně definovaný. KAPITOLA 1 hodnotyujednotlivých subjektů, ale tendence, která se v naměřených hodnotách projevuje u - z jistého hlediska - homogenních skupin či kategorií těchto objektů (u žen, u osob s vysokoškolským vzděláním, u osob s vysokou mírou anomie apod.). Míry závislosti či souvislosti mezi vlastnostmi jsou měřitelné jen v souborech objektů. ilustrace..... Měření souvislosti mezí pohlavím a vzděláním není na. úrovni jednoho subjektu smysluplné. Smysl dw.áyá ai na úrovni ..z jiitýci hledisek nomoge-in-ch souborů" subjekt j, kde můžeme konstatovat : nouíikí.jd: Meri nrznmfctiiarifmi (sojbor osob homnrjrmí 7 h pdis'<<-, jejich postavení na trhu nr.íre) ;e ■ /p/rUfľezan^ V případě souboru, skupiny chceme: - zjistit stav vlastností jednotek, z nichž je soubor složen, identifikovat jejich vlastnosti (míru těchto vlastností), popsat je pomocí vlastností souboru a zjistit rozložení těchto vlastností v souboru: u kategorizovaných proměnných počty a podíly jednotek s určitou vlastností, intenzitou vlastností v souboru (například: kolík bylo ve sledovaném souboru lujíolíků aja/ýpodílvněm tvoří?...), u spojitých proměnných stanovit střední hodnoty (například: jaký je průměrný věk, příjem, ... v daném souboru?); - hledat příčiny variability neboli hledat vztahy či souvislosti mezi vlastnostmi (proměnnými): pohlaví, vzdělání nebo věk, příjem, respektive vztah mezi pohlavím a vzděláním či věkem a prijmem (jak se mění výše příjmu v závislosti na vzdělání?);13 - sledovat vývoj lcvantifikovaných vlastností v souboru. Z hlediska sociologické metodologie zde lze použít opakované výzkumy, kohortní analýzu či panelová šetření (což jsou fonny longitudinálnlch výzkumů). Ke zpracování dat shromážděných těmito technikami má statistika vlastní nástroje, s nimiž se ovšem v rozsahu našeho textu seznamovat nebudeme. 1.2 Hromadná data Kvantitativní výzkum soustředící se na to, jak mnoho (jaký podíl) něčeho ve společnosti existuje a jak něco s něčím souvisí, pracuje s hromadnými daty. V hromadnosti se projevují pravidelnosti, které u jednotlivých případů nemůžeme identifikovat (setká-váme-li se s jednotlivými případy, působí na nás dojmem obrovské proměnlivosti a individuálnosti), zatímco v hromadných datech existuj í j isté tendence. Například individuálně se můžeme setkat s velkou variabilitou příjmů a můžeme nalézt případy, kdy osoby se středoškolským vzděláním mají vyšší příjmy než některé osoby se vzděláním NEŽ ZAČNEME •• vysokoškolským.1-1 přesto v hromadných datech nepochybně zjistíme již zmíněnou tendenci: čím vyšši stupeň vzdělání, lim je mezi osobami, které ho dosáhly, vyšší ■ průměrný příjem. Ilustrace Lidé uzavírají sňatky v nejrůzriějších životních situacích as partnery s nejrůznějšími osobními i sociál-. nimi charakteristikami - v reálném životě se setkámese všemi kombinacemi podle výše vzdělání obou partnerů. Jakmile ale přestaneme posuzovat jednotlivé případy a začneme brát v úvahu větší počty, začnou se projevovat určité pravidelnosti, respektive nepravidelnosti) například tendence k homoga-rriii (to je tendence brát si partnera s analogickým sociálním statusem;vzdě!áním apod.). A zjišťovat-■ iťytcttendencejejednímz důiežitých.úkolů statistické analýzy hromadných dat... Hromadná data se zpracovávají statistickou procedurou, jejíž obsah tvoří: - výběr jednotek pro sledování (zjišťování jevii či charakteristik), /de se rozhodujeme, jaký druh výběru použijeme, zdali pravděpodobnostní, kvótní, záměrný apod.; - zjišťování údajů (prostřednictvím pozorování a měření), většinou u velkého počtu jednotek (pozor: sama statistika nemůže nahradit konceplualizaci pojmů a konstrukci nástroje sběru dat). Zde měříme vlastnosti jednotek, které nás na základě naší výzkumné otázky zajímají; - kontrola údajů, jak formálni, loje kontrola návratnosti a úplnosti údajů, tak i logická, kdy kontrolujeme nerozpornost údajů. Zde izv. „čistíme11 data; ■ získání informace o struktuře souboru v. hlediska jednotlivých sledovaných vlastností jeho jednotek. Třídění údaju ústící do informace o rozloženi jevů (třídění prvního slupne), popřípadě o rozložení kombinace jevů či charakteristik objektu (neboli třídění vyšších stupňu). Zde se již dostáváme do oblasti statistické analýzy; - výpočet statistik (středních hodnot charakterizujících rozložení hodnot proměnných, koeficientů asociace charakterizujících silu, respektive směr vztahů mezi ■ proměnnými) a sledování časové (časové řady) i věcné (testování významností rozdílů a shody) proměnlivosti jevů: - vyjádření rozložení jevů (charakteristik) v tabulkách a grafech, časových řadách; relační neboli vztahová analýza (hledající souvislosti), která může býl. jednoduchá a vícefaktorová nebo také kauzální (hledající příčinné závislosti); - statistická verifikace hypotéz, rozoř, jde o verifikaci opcracionalizovaných hypotéz, které lze dosáhnout jen s určitou přesnosti určitou pravděpodobností chyby. Není verifikací věcnou! - inlerenčni statistika (statistická indukce) neboli zobecnění výsledků našeho výběrového souboru na cílovou populaci, z níž byl vybrán (jde o pravděpodobnost platnosti našich výsledků i v cílové populaci, samozřejmě za předpokladu, že pracujeme s reprezentativním výběrovým souborem). Problém závislosti statistické a kauzální jsme již otevřeli v úvodu tohoto textu. Blíže bude popsán v kapitole o měření statistické souvislosti. Dopředu pouze upozorňujeme, že raluvíme-li v tomto textu o vztahu, nemáme ve většině případů na mysli vztah kauzální (příčinný). i4 Nezapomeňme ovšem na možnost intervence dalších faktorů do vztahu dvou vlastností (proměnných), to je mezi výší vzdělání a výší přijmu. K tomuto problému se ještě dostaneme, zde jen . připomeňme, že je třeba vzít v úvahu působeni přinejmenším třetího faktoru, jímž je věk jedince. : To je příklad uváděný Dismanem (1993, s. 24) jako dvojí příčina nebo také nepravá závislost. KAPITOLA I r-JfcŽ ZAČNbMB Pro sběr hromadných dat je v sociologii typický zejména survey - nejčastěji používané dotazníkové šetření (vedle například rutinně shromažďovaných statistik nebo panelových šetření) na výběrovém souboru. Bliže k logice survey a postupu při něm viz například de Vaus (1990). 13 Soubory a způsoby wýběru jednotek Již bylo řečeno, že data pro statistickou analýzu většinou shromažďujeme standardizovaným způsobem. Máme-li je statisticky zpracovat, musejí mít standardní podobu a musejí být zaznamenána jako čísla (neboli kardinální proměnné) nebo číslice (proměnné ordinální a nominální). Navíc bychom si měli uvědomit, že jen málokdy pracujeme s vyčerpávajícími šetřeními zahrnujícími všechny dostupné členy dané cílové populace neboli se základními soubory. Každý výzkum vyžaduje určení okruhu zkoumaných jednotek (osob), tedy určení „zkoumané populace". Jestliže říkáme, že se naše „zkoumání zaměří" na určitý soubor jednotek, máme na mysli většinou širší množinu jednotek, než postihne naše výzkumná činnost. Je to tzv. cílová populace {generál universtim/population). Cílová populace představuje okruh osob (soubor jednotek) vymezených nějakými sociálními či demografickými vlastnostmi, pro který chceme vyslovit závěry. Toto vymezení cílové populace může být různé a určuje i její velikost (zahrnuje všechny jednotky s vymezenými charakteristikami). . ilustrace^;. (Ibvo.i pooulaci irjže tvořit -1103 stucionta. kteří navitčyu.i Fakultu sociďhith .stud i v Brró; nebo -.o niyhou být v5tích:iy ieny. kťrij poručily v roce 200B v porodnici nésta X své dítě; příjom.-i luciolnici d,ivo:< .•. tívjlým bydliitC-n- v Ostravě; obýyatějeteléčŔ ve:věku 15^65 leť, ekonomicky akťvní obyvatelé ČR, ohyvnieló ČR r. volabnín pnWr-Ti npod.1'' Určení zkoumané populace je dáno především naším výzkumným Icmalem. Většinou přímo nezkoumáme, nemusíme zkoumat a mnohdy ani fyzicky zkoumat nemůžeme celou cílovou populaci - kdybychom tak učinili, provedli bychom tzv. vyčerpávající zjišťování neboli census. Proto převážně pracujeme s výběrovými soubory (samples), které jsou tvořené jednotkami vybranými podle určitých kritérií z cílového souboru, provádíme tedy výběrová šetření.16 Jednotky pro náš výzkum vybíráme obvykle tak, aby byl výběrový soubor pro základní soubor reprezentativní. 15 Všimněme si, že vymezení cílové populace vyžaduje často definici (co rozumíme ekonomickou aktivitou, jak je vymezeno volební právo, jaké sociální dávky máme na mysli apod.). " Způsoby, jak tyto jednotky vybíráme, aby byl náš soubor reprezentativní, zde nepopisujeme, čtenář se s nimi může seznámit v publikacích věnovaných sociologické metodologii, jako jsou například Babbie, 2001, de Vause, 1990 či Diaman, 1993. Reprezentativnost znamená dvojí věc: . - Výběrový soubor má strukturu analogickou strulctuře cílové populace - z hledis-: V: ka známých i neznámých charakteristik jeho prvků -, což ovšem zajistí jen jejich pravděpodobnostní (náhodný) výběr (viz například Babbie, 2001 nebo Disman, IW), - Výsledky v něm zjištěné proto mohou být zobecněny na cílovou populaci. Co pla-■ tí ve výběrovém souboru, platí i v cílové populaci. Takové zobecnění je možné ovšem jen za dodržení určitých podmínek při výběru jednotek - při dodržení pravidel pravděpodobnostního (náhodného) výběru. Znovu připomínáme, že zobecnění je možné jedině pro cílovou populaci, z níž byl výběrový soubor vybrán, a pro žádnou jinou. Na to často autoři zapomínají, a proto se lze setkat i se statěmi, které mají například tendenci vypovídat o povaze sexuálního života české populace na základě dat získaných mezi klienty sexuologických ordinací a poraden. Potíž u takovýchto závěrů spočívá jednoduše v tom, -že klienti sexuologických ordinací, byť by byli vybráni na základě všech pravidel pro reprezentativní výběr (tj. i kdyby všechny jednotky cílové populace - zde je možná na místě hovořit o základním souboru cílovou populaci zastupujícím -měly stejnou pravděpodobnost být vybrány do souboru výběrového), prostě nejsou reprezentanty pro výpovědi o sexuálním chování české populace, nýbrž pouze pro výpovědi o sexuálním chování souboru klientů poraden a ordinací (se všemi jejich zvláštními charakteristikami). Proto pozor: před získáním výběrového souboru musíte vždy vymezit cílovou populaci, a to není vždy tak jednoduché, jak by se na první pohled mohlo zdát. :jÍustrScé--. gffclze škourriat hodnotu mateřství jen v souboru žen s dětmi, ani jenv souboru žeň vdaných. Můžěme: se sanwrjnv' n,i rulo c ilovi.i.. popi..l<«i oiw/U. i nusime být vsoumi -IrniUt svých vyved •m. inl;ý by asi být: příspěvekk poznání toho,,jakouHbdnbtú má dítě pro žébú", bez dotazován'žen, kte*é dítě chtějí. nit nemetou (neplodnost, zdravotní problémy), či žen, které mít dítě přůararriově odmítají? ; Upozorňujeme také, že z jedné cílové populace, respektive z jednoho základního souboru lze učinit celou řadu výběrů (k této otázce se dostaneme podrobněji v pasážích věnovaných testování hypotéz a inferenční statistice). Závisí to na velikosti ;obou, nebo lépe na poměru jejich velikostí. kapitoi a i 1.4 Měření Chceme-li analyzovat výzkumná data, musíme je nejdříve získat. Ačkoliv se kolem nás pohybuje obrovské množství dat, která jsou již někde uložena a dychtivě čekají, abychom je dále zpracovali,17 ne vždy jsou po ruce data taková, abychom mohli vyřešit naši výzkumnou otázku. Proto musíme jít často do terénu a vlastní výzkumná data získat, tj. musíme fenomény, s nimiž budeme operovat, změřit. Již Galileo G'alilei ľormulával na' přelomu 16. a 17. století pro vědu požadavek měřit všechno, čó je měřitelné, a snažil sé učinit měřitelným vše, co dosud měřitelné není. Tento přístup vedl v přírodních vědách v 18. století, a zejména v 19. století k revoluci poznám. Není divu, že učaroval i mnoha sociálním vědcům. V pozitivistické empirické sociologii bylo měření od počátku chápáno jako jediná záruka vědeckosti jejích výsledků. Tento radikální požadavek je dnes již minulostí, model poznávání sociální reality skrze měření ovšem (a to je dobře) mrtvý není. Jen se musel tváří v tvář kvalitativním přístupům zříci monopolu, který byl nejzřetelněji zformulován a uplatňován v 30. až 50. letech dvacátého století.18 Základním předpokladem měření v sociologii je, že sociální objekt či jev, respektive jeho atributy (vlastnosti) jsou popsatelné pomocí čísel nebo číslic, které jsou jim připsány v procesu měření. Tyto číselné vlastnosti ovšem objekt nemá de facto - jsou mu připisovány teprve v tomto procesu. Měření lze jednoduše definovat slovy klasika měření Stanleyho Stevense - litery vlastně jen parafrázoval definici jiného klasika měření, Normana Campbella -jako přiřazování čísel objektům a jevům podle pravidel. Český statistik Jan Řehák tuto definici rozvinul a formuloval ji následovně: „Měření je proces realizace homeo-morfních zobrazení empirického systému s relacemi do jednoznačně určeného abstraktního systému s relacemi" (Řehák, 1971, s. 646)." Celý proces měření lze znázornit jednoduchým schématem (viz obr. 1,2). Popíše-me-li jej slovně (a zde si vypůjčujeme formulace Řeháka), pak říká: Pozorovatel měří vlastnosti objektu měření tak, že mu přiřazuje hodnoty měřicí stupnice (škály) pomocí měřicího přístroje a měřicích postupů v určitém prostředí měření. Z toho vyplývá, Data např. leží (v agregované podobě) na statistických úřadech (v Českém statistickém úřadě, v evropské databázi Eurostat, datové databázi OSN atd.) nebo jsou - jako primární data - uložena v datových archivech sociálněvědnich výzkumů a čekají na sekundární analýzu, to je na nové zpracování. Blíže k tomu viz přílohu, která obsahuje internetové linky aktuální v době vydání této publikace. Upozornění na limity tohoto přístupu naleznete již v klasické práci Charlese Wrighta Millse Sociologická imaginace z roku 1959 (česká vydání v letech 1968 a 2002). Ostatně jeho stať o měření nazvaná „Definice měření ve společenských vědách", kterou publikoval v Sociologickém časopise v r. 1971, stojí rozhodně za přečtení. i\T7 7AČNfMF Obr. 1.2 Obecné schéma procesu měření fpróStředírněřent!; - OBJEKT MĚFÍĚŇÍ ■■'—'■■v MĚŘICÍ STUPNICE .MĚŘÍCÍ PŘISTROJ, (prostředek) : : á MĚŘICÍ POSTUPY ■. : . ■ .'a .; POZOROVATEL Podle: Řehák (1971), str. 639. že abychom mohli úspěšně měřit, musíme míl 1) jednoznačně určenou stupnici, jejímž prostřednictvím měříme; 2) musí být zkonstruován reliabilní a validní měřicí přístroj ä musíme vědět, jaké jsou adekvátní měřicí postupy; 3) musí být maximálně eliminován vliv prostředí a 4) musí být maximálně eliminován vliv subjektu pozorovatele na výsledek měření. Žádná z těchto podmínek není triviální a v sociálních vědách může být vážnou překážkou měření. Pro ilustraci: Jak bychom asi v tomto kontextu změřili míru individuálního blaha (tzv. well-being), která, j ak naznačují někteří ekonomové, by mohla sloužit jako obecný ukazatel celkové ekonomické úspěšnosti a ekonomického pokroku společnosti? Na měření blaha přece nemáme ani žádnou reliabilní stupnici, ani validní měřicí prostředek a rovněž by se poněkud obtížně eliminoval vliv prostředí (pokud by "y době měření ve společnosti převažovala „blbá nálada", byly by výsledky zřejmě jiné, riež kdyby panoval duch veselí a optimismu). Znovu jsme se tak obloukem dostali k problematice operacionalizace. Teoretický rozbor našeho konceptu a určení j eho dimenzí a subdimenzí po vzoru de Vausova schématu (viz obr. 1.1) by nás jistě přivedl k formulaci adekvátních a validních indikátorů a ke způsobu jejich měřeni - vždyť přece ve vědě je vše měřitelné, a co není měřitelné, "se měřitelným musí učinit!20 1.4.1 Koncepty a jejich operacionalizace - indikátory Gliceme-li nějaký jev změřit, musíme vědět, jak je daný jev vymezen, ohraničen, definován. Musíme tedy mít jeho koncept a jeho definici. Když budeme zjišťovat ;: např; podíl nezaměstnaných v ekonomicky aktivní populaci (míra nezaměstnanosti), -.musíme mít definici nezaměstnanosti - kdo je za nezaměstnaného považován. Definic !* :A skutečně, základní kroky již byly v tomto ohledu učiněny - viz zprávu: Stiglitz, J., Sen, A., j ,&Fitoussi J.-P. (2008). Issues paper— Commission on the Measurement of Economic Performance ■;'.; and Social Progress, která je dostupná na: http://www.stiglitz-sen-fitoussi.li/en/index.htm. KAPITOLA 1 NEŽ ZAČNEME konceptu může být ovšem více - ostatně v sociologii jakožto multiparadigmatické vědě je to jev docela častý. Můžeme např. použít definici formulovanou Mezinárodní organizací práce (ILO), která je základem oficiálního určení nezaměstnaných osob v zemích EU, a tedy i v České republice: Definice ILO považuje za nezaměstnané ty osoby {v metodice Eurostatu ve věku 15-74 let), které: a) v referenčním období neměly zaměstnání, b) neodpraco-valy ani jednu hodinu za mzdu nebo odměnu a c) aktivně hledaly práci, d) do které by byly schopny nastoupit nejpozději do dvou týdnů ode dne zjišťování. Ještě ilustrativnějším příkladem toho, že se neobejdeme bez úvodní definice, může být zkoumání chudoby. Jaké osoby máme do svého výzkumného souboru zahrnout (kdo je vlastně chudý, a tudíž předmětem našeho zájmu)? Osoby s příjmem pod hranicí stanoveného životního minima? Nebo domácnosti vydávající více než 30 % svých příjmů na potraviny? Či osoby s příjmem nedosahujícím 60 % mediánu příjmového rozložení v dané zemi (což je definice Eurostatu)? Anebo osoby či domácnosti dosahující určité hodnoty na indexu deprivace? Popřípadě osoby, respektive domácnosti, které se deklarují jako chudé (což je tzv. subjektivní chudoba)? To vše jsou příklady definic chudoby a nejde vůbec o jejich vyčerpávající výčet.21 Chudobu tedy nikdy nezkoumáme samu o sobě, vždy půjde o její určitý koncept. Proto budeme-li analyzovat data o chudobě, nebudeme vypovídat o chudobě jako takové, ale o chudobě, jak jsme ji definovali (nebo podle definice chudoby, kterou jsme přijali). Tento aspekt sociálních věd mějme neustále na paměti, když vypovídáme o sociálních jevech, které zkoumáme - to znamená, řečeno jinými slovy - při interpretaci výsledků našich analýz. V sociálních vědách se celá věc ještě komplikuje tím, jakjsme již uvedli na začátku této kapitoly, že vlastnosti jednotek často nejsme schopni měřit přímo, takže musíme měřit pouze indikátory (ukazatele) těchto vlastností.22 Například politickou orientaci jedince z hlediska levice či pravice jsme schopni určit na základě toho, jakou volil stranu v parlamentních volbách. A to ještě pouze na základě jeho výpovědi. Při měření jevů (konceptů, indikátorů) měříme různé aspekty: 1. Intenzitu vlastností zkoumaných jednotek výzkumu a také vlastností objektů vnějšího světa, který je obklopuje (kontextuální vlastnosti - podmínky). V zásadě ale zjišťujeme: 21 Čtenáři by se velmi podivili, kdyby porovnali výsledky získané různým mířením chudoby a předpokládali, že všechna měří totéž - chudobu jakožto jakýsi esenciální stav. Podle definice Eurostatu (tzv. příjmová chudoba) bylo v roce 2001 v České republice asi 8 % chudých, měřeno ale dotazem na pocit chudoby (tzv. subjektivní chudoba) jich bylo 36 % (Sirováika & Mareš, 2006). Podobně bychom ale dopadli při měření v jiných evropských zemích. 22 Hledáme něco, co indikuje existenci nějaké vlastnosti, která sama o sobě není pozorovatelná. Čtenáři si to mohou samí zkusit, chtějí-li „změřit" lásku svého partnera, respektive své partnerky. Ríkají-li si „miluje mě", z čeho tak usuzuji - z jakých jeho/jejích projevů? i - jaká je intenzita nějaké vlastnosti nějakého zkoumaného jevu (objektu) v určitém okamžiku; - k jaké změně intenzity vlastností došlo v nezměněných podmínkách v určitém čase; - k jaké změně intenzity určité vlastnosti došlo v podmínkách, které se v určitém čase známým způsobem změnily. 2. Distance objektů (vlastností), což je ve svém primárním významu geometrický po-; jem, konkretizovaný v teorii měření metrickou veličinou délky. Tato distance může být měřena i v určitém konstruovaném prostoru, j ak j e tomu v případě prostoru zna-i ků postulovaném Lazarsfeldem (Bartoň, 1955), v sémantickém prostoru, či v pro- storu vytvářeném technikou faktorové analýzy. Ve svém sekundárním významu jde i o vztah mezi dvěma bezprostředně sousedními škálovými hodnotami, který je nu- mericky reprezentován jako jejich rozdíl, vyjádřený v absolutních hodnotách. 3. Závislosti (asymetrický vztah) či souvislosti (symetrický vztah) mezi dvěma ; vlastnostmi zkoumaných jednotek (to je subjektů či objektů výzkumu) či mezi dvěma jevy, respektive mezi proměnnými, jež je reprezentují. 4. Globální vlastnosti souborů (například průměrný věk okresů ČR, průměrný příjem vzdělanostních skupin, porodnost v zemích EU apod.). í 1.4.2 Proměnná Kvantitativní sociákěvědní výzkum může nalézt řešení jen pro problémy, které je možno popsat v termínech vztahu mezi pozorovatelnými proměnnými. Proměnné před- ; stavují logicky uspořádané charakteristiky/vlasmosti zkoumaných jednotek (hodnoty proměnných). Dovolují zkoumané jednotky podle jejich vlastností pouze zařadit do kategorií (nominálni proměnné - např. pohlaví, umožňující jednotky zařadit mezi muže í nebo ženy), nebo je zařadit do kategorií uspořádaných podle nějaké míry (ordinální proměnné - např. vzdělání, umožňující jednotky zařadit do kategorií seřazených podle stupňující se míry dané vlastnosti, mezi absolventy pouze základního vzdělání, absolventy středních škol a absolventy vysokých škol) nebo určit číselně intenzim, jakou daná vlastnost nabývá (spojité neboli kardinální proměnné - např. věk, příjem apod.).23 Ilustrace ,:' Ku/, c zena jsou vlas;ns:sri latirihuU-.) .•! sou asné hocHoty (yc',W'■ !V6!/yi Ordinální proměnná je taková, jejíž kategorie lze uspořádat do pořadí. Takže zatímco u kategorií nominální proměnné pouze zjišťujeme, zdali se jednotlivé kategorie vyskytly, nebo ne, a pokud se vyskytly, pak jak často, o kategoriích ordinální proměnné jsme schopni říci, která je v pořadí výše nežjiná. Příkladem ordinální proměnné je míra spokojenosti (stupnice může mít podobu: 1. velmi spokojen, 2. spokojen, 3. nespokojen, 4. velmi nespokojen), stupeň dosaženého vzdělání, výsledky v soutěži krásy. Pozor tedy: ordinální stupnice zobrazují pouze pořadí, a nikoliv stupeň odlišnosti - nedokážeme zde totiž určit, o jaké množství spokojenosti se liší „velmi spokojeni" od „spokojených", byť číselná řada by nezkušenému výzkumníkovi sugerovala, že jde o rozdíl/množství jednoho stupně. HowdHSW'ľ <- *&T- M.6n<£i Kardinální proměnná je taková, jejíž číselné kategorie již vyjadřují skutečné množství sledované vlastnosti (číselné kódy tedy nejsou arbitrárni). Jednotlivé kategorie této proměnné jsme proto nejenom schopni seřadit do pořadí, ale umíme i říci, o kolik (o jaké množství) se liší. Kardinální proměnné rozdělujeme na proměnné intervalové (jejich stupnice nemá přirozenou smysluplnou nulu) a proměnné poměrové (s existencí přirozené nuly) - poměrové proměnné jsou snem každého sociologického kvantitativního výzkumníka. Je to tím, že unich jsme schopni říci nejenom, o kolik se kategorie liší, ale také kolikrát je nějaká kategorie vyšší než jiná (je to dáno právě tím, že poměrové škály mají přirozenou nulu). Příkladem kardinální proměnné je věk, příjem respondenta, počet dětí, které žena porodila, apod. V jemnějším pohledu lze kardinální proměnné ještě členit na diskrétní, tedy takové, které mohu nabývat pouze určitých hodnot - většinou to jsou celá čísla, příkladem je počet dětí -, a na jejich opak, tedy proměnné spojité {continuous), které mohou, jak naznačuje název, nabývat jakýchkoliv hodnot: např, věk člověka může být měřen — podle potřeby přesnosti -nejenom na roky, ale i na dny, sekundy, popřípadě mikrosekundy a nanosekundy... Zvláštním případem je proměnná, která nabývá pouze dvou kategorií. Označuje ne jako proměnná dichotomická (nebo také binární). Příkladem je muž x žena, zamestnaný x nezaměstnaný, živý x mrtvý apod. Chování dicholomických proměnných je trochu zvláštní./, pohledu metodologie jde o nominální proměnnou, ale pokud užíváme zavedených kódovacích schémat (často 0 vs. I či 0 vs. 100), lze s ní ve statistice často operovat jako s proměnnou kardinální. Rozlišovat úrovně měření a druhy proměnných je velmi důležité, neboť na druhu proměnných jsou závislé štatistické operace* klére míižěme s daly provádět. ideálem pro statistiku jsou pochopi tel ně proměnné kardinální, neboť umožňují nejvyšší množství statistických operací. V sociálních vědách jich ovšem není příliš mnoho, velmi často se pohybujeme poúzě v oboru proměnných ordinálnícha nominálních: Typy proměnných je třeba doplnil ještě o jednu důležitou klasifikaci, a to o proměnné nezávislé a závislé. Základem pro toto dělení již není množství vlastnosti a způsob měřeni, ale úvaha o lom. co je „příčinou" a co „následkem". Když hledáme souvislosti nic/.i jevy, obvykle začínáme úvahou o vztahu dvou jevů, dvou proměnných. Přitom předpokládáme, že jeden jev je příčinou, druhý následkem. Proměnná reprezentující v našich úvahách (v naší hypotéze) příčinu je proměnná nezávislá (independent variable), proměnná reprezentuj ící uvažovaný následek je proměnná závislá (dc.pendcnt vatiablá). Např. hledáme-li vztah mezi pocitem štěstí a věkem, můžeme formulovat předpoklad, že mladší lidé budou v průměru šťastnější než senioři, loje že s rostoucím věkem se bude snižovat průmětný pocit štěstí. Rozlišit nezávisle a závisle proměnnou není obvykle problém.; pokud si nejsme jisti, vezměme v úvahu časový průběh: v našem případě pocit štěstí prostě nemůže hýl nezávisle proměnná, pocit štěstí nemůže být příčinou určitého věku.'-5 V analýze dal se bez rozlišováni nezávisle a závisle proměnných neobejdeme, Hcndl dokonce říká, že „výzkum začíná určením nezávisle a závisle proměnných,.." (Hcndl, 2004. s. 40). Při měření sc pochopitelně můžeme dopustit řady chyb. Ostatně základní teorie měření (anglicky true score theorý) s chybou počítá, neboť říká, že každé měření sestává ze dvou (aditivních) složek: ze skutečné správné hodnoty a z chyb měření. Vyjádřeno jednoduchým vzorcem: X^T+e, 25 Někteří autoři namítají, že tato klasifikace je patřičná pouze pro experimentální výzkum, v němž jsme schopni manipulovat s příčinami: experimentátor vystavuje subjekty experimentu různým podnětům - nezávisle proměnným - a zkoumá jejich reakce (závisle proměnné). Pro analýzu neexperimentálních dat, např. pro data ze sociologických výzkumů založených na dotazníku, navrhují nazývat nezávisle proměnné prediktorem (predictor variable), závisle proměnné pak výsledkem (outcome variable). Česká sociologická praxe je taková, že používáme termíny nezávisle a závisle proměnná. Obr. 1.3 Graf rozložení dat při náhodné chybě měření a při měření bez chyby Notice that random error doesn't affect the average, only the variability around the average Zdroj:True Score Theory, dostupnéz: http://www.5oclalresearrfimethad5.net/kb/true5cor,php kdeXje naměřená hodnota vlastnosti, Tjejejí skutečná, správná (true) hodnota, kterou ale neznáme (snažíme se ji totiž zjistit právě našim měřením), a e je celková chyba měření (error). Celková chyba měření může být systematická nebo náhodná. Náhodná chyba (remdom error) většinou nezpůsobuje větší problém, neboť odchylky odměření sice způsobují větší variabilitu v datech, ale jelikož mají tendenci se náhodně vychylovat v kladném i záporném směru (někdy naměříme více, než je skutečná vlastnost, jindy zase méně), vzájemně se vyruší, takže průměr měřené vlastnosti zůstává nedotčen. Proto se někdy o náhodné chybě hovoří jako o šumu (noisé). Hezky to vyjadřuje obrázek 1.3, v němž modrá křivka ukazuje, jaké bychom měli hodnoty bez náhodné chyby měření, zatímco zelená křivka zobrazuje hodnoty s náhodnou chybou. Vidíme, že střední hodnota (průměr) je u obou křivek shodná, rozdíl mezi Iďivkami je pouze v šířce rozložení hodnot - zelená (s chybou) má širší rozložení, hodnoty zde mají větší rozptyl (variabilitu), modraje sevřenější, rozptyl je menší. Systematická chyba (systemettic error) — viz obr. 1.4 - představuje trvalou, nikoliv náhodnou chybu, a pokud se při měření vyskytne, je to skutečný problém. Jelikož jde 0 systematické zkreslení, jsou hodnoty při měření opakovaně vychýleny buď kladně, nebo záporně, takže se navzájem nemohu vyrušit. Výsledné měření je pak systematicky vychýlené (na obr. 1.4 je to ta červená křivka), a tudíž zkreslující - průměr hodnot se systematickou chybou (u červené křivky) je odlišný od průměru hodnot, které chybu neobsahují (modrá křivka). Systematickou chybu nazýváme zkreslením (bias). Zdroj systematické chyby je různý. Může být na straně pozorovatele, pokud je jeho pozorování selektivní (viz schéma měření na obr. 1.2), ale chyba může být způsobena 1 měřicím nástrojem (pokud je například nevalidní). Jejím zdrojem může být ale i měřený objekt, například když u výběrových souborů jde o chybný výběr jejich jednotek. Zobecňujeme-li z výběrového souboru na cílovou populaci, může jít o chybu spočívající v neoprávněném zobecnění - hovoříme zde o chybě neoprávněného rozšíření domény KAPITOLA 1 ~-M j<4 NEŽ ZAČNEM C ^ . Obr. 1.4 Graf rozložení dat ' \ / \ ,'Jl'"0" °' X | př| systematické chybě měření í \ I \ W!th systematic error j a při měření bez chyby I \ \...... " " . d 111 the distribution of X with a> # ft \ rw sysřemafíc error *= / M V -—-------■ (Notice that systematic error does") i affect i/ie average - we caff j I f/ws 3 toas j Zdroj: True Score Theory, dostupné z: http://www.socialresearchmethods.net/kb/truescor.php měření, kdy zobecňujeme své výsledky na širší soubor, než z něhož jsme provedli náš výběr. Může jíl. například o snahu zobecnit volební preference /. výběrového souboru vybraného z pražské populace na celou populaci CR. Obecně ve statistice chyba (error) znamená rozdíl mezi pozorováním a predikcí (či odhadem) a je spíše nepřesností než skutečnou chybou. Jde většinou o náhodnou chybu. V tomto ohledu se v kapitole o inferenční statistice (viz kapitolu 5) seznámíme se standardní chybou {standard error) a výběrovou chybou (sampling error). /.de jde o to, jak blízko (s určitou zvolenou pravděpodobností) jsou výsledky získané výzkumem vc výběrovém souboru příslušným charakteristikám populace.-"1 1.4.4 Aspekty měření Při měření si musíme všímat jeho několika aspektů. Zásadně platí, že použitý způsob měření by měl být relevantní, validní, reliabilní, senzitivní a přesný. To jsou hlavní aspekty měření (viztéžDisman, 1993, s. 62 nebo Babbie, 2001,s. 140 145). Relevance znamená vhodnost použité procedury měření ve vztahu k problému. Validita se týká rozsahu, v němž měření korespondují se skutečnou vlastností, která má být měřena (měříme skutečně to, co měřil, chceme?). Základní otázkou, kterou si můžeme u každého mořicího nástroje položit, je: „Co měří?" Validitou se zhruba chápe platnost měřicích procedur, získaných údajíi, měřicích nástrojů, prostě všech složek měření a škálování. Měření je validní, jestliže měří to, co myslíme (očekáváme), že měří. Ve skutečnosti to ovšem není měření, které je validní nebo nevalidní, ale jeho použití. Validita tak závisí na tom, jak jc 26 V jazyce analýzy označujeme výsledky získané výpočty (ve výběrovém souboru) výrazem „statistiky" a číselným charakteristikám populace říkáme „parametry". definován měřený pojem.27 Babbie (2001) konstatuje, že konvenčni používání termínu validita se vztahuje k rozsahu, ve kterém empirická míra adekvátně reflektuje skutečný význam uvažovaného pojmu. Poiržijeme-li proměnnou i,úro^ ne-bude, zrl.i mérrre r. úspěchem tuto úroveň V7rió:á->i, ;;fe 7:);; tímto 7p jsohrn- ;prostřWlrk tvírn toho-;r.Mik,i/r:!cvle', skuteůié •íiýŕ'me to. u.> inň'it chcomf: teciy soci.iln's*ati.s. Reliabilita označuje rozsah, ve kterém způsob měření dává konzistentní výsledky. U reliability se tedy ptáme, do jaké míry jsou výsledky opakovaného měření shodné s původním měřením. Ilustrativní pro reliabilitu je Segalův zákon, který praví: Když má člověk jen jedny hodinky, ví vždycky, kolikje hodin. Když má člověk dvoje hodinky, nemůže si být nikdy jist. Reliabilitou se zhruba chápe spolehlivost výsledků měření v závislosti na a) objektivní spolehlivosti měřicích procedur, technik či nástrojů, b) subjektivní spolehlivosti respondentů a experimentátora. Reliabilita je také považována za míru stability měřicích nástrojů, s jakou lze při opakovaných měřeních či testech získávat přibližně stejné výsledky. Jde o záruku, že proměnlivé výsledky měření nejsou způsobeny špatným měřicím prostředkem, ale skutečnou variabilitou měřené vlastnosti. Jestliže lidé odpovídají na otázky při opakovaném dotazování stejným způsobem, pak jsou otázky reliabilní. Synonyma reliability jsou: spolehlivost, stabilita, konzistence, prediktabilita neboli předpověditelnost, přesnost (Kerlinger, 1972, s. 421 ).28 Zdrojem nereliability mohou být špatné formulace otázek, rozdílné kulturní významy vkládané do použitých termínů v různých sociálně kulturních prostředích, vliv tazatelů (a to nejen záměrný). Pohlaví tazatele, jeho etnický původ, oblečení, sociální zařazení, to vše může při dotazováni (to je sběru dat) hrát značnou roli. Jinak odpovídá žena ženě, jinak muži a podobně, a v tomto odlišném odpovídání se skrývá zdroj chyb. Jiným zdrojem chyb může být kódování, neboť různí tazatelé mohou kódovat stejné odpovědi rozdílně, uplatňuje se selektivní slyšení a podobně. Reliabilita je nízká i u otázek, na které lidé nemají názor (míněni, postoj), a otázka tento názor uměle vytváří (může, ale spíše nemusí zůstat stabilní). Reliabilitu se proto snažíme zvyšovat Měříme-li příjmovou chudobu definovanou například poměřením příjmu jednotky s příjmovým rozložením (například za chudé považujeme všechny jednotky s příjmem nižším než 60 % příjmového mediánu), bude dotaz typu „cítíte se být chudou rodinou" nepochybně velmi zajímavý, ale neměří jej! (definovanou) chudobu - je z tohoto hlediska nevalidní. I když ve vztahu k subjektivní chudobě jistě validní je. Koncept reliability je pro nás důležitý obecně, ale i specificky - například v případě sumačních indexů (viz kapitolu 6 o transformaci proměnných), kde je nutno změřit reliabilitu jednotlivých položek (jejich vnitřní konzistenci), z nichž je sumační index vytvořen. KAPITOLA 1 NEŽ ZAČNEMK použitím více indikátorů (u jednoduchých položek jc vždy obtížnější zajistil, reliabili-tu než u použili více indikátorů), pečlivou formulaci otázek, ale i určitým výcvikem (instruktážemi) tazatelů a standardizací způsobu kódování. Sensitivitou se rozumí schopnost testu dávat pozitivní odpověď, jestliže daná osoba má příslušnou vlastnost, spécificitou pak schopnost testu dávat negativní odpověď, jestliže daná osoba nemá příslušnou vlastnost. Toto rozlišeni zná velmi dobře například medicína a medicínský výzkum. 1 »5 Hypotézy a modely 1.5.1 Od tématu přes problém k výzkumné hypotéze Hypotéza je určité očekávání o povaze věcí odvozené většinou z teorie (jc to tvrzení o tom, jaká tato povaha má být, má-li být teorie, z které je odvozena, pravdivá). Výzkumná hypotéza je předběžný předpoklad, domněnka o 1) existenci a 2) příčinách jevů, o 3) vztahu mezi jevy, o 4) průběhu nějakého procesu, o 5) změně apod. Svou povahou leží na jakémsi myšlenkovém rozhraní mezi teoretickou a empirickou fázi výzkumu. Je návodem k výzkumu, který jc najedno straně determinován dosavadním poznáním, na druhé straně jc orientován na další poznání. Může být: odvozena z kontextu vědy (formulována •/. teorie nebo z jiných hypotéz), ale i ze zkušenosti. Má charakter výroku, tvrzení, modelu, či dokonce teorie, ale jsou to výroky, tvrzení, modely a teorie, jež nebyly dosud přijaty jako obecně plaíné. Její podstatnou charakteristikou je, že ji můžeme nižným způsobem empiricky ověřovat. Podle elologa Konráda Loren/.e (1903 19R9) si nejdříve něco myslíme, pak to srovnáváme se zkušeností a s dalšími smyslovými daty, až nakonec podle toho, shodujc-li sc to s nimi, nebo ne rozhodneme o správnosti či cliybnosti toho, co jsme vymysleli. Hypotéza jc něco, co dosud nebylo ověřeno, a má proto v rámci vědy dočasný status (Lorenz, 1990, s. 72 li).1'-' Velmi časlo se setkáváme s nepochopením při rozlišování mc/.i tématem výzkumu a výzkumnou otázkou, respektive výzkumnou hypotézou. Rozlišuje se: - téma, respektive předmět výzkumu. Jestliže řekneme, že chceme zkoumat sociální nerovnost, neboli vidíme v nerovnosti problém (sociální či výzkumný) a chceme výzkumem získat odpovědi na některé otázky týkající sc „sociální nerovnosti", vymezili jsme si prozatím jen předmět výzkumu; - výzkumný problém, na který hledáme prostřednictvím výzkumu odpověď a který jc zúžením tématu na některý z jeho (pro nás) významných aspektu; - výzkumná olá/ka/hypoléza, která problém dále specifikuje do takové podoby, abychom z odpovědi na ni tento problém mohl i pochopit - tcpive výzkumná otázka určuje otázky, s nimiž se obracíme ke zkoumaným jednotkám: například otázky dotazníku. Ilustrace lénvt (předmět) výzkumu jc sociální nerovnost. odpovědi na ;aké otázky chceme; získat (co jo výzkmrý problém)? Jaký typ n.-ovľKNti budeme 7kn;inat íekortoirir kou, mocenskou, politickou}? Jak ji bjclomo nořit (rozďly ve. sto'.wwi, v pŕijn Wi)? Inky vy:'k,imr.ý prostor zvolíme? Celo.i společnost, něco pouze její urf tý výsfk (cicaii/V-ri, korru-riti!. sodďln: i-uipifiu, rodinu!? - Jaké období buoe časovým rámcem výzkumu? Soustředíme se nájednú generaci, nebo budeme zkoumatimezigenerační vztahy-a procesy (například přenos nerovností ž generace nä: generaci)? Jaký aspekt ">r>:r>vnosr: budenie sil.doval? 7,o nc zJvisle promř-nná vyswtlcjc jen ■!!> wiiiňnc e v píiji-n., zbylých 64 jdo ví vr,iL> vlivu jiných pfown ^Hýchltttišírripijz^ rirĚ;je!pNh^menaířnřý^ 35 U procedur, se kterými se zde seznamujeme, se s tím setkáme například u lineární regrese (koeficient determinace) nebo u faktorové analýzy. KAPITOLA 1 1.6 Jak získat data pro analýzu Hromadná data pro analýzu lze získat mnoha způsoby. Primární podmínkou je, aby byla získávámi jako dala standardizovaná. Například používámc-íi pro jejich sbor dotazník, musíme zajistit vedle takových podmínek, aby všem byly kladeny stejné otázky ve stejném znění a stejném poradí, také podmínky plynoucí ze statistických požadavků na proměnné: - Proměnná musí variovat, musí ledy nabývat alespoň dvou hodnot (diskriminabilita čili rozlišitelnost mezi vlastnostmi objektu uvnitř proměnné: například u proměnné pohlaví lze rozlišit mezi muži a ženami). Kc každému stavu vlastnosti existuje příslušná hodnota znaku (zařaditelnosl). Všechny pozorovatelné vlastnosti objektu musejí býl zařariitelné do některé z hodno! proměnné (např. proměnná „volební preference" má mít tolik hodnot, kolik politických stran postavilo své kandidátky do parlamentních voleb). - Dvě různé hodnoty znaku nemohou odpovídat jednomu stavu vlastnosti (jednoznačnost). U žádné z pozorovatelných vlastností objektu nemůžeme být na rozpacích, jakou hodnotu proměnné jí přiřadit neboli do které kategorie ji zařadit. Například proměnná věk nemůže mít vedle hodnoty 20-30 let hodnotu 30-40 let, neboť by nebylo možné jednoznačně rozhodnout, do které kategorie by měly být zařazeny třicetileté osoby. - Naše data by měla být reprezentativní (viz předchozí lext), tak aby nám umožnila zobecnení výsledků našich výpočtu z výběrového souboru na soubor základní (statistickou inferencí - viz dále) a do výzkumu musí být zahrnut dostatečný počet výzkumných jednotek ,ir' Poslední podmínku je ovšem třeba mírně korigovat; ne vždy musejí být naše dala reprezentativní. Máme-li například malou populaci (studenty jednoho gymnázia), uděláme vyčerpávající šetření (census), při kterém do výzkumu jednoduše zahrneme všechny její členy. V takovém případě ovšem ztrácí smysl tzv. iiifcrenční statistika (viz kapitolu 5), kterou lze aplikoval pouze v souborech, jehož jednotky byly vybrány náhodně. Zdrojem hromadných dal pro statistickou analýzu muže být především vlastní sběr dat, dále data posbíraná jinými výzkumníky nebo statistické výkaznictví a speciální šetření, jako je například sčítáni lidu nebo mikrocensus. J6 Mlhavý výraz „dostatečný" si blíže specifikujeme, až se dostaneme k inferenčnf statistice a k otázce výběrové chyby. Co tímto výrazem míníme, závisí na velikosti výběrové chyby, kterou jsme ochotni připustit, a také na hloubce zamýšlené analýzy (do kolíka podsouborů budeme soubor, s nímž pracujeme, členit). Může nás uspokojit třeba i 300-400 výzkumných jednotek, ale nemusí nám stačit ani 5 000 výzkumných jednotek. Vše závisí na řadě okolností. NEŽ ZAČNEME 1.6.1 Sekundární analýza dat Zdrojem dat pro nás mohou být i datové archivy (blíže o nich píšeme v dodatku IV). V nich jsou umístěny soubory, jež lze získat buď za úplatu, nebo se pro jejich získání požaduje jen registrace, popřípadě jsou volně k dispozici bez dalších podmínek (včetně dotazníků - bez nich jsou data často jen obtížně luštitelná nebo i zcela nečitelná a jejich analýza může pro neznalost přesného znění otázek a hodnot proměnných37 být až zavádějící). Většina datových archívuje spravována různými výzkumnými pracovišti (viz například GESIS - Archive for Empirical Social Reseach - University Köln am Rhein apod.), nadacemi (viz European Social Survey apod.), mezinárodními organizacemi (UNESCO či Světová banka apod.) nebo státní správou (v České republice jde zejména o Český statistický úřad, v EU o Eurostat; může jít o dohodu sdružení států jako v případě The European Community Household Panel). Většina datových archivů je také na webu a data si lze přímo stáhnout. Nejvýznairmějším datovým archivem kvantitativních dat v České republice je datový archiv Sociologického ústavu Akademie věd České republiky (viz http://archiv.soc.cas.cz/). Doporučujeme webové stránky všech zmíněných institucí navštívit a s jejich archivy se seznámit. Více o těchto službách najdete v dodatku této učebnice. Naléhavá připomínka: Mějme zdravou skepsi k datům, s nimiž pracujeme! Pro vědeckou práci platí základní dictum: „buďme zdravě skeptičtí". Každý výzkumník je pochopitelně přesvědčen, že jeho nástroje jsou validní a reliabilní a že jeho data jsou určitě reprezentativní. Do jaké míry je však třeba uchovávat si v tomto ohledu určitou skepsi, můžeme ilustrovat na několika příkladech tzv. rutinních statistik. Nejsou primárně shromažďovány pro výzkumné účely, ale mohou být pro ně využity stejně jako například jiné údaje shromažďované v systému statistického výkaznictví. Příklady databází vznikajících takovým způsobem můžete nalézt na webových stránkách Českého statistického úřadu, Ministerstva práce a sociálních věcí (například data o struktuře nezaměstnanosti) i jinde. Při jejich studiu si ale musíme klást otázky. Například můžeme věřit policejním nebo zdravotnickým statistikám? Policie se může soustředit na určité typy trestných činů a to se projeví v policejních statistikách. Nikoliv tedy změna ve struktuře, povaze a množství deviantního jednání, ale změna v přístupu této sociální instituce může mít za následek pohyb ve statistikách o trestných činech. Ilustrace....... ....... -: .: Poklesneji velká kriminalita, má policie více času ha malou kriminalitu1 a vzroste jejľobjasnénost.. Výskyt nemoci ve sialiitikách múze být ovlivněn schop-iosti diagnostikovat jp. ackuci íshyla nemu:, iduntií kov.índ (nebyly popsány:její. příznaky, indikátory), respektive.pojmenována, nemůže'7 V datových souborech jsou proměnné a jejich hodnoty opatřeny jen velmi hrubými a zkratkovitými orientačními popisky (variable label a value labels). KAPITOLA 1 NEŽZAČNEME být diagnostikována. Podobné.též poiičejní statistiky zaznamenávají jen odhalené:trestné činy. : (existuje například skrytá kriminalita, jako jsou zločiny.bílých límečků nebo nehlásená trestná čin-: nost uvnitř rodin, jako je třeba domácí násilO- V Brně vypadá jiňakmapa kriminality (počet určitých trestných činů nebo trestných činů obecně) podle odhalených, trestných ŕ nú. jii-ck by vypadala podle skutečné spáchaných trestných činů (včetně neodhalených a neohlášených). Zřeme by se také ukňza'o. že mnohém více,: než by se čekalo, je trestných činůuvnitř rodin. Mohou se také měnit definice. "Například ve zdravotnických statistikách lze jeti s obtížemi prováděl, historické komparace údajů. Vezměme třeba rozdíl mezi úmrtími na srdeční choroby v 21. století a v 19. století, kdy (právě s ohledem na zmíněnou schopnost diagnostikovat a rozlišovat mezi diagnostikami) byla do této kategorie zahrnována úmrtí, která se dnes zahrnuji do kategorií zcela jiných. Analogicky se mohou mčnil klasifikace určitých osob či domácností mezi chudé či neelmdé, aniž by se změnila jejich situace (příjmy či vydání), a sice prostým administrativním úkonem změnou hranice chudoby. Vše komplikuje i to, že tvůrci statistik, respektive li, kdo pro ně poskytují údaje, mohou přitom přihlížet ke svým zájmům. Policie je například hodnocena podle míry objasněnosti svých případů a policisté mají zájem, aby některé činy nebyly ve statistikách zachyceny a jiné ano (nejde jen o přímé falšování údajů, ale i o takové aktivity, jako je neochota přijímat trestní oznámení drobných činů, které mají tradičně nízkou míru objasnění). Podobně se někdy licituje v nemocnicích, zda dítě zachytil jako mrtvě narozené nebo jako novorozeneckou úmrtnost apod. (takto manipulovaly a manipulují se statistikami i některé státy). Policisté mohou sympatizovat s hnutími vyjadřujícími xenofóbii a rasismus, jako jsou například skinheads, a snažit se - když už musejí jejich činy vyšetřovat - neklasifikoval je jako motivované rasovou nesnášenlivostí. Naopak může docházet k růstu podílu takto motivovaných činů ve statistikách pod vlivem vnějších tlaků, ať již mocenských ze strany různých příslušných státních institucí (ministerstva vnitra, státních zastupitelství, soudů), nebo pod vlivem změn legislativy napr. /.měnou dennice, jejím jednoznačnějším výkladem apod., popřípadě pod tlakem veřejného mínění či kontrolou masmédií, zejména jsou-li vyburcovány díky zvláště brutálnímu činu. fixistují i jiné způsoby „práce" se statistikami. Jen jeden / možných příkladů: v 19. století bylo velmi obtížné dosáhnout rozvodu. Důvody k rozvodu, které soudy uznávaly, byly velmi omezené a možnost rozvodu po vzájemné dohodě tehdy v právních normách neexistovala. Přesto se však tento způsob rozvodu v některých zemích fakticky vyskytoval. Manželé si totiž například účelově po vzájemné dohodě vyměřovali urážlivé dopisy a mohli pale být rozvedeni pro oboustranné těžké urážky (viz liolognc, 1996). Absolutní čísla jsou často interpretačně málo zajímavá, zajímavější jsou čísla poměrná (přepočtená na určitý základ - často sc o nich hovoří jako o špecifických ukazatelích). Policejní statistika je jen hrubou informací o struktuře trestných činů (o podílu dané činnosti v celku trestné činnosti), zajímavější údaj však dostaneme, přepočteme-li čísla například na celkový počet obyvatel určitého území nebo na cílové skupiny (např. počet trestných činů mladistvých nikoliv v celku trestných činů, ale v přepočtu na počet osob této věkové skupiny v populaci a porovnání tohoto přepočtu s ekvivalentními přepočty ostatních věkových skupin). Velmi cenné jsou komparace s jinými prostředími, například s jinými městy, státy - ovšem za předpokladu, že je používána ve všech prostředích stejná metodika a tato metodika je stejným způsobem vykládána. Literatura Babbie, E. (2001). The Practice of Social Research (9th ed.). Belmont: Wadsworth Publishing Company. Barton, A. H. (1955). The Concept of Property-Space in Social Research, tn P. F. Lazarsfeld & M. Rosenberg (Eds.), The Language of Social Research (pp. 40-53). New York: The Free Press. Bell, D. (1999). Kulturní rozpory kapitalismu. Praha: Slon. Blahuš, P. (2000). Statistická významnost proti vědecké průkaznosti výsledků výzkumu. Česká kin- antropologie, 4(2), 53-72. BlaiMe, N. (2003). Analyzing Quantitative Data. London: Sage. Blau, P. M., & Duncan, O. D. (1967). The American Occupational Structure. New York: Wiley. Bologne, J. C. (1996). Svatby. Dejiny svatebních obřadů na Západě. Praha: Volvox Globator. Disman, M. (1993). Jak se vyrábí sociologická znalost. Praha: Slon. Field, A. (2009). Discovering Statistics Using SPSS for Windows. Advanced Techniques for the Beginner. London: Sage. Hendl, J. (2004). Přehled statistických metod zpracování dat. Praha: Portál. Kerlioger, F. N. (1972). Základy výzkumu chování. Praha: Academia. Lorenz, K. (1991). 8 smrtelných hříchů. Praha: Panorama. Mertens, D. M. (1998). Research Methods in Education and Psychology. London: Sage. Mills, Ch. W. (2002). Sociologická imaginace. Praha: Slon. Nowak, S. (1975). Metodologie sociologických výzkumů. Praha: Svoboda. Petrusek, M. (1993). Teorie a metoda v moderní sociologii. Praha: Karolinum. Popper, K. R. (1974). Thesis in Defence of Science and Rationality. In Notturno, M. A. (Ed.), 17;e Myth of the Framework. London: Routledge. Rabušic, L„ & Mareš, P. (1996). Je česká společnost anomická? Sociologický časopis, 32(1), 175-188. Řehák, J. (1971). Definice měření ve společenských vědách. Sociologický časopis, 7(6), 639. Sirováíka, T, & Mareš, P. (2006). Poverty, Social Exclusion and Social Policy in the Czech Republic. Social Policy and Administration, 40(3), 288-303. Soukup, P., & Rabušic, L. (2007). Několik poznámek k jedné obsesi českých sociálních věd - statistické významnosti. Sociologický: časopis / Czech Sociological Review, 43(2), 379-395. Vaus, D. de. (1990). Survey in Social Research. London: Unwin Hyman.