overovali nové a nové varianty našich textů - dík za to, že to s námi vydrželi a že nám dávali důležité podněty o slabých místech v těchto textech. Dále patří velký dík našim dvěma recenzentům, prof. Janu Hendlovi a doc. Janu Řehákovi, za jejích detailní a cenné připomínky k našemu rukopisu - pokud však v textu čtenáři naleznou nedokonalosti, případně i chyby, není to v žádném případě vina recenzentů, ale pouze a toliko vina naše. A budeme pochopitelně našim čtenářům vděčni za jakékoliv podněty pro další zkvalitňování textu. Konečně velice poděkování patří našim kolegům, kteří svými opakovanými otázkami typu Tak kdy už to konečně vydáte? přispěli k tomu, že jsme původní soubor našich jednotlivých učebních textů vtělili do jednolitého celku a učebnici skutečně KONEČNĚ vydali.
Petr Mareš, Ladislav Rabušic, Petr Soukup V Brně a Praze v listopadu 2014
lez začneme
Jasnost je intelektuální hodnota; ne však přesnost a preciznost. Absolútni preciznost je nedosažitelná; je neúčelné chtít být přesnější, než to vyžaduje naše problémová situace.
Karl R. Popper
Aforismus o statistice aneb tři druhy lži: lež prostá, lež sprostá, statistika.
Benjamin Disraeli
:;: Memento na začátek
V tomto učebním textu se budeme pohybovat v diskurzu kvantitativního výzkumu, v tzv. kvantitativním paradigmatu. Připomínáme, že sociální vědy jsou vědami multi-
: paradigmatickými, což znamená, že vedle sebe koexistují různé vzorce a pravidla, jak dělat vědu, jak řešit její hlavolamy. Různost těchto vzorců je v podstatě dána tím, jak si jednotlivá paradigmata odpovídají na tři základní otázky: ontologickou, episte-mologicko'i a metodologickou. 1) Ontologická otázka se ptá, jaká je povaha reality, kterou zkoumáme. 2) Epistemologická otázka řeší, jaká je podstata poznání a jaký je vztah mezi tím, kdo poznává, a tím, co je poznáváno, 3) Metodologická otázka se pídí
: po tom, jakým způsobem se produkuje vědění, porozumění a pochopení. Na tomto zá-
:'kládě se dnes definují tři základní skupiny paradigmat: pozitivistické, interpretativní
: a emancipativni (Mertens, 1998).3
Kvantitativní paradigma má svůj vzor v přírodních vědách. Vychází z přesvěd-
: čení, že realita je vnější a objektivně poznatemá. Klade velký důraz na měření vlastností, to je na jejich kvantifikaci. Jelikož převážná většina vlastností lidského chování
V literatuře najdeme i další názvy: synonymicky s interpretativmm paradigmatem se objevují výrazy etnografické, fenomenologické, hermeneutické nebo naturalistické paradigma. Vedle emancipativniho paradigmatu nacházíme také výrazy feministické, participativní nebo kriticky teoretické paradigma.
MASARYKOVA UNiVEilZJTA
KAPITOLA 1
a lidského světa, jimiž se sociální vědy zabývají, jsou složitými konstrukty a entitami, musíme se ve výzkumu velmi často spokojit s měřením ne přímo těchto vlastností (nejsou totiž přímo pozorovatelné), ale s měřením jejich pozorovatelných indikátorů. Nemůžeme například přímo změřit vzdělanost jedinců, ale na jejich vzdělanost můžeme usuzovat z výše dosaženého vzdělání. Vzdělanost je v tomto případě vlastností, úroveň dosaženého vzdělání jejím indikátorem.
Nemožnost přímého měření vlastností sociálního světa je v sociálněvědním výzkumu zdrojem j istých potíží. Mnozí metodologové proto zdůrazňují - a my s nimi -, že jedním z klíčových momentů kvantifikace a měření v sociálních vědách je opera-cionalizace, tedy převod abstraktních konstruktů do měřitelných znaků. S operacio-nalizací je spojen důležitý prvek, a to otázka validity těchto operací, což je posouzení, zdali námi vytvořený měřitelný znak (indikátor) je dobrým a skutečným reprezentantem vlastnosti, kterou chceme změřit - proto se také validita definuje jako schopnost měřit to, co skutečně měřit chceme.
Operacionalizace je náročným tvůrčím procesem, v němž od sociálněvědních konceptů a jejich nominálních definic postupujeme přes odhalování jejich dimenzí a subdimenzí ke konkrétním operacím (operacionálním definicím), které nám říkají, co vlastně máme ve výzkumu zjišťovat a měřit. Názornou ukázkou nechť je příklad schématu operacionalizace, které použil de Vaus (1990) pro koncept (pojem) depri-vace - viz obrázek 1.1. Co z něj rozhodně stojí za zapamatování, je, že při zjišťování míry deprívace nevystačíme pouze s jedním indikátorem - de Vaus jich navrhuje zjišťovat devět, a to ještě použití škály introverze/extroverze a škály asertivity obsahuje zjišťování řady dalších údajů.'1
Operacionalizaci a měření vnímáme jako ústřední metodologické téma kvantitativního výzkumu. Jak konstruovat dobré, tedy validní a samozřejmě i dostatečně spolehlivé (reliabilní) měřicí nástroje a jakým způsobem měřit sociální vlastnosti, to jsou kardinální otázky kvantitativního paradigmatu. Podle zastánců paradigmatu kvalitativního jsou také zásadními - a z jejich pohledu jen obtížně překonatelnými -překážkami vědecké práce.5
Problém měření se navíc umocňuje tím, že velkou část našich kvantitativních dat získáváme na základě standardizovaných výpovědí, to je na základě standardizovaných rozhovorů tazatele se subjekty výzkumu. Standardizovanými výpověďmi rozumíme (i v dalším textu) výpovědi, které lze vyjádřit čísly (věk, příjem apod.) nebo číslicemi (přiřazenými jednotlivým variantám možných odpovědí), umožňujicími
Zájemce o detailnější vysvětlení problematiky koneeptualizace a operacionalizace odkazujeme např. na pasáže v učebnici E. Babbieho (Babbie, 2001, s. 119-145).
Není cílem tohoto textu tento spor posuzovat, dodejme potíže, že po letech původně nesmiřitelných diskuzí v poslední čtvrtině minulého století došlo nyní mezi oběma tábory ke smím a ke koexistenci, především prostřednictvím tzv. mixed metliods research, neboli metod smíšeného výzkumu, který kombinuje (směšuje) relevantní metody kvantitativního a kvalitativního výzkumu. Pro zájemce o metody smíšeného výzkumu může být dobrým úvodem kniha Advances in Mixed Methods Research: Theories and Applications editovaná Manfredem Maxem Bergmanem (Sage, 2008).
.almí v;.
Deprivatioi
Specification of what constitutes social isolation
Measures of soda! isolation
?. Number of friends
2. Contact with family
3. Number of organisation involvements
4. Contact with neighbours
1	f
Absence	□f socially
vaiued roles	
	
Specification	
of socially valued	
roles	
	r
Question to determine	
the roles of a particular	
respondent	
e.g. 1. Gender	
2. Occupation	
3. Marital status etc	
Physic
7K
Lack Df social skills
Specification of what social skills are
Question to determine respondents skiiis e.g.
1. Introversion/extroversion
scale
2. Assertiveness scale
Nomina! definition
Sub-dimensions
Operational definitions
Concept
Podie: de Vaus (1390), str. 52.
Obr. 1.1 Schéma procesu operacionalizace pojmu„deprivace"
jejich statistické zpracování. Klasickým příkladem standardizovaného rozhovoru je ■použití dotazníku, v němž jsou všem zkoumaným subjektům kladeny stejné otázky o ve stejném pořadí, přičemž je na ně možno odpovědět jen volbou (většinou) jedné z předložených variant možných odpovědí, označených číslicemi (např. otázka , jaké je vaše nejvyšší dosažené vzdělání" s možností zatrhnout jednu z nabízených variant: 1 - základní, 2 = středoškolské; 3 = vysokoškolské).6 Zde je dobré si připomenout, žc při takovém způsobu měření může docházet k celé řadě poruch, neboť zaznamenáváme pouze tzv. verbální (neboli symbolické) chování, z něhož usuzujeme na chování skutečné. Při práci s takto získanými daty je proto nutné si neustále uvědomovat, že mezi skutečným předmětem výpovědi (to je jeho vlastnostmi) a tím, co je obsahem výpovědi (co se sděluje), může být obrovský rozdíl. Platí zde proto základní poučka, kterou si dobře pamatujme: Výpovědi o realitě zdaleka nemusejí být realitou samotnou!
Metodologové sociálních věd se ovšem snaží tyto potíže intenzivně překonávat a snad můžeme konstatovat, že se to daří. Nicméně při formulaci jakýchkoliv závěrů z k víintitativního výzkumu musíme mít neustále na mysli (a musíme to i v našich publikacích sdělovat), že naše závěiy mohou být zatíženy nedokonalostmi naší operacio-nali/;ice a našeho měření. Permanentně tuto skutečnost reflektujme!
Permanentní reflexe však není úplně jednoduchá. Ve hře je totiž naše psychika. Po převodu vlastností do znaků (proměnných) a po záznamu jejich hodnot - tedy
Blíže viz oddíl 1.4.2, v němž hovoříme o proměnných.
KAPITOLA 1
NEZZAČNRMF
po vytvoření čísel a jejich nahrání do statistického softwaru počítače- dochází postupně k tomu, že těmto číslům začneme bezmezné věřit. Nastává jev, který označil Petrasek (1993, s. 92) jako tzv. durifikaci (ztvrzení) dat. Což znamená, že s daty postupně začneme pracovat jako s naprosto přesnými čísly, bezmezné jim věříme a výsledky neproblematizujeme. Může to vést dokonce až k jakési hyper-přes.nosti, kdy začneme uvádět (nereflektované!) výsledky na několik desetinných míst. Např.: „58,36 % respondenta nesouhlasilo s přijímáním imigrantů do zaměstnám"; „průměrná mírä pocitu anomie byla 2,856"; „souvislost mezi úrovní dosaženého vzdělání a příjmem respondenta měřená Spearmanovým pořadovým koeficientem je 0,4681". Osvícený výzkumník by samozřejmě hovořil o 58 %, průměr anomie by uvedl najedno desetinné místo (2,9) a hodnotu koeficientu asociace zaokrouhlil na 0,47 - a nedopustil by se přitom žádné redukce informace, spíše naopak,
Z metodologického hlediska je základem pro kvantitativní výzkum metodologie přírodních věd. Organickou součástí sociálněvědního kvantitativního výzkumu je statistická analýza dat. Jsme přesvědčeni o tom, že právě ve statistické analýze spočívá značná síla tohoto přístupu: umožňuje víceméně exaktně (samozřejmě při vědomí všech možných omezení, litera Icvantitativní paradigma v sobě skrývá) popisovat zkoumané fenomény, navíc často v jejich vývoji, prostřednictvím analýzy časových řad; skýtá možnosti explorovat fenomény nové a umí ověřovat teorie - to vše za pomoci exaktního matematicko-statistického aparátu. Jelikož často pracuje s výběrovými soubory, dokáže s relativně malými náklady zobecňovat (generalizovať) své závěry na velké populace, a přinášet tudíž zobecnitelné poznatky, jež je možné využívat v praxi. Rozvoj sofistikovaných postupů statistické analýzy, jejich přepis do počítačových programů a obecná dostupnost osobních počítačů vede k tomu, že i ty nejmodernější postupy jsou dnes přístupny prakticky každému výzkumníkovi, včetně studentů.
Právě zde leží podle našeho názoru obrovská potence, neboť moderní postupy statistické analýzy pomáhají odkrývat vztahy a souvislosti, které bychom jinak v datech nebyli schopni vidět. Jdou do latentních datových struktur, odhalují efekty působení nezávislé proměnné na proměnnou závislou, očištěnou od efektů dalších proměnných, umí smysluplně pracovat s kategorizovanými daty a tak dále, a to vše ve velmi krátkém čase. Tyto postupy pak vedou k výsledkům, které dříve nebylo možné nalézt a formulovat. Hlavní směr rozvoje postupů moderní statistické analýzy v sociálních vědách byl veden několika záldadními cíli: popsat a vysvětlit nějaký sociální jev znamená odhalit paralelní působení řady faktorů, které často mají hierarchický charakter.' Proto byly zavedeny nejrůznější modelovací techniky. Jelikož sociálněvědní data jsou velmi často data kategorizovaná - a s těmi toho statistika zatím mnoho nesvedla —,
7 V dalších pasážích této úvodní kapitoly čtenář možná nalezne pojmy, které mu nebudou zcela jasné. Není to jeho chyba, prosíme o strpení, postupně budou všechny vysvětleny v dalších kapitolách. Věříme, že to není ani chyba didaktická, jak by se v takovém případě u učebního textu mohlo zdát. Považovali jsme prostě za nutné na úvod sdělit naše zásadní stanovisko k problematice kvantitativní analýzy dat, byť s vědomím, že mnohé bude jasnější až po přečtení celého textu. Doporučujeme vrátit se k první kapitole po přečtení celé učebnice.
byly vyvinuty nové postupy pro analýzu kategorizovaných dat, které tento hen-dikcp překonávají (např. binární a logitová regrese, loglineární analýza). Většina těchto postupuje součástí běžně dostupných statistických programových balíku (sta-itisticalpackages). Možnosti statistické analýzy jsou tedy značné. Otázkou ovšem je, zdali je umíme dobře používat. A v tom spočívá, domníváme se, kardinální limit české ■ kvantitativní sociální vědy, sociologii nevyjímaje.
V Cechách, na Moravě a ve Slezsku působí zatím jen nemnoho badatelů, kteří umějí možnosti současné statistické analýzy plně využívat. Jednou z příčin je, že statistika bývá při studiu sociálních věd často obávaným předmětem, kterým je potřeba „nějak projít", bez ambice pochopit její smysl a kouzlo. Studenti se statistiky obávají - čísla jsou pro humanitně orientované osoby strašákem - a mnozí učitelé statistiky studenty tohoto strachu nejenom nezbavují, ale ještě jej zvyšují. A přitom, jak věříme, je možné naučit statistickou analýzu i ty studenty, kteří šli studovat sociální vědy právě z důvodu, že se báli čísel a - jak oni říkají - „matematiky". Možná právě způsob, jakým se v Česku učí kvantitativní metody výzkumu a analýzy, vede k tomu, že se dnes mezi studenty sociálních věd stal do značné míry módou výzkum kvalitativní (kvali-výzkum). Studenti se domnívají, zeje to výzkum lehčí, neboť je založen na analýze slov namísto analýzy čísel. Hluboce se však mýlí - takový výzkum není lehčí, neboť stejně jako kvanti- výzkum klade obrovské nároky na schopnost sociologické imaginace. Jsme pevně přesvědčeni o tom, že student, který nezvládne metodologii výzkumu kvantitativního a analýzu jeho dat, nebude ani dobrým výzkumníkem kvalitativním.
Aualýza studentských prací by nám jistě odhalila i to, že v českých sociálních vědách panují některé obsese, jichž je potřeba se urychleně zbavit. Uvádíme je níže -a jelikož jsme je s úpravami převzali od anglického kolegy, který má podobné pocity a zkušenosti (viz Blaikie 2003, s. 6-7), s jistou škodolibou útěchou konstatujme, že V.tom asi nejsme v Česku tak úplně sami,
a) Sociálněvědní výzkum musí vždy začínat s hypotézami.
b) Testy statistické významnosti (statistické sígnifikance) jsou esenciálním rysem analýzy dat.
c) : Zjištěná míra asociace nebo korelace mezi dvěma znaky (proměnnými) postačuje
k vysvětlení zkoumaného jevu.
::; Tyto poněkud radikální teze nyní rozviňme.
Ad a) Musí sociálněvědní výzkum začínat s hypotézami?
Jednoduchá odpověď zní: jak kdy. Argumenty jsou následující: -   Kažeý sociálněvědní výzkum musí mít na svém počátku nějaký problém, který je přeložen do zkoumatelné podoby formou výzkumné otázky (nebo několika vý-■;. zkiini vch otázek).
■-. Existuje několik typů výzkumných otázek: otázky „co", „kolik", „do jaké míry" po-pisují věci a jsou tedy typické pro deskripce. Otázka „proč" je otázkou na příčiny a je
KAPITOLA 1
i
Nľ7 7AC'NľMr
typická pro explanační (vysvětlující) výzkum. Otázka ,jak" je otázkou na sociálni mechanismy a je typická pro akční výzkum, pro intervenci.
- Pouze otázka „proč" vede badatele k výzkumu, který je založen (deduktivně) na teorii, a proto vyžaduje hypotézy.
- Existují dva druhy hypotéz: teoretické hypotézy, které jsou odvozovány z teorie a které nabízejí předběžné vysvětlení otázky typu „proč". Vedle toho jsou zde hypotézy statistické, které se používají k zobecňování výsledků z reprezentativního výběrového souboru na cílovou populaci,8 z níž byl výběrový soubor získán.
- Tento rozdíl mezi statistickou a teoretickou (výzkumnou) hypotézou není často akceptován a vede ke zmatku u začínajících výzkumníků.
- Teoretické hypotézy jsou relevantní pouze v případě, kdy hledáme odpovědi na otázku „proč"; statistické hypotézy j sou relevantní, když data pocházejí z pravděpodobnostního (náhodného) či randomizovaného9 výběru, při kterém mají všechny osoby v dané populaci na začátku výběru stejnou pravděpodobnost, že budou do zkoumaného výběrového souboru vybrány.10 Některý druh výzkumu může vyžadovat oba druhy hypotéz, některý může vyžadovat pouze jeden z typů; značná část výzkumu ovšem nevyžaduje ani jeden z nich. Co však každý výzkum musí mít, je výzkumná otázka!
- Určitý druh výzkumu hypotézami končí, místo aby jimi začínal (tzv. explorační výzkum).
Ad b) Jsou testy významnosti esenciálním rysem analýzy dat?
Nejdříve opět jednoduchá odpověď: ne, nejsou. Avšak v českých sociálních vědách (a nejen v nich) bohužel velmi často bývají.
Testy signiíikace jsou pravděpodobně nejhůře pochopeným aspektem statistické analýzy dat. Jsou součástí tzv. statistické indukce (nebo také inferenční analýzy či statistického usuzování) a používají se tehdy a jen tehdy, když pracujeme s pravděpodobnostním výběrovým souborem. Slouží k tomu, abychom z charakteristik výběru odhadli charakteristiky populace.
Inferenční analýza se využívá pro dva typy úloh: a) k odhadu charakteristik populace z dat výběrového souboru (odhadujeme např. průměrný příjem); b) ke zjištěním, zdali vztah (či rozdíl) nalezený ve výběru je možné také očekávat v populaci, z níž byl
Je zvykem hovořit často spíše o základním souboru než o cílové populaci, ale spolu s řadou daSších autorů rozlišujeme mezi cílovou populací jakožto souborem jednotek, na které chceme zobecnit své závěry, a základním souborem tuto cílovou populaci zastupujícím (ne všechny jednotky této cílové populace jsou totiž ve všech případech v daném okamžiku výzkumu dostupné). Randomizace jako náhodné přiřazování osob do zkoumaných skupin (experimentální a kontrolní) se často používá v klinickém výzkumu v medicíně či v psychologii, ale i v ekonomii, méač často v sociologii. Nikoliv tedy nahodilého!
vybírán (toto je důležité). Např. odhadujeme, zdali i v populaci platí, že existuje vztah mezi vzděláním respondenta a jeho intencí účastnit se kurzů celoživotního vzdělávání.
1'ivní typ infereněních úloh není v sociologii příliš častý; výzkumníci málokdy počítají pravděpodobnou hodnotu populační charakteristiky; často se používá tzv. bodového odhadu, kdy se prostě předpokládá, že hodnota výběrové charakteristiky bude stejná i v populaci (což ovšem není úplně v pořádku, měly by se počítat intervaly spolehlivosti). Druhému způsobu inferenční analýzy, testům statistické významnosti (jimiž jsou, jak uvidíme později, např. test chí-kvadrát pro nominální znaky, test významnosti pořadových koeficientů, t-test pro rozdíl dvou průměrů, analýza rozptylu pro rozdíl více průměrů) je naopak věnována velká pozornost a podle našich zkušeností jsou tyto postupy dokonce v české sociální vědě nadužívány, zneužívány a používány špatně (blíže k tomu viz Soukup & Rabušic, 2007). Je to proto, že je špatně pochopen jejich účel a smysl, takže se používají k operacím, pro které nejsou vhodné.
Badatelé a badatelky se zkrátka setrvačně domnívají, že jim testy významnosti řeknou, co je v datech důležitého, a že jim pomohou odhalit těsnost vztahu dvou proměnných. Dále jsou přesvědčeni, že tyto testy musejí být aplikovány na všechny výsledky bez ohledu na to, zdali data pocházejí z vyčerpávajícího zjišťováni (z censu), ■/. pravděpodobnostního (náhodného) výběru nebo z výběru nenáhodného (kvótního, záměrného, samovýběru).
Nic l toho ovšem statistická infercnce neumí. Z toho tedy vyplývá, že testy významnosti:
- nemohou v žádném případě sloužit k rozhodnutí, zdali je zjištěný výsledek vědec-ky nebo prakticky důležitý;
- nej sou míry asociace;
- jsou použitelné pouze tehdy, testujeme-li statistické hypotézy, a ty používáme :; pouze tehdy, když z dat pravděpodobnostního (náhodného) výběrového souboru
odhadujeme charakteristiky populace;
- mohou být aplikovány pouze tehdy, pracuj eme-li s výběrovým souborem, který byl vybrán z populace za pomoci postupů pravděpodobnostního (náhodného) výběru a návratnost (např. dotazníků) je relativně vysoká - měla by se, jak nabádá
■   Blaikie (2003, s. 167) pohybovat kolem 85%;"
- je mylné a chybné používat v případech, kdy výběr není pravděpodobnostní. A už .. žádný smysl nemá jejich použití v případě, kdy nemáme výběr, ale náš soubor je
i\. populací (např. když provedeme výzkum na všech žácích gymnázia v městě X);
-r nemohou být použity k testování teoretických hypotéz;
nemohou sloužit ke generalizujícím výpovědím za populaci, z nichž nebyl soubor vybrán. Například pokud provedeme pravděpodobnostní (náhodný) výběr
V současnosti se bohužel talc vysoké návratnosti dosahuje poměrně obtížně - k tomu viz např. článek J. Krejčího „Problém nízké návratnosti výběrových dotazovacích šetření" (SDA info 2, v listopad 2006 - dostupný z: http://archiv.soc.cas.cz/articles/cz/14/SDA-Info.html) nebo obsáhlejší Krejčí, J. (2007). Non-Response in Probability Sample Surveys in the Czech Republic. Sociologický časopis / Czech Sociological Review, 43(3), 561-587.
KAPITOLA 1
NrŽľAČKTMr
z populace všech studentů gymnázií v Brně (ze seznamu všech brněnských gymnázií bychom si udělali seznam všech tříd a z tohoto seznamu bychom vylosovali takový počet tříd, aby náš výběrový soubor měl dostatečný počet jednotek), naše závěry nemůžeme zobecňovat na všechny studenty brněnských středních škol (my jsme totiž dělali výzkum pouze na gymnáziích, přičemž víme, že existují ještě další typy středních škol), a už vůbec ne na studenty v jiných městech.
Ad c) Je zjištěná dvourozměrná míra asociace nebo korelace postačující pro vysvětlení?
Ne, není. Důvody jsou následující:
- Vysvětlením říkáme, proč něco existuje. Nalezení těsnosti vztahu mezi dvěma proměnnými je součástí deskriptivního výzkumu, neboť cílem deskripce je určit charakteristiky nějakého sociálního fenoménu, popsat jeho vývoj v čase a typické vzorce vazby na jiné fenomény.
- Nalezení vztahu mezi proměnnými a jeho změření prostřednictvím měr asociace a korelace je formou vyšší míry deskripce.
- Ačkoliv tato deskripce může posloužit k pochopení fenoménu (a někteří i tvrdí, že může sloužit jako základ k predikci), míry asociace nemohou přinést odpověď na otázku „proč", neboť otázka „proč" se ptá na příčiny. Asociace vyjadřuje pouze stochastickou (pravděpodobnostní) souvislost, nikoliv však souvislost příčinnou, kauzální.
- Nicméně, chceme-li vysvětlit nějaký jev, musíme nejdříve najít asociaci - neboť tam, kde není žádná stochastická asociace, nemůže být ani kauzální spojení.
Jak je vidět, dobře pochopená a osvojená statistická analýza dat může být klíčem k badatelsky platným výsledkům. Statistická analýza je mocným nástrojem, ale samozřejmě pouze v takových rukách, které vědí, jak na to. Při provádění kvantitativního výzkumu proto mějme stále na paměti zásady, na nichž musí být každý dobrý - f kvantitativní výzkum založen (viz Blahuš, 2000): \
1) Vědecká průkaznost výsledků výzkumu spočívá v logicky správném a metodologicky čistém designu výzkumu.
2) Design výzkumu nemohou nahradit žádné dodatečné statistické, byt' téměř akrobatické cviky s daty.
3) Vědecká průkaznost výsledků výzkumu nespočívá v jejich „statistické významnosti".
1.1 Logika kvantitativního výzkumu
V kvantitativním výzkumu pracujeme s hromadnými daty. Tato data jsme získali na základě designu výzkumu, který se odvíjí od naší výzkumné otázky. Ta vzniká většinou na základě naší touhy vysvětlit nějaký problém. Výzkumná otázka určuje, co sledovat, jaké vlastnosti měřit. V sociologii tato hromadná standardizovaná data (viz dále) získáváme většinou dotazníkovým šetřením na výběrových souborech (viz dále), kdy jednotkou dotazování je většinou jedinec, nebo ze statistických výkazů.
T)otazujeme-li se jedince, chceme:
zjistit jeho stav, identifikovat jeho měřitelné vlastnosti (například: je to muž, nebo žena?; jakou stranu volí?...) a míru těchto vlastností (jaké má vzdělání?; jakou mírou anomie se vyznačuje?; do jaké míry souhlasí s určitým názorem?...);
- klasifikovat jedince podle těchto zjištění do obecnější kategorie jednotek (volí le-vici, nebo pravici?; je liberál, nebo etatista?..,);12
- usuzovat z výskytu nějaké vlastnosti (intenzity vlastnosti) na jinou vlastnost (respektive její intenzitu);
- sledovat vývoj kvantifikovaných vlastností jedinců v čase.
Vlastnostmi neboli charakteristikami, kterými je jedinec popisován, nejsou jen jeho psychické Ht-ibuty a stavy dysy osobnosti, inteligence, neurotické stavy, emoční vyladění, frustrečni toie-M-ice), demografické rharaktpristiky (pohlaví, vek, pořrt drtí) a john zařazení do sori.ilní Mnilc rtury (sociální třída;; profese, velikost místabydlištěK či výrazy tohoto zařazení (sociální status, prestiž), alei jeho postoje a preference (volební preference, hodnotové orientace, míraxenofobie : či Fašismu, distance od jir.ych osob čí. sociálních skupin,;obliba určitých TV programů, religiozita či náboženská konfese, etati.smus či liberalismus, způsob tráveni dovolené), aktivity či jed nání (náplň volného času, účasť v sociálních hnutích, návštěvy kulturních akcí, účast na stávce),: vědomosti či míra informovanosti a stavy či podmínky, jimž je vystaven (nezaměstnanost, agónie, nemoc, dlouhodobý stres, deprivace) atd.
Rámeček 1.1 Vlastnosti jedince
V sociologii jsou ovšem údaje o jedincích jen přechodnou informací a slouží k Lomu, abychom získali informace o sociálních útvarech (skupinách, kategoriích, institucích), jejichž členy/členkami tito jedinci jsou. Nezajímají nás tedy ani tak naměřené
12 Na to se lze v prvním případě zeptat přímo (předložením škály se stupnicí a póly levice/pravice se žádostí, aby se na ni respondenti zařadili podle svých politických názorů), ale zařazení lze také opřít o klasifikaci jednotlivých politických stran jako levicových, pravicových či středových a jedince přiřadit k levici, středu či pravici podle jím volené strany. V druhém výše uvedeném případě se ptát přímo nemůžeme nejen proto, že mnozí z dotazovaných by neměli představu, na co se jich vlastně ptáme. Problémem by bylo i to, že ti znalejší by mohli používat vlastní definice liberalismu a etatismu - a my bychom nevěděli, co si vlastně pod těmito pojmy jednotliví respondenti představovali. Výzlaimník musí mít vlastni definici obou postojů a z ni odvozené otázky indikující jejich přítomnost u daného jedince. Na tuto skutečnost ovšem nesmi zapomínat ani při interpretaci svých výsledků. Nejde o liberalismus/etatismus obecně, abstraktně, ale o liberalismus/etatismus jím konkrétně definovaný.
KAPITOLA 1
hodnotyujednotlivých subjektů, ale tendence, která se v naměřených hodnotách projevuje u - z jistého hlediska - homogenních skupin či kategorií těchto objektů (u žen, u osob s vysokoškolským vzděláním, u osob s vysokou mírou anomie apod.). Míry závislosti či souvislosti mezi vlastnostmi jsou měřitelné jen v souborech objektů.
ilustrace.....
Měření souvislosti mezí pohlavím a vzděláním není na. úrovni jednoho subjektu smysluplné. Smysl dw.áyá ai na úrovni ..z jiitýci hledisek nomoge-in-ch souborů" subjekt j, kde můžeme konstatovat : nouíikí.jd: Meri nrznmfctiiarifmi (sojbor osob homnrjrmí 7 h pdis'<<-, jejich postavení na trhu nr.íre) ;e
■ /p/rUfľezan^ V případě souboru, skupiny chceme:
- zjistit stav vlastností jednotek, z nichž je soubor složen, identifikovat jejich vlastnosti (míru těchto vlastností), popsat je pomocí vlastností souboru a zjistit rozložení těchto vlastností v souboru: u kategorizovaných proměnných počty a podíly jednotek s určitou vlastností, intenzitou vlastností v souboru (například: kolík bylo ve sledovaném souboru lujíolíků aja/ýpodílvněm tvoří?...), u spojitých proměnných stanovit střední hodnoty (například: jaký je průměrný věk, příjem, ... v daném souboru?);
- hledat příčiny variability neboli hledat vztahy či souvislosti mezi vlastnostmi (proměnnými): pohlaví, vzdělání nebo věk, příjem, respektive vztah mezi pohlavím a vzděláním či věkem a prijmem (jak se mění výše příjmu v závislosti na vzdělání?);13
- sledovat vývoj lcvantifikovaných vlastností v souboru. Z hlediska sociologické metodologie zde lze použít opakované výzkumy, kohortní analýzu či panelová šetření (což jsou fonny longitudinálnlch výzkumů). Ke zpracování dat shromážděných těmito technikami má statistika vlastní nástroje, s nimiž se ovšem v rozsahu našeho textu seznamovat nebudeme.
1.2 Hromadná data
Kvantitativní výzkum soustředící se na to, jak mnoho (jaký podíl) něčeho ve společnosti existuje a jak něco s něčím souvisí, pracuje s hromadnými daty. V hromadnosti se projevují pravidelnosti, které u jednotlivých případů nemůžeme identifikovat (setká-váme-li se s jednotlivými případy, působí na nás dojmem obrovské proměnlivosti a individuálnosti), zatímco v hromadných datech existuj í j isté tendence. Například individuálně se můžeme setkat s velkou variabilitou příjmů a můžeme nalézt případy, kdy osoby se středoškolským vzděláním mají vyšší příjmy než některé osoby se vzděláním
NEŽ ZAČNEME
•• vysokoškolským.1-1 přesto v hromadných datech nepochybně zjistíme již zmíněnou tendenci: čím vyšši stupeň vzdělání, lim je mezi osobami, které ho dosáhly, vyšší ■ průměrný příjem.
Ilustrace
Lidé uzavírají sňatky v nejrůzriějších životních situacích as partnery s nejrůznějšími osobními i sociál-. nimi charakteristikami - v reálném životě se setkámese všemi kombinacemi podle výše vzdělání obou partnerů. Jakmile ale přestaneme posuzovat jednotlivé případy a začneme brát v úvahu větší počty, začnou se projevovat určité pravidelnosti, respektive nepravidelnosti) například tendence k homoga-rriii (to je tendence brát si partnera s analogickým sociálním statusem;vzdě!áním apod.). A zjišťovat-■ iťytcttendencejejednímz důiežitých.úkolů statistické analýzy hromadných dat...
Hromadná data se zpracovávají statistickou procedurou, jejíž obsah tvoří:
- výběr jednotek pro sledování (zjišťování jevii či charakteristik), /de se rozhodujeme, jaký druh výběru použijeme, zdali pravděpodobnostní, kvótní, záměrný apod.;
- zjišťování údajů (prostřednictvím pozorování a měření), většinou u velkého počtu jednotek (pozor: sama statistika nemůže nahradit konceplualizaci pojmů a konstrukci nástroje sběru dat). Zde měříme vlastnosti jednotek, které nás na základě naší výzkumné otázky zajímají;
- kontrola údajů, jak formálni, loje kontrola návratnosti a úplnosti údajů, tak i logická, kdy kontrolujeme nerozpornost údajů. Zde izv. „čistíme11 data;
■ získání informace o struktuře souboru v. hlediska jednotlivých sledovaných vlastností jeho jednotek. Třídění údaju ústící do informace o rozloženi jevů (třídění prvního slupne), popřípadě o rozložení kombinace jevů či charakteristik objektu (neboli třídění vyšších stupňu). Zde se již dostáváme do oblasti statistické analýzy;
- výpočet statistik (středních hodnot charakterizujících rozložení hodnot proměnných, koeficientů asociace charakterizujících silu, respektive směr vztahů mezi
■ proměnnými) a sledování časové (časové řady) i věcné (testování významností rozdílů a shody) proměnlivosti jevů:
- vyjádření rozložení jevů (charakteristik) v tabulkách a grafech, časových řadách; relační neboli vztahová analýza (hledající souvislosti), která může býl. jednoduchá a vícefaktorová nebo také kauzální (hledající příčinné závislosti);
- statistická verifikace hypotéz, rozoř, jde o verifikaci opcracionalizovaných hypotéz, které lze dosáhnout jen s určitou přesnosti určitou pravděpodobností chyby. Není verifikací věcnou!
- inlerenčni statistika (statistická indukce) neboli zobecnění výsledků našeho výběrového souboru na cílovou populaci, z níž byl vybrán (jde o pravděpodobnost platnosti našich výsledků i v cílové populaci, samozřejmě za předpokladu, že pracujeme s reprezentativním výběrovým souborem).
Problém závislosti statistické a kauzální jsme již otevřeli v úvodu tohoto textu. Blíže bude popsán v kapitole o měření statistické souvislosti. Dopředu pouze upozorňujeme, že raluvíme-li v tomto textu o vztahu, nemáme ve většině případů na mysli vztah kauzální (příčinný).
i4  Nezapomeňme ovšem na možnost intervence dalších faktorů do vztahu dvou vlastností (proměnných), to je mezi výší vzdělání a výší přijmu. K tomuto problému se ještě dostaneme, zde jen .   připomeňme, že je třeba vzít v úvahu působeni přinejmenším třetího faktoru, jímž je věk jedince. : To je příklad uváděný Dismanem (1993, s. 24) jako dvojí příčina nebo také nepravá závislost.
KAPITOLA I
r-JfcŽ ZAČNbMB
Pro sběr hromadných dat je v sociologii typický zejména survey - nejčastěji používané dotazníkové šetření (vedle například rutinně shromažďovaných statistik nebo panelových šetření) na výběrovém souboru. Bliže k logice survey a postupu při něm viz například de Vaus (1990).
13 Soubory a způsoby wýběru jednotek
Již bylo řečeno, že data pro statistickou analýzu většinou shromažďujeme standardizovaným způsobem. Máme-li je statisticky zpracovat, musejí mít standardní podobu a musejí být zaznamenána jako čísla (neboli kardinální proměnné) nebo číslice (proměnné ordinální a nominální). Navíc bychom si měli uvědomit, že jen málokdy pracujeme s vyčerpávajícími šetřeními zahrnujícími všechny dostupné členy dané cílové populace neboli se základními soubory. Každý výzkum vyžaduje určení okruhu zkoumaných jednotek (osob), tedy určení „zkoumané populace". Jestliže říkáme, že se naše „zkoumání zaměří" na určitý soubor jednotek, máme na mysli většinou širší množinu jednotek, než postihne naše výzkumná činnost. Je to tzv. cílová populace {generál universtim/population). Cílová populace představuje okruh osob (soubor jednotek) vymezených nějakými sociálními či demografickými vlastnostmi, pro který chceme vyslovit závěry. Toto vymezení cílové populace může být různé a určuje i její velikost (zahrnuje všechny jednotky s vymezenými charakteristikami).
. ilustrace^;.
(Ibvo.i pooulaci irjže tvořit -1103 stucionta. kteří navitčyu.i Fakultu sociďhith .stud i v Brró; nebo -.o niyhou být v5tích:iy ieny. kťrij poručily v roce 200B v porodnici nésta X své dítě; příjom.-i luciolnici d,ivo:< .•. tívjlým bydliitC-n- v Ostravě; obýyatějeteléčŔ ve:věku 15^65 leť, ekonomicky akťvní obyvatelé ČR, ohyvnieló ČR r. volabnín pnWr-Ti npod.1''
Určení zkoumané populace je dáno především naším výzkumným Icmalem. Většinou přímo nezkoumáme, nemusíme zkoumat a mnohdy ani fyzicky zkoumat nemůžeme celou cílovou populaci - kdybychom tak učinili, provedli bychom tzv. vyčerpávající zjišťování neboli census. Proto převážně pracujeme s výběrovými soubory (samples), které jsou tvořené jednotkami vybranými podle určitých kritérií z cílového souboru, provádíme tedy výběrová šetření.16 Jednotky pro náš výzkum vybíráme obvykle tak, aby byl výběrový soubor pro základní soubor reprezentativní.
15 Všimněme si, že vymezení cílové populace vyžaduje často definici (co rozumíme ekonomickou aktivitou, jak je vymezeno volební právo, jaké sociální dávky máme na mysli apod.).
" Způsoby, jak tyto jednotky vybíráme, aby byl náš soubor reprezentativní, zde nepopisujeme, čtenář se s nimi může seznámit v publikacích věnovaných sociologické metodologii, jako jsou například Babbie, 2001, de Vause, 1990 či Diaman, 1993.
Reprezentativnost znamená dvojí věc:
. - Výběrový soubor má strukturu analogickou strulctuře cílové populace - z hledis-: V: ka známých i neznámých charakteristik jeho prvků -, což ovšem zajistí jen jejich pravděpodobnostní (náhodný) výběr (viz například Babbie, 2001 nebo Disman, IW),
- Výsledky v něm zjištěné proto mohou být zobecněny na cílovou populaci. Co pla-■    tí ve výběrovém souboru, platí i v cílové populaci. Takové zobecnění je možné ovšem jen za dodržení určitých podmínek při výběru jednotek - při dodržení pravidel pravděpodobnostního (náhodného) výběru.
Znovu připomínáme, že zobecnění je možné jedině pro cílovou populaci, z níž byl výběrový soubor vybrán, a pro žádnou jinou. Na to často autoři zapomínají, a proto se lze setkat i se statěmi, které mají například tendenci vypovídat o povaze sexuálního života české populace na základě dat získaných mezi klienty sexuologických ordinací a poraden. Potíž u takovýchto závěrů spočívá jednoduše v tom, -že klienti sexuologických ordinací, byť by byli vybráni na základě všech pravidel pro reprezentativní výběr (tj. i kdyby všechny jednotky cílové populace - zde je možná na místě hovořit o základním souboru cílovou populaci zastupujícím -měly stejnou pravděpodobnost být vybrány do souboru výběrového), prostě nejsou reprezentanty pro výpovědi o sexuálním chování české populace, nýbrž pouze pro výpovědi o sexuálním chování souboru klientů poraden a ordinací (se všemi jejich zvláštními charakteristikami).
Proto pozor: před získáním výběrového souboru musíte vždy vymezit cílovou populaci, a to není vždy tak jednoduché, jak by se na první pohled mohlo zdát.
:jÍustrScé--.
gffclze škourriat hodnotu mateřství jen v souboru žen s dětmi, ani jenv souboru žeň vdaných. Můžěme: se sanwrjnv' n,i rulo c ilovi.i.. popi..l<«i oiw/U. <iIľ i;<ik >i nusime být vsoumi -IrniUt svých vyved •m. inl;ý by asi být: příspěvekk poznání toho,,jakouHbdnbtú má dítě pro žébú", bez dotazován'žen, kte*é dítě chtějí.    nit nemetou (neplodnost, zdravotní problémy), či žen, které mít dítě přůararriově odmítají?
; Upozorňujeme také, že z jedné cílové populace, respektive z jednoho základního souboru lze učinit celou řadu výběrů (k této otázce se dostaneme podrobněji v pasážích věnovaných testování hypotéz a inferenční statistice). Závisí to na velikosti ;obou, nebo lépe na poměru jejich velikostí.
kapitoi a i
1.4 Měření
Chceme-li analyzovat výzkumná data, musíme je nejdříve získat. Ačkoliv se kolem nás pohybuje obrovské množství dat, která jsou již někde uložena a dychtivě čekají, abychom je dále zpracovali,17 ne vždy jsou po ruce data taková, abychom mohli vyřešit naši výzkumnou otázku. Proto musíme jít často do terénu a vlastní výzkumná data získat, tj. musíme fenomény, s nimiž budeme operovat, změřit.
Již Galileo G'alilei ľormulával na' přelomu 16. a 17. století pro vědu požadavek měřit všechno, čó je měřitelné, a snažil sé učinit měřitelným vše, co dosud měřitelné není.
Tento přístup vedl v přírodních vědách v 18. století, a zejména v 19. století k revoluci poznám. Není divu, že učaroval i mnoha sociálním vědcům. V pozitivistické empirické sociologii bylo měření od počátku chápáno jako jediná záruka vědeckosti jejích výsledků. Tento radikální požadavek je dnes již minulostí, model poznávání sociální reality skrze měření ovšem (a to je dobře) mrtvý není. Jen se musel tváří v tvář kvalitativním přístupům zříci monopolu, který byl nejzřetelněji zformulován a uplatňován v 30. až 50. letech dvacátého století.18
Základním předpokladem měření v sociologii je, že sociální objekt či jev, respektive jeho atributy (vlastnosti) jsou popsatelné pomocí čísel nebo číslic, které jsou jim připsány v procesu měření. Tyto číselné vlastnosti ovšem objekt nemá de facto - jsou mu připisovány teprve v tomto procesu.
Měření lze jednoduše definovat slovy klasika měření Stanleyho Stevense - litery vlastně jen parafrázoval definici jiného klasika měření, Normana Campbella -jako přiřazování čísel objektům a jevům podle pravidel. Český statistik Jan Řehák tuto definici rozvinul a formuloval ji následovně: „Měření je proces realizace homeo-morfních zobrazení empirického systému s relacemi do jednoznačně určeného abstraktního systému s relacemi" (Řehák, 1971, s. 646)."
Celý proces měření lze znázornit jednoduchým schématem (viz obr. 1,2). Popíše-me-li jej slovně (a zde si vypůjčujeme formulace Řeháka), pak říká: Pozorovatel měří vlastnosti objektu měření tak, že mu přiřazuje hodnoty měřicí stupnice (škály) pomocí měřicího přístroje a měřicích postupů v určitém prostředí měření. Z toho vyplývá,
Data např. leží (v agregované podobě) na statistických úřadech (v Českém statistickém úřadě, v evropské databázi Eurostat, datové databázi OSN atd.) nebo jsou - jako primární data - uložena v datových archivech sociálněvědnich výzkumů a čekají na sekundární analýzu, to je na nové zpracování. Blíže k tomu viz přílohu, která obsahuje internetové linky aktuální v době vydání této publikace.
Upozornění na limity tohoto přístupu naleznete již v klasické práci Charlese Wrighta Millse Sociologická imaginace z roku 1959 (česká vydání v letech 1968 a 2002). Ostatně jeho stať o měření nazvaná „Definice měření ve společenských vědách", kterou publikoval v Sociologickém časopise v r. 1971, stojí rozhodně za přečtení.
i\T7 7AČNfMF
Obr. 1.2 Obecné schéma procesu měření
fpróStředírněřent!; - OBJEKT MĚFÍĚŇÍ
■■'—'■■v
MĚŘICÍ STUPNICE
.MĚŘÍCÍ PŘISTROJ, (prostředek) :  :   á MĚŘICÍ POSTUPY    ■. :
. ■ .'a .;
POZOROVATEL
Podle: Řehák (1971), str. 639.
že abychom mohli úspěšně měřit, musíme míl 1) jednoznačně určenou stupnici, jejímž prostřednictvím měříme; 2) musí být zkonstruován reliabilní a validní měřicí přístroj ä musíme vědět, jaké jsou adekvátní měřicí postupy; 3) musí být maximálně eliminován vliv prostředí a 4) musí být maximálně eliminován vliv subjektu pozorovatele na výsledek měření. Žádná z těchto podmínek není triviální a v sociálních vědách může být vážnou překážkou měření. Pro ilustraci: Jak bychom asi v tomto kontextu změřili míru individuálního blaha (tzv. well-being), která, j ak naznačují někteří ekonomové, by mohla sloužit jako obecný ukazatel celkové ekonomické úspěšnosti a ekonomického pokroku společnosti? Na měření blaha přece nemáme ani žádnou reliabilní stupnici, ani validní měřicí prostředek a rovněž by se poněkud obtížně eliminoval vliv prostředí (pokud by
"y době měření ve společnosti převažovala „blbá nálada", byly by výsledky zřejmě jiné, riež kdyby panoval duch veselí a optimismu).
Znovu jsme se tak obloukem dostali k problematice operacionalizace. Teoretický rozbor našeho konceptu a určení j eho dimenzí a subdimenzí po vzoru de Vausova schématu (viz obr. 1.1) by nás jistě přivedl k formulaci adekvátních a validních indikátorů a ke způsobu jejich měřeni - vždyť přece ve vědě je vše měřitelné, a co není měřitelné,
"se měřitelným musí učinit!20
1.4.1 Koncepty a jejich operacionalizace - indikátory
Gliceme-li nějaký jev změřit, musíme vědět, jak je daný jev vymezen, ohraničen, definován. Musíme tedy mít jeho koncept a jeho definici. Když budeme zjišťovat ;: např; podíl nezaměstnaných v ekonomicky aktivní populaci (míra nezaměstnanosti), -.musíme mít definici nezaměstnanosti - kdo je za nezaměstnaného považován. Definic
!* :A skutečně, základní kroky již byly v tomto ohledu učiněny - viz zprávu: Stiglitz, J., Sen, A., j ,&Fitoussi J.-P. (2008). Issues paper— Commission on the Measurement of Economic Performance ■;'.; and Social Progress, která je dostupná na: http://www.stiglitz-sen-fitoussi.li/en/index.htm.
KAPITOLA 1
NEŽ ZAČNEME
konceptu může být ovšem více - ostatně v sociologii jakožto multiparadigmatické vědě je to jev docela častý. Můžeme např. použít definici formulovanou Mezinárodní organizací práce (ILO), která je základem oficiálního určení nezaměstnaných osob v zemích EU, a tedy i v České republice:
Definice ILO považuje za nezaměstnané ty osoby {v metodice Eurostatu ve věku 15-74 let), které: a) v referenčním období neměly zaměstnání, b) neodpraco-valy ani jednu hodinu za mzdu nebo odměnu a c) aktivně hledaly práci, d) do které by byly schopny nastoupit nejpozději do dvou týdnů ode dne zjišťování.
Ještě ilustrativnějším příkladem toho, že se neobejdeme bez úvodní definice, může být zkoumání chudoby. Jaké osoby máme do svého výzkumného souboru zahrnout (kdo je vlastně chudý, a tudíž předmětem našeho zájmu)? Osoby s příjmem pod hranicí stanoveného životního minima? Nebo domácnosti vydávající více než 30 % svých příjmů na potraviny? Či osoby s příjmem nedosahujícím 60 % mediánu příjmového rozložení v dané zemi (což je definice Eurostatu)? Anebo osoby či domácnosti dosahující určité hodnoty na indexu deprivace? Popřípadě osoby, respektive domácnosti, které se deklarují jako chudé (což je tzv. subjektivní chudoba)? To vše jsou příklady definic chudoby a nejde vůbec o jejich vyčerpávající výčet.21 Chudobu tedy nikdy nezkoumáme samu o sobě, vždy půjde o její určitý koncept. Proto budeme-li analyzovat data o chudobě, nebudeme vypovídat o chudobě jako takové, ale o chudobě, jak jsme ji definovali (nebo podle definice chudoby, kterou jsme přijali). Tento aspekt sociálních věd mějme neustále na paměti, když vypovídáme o sociálních jevech, které zkoumáme - to znamená, řečeno jinými slovy - při interpretaci výsledků našich analýz.
V sociálních vědách se celá věc ještě komplikuje tím, jakjsme již uvedli na začátku této kapitoly, že vlastnosti jednotek často nejsme schopni měřit přímo, takže musíme měřit pouze indikátory (ukazatele) těchto vlastností.22 Například politickou orientaci jedince z hlediska levice či pravice jsme schopni určit na základě toho, jakou volil stranu v parlamentních volbách. A to ještě pouze na základě jeho výpovědi.
Při měření jevů (konceptů, indikátorů) měříme různé aspekty:
1. Intenzitu vlastností zkoumaných jednotek výzkumu a také vlastností objektů
vnějšího světa, který je obklopuje (kontextuální vlastnosti - podmínky). V zásadě
ale zjišťujeme:
21 Čtenáři by se velmi podivili, kdyby porovnali výsledky získané různým mířením chudoby a předpokládali, že všechna měří totéž - chudobu jakožto jakýsi esenciální stav. Podle definice Eurostatu (tzv. příjmová chudoba) bylo v roce 2001 v České republice asi 8 % chudých, měřeno ale dotazem na pocit chudoby (tzv. subjektivní chudoba) jich bylo 36 % (Sirováika & Mareš, 2006). Podobně bychom ale dopadli při měření v jiných evropských zemích.
22 Hledáme něco, co indikuje existenci nějaké vlastnosti, která sama o sobě není pozorovatelná. Čtenáři si to mohou samí zkusit, chtějí-li „změřit" lásku svého partnera, respektive své partnerky. Ríkají-li si „miluje mě", z čeho tak usuzuji - z jakých jeho/jejích projevů?
i - jaká je intenzita nějaké vlastnosti nějakého zkoumaného jevu (objektu) v určitém
okamžiku;
- k jaké změně intenzity vlastností došlo v nezměněných podmínkách v určitém čase;
- k jaké změně intenzity určité vlastnosti došlo v podmínkách, které se v určitém čase známým způsobem změnily.
2. Distance objektů (vlastností), což je ve svém primárním významu geometrický po-;                jem, konkretizovaný v teorii měření metrickou veličinou délky. Tato distance může
být měřena i v určitém konstruovaném prostoru, j ak j e tomu v případě prostoru zna-i ků postulovaném Lazarsfeldem (Bartoň, 1955), v sémantickém prostoru, či v pro-
storu vytvářeném technikou faktorové analýzy. Ve svém sekundárním významu jde i o vztah mezi dvěma bezprostředně sousedními škálovými hodnotami, který je nu-
mericky reprezentován jako jejich rozdíl, vyjádřený v absolutních hodnotách.
3. Závislosti (asymetrický vztah) či souvislosti (symetrický vztah) mezi dvěma ;                vlastnostmi zkoumaných jednotek (to je subjektů či objektů výzkumu) či mezi
dvěma jevy, respektive mezi proměnnými, jež je reprezentují.
4. Globální vlastnosti souborů (například průměrný věk okresů ČR, průměrný příjem vzdělanostních skupin, porodnost v zemích EU apod.).
í 1.4.2 Proměnná
Kvantitativní sociákěvědní výzkum může nalézt řešení jen pro problémy, které je možno popsat v termínech vztahu mezi pozorovatelnými proměnnými. Proměnné před-
; stavují logicky uspořádané charakteristiky/vlasmosti zkoumaných jednotek (hodnoty
proměnných). Dovolují zkoumané jednotky podle jejich vlastností pouze zařadit do kategorií (nominálni proměnné - např. pohlaví, umožňující jednotky zařadit mezi muže
í nebo ženy), nebo je zařadit do kategorií uspořádaných podle nějaké míry (ordinální
proměnné - např. vzdělání, umožňující jednotky zařadit do kategorií seřazených podle stupňující se míry dané vlastnosti, mezi absolventy pouze základního vzdělání, absolventy středních škol a absolventy vysokých škol) nebo určit číselně intenzim, jakou daná vlastnost nabývá (spojité neboli kardinální proměnné - např. věk, příjem apod.).23
Ilustrace
,:' Ku/, c zena jsou vlas;ns:sri latirihuU-.) .•! sou asné hocHoty (yc',W<i prorrónnŕ ivnňabU') nazýváno
i...- ::: „pohlaví".Tyto dvó vlastnosti prrďitwujíobor moznýrh hodnot toto promoklo I Y'j: vni irvity).
- . Zamóstn.iný n nezaměstnaný orcdstavuji dvó vlastnosti n současně dvě hodnoty oroměrné,..po
stnvonírř! trhu prácol ■ :. ■■■■ . - .Vzdělání základní, středoškolské a vysokoškolské představují' Ir", vlastnosti a současné tři hod-
noty proměnné nazýváno „ivjvyš5; doražené vzdékini". Jak pronvm-ou konstruujeme, závisí
j 25  Někdy se namísto výrazu „proměnná" používá výraz „znak". Pojem znaku se často používá
tehdy, jestliže je kladen důraz na to, že něco znáči, zastupuje (nějakou vlastnost, stav apod.).
;j Pojem proměnné používáme tehdy, když se naše úvahy koncentrují na to, jak se tento znak mění,
jakých hodnot sledovaný objekt nabývá.
KAPITOLA 1
NEŽ ZAČNEME
na našich výzkumných otázkách. Proměnnou „vzděláni" si jistě dovedeme představit i s jh ným počtem hodnot (variant). Například ve variantě základní vzděláni můžeme odlišit ty, kdo základní vzdělání nedokončili, od osob s dokončeným základním vzděláním, nebo v rámci vysoko :  školského vzdělání můžeme rozlišit stupeň bakalářský a magisterský. V případě; že budeme chtít srovnávat vzdělání v různých zemích; musí být mezi nimi dosaženo shody o obsahu jednotlivých; .. kategorií.(jejich.standardizace). I: v rámci;pouhé Evropy se totiž školské soustavy jednotlivých^ : zemí vyvíjely různým způsobem, takže je nutná společná metodika, jak absolventy různých typů škol na škále nejvyššího dosaženého vzdělání umisťovat; K tomu slouží Mezinárodni standardní klasifikace Vzdělávání neboli ISCED (International Standard Classification of Education). Vydalo ji UNESCO v roce 1976 a od té dobyje pravidelně aktualizována. V současnosti se používá verze :.z roku: 1997, která má 7 úrovní vzdělávání, v knždó z nich je. navíc ještě vnitřní: členění A až C." V České republice ji používá například Výběrové šetření pracovních sii, prováděné Českým statistickým úřadem, běžně se používá ve velkých komparativních výzkumech (například European Social Survey nebo European Values Study zahrnujícím většinu evropských zemí),
- Silný souhlas, souhlas, nesouhlas a silný nesouhlas s privatizací představují čtyři vlastnosti a: sout časně hodnoty proměnné nazývané„postoj k privatizaci" apod.
Složité vlastnosti lidí jsou takto převáděny na relativně jednoduchý soubor informací. Člověk se tak jeví jako statistická jednotka (nositel statistické informace), jako nositel těchto proměnných, lópc řečeno jako nositel určitých vlastnosti uvnitř daných proměnných. V kvantitativním výzkumu je člověk:
mužem či ženou {proměnná pohlaví);
- osobou s určitým počtem lot (proměnná věk);
příslušníkem vyšší, střední či nižší třídy (proměnná sociální třída);
- osobou s určitou výší příjmu (proměnná příjem); vlastníkem určitého statku (proměnná vlastnictví tohoto statku);
- osobou s určitým dosaženým vzděláním (proměnná vzdělání); příslušníkem nějaké profese (proměnná profese);
- residentem v určité komunitě (proměnná bydliště);
- potenciálním nebo i reálným voličem jedné /. politických stran (proměnná volební preference);
- jedincem, který nějak tráví svůj volný čas (proměnná struktura volného času); osobou, která má určité postavení na. trhu pníce   má či nemá placené zaměstnání (proměnná ekonomická aktivita);
nositelem určitého postoje či názoru (proměnnou je postoj: například nesouhlas se snahou vlády zvyšovat daně);
- sociálním aktérem (proměnná akce: například účast na antiglobalistické demonstraci, volební účast   účastní se/rie/účasíní se voleb; apod.
ISCED (International Standard Ciassification of Education) je nástrojem, který vyvinulo UNESCO pro porovnávání indikátorů a statistik vzdělávání ve svých členských zemích, který bere v úvahu rozdíly jejich vzdělávacích systémů. Více informací najdete v knize Cesta k datům (Soukup, 2012) nebo přímo na http://www.uis.unesco.org/Education/Pages/international-stan-dard-classification-of-education.aspx. Uživatelskou příručku pro zaváděni ISCED 97 v zemích OECD vydaí v roce 1999 Ústav pro informace ve vzdělávání, Praha.
1.4.3 Typy škál - proč jsou důležité
Při měření používáme měřicí stupnice (měřicí škály). Tím se rozumí obvykle číselná stupnice, předem daný jednoznačný systém, jehož hodnoty jednoznačně odpovídají úrovním měřené vlastnosti. Měřicí stupnice bývá určena svým měřítkem nebo jednotkou a způsobem uspořádání svých hodnot. Pod vlivem Stanleyho Stevense rozlišujeme různé úrovně měření, což závisí na tom, jaký je vztah mezi tím, co se měří, a číslem, které reprezentuje výsledek měření. Tyto úrovně (škály) měření jsou: nominální, ordinální a kardinální (a ty se ještě dělí na intervalové a podílové). Podle těchto úrovní potom rozeznáváme proměnné nominální, ordinální a kardinální. ^ 0 ^(
Nominální proměnná je taková, jejíž hodnoty jsou kategorie označené číselnými kódy, které jim výzkumník arbitrárne přiřadil. Příkladem nominální proměnné jsou např. barva vlasů (1. černá, 2. kaštanová, 3. rezavá, 4. blond), okresy ČR, druhy zaměstnání. Jednotlivé kategorie nominální proměnné, byť mají číselná označení, není možné uspořádat do pořadí, neboť přiřazené číslo je pouhým symbolem a v žádném případě neoznačuje množství měřené vlastnosti - objekty zde můžeme pouze přiřazovat do číselných kategorií podle předem stanovených pravidel, vxěi/s >'■ !V6!/yi
Ordinální proměnná je taková, jejíž kategorie lze uspořádat do pořadí. Takže zatímco u kategorií nominální proměnné pouze zjišťujeme, zdali se jednotlivé kategorie vyskytly, nebo ne, a pokud se vyskytly, pak jak často, o kategoriích ordinální proměnné jsme schopni říci, která je v pořadí výše nežjiná. Příkladem ordinální proměnné je míra spokojenosti (stupnice může mít podobu: 1. velmi spokojen, 2. spokojen, 3. nespokojen, 4. velmi nespokojen), stupeň dosaženého vzdělání, výsledky v soutěži krásy. Pozor tedy: ordinální stupnice zobrazují pouze pořadí, a nikoliv stupeň odlišnosti - nedokážeme zde totiž určit, o jaké množství spokojenosti se liší „velmi spokojeni" od „spokojených", byť číselná řada by nezkušenému výzkumníkovi sugerovala, že jde o rozdíl/množství jednoho stupně. HowdHSW'ľ <- *&T- M.6n<£i
Kardinální proměnná je taková, jejíž číselné kategorie již vyjadřují skutečné množství sledované vlastnosti (číselné kódy tedy nejsou arbitrárni). Jednotlivé kategorie této proměnné jsme proto nejenom schopni seřadit do pořadí, ale umíme i říci, o kolik (o jaké množství) se liší. Kardinální proměnné rozdělujeme na proměnné intervalové (jejich stupnice nemá přirozenou smysluplnou nulu) a proměnné poměrové (s existencí přirozené nuly) - poměrové proměnné jsou snem každého sociologického kvantitativního výzkumníka. Je to tím, že unich jsme schopni říci nejenom, o kolik se kategorie liší, ale také kolikrát je nějaká kategorie vyšší než jiná (je to dáno právě tím, že poměrové škály mají přirozenou nulu). Příkladem kardinální proměnné je věk, příjem respondenta, počet dětí, které žena porodila, apod. V jemnějším pohledu lze kardinální proměnné ještě členit na diskrétní, tedy takové, které mohu nabývat pouze určitých hodnot - většinou to jsou celá čísla, příkladem je počet dětí -, a na jejich opak, tedy proměnné spojité {continuous), které mohou, jak naznačuje název, nabývat jakýchkoliv hodnot: např, věk člověka může být měřen — podle potřeby přesnosti -nejenom na roky, ale i na dny, sekundy, popřípadě mikrosekundy a nanosekundy...
Zvláštním případem je proměnná, která nabývá pouze dvou kategorií. Označuje ne jako proměnná dichotomická (nebo také binární). Příkladem je muž x žena, zamestnaný x nezaměstnaný, živý x mrtvý apod. Chování dicholomických proměnných je trochu zvláštní./, pohledu metodologie jde o nominální proměnnou, ale pokud užíváme zavedených kódovacích schémat (často 0 vs. I či 0 vs. 100), lze s ní ve statistice často operovat jako s proměnnou kardinální.
Rozlišovat úrovně měření a druhy proměnných je velmi důležité, neboť na druhu proměnných jsou závislé štatistické operace* klére míižěme s daly provádět. ideálem pro statistiku jsou pochopi tel ně proměnné kardinální, neboť umožňují nejvyšší množství statistických operací. V sociálních vědách jich ovšem není příliš mnoho, velmi často se pohybujeme poúzě v oboru proměnných ordinálnícha nominálních:
Typy proměnných je třeba doplnil ještě o jednu důležitou klasifikaci, a to o proměnné nezávislé a závislé. Základem pro toto dělení již není množství vlastnosti a způsob měřeni, ale úvaha o lom. co je „příčinou" a co „následkem". Když hledáme souvislosti nic/.i jevy, obvykle začínáme úvahou o vztahu dvou jevů, dvou proměnných. Přitom předpokládáme, že jeden jev je příčinou, druhý následkem. Proměnná reprezentující v našich úvahách (v naší hypotéze) příčinu je proměnná nezávislá (independent variable), proměnná reprezentuj ící uvažovaný následek je proměnná závislá (dc.pendcnt vatiablá). Např. hledáme-li vztah mezi pocitem štěstí a věkem, můžeme formulovat předpoklad, že mladší lidé budou v průměru šťastnější než senioři, loje že s rostoucím věkem se bude snižovat průmětný pocit štěstí. Rozlišit nezávisle a závisle proměnnou není obvykle problém.; pokud si nejsme jisti, vezměme v úvahu časový průběh: v našem případě pocit štěstí prostě nemůže hýl nezávisle proměnná, pocit štěstí nemůže být příčinou určitého věku.'-5 V analýze dal se bez rozlišováni nezávisle a závisle proměnných neobejdeme, Hcndl dokonce říká, že „výzkum začíná určením nezávisle a závisle proměnných,.." (Hcndl, 2004. s. 40).
Při měření sc pochopitelně můžeme dopustit řady chyb. Ostatně základní teorie měření (anglicky true score theorý) s chybou počítá, neboť říká, že každé měření sestává ze dvou (aditivních) složek: ze skutečné správné hodnoty a z chyb měření. Vyjádřeno jednoduchým vzorcem:
X^T+e,
25 Někteří autoři namítají, že tato klasifikace je patřičná pouze pro experimentální výzkum, v němž jsme schopni manipulovat s příčinami: experimentátor vystavuje subjekty experimentu různým podnětům - nezávisle proměnným - a zkoumá jejich reakce (závisle proměnné). Pro analýzu neexperimentálních dat, např. pro data ze sociologických výzkumů založených na dotazníku, navrhují nazývat nezávisle proměnné prediktorem (predictor variable), závisle proměnné pak výsledkem (outcome variable). Česká sociologická praxe je taková, že používáme termíny nezávisle a závisle proměnná.
Obr. 1.3 Graf rozložení dat při náhodné chybě měření a při měření bez chyby
Notice that random error doesn't affect the average, only the variability around the average
Zdroj:True Score Theory, dostupnéz: http://www.5oclalresearrfimethad5.net/kb/true5cor,php
kdeXje naměřená hodnota vlastnosti, Tjejejí skutečná, správná (true) hodnota, kterou ale neznáme (snažíme se ji totiž zjistit právě našim měřením), a e je celková chyba měření (error). Celková chyba měření může být systematická nebo náhodná. Náhodná chyba (remdom error) většinou nezpůsobuje větší problém, neboť odchylky odměření sice způsobují větší variabilitu v datech, ale jelikož mají tendenci se náhodně vychylovat v kladném i záporném směru (někdy naměříme více, než je skutečná vlastnost, jindy zase méně), vzájemně se vyruší, takže průměr měřené vlastnosti zůstává nedotčen. Proto se někdy o náhodné chybě hovoří jako o šumu (noisé). Hezky to vyjadřuje obrázek 1.3, v němž modrá křivka ukazuje, jaké bychom měli hodnoty bez náhodné chyby měření, zatímco zelená křivka zobrazuje hodnoty s náhodnou chybou. Vidíme, že střední hodnota (průměr) je u obou křivek shodná, rozdíl mezi Iďivkami je pouze v šířce rozložení hodnot - zelená (s chybou) má širší rozložení, hodnoty zde mají větší rozptyl (variabilitu), modraje sevřenější, rozptyl je menší.
Systematická chyba (systemettic error) — viz obr. 1.4 - představuje trvalou, nikoliv náhodnou chybu, a pokud se při měření vyskytne, je to skutečný problém. Jelikož jde
0 systematické zkreslení, jsou hodnoty při měření opakovaně vychýleny buď kladně, nebo záporně, takže se navzájem nemohu vyrušit. Výsledné měření je pak systematicky vychýlené (na obr. 1.4 je to ta červená křivka), a tudíž zkreslující - průměr hodnot se systematickou chybou (u červené křivky) je odlišný od průměru hodnot, které chybu neobsahují (modrá křivka). Systematickou chybu nazýváme zkreslením (bias).
Zdroj systematické chyby je různý. Může být na straně pozorovatele, pokud je jeho pozorování selektivní (viz schéma měření na obr. 1.2), ale chyba může být způsobena
1 měřicím nástrojem (pokud je například nevalidní). Jejím zdrojem může být ale i měřený objekt, například když u výběrových souborů jde o chybný výběr jejich jednotek. Zobecňujeme-li z výběrového souboru na cílovou populaci, může jít o chybu spočívající v neoprávněném zobecnění - hovoříme zde o chybě neoprávněného rozšíření domény
KAPITOLA 1
~-M
j<4
NEŽ ZAČNEM C
^ . Obr. 1.4 Graf rozložení dat
' \    / \ ,'Jl'"0" °' X     | př| systematické chybě měření
í  \ I  \    W!th systematic error   j a při měření bez chyby
I       \  \......        " " .
d 111     the distribution of X with
a> #      ft      \    rw sysřemafíc error
*=      /     M     V -—-------■
(Notice that systematic error does") i affect i/ie average - we caff j I f/ws 3 toas j
Zdroj: True Score Theory, dostupné z: http://www.socialresearchmethods.net/kb/truescor.php
měření, kdy zobecňujeme své výsledky na širší soubor, než z něhož jsme provedli náš výběr. Může jíl. například o snahu zobecnit volební preference /. výběrového souboru vybraného z pražské populace na celou populaci CR.
Obecně ve statistice chyba (error) znamená rozdíl mezi pozorováním a predikcí (či odhadem) a je spíše nepřesností než skutečnou chybou. Jde většinou o náhodnou chybu. V tomto ohledu se v kapitole o inferenční statistice (viz kapitolu 5) seznámíme se standardní chybou {standard error) a výběrovou chybou (sampling error). /.de jde o to, jak blízko (s určitou zvolenou pravděpodobností) jsou výsledky získané výzkumem vc výběrovém souboru příslušným charakteristikám populace.-"1
1.4.4 Aspekty měření
Při měření si musíme všímat jeho několika aspektů. Zásadně platí, že použitý způsob měření by měl být relevantní, validní, reliabilní, senzitivní a přesný. To jsou hlavní aspekty měření (viztéžDisman, 1993, s. 62 nebo Babbie, 2001,s. 140 145). Relevance znamená vhodnost použité procedury měření ve vztahu k problému. Validita se týká rozsahu, v němž měření korespondují se skutečnou vlastností, která má být měřena (měříme skutečně to, co měřil, chceme?).
Základní otázkou, kterou si můžeme u každého mořicího nástroje položit, je: „Co měří?" Validitou se zhruba chápe platnost měřicích procedur, získaných údajíi, měřicích nástrojů, prostě všech složek měření a škálování. Měření je validní, jestliže měří to, co myslíme (očekáváme), že měří. Ve skutečnosti to ovšem není měření, které je validní nebo nevalidní, ale jeho použití. Validita tak závisí na tom, jak jc
26   V jazyce analýzy označujeme výsledky získané výpočty (ve výběrovém souboru) výrazem „statistiky" a číselným charakteristikám populace říkáme „parametry".
definován měřený pojem.27 Babbie (2001) konstatuje, že konvenčni používání termínu validita se vztahuje k rozsahu, ve kterém empirická míra adekvátně reflektuje skutečný význam uvažovaného pojmu.
Poiržijeme-li proměnnou i,úro^ ne-bude, zrl.i mérrre r. úspěchem tuto úroveň V7rió:á->i, ;;fe 7:);; tímto 7p jsohrn- ;prostřWlrk tvírn toho-;r.Mik,i/r:!cvle', skuteůié •íiýŕ'me to. u.> inň'it chcomf: teciy soci.iln's*ati.s.
Reliabilita označuje rozsah, ve kterém způsob měření dává konzistentní výsledky. U reliability se tedy ptáme, do jaké míry jsou výsledky opakovaného měření shodné s původním měřením. Ilustrativní pro reliabilitu je Segalův zákon, který praví: Když má člověk jen jedny hodinky, ví vždycky, kolikje hodin. Když má člověk dvoje hodinky, nemůže si být nikdy jist.
Reliabilitou se zhruba chápe spolehlivost výsledků měření v závislosti na a) objektivní spolehlivosti měřicích procedur, technik či nástrojů, b) subjektivní spolehlivosti respondentů a experimentátora.
Reliabilita je také považována za míru stability měřicích nástrojů, s jakou lze při opakovaných měřeních či testech získávat přibližně stejné výsledky. Jde o záruku, že proměnlivé výsledky měření nejsou způsobeny špatným měřicím prostředkem, ale skutečnou variabilitou měřené vlastnosti. Jestliže lidé odpovídají na otázky při opakovaném dotazování stejným způsobem, pak jsou otázky reliabilní. Synonyma reliability jsou: spolehlivost, stabilita, konzistence, prediktabilita neboli předpověditelnost, přesnost (Kerlinger, 1972, s. 421 ).28 Zdrojem nereliability mohou být špatné formulace otázek, rozdílné kulturní významy vkládané do použitých termínů v různých sociálně kulturních prostředích, vliv tazatelů (a to nejen záměrný). Pohlaví tazatele, jeho etnický původ, oblečení, sociální zařazení, to vše může při dotazováni (to je sběru dat) hrát značnou roli. Jinak odpovídá žena ženě, jinak muži a podobně, a v tomto odlišném odpovídání se skrývá zdroj chyb.
Jiným zdrojem chyb může být kódování, neboť různí tazatelé mohou kódovat stejné odpovědi rozdílně, uplatňuje se selektivní slyšení a podobně. Reliabilita je nízká i u otázek, na které lidé nemají názor (míněni, postoj), a otázka tento názor uměle vytváří (může, ale spíše nemusí zůstat stabilní). Reliabilitu se proto snažíme zvyšovat
Měříme-li příjmovou chudobu definovanou například poměřením příjmu jednotky s příjmovým rozložením (například za chudé považujeme všechny jednotky s příjmem nižším než 60 % příjmového mediánu), bude dotaz typu „cítíte se být chudou rodinou" nepochybně velmi zajímavý, ale neměří jej! (definovanou) chudobu - je z tohoto hlediska nevalidní. I když ve vztahu k subjektivní chudobě jistě validní je.
Koncept reliability je pro nás důležitý obecně, ale i specificky - například v případě sumačních indexů (viz kapitolu 6 o transformaci proměnných), kde je nutno změřit reliabilitu jednotlivých položek (jejich vnitřní konzistenci), z nichž je sumační index vytvořen.
KAPITOLA 1
NEŽ ZAČNEMK
použitím více indikátorů (u jednoduchých položek jc vždy obtížnější zajistil, reliabili-tu než u použili více indikátorů), pečlivou formulaci otázek, ale i určitým výcvikem (instruktážemi) tazatelů a standardizací způsobu kódování.
Sensitivitou se rozumí schopnost testu dávat pozitivní odpověď, jestliže daná osoba má příslušnou vlastnost, spécificitou pak schopnost testu dávat negativní odpověď, jestliže daná osoba nemá příslušnou vlastnost. Toto rozlišeni zná velmi dobře například medicína a medicínský výzkum.
1 »5 Hypotézy a modely
1.5.1 Od tématu přes problém k výzkumné hypotéze
Hypotéza je určité očekávání o povaze věcí odvozené většinou z teorie (jc to tvrzení o tom, jaká tato povaha má být, má-li být teorie, z které je odvozena, pravdivá). Výzkumná hypotéza je předběžný předpoklad, domněnka o 1) existenci a 2) příčinách jevů, o 3) vztahu mezi jevy, o 4) průběhu nějakého procesu, o 5) změně apod. Svou povahou leží na jakémsi myšlenkovém rozhraní mezi teoretickou a empirickou fázi výzkumu. Je návodem k výzkumu, který jc najedno straně determinován dosavadním poznáním, na druhé straně jc orientován na další poznání. Může být: odvozena z kontextu vědy (formulována •/. teorie nebo z jiných hypotéz), ale i ze zkušenosti. Má charakter výroku, tvrzení, modelu, či dokonce teorie, ale jsou to výroky, tvrzení, modely a teorie, jež nebyly dosud přijaty jako obecně plaíné. Její podstatnou charakteristikou je, že ji můžeme nižným způsobem empiricky ověřovat. Podle elologa Konráda Loren/.e (1903 19R9) si nejdříve něco myslíme, pak to srovnáváme se zkušeností a s dalšími smyslovými daty, až nakonec podle toho, shodujc-li sc to s nimi, nebo ne rozhodneme o správnosti či cliybnosti toho, co jsme vymysleli. Hypotéza jc něco, co dosud nebylo ověřeno, a má proto v rámci vědy dočasný status (Lorenz, 1990, s. 72 li).1'-'
Velmi časlo se setkáváme s nepochopením při rozlišování mc/.i tématem výzkumu a výzkumnou otázkou, respektive výzkumnou hypotézou. Rozlišuje se:
- téma, respektive předmět výzkumu. Jestliže řekneme, že chceme zkoumat sociální nerovnost, neboli vidíme v nerovnosti problém (sociální či výzkumný) a chceme výzkumem získat odpovědi na některé otázky týkající sc „sociální nerovnosti", vymezili jsme si prozatím jen předmět výzkumu;
- výzkumný problém, na který hledáme prostřednictvím výzkumu odpověď a který jc zúžením tématu na některý z jeho (pro nás) významných aspektu;
- výzkumná olá/ka/hypoléza, která problém dále specifikuje do takové podoby, abychom z odpovědi na ni tento problém mohl i pochopit - tcpive výzkumná otázka určuje otázky, s nimiž se obracíme ke zkoumaným jednotkám: například otázky dotazníku.
Ilustrace
lénvt (předmět) výzkumu jc sociální nerovnost.
odpovědi  na ;aké otázky chceme; získat (co jo výzkmrý problém)?
Jaký typ n.-ovľKNti budeme 7kn;inat íekortoirir kou, mocenskou, politickou}? Jak ji bjclomo nořit (rozďly ve. sto'.wwi, v pŕijn Wi)?
Inky vy:'k,imr.ý prostor zvolíme? Celo.i společnost, něco pouze její urf tý výsfk (cicaii/V-ri, korru-riti!. sodďln: i-uipifiu, rodinu!? - Jaké období buoe časovým rámcem výzkumu? Soustředíme se nájednú generaci, nebo budeme zkoumatimezigenerační vztahy-a procesy (například přenos nerovností ž generace nä: generaci)? Jaký aspekt ">r>:r>vnosr: budenie sil.doval? 7<ijím.-i :ias rozsah, jakého nerovnost ve společnosti rahývá, joji rozložen' ve společnosti, je.'i příčiriý, její důsledky, funkce vé společnosti nebo ještě nóoojiiv-ho (ľd:jfikl«c! extré'rni íorria ne'ovnost;)?
Bude nďb zajímat, které instituce, ideologie, hodnoty ä normy nerovnost podporuji a jaké -nedia-nismy ji zajišťuji, .to< hanisrny, ,imiž so nerovnost ve společnosti reprodukuje?/. ■ť   Jde nárn o toijakézájmy stojí za udržováním nerovnosti či jak je ideologizována, respektive légltV rrizována, jak ji lidé nod.ioti ii jak vysvětluji jeji oiiU-iy?
Budeme :4:o,:ii:at rjrožiteA nerovnosti a deprivaci, anomii čí märgiriaiižäci,které jidoprovázejí?
Všechny tyto otázky ovlivňují povahu hypotéz, které v návaznosti na volbu výzkumného problému formulujeme. Například si zvolíme jako prostor rodinu (nerovnosti v rodině) a budeme se zajímat o genderový aspekt nerovnosti, konkrétně v dispozici rodinnými zdroji. Můžeme formulovat hypotézu: Pohlaví bude mít vliv na osobní spotřebu finančních zdrojů rodiny. Tu bychom mohli ještě zpřesnit (zaměřit) tím způsobem, že budeme předpovídat, že: Muži pro svou osobní spotřebu využívají více finančních zdrojů rodiny než ženy. (Vyšší výdaje na vlastní spotřebu indikují větší moc nad finančními prostředky rodiny a tím i nerovnost v rodině.)
1.5.2 Typy hypotéz
Hypotézy lze klasifikovat podle různých hledisek. Jaké druhy tedy rozlišujeme?
Hypotézy teoretické a empirické. Teoretické hypotézy jsou výroky formulované jazykem teorie. Empirické hypotézy jsou výroky, které jsou empiricky testovatelné.
Hypotézy výchozí a pracovní. Výchozí hypotézy bývají obvykle hypotézami teoretickými nebo empirickými na vyšší úrovni obecnosti a hypotézami komplexními. Statistická analýza slouží k ověřování pracovních hypotéz, které Disman definuje následujícím způsobem: 1) Pracovní hypotéza je tvrzení předpovídající souvislosti mezi dvěma nebo více proměnnými; 2) všechny proměnné zmíněné v hypotéze musejí mít validní operační definici; 3) soubor pracovních hypotéz musí zahrnovat nejen proměnné reprezentující zkoumané koncepty, ale i ty proměnné, které mohou významně zkreslit interpretaci testovaných vztahů (Disman, 1993, s. 79).
Hypotézy kauzální a vztahové.30 Hypotézy mohou být hypotézami o stavu čí struktuře (zde je užitečná jednorozměrná analýza, neboť technicky jde o otázky týkající se hodnot
Připomeňme siPopperovo stanovisko, že všechna vědecká tvrzení jsou viastně jen hypotézy, jež mají dočasný status (Popper, 1974, s. 87-88).
Blíže k otázkám kauzalit v sociálním výzkumu Babbie (2001, s. 68-87) nebo také Field (2009, s. 13-14).
<AP.'IOLA 1
proměnných) - někdy o nich lze hovořit jako o hypotézách popisných. Většinou však ve statistické analýze testujeme hypotézy o vztahu dvou proměnných (dvojrozměrná analýza) nebo několika proměnných (vícerozměrná, multivariační analýza), které mohou být označeny také jako hypotézy vysvětlující (explanační). Zajímá nás, zda mezi určitými sledovanými proměnnými existují nějaké vztahy a jakou povahu tyto. vztahy mají. Primárně nás zajímá, zda jde o vztah statistický, nebo kauzální, Považujeme-li vztah za kauzální, uvažujeme o kauzální hypotéze. Babbie (2001, s. 86) uvádí tři základní kritéria kauzality: 1) proměnné musejí být empiricky asociovány nebo korelovány, musejí existovat jejich souběžné změny; 2) kauzální proměnná, rozumějme příčina, musí v čase předcházet proměnné, kterou ovlivňuje, rozumějme důsledku; 3) pozorovaný důsledek nemůže být vysvětlen působením jiných proměnných. Pouhá (ani perfektní) asociace nebo korelace nepředstavuje kauzalitu. Popravdě řečeno, empirická sociologie ve většině případů pracuje se statistickými vztahy (které nesplňují třetí ze zmíněných kritérií), a její závěiy proto mají vždy pravděpodobnostní charakter: např. čím má člověk vyšší příjem, tím je pravděpodobnější, že bude volit pravicové strany (proměnná X má vliv na proměnnou ľ).
Hypotézy věcné a statistické. Z hlediska statistické analýzy dat má toto rozlišení zásadní význam. Věcnou hypotézou je domněnka o existenci vztahu mezi dvěma nebo více proměnnými. Statistická hypotéza j e ve statistických termínech vyjádřené hypotetické tvrzení o relacích vyvozených ze vztahu ve věcné hypotéze. Věcné hypotézy se mohou týkat: 1) existence, výskytu a stavů předmětů, jevů, událostí, lidí, skupin (existují či proběhly, jak byly početné?); 2) vlastností předmětů, jevů, událostí, lidí, skupin (jak byly početné jejích určité kategorie, jakou měly intenzitu?); 3) vztahů mezi předměty, jevy, událostmi, lidmi, skupinami, respektive zda mezi jejich vlastnostmi existovaly, jaké povahy byly (příčinné, statistické), kdy nastaly atd.; 4) vývoje předmětů, jevů, událostí, lidí, skupin, jeho etap a stadií a jejich charakteristik (v jakých etapách se vyvíjely, co bylo pro tyto etapy charakteristické?); 5) procesů, jichž se lidé či skupiny účastní nebo jež v nich probíhají; respektive se mohou týkat vztahů mezi těmito skutečnostmi (existencí, výskytem, stavy, vlastnostmi, procesy apod.).
Věcnou hypotézu není možno podle Kerlingera (1972) samu o sobě testovat, proto testujeme tzv. statistickou hypotézu (představuje tedy způsob testování věcné hypotézy) - což je matematický model sociální reality o chování proměnných, který se snažíme zamítnout (viz pasáž o nulové hypotéze níže),31 Jde de facto o formulaci věcné hypotézy ve statistických termínech. Protože statistická teorie dovoluje testovat jen jednoduché hypotézy, rozkládá se často komplexní sociologická (věcná) hypotéza na řadu dílčích statistických hypotéz. To, že má hypotéza statistický charakter, znamená podle Nowaka (1975), že jednoznačně nehovoří o vlastnostech nebo chování každého člověka, nýbrž vypovídá o relativních četnostech, statistických závislostech
NEŽ ZAČNEME.
mezi vlastnostmi a chováním lidi. Tyto závislosti pak platí buď pro určitá seskupení lidí, nebojsou formulovány jako univerzální teze.
Hypotéza v empirickém výzkumu je výrokem o vztahu alespoň dvou jevů a v konečné fázi (v kvantitativním výzkumu) výrokem o vztahu (alespoň) dvou nebo více proměnných. Cistě teoreticky může být hypotézou i výrok: „staří lidé jsou konzervativní", protože obsahuje implicite dvě proměnné - věk a politickou ideologii. Lépe je ovšem formulovat hypotézu „věk je pozitivně vztažen ke konzervativismu" nebo „s růstem věku roste příklon osob ke konzervativismu" či „s růstem věku roste počet osob volících strany s konzervativním programem" nebo také „čím jsou lidé starší, tím vyšší dosahují skóre na škále konzervativismu" (všimněte si, že tyto hypotézy nevyjadřují vždy totéž).
V posledních dvou případech máme již pracovní hypotézu, neboť obě proměnné jsou operacionalizovány (věk vyjadřujeme v letech a na základě definice konzervativismu jsme schopni určit, které strany můžeme označit jako konzervativní, popřípadě máme k dispozici konstruovanou škálu konzervativismu). Ve zmíněné podobě jde
0 hypotézu vztahovou a pravděpodobnostní. Netvrdíme, že mezi oběma proměnnými existuje kauzální vztah a že všichni staří lidé jsou konzervativní. Jen předpokládáme, že pravděpodobnost výskytu konzervativismu (podíl osob zastávající konzervativní postoje) mezi starými lidmi je vyšší než mezi lidmi mladými. Je to hypotéza věcná, testovat bychom ji mohli jako statistickou (nulovou) hypotézu „neexistuje vztah mezi věkem jedince a skórem, kterého tento jedinec dosahuje na škále konzervativismu" nebo „koeficient korelace vztahu proměnné věk a proměnné hodnota dosažená jedincem na škále měřící míru konzervativismu je roven nule",32
1.5.3 Složitější modely
Modely jsou zvláštním způsobem výkladu reality, který reprodukuje aspekty jevu a umožňuje deduktivní odvození a výroky, jež mohou být přezkoušeny ve zkušenosti. Nejjednoduššími modely jsou abstraktní popisy systémů jako modely jejich jistých aspektů. Někdy jsou modely jen synonymem pro teorie - obvykle velmi jednoduché - nebo pro část teorie. Identifikujeme i tzv. konceptuálni modely. Ty jsou pokusem prezentovat sociální svět v pojmech řady vzájemně vztažených pojmů (blahobyt, moc, prestiž jako odměny za výkon určité role). Teoretické modely představují zabudování určité teorie, která vysvětluje výběr a uspořádání prvků modelu (např, teorie racionální volby umožňuje uspořádat jednotlivé kroky jednajícího aktéra). Mohou mít
1 charakter metaforických analogií. Modely mohou mít verbální prezentaci či matematickou prezentaci, mohou být také prezentovány jako diagramy.
Pozor! Mnohdy se statistické hypotézy neodlišují od věcných a testování statistických hypotéz je neoprávněně chápáno jako testováni hypotéz věcných.
Měli bychom být ale opatrní, protože jak si ukážeme dále, nulová hodnota korelačního koeficientu znamená pouze neexistenci asociace u vztahů lineárních (mohlo by se stát, že vztah existuje, ale není lineární).
Model na obr, 1.5 je matematické vyjádření vztahu mezi výší příjmu a výší vzdělání. Modelem tohoto vztahu je přímka, která říká, že vztah mezi oběma proměnnými je lineární. Model navíc vyjadřuje, že čím vyšší je vzdělání, tím vyšší je také příjem.33 Pokud bychom tento vztah vyjádřili matematicky ve formě rovnice, mohli bychom přesně predikovat, o kolik jednotek vzroste příjem (závisle proměnná), zvýší-li se výše vzdělání o jednotku.34
Otevřenost sociálních systémů znamená, že žádný z námi konstruovaných modelů nevystačí jen s proměnnými, které jsou do něho zahrnuty. Vždy musíme počítat s vlivem proměnných, které v našem modelu nejsou obsaženy, neboť nebyly např. dostupné našemu měření nebo o jejich vlivu, či dokonce o jejich existenci nemáme ani ponětí. Všimněme si, že Blau a Duncan v demonstrovaném modelu s těmito vlivy počítají (viz šipky směřující zvenčí do bodů U, Y a W v obr. 1.6).
Obr. 1.5 Vztah mezi vzděláním
a příjmem (smyšlená data)
vzdělání
Na dalším obrázku (viz obr. 1.6) je uveden příklad složitějšího modelu vyjadřujícího vztah mezi jednotlivými proměnnými, které byly předmětem zkoumání (čísla zde představují sílu vztahu mezi jednotlivými prvky, vyjádřenou specifickými koeficienty asociace). V tomto případě jde o model dosahování sociálního statusu respon-denta/respondentky v závislosti na vzdělání a zaměstnaneckém statusu otce.
Sociální systémy, které jsou předmětem zkoumání v sociologii, jsou ovšem systémy a) komplexními a b) otevřenými. Jejich komplexnost má za následek, že když je popíšeme jednoduchým modelem, dochází ke značnému zjednodušení, k simpli-fikaci. Ta je ovšem nezbytná (čím složitější modely konstruujeme, tím více se vymykají možnosti testovat je) a většinou postačující, protože se nesnažíme o úplné vysvětlení jevů, ale spíše o odkrytí míry vlivu určitých konlaétních stimulů na ně.
Takový vztah je nejeti lineární, ale i přímo úměrný, neboť s růstem hodnoty jedné proměnné roste současně i hodnota druhé proměnné, U nepřímo úměrného vztahu s růstem hodnot jedné proměnné hodnoty druhé proměnné klesají: například bylo empiricky ověřeno, že s růstem příjmu klesá míra anomie měřená na Sroleho škále (viz Rabušic & Mareš, 1996) - tento vztah je nejen nepřímo úměrný, ale také asymetrický, což znamená, že jedna proměnná je jasně nezávislá a druhá závislá. Hypoteticky bychom sice mohli předpokládat, že anomie jako nezávisle proměnná bude ovlivňovat závisle proměnnou, to je výši příjmu, což bychom spekulativně formulovali tak, že anomičtí lidé jsou natolik ve svých životech frustrovaní, že nepodávají v práci řádný výkon, a tím jsou jejich příjmy nižší, ale logičtější je očekávat příčinu a důsledek v opačném gardu: příjem ovlivňuje míra anomie. K otázce aspektů vztahů mezi proměnnými se ještě dostaneme. V tomto konkrétním případě bychom aie museli vzdělání vyjádřit ve formě kardinální proměnné, například počtem let strávených ve škole (studiem), a nikoliv, jak je obvyklé, stupněm dosaženého vzdělám (základní, středoškolské, vysokoškolské), což je proměnná ordinální. S ordi-nálnimi proměnnými totiž, striktně řečeno, nemá regresní analýza pracovat.
Obr. 1.6 Model proměnných
ovlivňujících dosažení sociálního statusu
V = vzdé[áníotce
X - zamestnanecký status otce
U ■ dosažené -vzděláni
W - zaměstnanecký status v prvním povalänf Y = zaměstnanecký status v dobe setření
Podie: Blau, P. M„ & Duncan, O. D. (1967). The American Occupational Structure. New York: Wiley. Převzato z Matějů, P. (2005). Ke kořenům sociálně psychologického modelu sociální stratifikace. Sociologický časopis, 47(1), 7-30.
I když se svými modely pracujeme jako s uzavřenými systémy, statistika nám v některých svých procedurách umožňuje alespoň odhadnout, jaký podíl variance závisle proměnné/proměnných z našeho modelu je vysvětlen nezávislými proměnnými zahrnutými do našeho modelu a jaký je podíl vlivu proměnných do modelu nezahrnutých.35 Podii vysvětlené variance závisle proměnné vlivem námi použitých nezávislých proměnných může být někdy i překvapivě vysoký, většinou jsme však nadmíru spokojeni i s 50-60 %. Zbylé procento variance v závisle proměnné (dopočítáváme do 100 %) jde pak na vrub proměnných, s kterými v modelu nepočítáme, a to většinou proto, že ani nevíme, které by to mohly být. Můžeme sice experimentovat a propočítávat modely s různými proměnnými (měnit jejich počet) i různými předpoklady vztahů mezi nimi, jsme však přitom omezeni jen na proměnné, které máme ve svých datech.
Ilustrace
Zjistili j-smr. re výše příhv.u iilrě koreluje s vě^rr, ale koeficient doiorninarp nám rká, že věk a>,o nc zJvisle promř-nná vyswtlcjc jen ■!!>   wiiiňnc e v píiji-n., zbylých 64   jdo ví vr,iL> vlivu jiných pfown ^Hýchltttišírripijz^ rirĚ;je!pNh^menaířnřý^
35   U procedur, se kterými se zde seznamujeme, se s tím setkáme například u lineární regrese (koeficient determinace) nebo u faktorové analýzy.
KAPITOLA 1
1.6 Jak získat data pro analýzu
Hromadná data pro analýzu lze získat mnoha způsoby. Primární podmínkou je, aby byla získávámi jako dala standardizovaná. Například používámc-íi pro jejich sbor dotazník, musíme zajistit vedle takových podmínek, aby všem byly kladeny stejné otázky ve stejném znění a stejném poradí, také podmínky plynoucí ze statistických požadavků na proměnné:
- Proměnná musí variovat, musí ledy nabývat alespoň dvou hodnot (diskriminabilita čili rozlišitelnost mezi vlastnostmi objektu uvnitř proměnné: například u proměnné pohlaví lze rozlišit mezi muži a ženami).
Kc každému stavu vlastnosti existuje příslušná hodnota znaku (zařaditelnosl).
Všechny pozorovatelné vlastnosti objektu musejí býl zařariitelné do některé z hodno! proměnné (např. proměnná „volební preference" má mít tolik hodnot, kolik politických stran postavilo své kandidátky do parlamentních voleb).
- Dvě různé hodnoty znaku nemohou odpovídat jednomu stavu vlastnosti (jednoznačnost). U žádné z pozorovatelných vlastností objektu nemůžeme být na rozpacích, jakou hodnotu proměnné jí přiřadit neboli do které kategorie ji zařadit. Například proměnná věk nemůže mít vedle hodnoty 20-30 let hodnotu 30-40 let, neboť by nebylo možné jednoznačně rozhodnout, do které kategorie by měly být zařazeny třicetileté osoby.
- Naše data by měla být reprezentativní (viz předchozí lext), tak aby nám umožnila zobecnení výsledků našich výpočtu z výběrového souboru na soubor základní (statistickou inferencí - viz dále) a do výzkumu musí být zahrnut dostatečný počet výzkumných jednotek ,ir'
Poslední podmínku je ovšem třeba mírně korigovat; ne vždy musejí být naše dala reprezentativní. Máme-li například malou populaci (studenty jednoho gymnázia), uděláme vyčerpávající šetření (census), při kterém do výzkumu jednoduše zahrneme všechny její členy. V takovém případě ovšem ztrácí smysl tzv. iiifcrenční statistika (viz kapitolu 5), kterou lze aplikoval pouze v souborech, jehož jednotky byly vybrány náhodně.
Zdrojem hromadných dal pro statistickou analýzu muže být především vlastní sběr dat, dále data posbíraná jinými výzkumníky nebo statistické výkaznictví a speciální šetření, jako je například sčítáni lidu nebo mikrocensus.
J6 Mlhavý výraz „dostatečný" si blíže specifikujeme, až se dostaneme k inferenčnf statistice a k otázce výběrové chyby. Co tímto výrazem míníme, závisí na velikosti výběrové chyby, kterou jsme ochotni připustit, a také na hloubce zamýšlené analýzy (do kolíka podsouborů budeme soubor, s nímž pracujeme, členit). Může nás uspokojit třeba i 300-400 výzkumných jednotek, ale nemusí nám stačit ani 5 000 výzkumných jednotek. Vše závisí na řadě okolností.
NEŽ ZAČNEME
1.6.1 Sekundární analýza dat
Zdrojem dat pro nás mohou být i datové archivy (blíže o nich píšeme v dodatku IV). V nich jsou umístěny soubory, jež lze získat buď za úplatu, nebo se pro jejich získání požaduje jen registrace, popřípadě jsou volně k dispozici bez dalších podmínek (včetně dotazníků - bez nich jsou data často jen obtížně luštitelná nebo i zcela nečitelná a jejich analýza může pro neznalost přesného znění otázek a hodnot proměnných37 být až zavádějící). Většina datových archívuje spravována různými výzkumnými pracovišti (viz například GESIS - Archive for Empirical Social Reseach - University Köln am Rhein apod.), nadacemi (viz European Social Survey apod.), mezinárodními organizacemi (UNESCO či Světová banka apod.) nebo státní správou (v České republice jde zejména o Český statistický úřad, v EU o Eurostat; může jít o dohodu sdružení států jako v případě The European Community Household Panel). Většina datových archivů je také na webu a data si lze přímo stáhnout. Nejvýznairmějším datovým archivem kvantitativních dat v České republice je datový archiv Sociologického ústavu Akademie věd České republiky (viz http://archiv.soc.cas.cz/). Doporučujeme webové stránky všech zmíněných institucí navštívit a s jejich archivy se seznámit. Více o těchto službách najdete v dodatku této učebnice.
Naléhavá připomínka: Mějme zdravou skepsi k datům, s nimiž pracujeme!
Pro vědeckou práci platí základní dictum: „buďme zdravě skeptičtí". Každý výzkumník je pochopitelně přesvědčen, že jeho nástroje jsou validní a reliabilní a že jeho data jsou určitě reprezentativní. Do jaké míry je však třeba uchovávat si v tomto ohledu určitou skepsi, můžeme ilustrovat na několika příkladech tzv. rutinních statistik. Nejsou primárně shromažďovány pro výzkumné účely, ale mohou být pro ně využity stejně jako například jiné údaje shromažďované v systému statistického výkaznictví. Příklady databází vznikajících takovým způsobem můžete nalézt na webových stránkách Českého statistického úřadu, Ministerstva práce a sociálních věcí (například data o struktuře nezaměstnanosti) i jinde.
Při jejich studiu si ale musíme klást otázky. Například můžeme věřit policejním nebo zdravotnickým statistikám? Policie se může soustředit na určité typy trestných činů a to se projeví v policejních statistikách. Nikoliv tedy změna ve struktuře, povaze a množství deviantního jednání, ale změna v přístupu této sociální instituce může mít za následek pohyb ve statistikách o trestných činech.
Ilustrace....... .......
-: .: Poklesneji velká kriminalita, má policie více času ha malou kriminalitu1 a vzroste jejľobjasnénost.. Výskyt nemoci ve sialiitikách múze být ovlivněn schop-iosti diagnostikovat jp. ackuci íshyla nemu:, iduntií kov.índ (nebyly popsány:její. příznaky, indikátory), respektive.pojmenována, nemůže'7
V datových souborech jsou proměnné a jejich hodnoty opatřeny jen velmi hrubými a zkratkovitými orientačními popisky (variable label a value labels).
KAPITOLA 1
NEŽZAČNEME
být diagnostikována. Podobné.též poiičejní statistiky zaznamenávají jen odhalené:trestné činy. :   (existuje například skrytá kriminalita, jako jsou zločiny.bílých límečků nebo nehlásená trestná čin-: nost uvnitř rodin, jako je třeba domácí násilO-
V Brně vypadá jiňakmapa kriminality (počet určitých trestných činů nebo trestných činů obecně) podle odhalených, trestných ŕ nú. jii-ck by vypadala podle skutečné spáchaných trestných činů (včetně neodhalených a neohlášených). Zřeme by se také ukňza'o. že mnohém více,: než by se čekalo, je trestných činůuvnitř rodin.
Mohou se také měnit definice. "Například ve zdravotnických statistikách lze jeti s obtížemi prováděl, historické komparace údajů. Vezměme třeba rozdíl mezi úmrtími na srdeční choroby v 21. století a v 19. století, kdy (právě s ohledem na zmíněnou schopnost diagnostikovat a rozlišovat mezi diagnostikami) byla do této kategorie zahrnována úmrtí, která se dnes zahrnuji do kategorií zcela jiných. Analogicky se mohou mčnil klasifikace určitých osob či domácností mezi chudé či neelmdé, aniž by se změnila jejich situace (příjmy či vydání), a sice prostým administrativním úkonem změnou hranice chudoby.
Vše komplikuje i to, že tvůrci statistik, respektive li, kdo pro ně poskytují údaje, mohou přitom přihlížet ke svým zájmům. Policie je například hodnocena podle míry objasněnosti svých případů a policisté mají zájem, aby některé činy nebyly ve statistikách zachyceny a jiné ano (nejde jen o přímé falšování údajů, ale i o takové aktivity, jako je neochota přijímat trestní oznámení drobných činů, které mají tradičně nízkou míru objasnění). Podobně se někdy licituje v nemocnicích, zda dítě zachytil jako mrtvě narozené nebo jako novorozeneckou úmrtnost apod. (takto manipulovaly a manipulují se statistikami i některé státy). Policisté mohou sympatizovat s hnutími vyjadřujícími xenofóbii a rasismus, jako jsou například skinheads, a snažit se - když už musejí jejich činy vyšetřovat - neklasifikoval je jako motivované rasovou nesnášenlivostí. Naopak může docházet k růstu podílu takto motivovaných činů ve statistikách pod vlivem vnějších tlaků, ať již mocenských ze strany různých příslušných státních institucí (ministerstva vnitra, státních zastupitelství, soudů), nebo pod vlivem změn legislativy napr. /.měnou dennice, jejím jednoznačnějším výkladem apod., popřípadě pod tlakem veřejného mínění či kontrolou masmédií, zejména jsou-li vyburcovány díky zvláště brutálnímu činu.
fixistují i jiné způsoby „práce" se statistikami. Jen jeden / možných příkladů: v 19. století bylo velmi obtížné dosáhnout rozvodu. Důvody k rozvodu, které soudy uznávaly, byly velmi omezené a možnost rozvodu po vzájemné dohodě tehdy v právních normách neexistovala. Přesto se však tento způsob rozvodu v některých zemích fakticky vyskytoval. Manželé si totiž například účelově po vzájemné dohodě vyměřovali urážlivé dopisy a mohli pale být rozvedeni pro oboustranné těžké urážky (viz liolognc, 1996).
Absolutní čísla jsou často interpretačně málo zajímavá, zajímavější jsou čísla poměrná (přepočtená na určitý základ - často sc o nich hovoří jako o špecifických
ukazatelích). Policejní statistika je jen hrubou informací o struktuře trestných činů (o podílu dané činnosti v celku trestné činnosti), zajímavější údaj však dostaneme, přepočteme-li čísla například na celkový počet obyvatel určitého území nebo na cílové skupiny (např. počet trestných činů mladistvých nikoliv v celku trestných činů, ale v přepočtu na počet osob této věkové skupiny v populaci a porovnání tohoto přepočtu s ekvivalentními přepočty ostatních věkových skupin). Velmi cenné jsou komparace s jinými prostředími, například s jinými městy, státy - ovšem za předpokladu, že je používána ve všech prostředích stejná metodika a tato metodika je stejným způsobem vykládána.
Literatura
Babbie, E. (2001). The Practice of Social Research (9th ed.). Belmont: Wadsworth Publishing Company.
Barton, A. H. (1955). The Concept of Property-Space in Social Research, tn P. F. Lazarsfeld & M. Rosenberg (Eds.), The Language of Social Research (pp. 40-53). New York: The Free Press. Bell, D. (1999). Kulturní rozpory kapitalismu. Praha: Slon.
Blahuš, P. (2000). Statistická významnost proti vědecké průkaznosti výsledků výzkumu. Česká kin-
antropologie, 4(2), 53-72. BlaiMe, N. (2003). Analyzing Quantitative Data. London: Sage.
Blau, P. M., & Duncan, O. D. (1967). The American Occupational Structure. New York: Wiley. Bologne, J. C. (1996). Svatby. Dejiny svatebních obřadů na Západě. Praha: Volvox Globator. Disman, M. (1993). Jak se vyrábí sociologická znalost. Praha: Slon.
Field, A. (2009). Discovering Statistics Using SPSS for Windows. Advanced Techniques for the
Beginner. London: Sage. Hendl, J. (2004). Přehled statistických metod zpracování dat. Praha: Portál. Kerlioger, F. N. (1972). Základy výzkumu chování. Praha: Academia. Lorenz, K. (1991). 8 smrtelných hříchů. Praha: Panorama.
Mertens, D. M. (1998). Research Methods in Education and Psychology. London: Sage.
Mills, Ch. W. (2002). Sociologická imaginace. Praha: Slon.
Nowak, S. (1975). Metodologie sociologických výzkumů. Praha: Svoboda.
Petrusek, M. (1993). Teorie a metoda v moderní sociologii. Praha: Karolinum.
Popper, K. R. (1974). Thesis in Defence of Science and Rationality. In Notturno, M. A. (Ed.), 17;e Myth of the Framework. London: Routledge.
Rabušic, L„ & Mareš, P. (1996). Je česká společnost anomická? Sociologický časopis, 32(1), 175-188.
Řehák, J. (1971). Definice měření ve společenských vědách. Sociologický časopis, 7(6), 639.
Sirováíka, T, & Mareš, P. (2006). Poverty, Social Exclusion and Social Policy in the Czech Republic. Social Policy and Administration, 40(3), 288-303.
Soukup, P., & Rabušic, L. (2007). Několik poznámek k jedné obsesi českých sociálních věd - statistické významnosti. Sociologický: časopis / Czech Sociological Review, 43(2), 379-395.
Vaus, D. de. (1990). Survey in Social Research. London: Unwin Hyman.