SOC108/708 LEKCE 1: POVAHA HROMADNÝCH DAT A LOGIKA SURVEY. PRÁCE S HROMADNÝMI DATY PŘED JEJICH ANALÝZOU (c) Petr Mareš a Ladislav Rabušic 2000 LEKCE00 CHARAKTER PROMĚNNÝCH vzorový výsledek cvičení Cvičení 0.1: Identifikujte nezávisle a závisle proměnné v následujících výzkumných projektech (jejich názvy vepište do příslušných kolonek): A. Výzkum se snaží zjistit, zdali ti, kdo poslouchají heavy metalovou hudby jsou násilnější ve svém chování než ti, kdo takovou hudbu neposlouchají. _______ poslech hudby__________ ______agresivita___________ nezávisle proměnná závisle proměnná B. Výzkumníci se zajímají o některé efekty dlouhodobé chudoby. Proto studují zdravotní situaci dlouhodobě chudých a také míru jejich sociálních kontaktů. _____chudoba_____ ____zdravotní stav_____ nezávisle proměnná závisle proměnná _____chudoba_____ ____míra sociálních kontaktů___ nezávisle proměnná závisle proměnná C. Pedagogové se zajímají o vztah mezi mírou sebevědomí a studijními výsledky u středoškoláků. __studijní výsledky__ ___sebevědomí__ nezávisle proměnná závisle proměnná C0.2: Podle vzoru ve cvičení C0-1 vymyslete nové tři výzkumné projekty. Opět vyznačte nezávisle a závisle proměnnou. Například: 1. projekt: Zajímá nás vztah mezi třídní příslušností a životním stylem jedinců __třídní příslušnost__ ___životní styl__ nezávisle proměnná závisle proměnná 2. projekt: Zajímá nás vztah mezi autoritativní výchovou lidí a jejich antisemitismem __autoritativní výchova__ __antisemitismus__ nezávisle proměnná závisle proměnná (viz například Adorno) 3. projekt: Zajímá nás vztah mezi mírou anomie jedince a jeho volebními preferencemi __míra anomie __ __volební preference__ nezávisle proměnná závisle proměnná a mnoho dalších možných C0.3: Určete, které proměnné jsou nominální (N), které ordinální (O), které intervalové čili kardinální (K) a které dichotomické (D): Průměrný měsíční příjem respondenta (K); počet závislých dětí v rodině (K); povolání respondenta (N); zdali respondent souhlasí, nebo nesouhlasí s výrokem X (D), jde-li skutečně jen o souhlas-nesouhlas - jde-li o míru souhlasu a nesouhlasu - například rozhodně souhlasí, spíše souhlasí atd., pak(O); zdali je respondent spokojen, ani spokojen ani nespokojen, či nespokojen se současným stavem demokracie v ČR (O); kolik by si přál mít respondent ve svém životě dětí (K); zdali se respondent obává, je mu to jedno, nebo neobává období stáří (O); zdali respondent čte denní tisk denně, alespoň 3x týdně, alespoň 1x za 14 dnů (O); co dělá respondent nejraději ve svém volném čase (N - nabízíme mu výčet aktivit); národnost respondenta (N); zdali by respondent chtěl nebo nechtěl mít za sousedy Rómy (D), jde- li jen o tyto 2 varianty; dosažená nejvyšší úroveň vzdělání respondenta (O); příslušnost respondenta k vyšší, střední nebo nižší třídě (O); počet souhlasných odpovědí v sadě 5 výroků (K); subjektivní posouzení zdravotního stavu -- zdali je špatný, průměrný či dobrý (O); míra nezaměstnanosti v evropských zemích (K); typy vysokých škol podle oborů (N); LEKCE01 MATICE DAT vzorový výsledek cvičení Cvičení 1.1: Vytvořte matici dat z miniankety, kterou uspořádáte mezi svými známými. V matici popište data tak, že jednotlivým proměnným přidělíte jejich jména (variable name) a jejich popisky (label) dále že u každé proměnné přidělíte popisky jejím variantám (values), missing value a typ proměnné neboli úroveň měření (measure). Získejte odpovědi od 10 respondentů a naplňte jimi matici. Anketa: I) Je pro vás tělesný pohyb důležitý? 1. Ano 2. Ne 9. Neodpověděl/a II) Kolik asi hodin týdně věnujete tělesnému cvičení nebo sportu? .......... hodin III) Rozhodněte se v případě následujících sportů, zda jsou podle vašeho názoru pro vás ideální nebo se naopak pro vás vůbec nehodí: (a) Tenis, (b) vysokohorská turistika, (c) posilování ve fitness centru, (d) jízda na kole? 1. ideální pro mne; 2. nehodí se pro mne; 3. nevím, rozhodnut; 9. neodpověděl IV) Cvičíte nebo sportujete v týdnu pravidelně, nepravidelně, nebo vůbec ne? 1. Cvičím (sportuji) pravidelně 2. Cvičím (sportuji) nepravidelně 3. Necvičím (nesportuji) vůbec V) Věk respondenta: .......... let VI) Pohlaví respondenta: 1. Muž 2. Žena Vyplňte následující tabulku popisující proměnné (jedno z možných řešení): Otázk Jméno Popis proměnné Varianty Úroveň a promě (variable label) znaku (Miss měření nné (values) ing (measure (name value ) ) ) I. a1 Význam pohybu 1. 9 ordináln pohyb důležitý í 2. nedůležitý 9. neodpověděl II. a2 Hodiny věnované kardinál hodin sportu ní y III. a3a Ideální sport: 1. ideální 9 ordináln tenis tenis pro mne í 2. nehodí se pro mne 3. nevím, nerozhodnut 9. neodpověděl a3b Ideální sport: 1. ideální 9 nomináln turis turistika pro mne í tik 2. nehodí se pro mne 3. nevím, nerozhodnut 9. neodpověděl a3c Ideální sport: 1. ideální 9 nomináln posil posilování pro mne í ova 2. nehodí se pro mne 3. nevím, nerozhodnut 9. neodpověděl a3d Ideální sport: 1. ideální 9 nomináln cykli cyklistika pro mne í sti 2. nehodí se pro mne 3. nevím, nerozhodnut 9. neodpověděl IV. a4 Pravidelnost 1. ordináln frekv cvičení pravidelně í enc 2. nepravidelně 3. vůbec ne V. a5 Věk kardinál vek ní VI. a6 Pohlaví 1. muž nomináln sex 2. žena í 7 Modře jsou uvedeny alternativní způsoby jmenování proměnných. Až na požadavek zachování základní konvence (jen osm znaků a prvním znakem nesmí být číslice, nepoužívá se diakritických znamének a mezer mezi znaky) lze ponechat jména proměnných vaší představivosti. Je však výhodné postupovat v souladu s mnemotechnikou. Použít pro všechny proměnné stejné první písmeno a číslovat je postupně tak, jak jsou umístěna v dotazníku, nebo pokud jsou v dotazníku bloky příbuzných otázek, rezervovat jim stejné písmeno (např. dotazník začíná proměnnými a1 -- a12 sledujícími spokojenost respondenta v rodině, následují proměnné b13-b22 sledující jeho spokojenost v zaměstnání, ....). ˙ Podle úvahy bychom mohli označit u proměnných a3 i variantu 3 jako missing value, ale nedoporučoval bych to. ˙ Potřebujete k tomu jen dotazník. Jméno proměnné dle konvencí SPSS začíná písmene a není delší jak 8 znaků. Pozor, u spojitých proměnných nemá smysl popisovat varianty (value labels). Labels a values se zapisují co nejstručněji. ˙ Protože u proměnných a3a -- a3d je 9 rovnou řazena mezi missing values, jde o ordinální proměnné. Vyplňte následující matici dat: ID a1 a2 a3a a3b a3c a3d a4 a5 a6 1 2 3 4 5 6 7 8 9 10 Přepište neutrální názvy proměnných var1 až var10 jmény vašich proměnných (SPSS to udělá samo v okamžiku, když definujete názvy proměnných ve variable view). Do matice vypisujete kódy variant, jež vaši respondenti volili u jednotlivých proměnných. Sloupec pojme i více číslic (je to otázka nastavení jeho šířky ve variables view - zde neprovádíme). Pro kontrolu popište znovu svého prvního respondenta: ID a1 a2 a3a a3b a3c a3d a4 a5 a6 1