Statistická analýza dat II.

Týden 6 - Seminář 3 - Pokročilé aplikace lineárně regresního modelu



Zadání seminárního úkolu
Zpracujte následující analýzu:
Data: EU Kids Online (viz odkaz níže). Rodiče a jejich děti napříč EU vypovídali o užívání internetu. Kdyby vás data zaujala , tak případným kontaktem může být prof. Šmahel nebo doc. Macháčková.
Data jsou rozsáhlá, takže hned na počátku si vyfiltrujte jen 3 země, s nimiž budete pracovat - ČR, Polsko a Německo (proměnná country).
ZP: Proměnnou, kterou máte modelovat, je věk rodiče (QP204). Je v letech, takže závislá má srozumitelnou metriku a nestandardizované regresní koeficienty by měly být snadno interpretovatelné. Chceme vyzkoušet, nakolik z různých proměnných dokážeme odhadnout věk rodiče.
Ne všichni dotazovaní jsou skutečně rodiče, proto je dobré ještě odfiltrovat "nerodiče" - proměnná QP206.
Prediktory
V prvním kroku hierarchické regrese predikujte charakteristikami dětí:
   Věk dítěte QP201. H: Čím starší dítě, tím starší rodič.
   Počet dětí v domácnosti QP202. H: Čím víc dětí, tím starší rodič.
V druhém kroku zohledněte zemi (country) a otestujte, zda se prediktivní schopnost věku dítěte neliší mezi zeměmi (moderace). Jako referenční zemi zvolte ČR. Konceptuální H: Čím "bohatější" země, tím více lidí odsouvají rodičovství. 
V třetím kroku zohledněte pohlaví rodiče (QP205) a otestujte, zda se prediktivní schopnost věku dítěte neliší pro muže a ženy (moderace). H: U mužů očekáváme méně těsný vztah.


Odevzdejte textový dokument se zprávou o analýze, která bude mít podobu sekce výsledky v souladu s doporučeními APA manuálu a příručky Morganové a kol.. Zpráva bude obsahovat:

  • stručné představení dat, vzorku, na kterém byla data získána, a použitých metod měření (velmi stručná verze sekcí Vzorek a Metody),
  • kroky provedené v rámci přípravy dat (čištění, počítání nových proměnných),
  • informace o chybějících datech a strategii, jak se s nimi naložilo v regresním modelu,
  • popisné statistiky všech proměnných použitých v analýze i s korelační maticí (bez dummies)
  • zdůvodnění specifikace modelu  (zde lze zmínit i transformace či jiné způsoby řešení problémů s případnou nelinearitou vztahů)
  • popis modelu s tabulkou parametrů a jeho hodnocení prizmatem vysvětleného rozptylu
  • zhodnocení naplnění předpokladů lineárně regresního modelu a případných omezení, které z toho mohou plynout, též zmínění outlierů a vlivných případů.
  • stručnou interpretaci a diskuzi smyslu výsledků

Formát. Minimum je na slajdech 38 a 39 v prezentaci z první přednášky. Pamatujte na 11. přikázání - NEZKOPÍRUJEŠ TABULKU ZE SPSS!

Odevzdejte také skript/syntax (.sps), jehož spuštěním vzniknou výsledky, které prezentujete ve své zprávě. Nejlépe je to vložit do odevzdávány jako jeden .zip pojmenovaný podle vzoru U3_S3_Bílek_Fialová_Zelená.zip. 

Pro zprávu využijte šablonu uloženou ve studijních materiálech zde.

Na vypracování je týden od semináře. Termín odevzdání je ve středu následující po tomto semináři pro skupinu S02 a v úterý pro seminární skupiny S01 a S03 .