Statistická analýza dat II.

S1 - Základní analýzy v SPSS

Základní analýzy v SPSS.

Dílčí poznámky k Fieldovi kap.  8. 

  • Začátek kapitoly je opakování, mělo by stačit rychlé čtení.
  • Protože SPSS samo hned nenabízí intervaly spolehlivosti pro r, je dobré neminout sekci 8.2.4.
  • Většina potřebného je v sekci 8.4. (8.4.5 lze přeskočit)
  • Sekci o parciálních korelacích (8.5) je dobré si přečíst až před studiem lineární regrese.
  • Nepřeskočit 8.8!

Dílčí poznámky k Fieldovi kap.  10. 

  • Sekci 10.4 je dobré nyní přeskočit - začne dávat smysl, až se podíváme na lineární regresi
  • Sekce 10.5 a 10.6 jsou opakování.
  • Jádro jsou sekce 10.8. a 10.9. Bayesovský t-test (10.8.5, 10.9.6) lze přeskočit.
  • Nepřeskočit 10.10!

Dílčí poznámky k Fieldovi kap.  19. 

  • Sekce 19.3.7 a 19.4 lze přeskočit. 
  • Jádro jsou sekce 19.7 a 19.8 (bez 19.8.3)
Zadání seminárního úkolu
Dopracujte ve tříčlenném týmu dvě analýzy odpovídající na otázky, které jsme si stanovili a nahrubo realizovali na semináři: 
1. Důvěřují respondenti stejně rodičům jako přátelům?
2. Rozvádějí otcové s různým vzděláním různě často?
Použijte data Long2, s nimiž jsme pracovali v nultém semináři a v instruktážním videu. Jsou ve studijním materiálech semináře 0 i 1.
  
Odevzdejte textový dokument se zprávou o analýze, která bude mít podobu sekce výsledky v souladu s doporučeními APA manuálu a příručky Morganové a kol.. Zpráva bude obsahovat:

  • stručné představení dat, vzorku, na kterém byla data získána, a použitých metod měření (velmi stručná verze sekcí Vzorek a Metody - max půl strany),
  • kroky provedené v rámci přípravy dat (čištění, počítání nových proměnných),
  • informace o chybějících datech (a případné strategii, jak se s vypořádat s problémem, který představují),
  • popisné statistiky všech proměnných použitých v analýze,
  • formulace hypotéz,
  • výsledky jejich testování zahrnující vyjádření se k předpokladům použitého testu, intervaly spolehlivosti a velikosti účinku,
  • relevantní zobrazení testovaných vztahů (scatterplot, sloupcový/čárový graf s chybovými úsečkami, kontingenční tabulka) 
  • stručnou diskuzi k validitě/(ne)zkreslenosti statistik vedoucích k závěrům.

Kromě prvních dvou bodů bude asi smysluplné strukturovat zprávu zvlášť pro každou z analyzovaných hypotéz.

Odevzdejte také skript/syntax (.sps), jehož spuštěním vzniknou výsledky, které prezentujete ve své zprávě. Nejlépe je to vložit do odevzdávány jako jeden .zip pojmenovaný po vzoru U1_S3_Bílek_Fialová_Zelená.zip (tj. Úkol 1, Sem. sk. 3, jména autorů).

Pro zprávu můžete využít šablonu uloženou ve studijních materiálech .

Termín odevzdání je v pátek  (o půlnoci) následující po tomto semináři.

Vyjma zadání samotných analýz budou tyto instrukce platit i pro všechny další seminární práce v předmětu.


Poznámky ke čtení Morganové et al. [MRH]

I když je text už poměrně letitý, dobře ukazuje obecný styl reportování výsledků. Všímejte si, jakým způsobem jsou statistiky uváděny v textu. Pokud nepotřebujeme sdělit více než 5-6 číselných údajů najednou, píšeme je do vět a neděláme pro ně tabulku. Všímejte si v příkladech uvedených v [MRH], co všechno se píše do vět a jaká se používá interpunkce. Vypíchl bych, že statistiky se snažíme psát kurzívou.


 


 !Odlišnosti české interpunkce:  desetinné čárky, ne tečky, což vede k preferenci středníku jako oddělovače číselných informací v seznamech --- nula před desetinou čárkou u čísel < 1 ---  mezera mezi číslem a znakem %, když znak čteme "procent", a absence této mezery, když znak čteme "procentní".

Když je prezentovaných číselných údajů hodně, použijeme tabulku. Když už to děláme, je potřeba vytvořit tabulku se všemi náležitostmi: Titulkem, který ji označuje jako tabulku a dává jí nadpis, z něhož je zřejmé, co v tabulce je. Poznámkami pod tabulkou, které vysvětlují zkratky použité v tabulce a doplňují informace nutné pro porozumění tomu, co je v tabulce. v APA formátu používáme v rámci tabulky pouze vodorovné čáry a obecně čarami šetříme (často jsou jen 3, stejně tlusté).
   


V jednotlivých kapitolách pak najdete doporučení, jak informovat o výsledcích t-testu (s. 54), chíkvadrátu (s. 36), či korelace (s. 33). U korelace doporučují uvádět df, což je N-2. I když už dnes netestujeme signifikanci korelace t-testem, je to užitečná informace, protože nás ujišťuje, na jak velkém vzorku byla daná korelace spočítaná.

Co se týká uvádění p-hodnot, dnes preferujeme uvádění přesné hodnoty, např. p = 0,013, spíše než porovnání se zvolenou hladinou alfa (tedy p < 0,05).

Všimněte si také, s jakou přesností jsou uváděna čísla. Požíváme pouze tolik desetinných míst, kolik jich nese nějakou informační hodnotu. Při obvyklé přesnosti měření v psychologii to obvykle znamená 2-3 významné číslice, tj. řády - 1,23, 12,3, 123 apod. Neuvádíme tolik desetinných míst, kolik jich nám SPSS vypíše!  


Literatura 

[F] kapitoly 4, 5, 8, 10  a 19 (835-863).

Publikační manuál APA, 6. vydání [APA] kapitola 2; kapitola 4 (od sekce Numbers); kapitola 5

Morgan, Reichert, Harrison [MRH] kap. 2,3,5,6,7 (po s. 55),8   (online je k dispozici nové vydání z r. 2016)

Rozšiřující čtení: Grotenhuis & Chris (2014)