Seminární cvičení

Datová matice

Datová matice představuje soubor kvantifikovaných odpovědí z dotazníku (případně jiných zdrojů dat) a její vytváření se řídí předem definovanými pravidly. Tato pravidla je nutné dodržovat, neboť analytické statistické programy počítají s předem danou strukturou dat.

Ukázka datové matice
Screenshot z programu IBM SPSS

Standardní formát datové matice je určen tak, že v řádcích jsou údaje od jednotlivých respondentů a ve sloupcích jsou pak jednotlivé proměnné (můžeme si je představit jako odpovědi na jednotlivé otázky v dotazníku, záznam o tom, zda jde o muže či ženu, jaký je věk respondenta, apod.) Důležitou součástí datové matice je proměnná, která jednoznačně identifikuje daného respondenta (standardně se nachází v prvním sloupci a označuje se obvykle ID). ID výzkumník přiřazuje jednotlivým respondentům tak, aby byla zachována jejich anonymita.

Kvantifikace proměnných

Vzhledem k tomu, že se předpokládá kvantitativní analýza získaných odpovědí, kódujeme jednotlivé odpovědi většinou v číselném formátu, a to i tam, kde je odpověď zakotvena verbálně. Například Likertovu škálu s pěti odpověďmi VŮBEC NESOUHLASÍM - NESOUHLASÍM - ANI SOUHLASÍM, ANI NESOUHLASÍM - SOUHLASÍM - ZCELA SOUHLASÍM kódujeme čísly 1 až 5. Obdobně pohlaví respondenta kóduje zvolenými čísly, např. 1 (žena) a 2 (muž).

Datová matice vzniká přepisem z vyplněných dotazníků, při větším počtu respondentů jde o poměrně náročnou činnost. Užitečnou praxí je přiřazené ID fixem napsat i na papírový dotazník pro pozdější dohledávání překlepů a nejasností v datové matici. Současně si doporučujeme také udržovat jeden vytištěný dotazník jako vzor, do kterého si dopíšeme ke každé položce kvantifikované kódy jednotlivých variant odpovědí.

V dnešní době se však již stává standardem využívání online dotazníků, kde odpadá krok s přepisem dat do elektronické podoby. Jednoduché dotazníky lze snadno vytvářet například v  nebo jiných více univerzálních nástrojů, které pak data umožňují exportovat ve formátu CSV - ten pak umí načíst prakticky jakýkoli analytický software, např. Microsoft Excel nebo IBM SPSS.