Prostorová analýza – Seminář 2 popisné statistiky, korelace 14. 4. 2015 Úkol č. 1 •Průměr, medián, směrodatná odchylka •Variační koeficient •Giniho koeficient • •Vizuálně přívětivé tabulky !!! •Česky!!! Možnosti interpretace •Interpretace neznamená jen přepis hodnot z tabulky do textu •Možnosti –Srovnání hodnot mezi stranami v rámci voleb –Srovnání se stejnou stranou v jiných volbách –Srovnání s jinými ukazateli (srovnání průměru a mediánu, srovnání giniho koeficientu a variačního koeficientu) –Jít zpět do dat (bude vysvětleno na příkladu) Příklady dobré praxe • Průměr •Srovnat s mediánem •Vhodné srovnat také s reálnou podporouv rámci kraje (např. Jihočeši 14,5 x 12, ODS 12,5 x 13,5) – vliv velikosti obce •KDUČSL má výrazně vyšší průměr, než medián, což je zapříčiněno odlehlými hodnotami. •Při porovnání průměru s mediánem tak můžeme zjistit mezi kterými hodnotami se vyskytuje více extrémních hodnot. Z tabulky tak vidíme, že například KSČM v roce 2013 má prakticky stejný průměr jako medián, což znamená, že se pravděpodobně vyskytovalo málo extrémních hodnot. Naopak u ČSSD v roce 2012 vidíme rozdíl až 2,5 procent. Variační koeficient •Podpora strany se mezi jednotlivými obcemi příliš nelišila, jelikož variační koeficient, jehož hodnoty ukazují variaci podpory dané strany v jednotlivých obcích, je pouze 0,36 a blíží se více 0 než 1 (ta by ukazovala na velké rozdíly mezi obcemi). •Volby do Poslanecké sněmovny 2013 vyhrála ČSSD. Její hodnota variačního koeficientu je oproti volbám do PS velmi vysoká (0,96). Podpora v jednotlivých obcích se tedy výrazně liší, což naznačuje, že se může lišit elektorát mezi jednotlivými úrovněmi voleb. Giniho koeficient •Nejvíce koncentrovanou podporu má v těchto volbách dle Giniho koeficientu strana TOP 09 (0,57). Tato situace je zapříčiněna tím, že strana získává vysokou podporu spíše ve velkých městech v rámci kraje a v menších obcích dosahuje obvykle nízkých zisků. •Tato strana měla velmi koncentrovanou volební podporu, tedy byla volena někde hodně a někde vůbec. Srovnání variační koeficient x Gini •KDU-ČSL má podle hodnoty variačního koeficientu nejvíce odlišnou podporu mezi obcemi. Giniho koeficient má však v tomto případě spíše nižší hodnotu. Ačkoli jsou tedy výsledky značně různorodé, tak nedochází k významnější koncentraci podpory. To je dáno především tím, že obce s velmi nízkou i velmi vysokou podporou strany jsou spíše menší a nemají tedy na koncentraci volební podpory velký vliv. Ne úplně dobrá praxe •Směrodatná odchylka nám ukazuje o kolik procent od průměru se může v jednotlivých obcích lišit konkrétní hodnota od průměrného zisku hlasů strany. Zde vidíme, že největší odchylky až 11% procent dosáhla ČSSD . •Díváme-li se na hodnoty variačního koeficientu, které jsou v procentuálním zobrazení … •Variační koeficient, který nám ukazuje podíl variability vzhledem k průměru, je u všech stran v pořádku; je v rozmezí hodnot 0-1. •Giniho koeficient u ČSSD dosahuje středních hodnot • •silně koncentrovaný voličský elektorát •nejblíže absolutně koncentrovanému rozložení oproti jiným stranám byla SOS a USZ, nicméně ani tyto strany nedosahují ideálu Popis vývoje volební podpory Popis vývoje volební podpory •Bazické a řetězové indexy •Korelační koeficient •Území stabilní volební podpory Území volební podpory •Přehlednost, zohlednění populační velikosti •Nevhodné pro lokální strany (např. SMK na Slovensku) • •Doplňující indikátory –Míra úspěšnosti: kolikrát je podpora strany vyšší v (jádru) území volební podpory oproti zbytku území Bazické a řetězové indexy •Řetězový index –Volby 2013/volby 2010; volby2010/volby2006 … –Ukazuje postupný vývoj •Bazický index –Volby 2013/volby2002, volby2010/volby 2002 –Ukazuje změnu stav oproti stanovenému základu – –Index volební úspěšnosti •=krajské volby 2012/poslanecké volby 2010 * 100 –Index volební stability •Krajské volby 2012/ krajské 2008 * 100 • • • Korelační analýza •Míra souvislosti mezi dvěma proměnnými •Lineární vztah •Nárůst hodnot jedné proměnné je spojený s nárůstem / poklesem hodnot druhé proměnné •Korelace neimplikuje kauzalitu •Možnost vytvořit (libovolně) velkou matici –Souvislost následujících voleb i souvislost vzdálených voleb Pearsonův korelační koeficient •Předpoklady: –Kardinální data (možná výjimka) –Pokud zjišťujeme i statistickou signifikanci, tak i normální rozložení (nebo dostatečná velikost vzorku) •V prostorové analýze obvykle není důvod zabývat se signifikancí •Hodnoty koeficientu: Rozsah od -1 po 1 •Čím více je hodnota vzdálena od nuly, tím je souvislost silnější •Existují různé návody jak označovat různě silné korelace –NEDĚLEJTE TO !!! • • Interpretace koeficientů •Míra souvislosti •Neukazuje kauzalitu •Přímo lze hodnoty srovnávat, jen pokud jsou spočítány na stejném počtu případů (- to se týká především signifikance) Území stabilní volební podpory •Strany s koncentrovanou stabilní podporou X strany s nekoncentrovanou stabilní podporou •Výpočet procenta hlasů přítomných v ÚSVP v každých volbách Analýza normálního rozdělení •Průměr, medián •Směrodatná odchylka •Kvartily •Šikmost, strmost • •testy Proč? •Můžeme použit proměnné v další analýze?