Týmový projekt z ZMĚNY STRUKTUŘE V Zpracovaly: Tereza Mar Vedoucí práce: Bc. Renata Chloupková, Mgr. Michaela Kuč Týmový projekt z Matematické biologie V DEMOGRAFICKÉ STRUKTUŘE OBYVATEL V OKRESECH Martináková, Tereza Nováková, Hana Vespalcová : Bc. Renata Chloupková, Mgr. Michaela Kuč Matematické biologie DEMOGRAFICKÉ OBYVATEL ČR Vespalcová : Bc. Renata Chloupková, Mgr. Michaela Kučerová Obsah 1. kapitola ÚVOD ........................................................................................... 3 2. kapitola HISTORIE A ZAJÍMAVOSTI........................................................ 4 3. kapitola VÝBĚR ČASOVÉHO OKNA ........................................................ 6 4. kapitola ČIŠTĚNÍ DAT............................................................................. 10 5. kapitola TRANSFORMACE DAT DO SPSS............................................ 12 6. kapitola ZVOLENÉ OBLASTI PRO TESTOVÁNÍ HYPOTÉZ.................. 13 7. kapitola TESTOVÁNÍ HYPOTÉZ ............................................................. 14 7.1. Věková struktura ................................................................................. 14 7.1.1. Podíl seniorů................................................................................. 14 7.1.2. Podíl dětí ...................................................................................... 15 9.2. Národnostní struktura.......................................................................... 16 9.2.1. Podíl Slováků................................................................................ 16 9.2.2. Podíl obyvatel s českou národností.............................................. 18 9.3. Ekonomická struktura.......................................................................... 19 9.3.1. Podíl terciéru ................................................................................ 19 8. kapitola VÝSLEDKY TESTOVÁNÍ HYPOTÉZ......................................... 22 9. kapitola VIZUALIZACE DAT V ARCGISU............................................... 23 9.1. Věková struktura................................................................................. 23 9.2. Suburbanizace .................................................................................... 28 9.3. Seznam zkratek okresů....................................................................... 31 10. kapitola ZÁVĚR...................................................................................... 32 11. kapitola PŘÍLOHA.................................................................................. 33 12. kapitola ZDROJE................................................................................... 38 Změny v demografické struktuře Martináková, Nováková, Vespalcová obyvatel ČR v okresech 3 1. kapitola ÚVOD Tématem našeho projektu jsou Změny v demografické struktuře obyvatel ČR v okresech. Demografickou strukturu můžeme popsat skrze vědu nazývanou demografie, která se zabývá vývojem populací. Pro své závěry využívá mimo jiné dat ze Sčítání lidu, domů a bytů, což je hromadné sčítání lidí a domácností, které provádí ČSÚ vždy jedenkrát za deset let. Naším cílem je výběr vhodných datových charakteristik, které by bylo možné mezi sebou korektně srovnávat a které by mohly zajímavě popsat vývoj demografické struktury v okresech ČR. Pro interpretaci výsledků jsme se snažily vybrat co nejvhodnější metody vizualizace, které by názorně zobrazovaly srovnání jak mezi roky, tak mezi okresy. Naše analýza obsahovala tyto kroky: 1. seznámení se s metodikou Sčítání lidu, domů a bytů 2. seznámení se s rozsáhlým datovým souborem 3. výběr vhodného časového okna 4. výběr kategorií pro srovnávání 5. kontrola a čištění dat 6. standardizace dat 7. vizualizace vybraných charakteristik pomocí grafů 8. transformace dat do SPSS 9. formulace hypotéz a jejich testování v SPSS 10. vizualizace vybraných charakteristik v softwaru ArcGIS 11. závěry práce Změny v demografické struktuře Martináková, Nováková, Vespalcová obyvatel ČR v okresech 4 2. kapitola HISTORIE A ZAJÍMAVOSTI Počátky sčítání lidu sahají až do Starého Říma, což dokládají záznamy nalezené na dobových hliněných tabulkách. Na našem území se první sčítání prováděla především kvůli daňovým a vojenským účelům, a to již během středověku. Později, v období Rakouska-Uherska, vznikl propracovaný a moderní systém sčítání, z něhož vycházely i metodiky mnoha dalších států. Také se ustanovila desetiletá periodicita sčítání, a to vždy na půlnoc z 31. prosince roku končícího devítkou na 1. ledna roku končícího nulou. Za první moderní sčítání lidu je považováno to z roku 1869, kdy se u obyvatel zaznamenávalo nejen pohlaví, věk, státní příslušnost či povolání, ale také například údaje o gramotnosti nebo různá postižení, jako slepota, hluchota či mentální poruchy. Československá sčítání se konala zhruba v pravidelných desetiletých intervalech, a to v letech 1921, 1930, 1947, 1950, 1961, 1970, 1980, 1991, 2001 a nejnověji v roce 2011. V roce 1940 se sčítání nekonalo z důvodu 2. světové války, a další právoplatné sčítání bylo provedeno až v roce 1950. Roku 1947 totiž proběhl pouze tzv. soupis obyvatelstva, který neměl všechny náležitosti ostatních sčítání. Soupis sloužil především k analýze poválečného stavu a výstupy nebyly tak podrobné z důvodu zmenšené rozlohy (Protektorát Čechy a Morava) a také neochotě českých úřadů poskytnout citlivé informace o průmyslu a věkové struktuře na našem území. Změny v demografické struktuře Martináková, Nováková, Vespalcová obyvatel ČR v okresech 5 Během následujících sčítání se dále vylepšovala metodika pro sběr dat i následné vyhodnocení, například v roce 1980 výsledky poprvé sestavil superpočítač a v roce 2001 bylo použito optické snímání. V průběhu let se také měnila skladba otázek – během komunismu se u obyvatel nezjišťovala víra, v roce 1980 bylo zakázáno zaznamenávat cikánský původ a na přelomu tisíciletí přibyl dotaz na přítomnost počítače v domácnosti a naopak odpadly otázky na ledničku, mrazničku či televizi. Změny v demografické struktuře Martináková, Nováková, Vespalcová obyvatel ČR v okresech 6 3. kapitola VÝBĚR ČASOVÉHO OKNA Jako podklad pro naši práci jsme obdržely soubor v Excelu s daty z let 1921 až 2011. Každá záložka pak představovala jeden rok sčítání. Pro každý rok jsme získaly tabulku se stovkami dat roztříděnými dle jednotlivých okresů (ty představovaly řádky tabulky), které v jednotlivých letech existovaly. Ve sloupcích jsme měly informace rozdělené dle jednotlivých kategorií. K souboru jsme dostaly navíc metadata, která vysvětlovala zkratky kategorií z datového souboru. Jelikož jsme dostaly takovou spoustu různorodých dat, naším prvním úkolem bylo vytvořit si tzv. časové okno, tedy vybrat si pouze ty roky, jejichž data jsou srovnatelná a vypovídající. Vzhledem k tomu, že nám je rok 2011 nejbližší, vybraly jsme si ho tedy jako referenční. Vytvořily jsme si tabulku, která shrnuje počty okresů a kategorií v jednotlivých letech, abychom snáze mohly vybrat ty roky, které by byly vhodné do našeho časového okna, viz Tabulka 1. Z našeho časového okna jsme jednoznačně vyřadily rok 1961, protože nám k němu chyběla veškerá data. Zjistily jsme, že čísla z let 1950 a 1961 jsou naprosto shodná, proto jsme pomocí metadat a informací z Českého statistického úřadu1 přiřadily daná data pouze tomu roku, kterému reálně náležela, tedy roku 1950. Vzhledem k tomu, že všechna čísla jsou tříděna dle jednotlivých okresů, zaměřily jsme se v prvé řadě na ně. Nejdříve jsme musely názvy okresů sjednotit tak, abychom je v každém roce měly zařazeny pod stejným názvem 1 https://www.czso.cz/csu/sldb Změny v demografické struktuře Martináková, Nováková, Vespalcová obyvatel ČR v okresech 7 např. Zlín/Gottwaldov. Dále jsme vyřadily z dat od roku 1970 a výše okres Boskovice, jelikož v tomto období již neexistoval. V roce 1950 existovalo 182 okresů, v roce 1947 163 okresů a v předešlých letech přibližně dvakrát více okresů. V následujících letech se území dělilo na 77 okresů až do roku 1996, kdy vznikl okres Jeseník vyčleněním z okresu Šumperk a přidáním města Zlaté hory z okresu Bruntál. Můžete si všimnout, že 78 okresů (viz Obrázek 1), tedy 77 okresů společně s Jeseníkem však existuje již od roku 1991 (viz Tabulka 1). Data pro něj jsou z tohoto roku uměle dopočítána. Obrázek 1: Rozložení okresů z roku 2005 (stejné i v roce 2016) Změny v demografické struktuře Martináková, Nováková, Vespalcová obyvatel ČR v okresech 8 Co se týče okresů, zdálo se vhodné použít ty roky, kde se vyskytovalo 77 či 78 okresů. Musely jsme však ověřit, zda 182 okresů z roku 1950 nelze sečíst dohromady tak, abychom dostaly dnešních 78 okresů. Že to není možné, jsme dokázaly pomocí dvou přes sebe překrytých map, viz Obrázek 2. Obrázek 2: Porovnání hranic okresů z roku 2005 a 1950 Dále jsme se zaměřily na počty kategorií v jednotlivých letech. Nejvhodnější pro nás samozřejmě byly ty roky, které se nejblíže v počtu kategorií blížily našemu referenčnímu roku, tedy roku 2011. Tyto skutečnosti jsme sledovaly v naší tabulce, (viz Tabulka 1), a zobrazily si je i pomocí barevných spekter (viz Obrázek 3). Co se týče obrázku, nejlépe pro nás vychází v jednotlivých druzích kategorií ta barevná spektra, která mají nejblíže k barevnému spektru roku 2011. Změny v demografické struktuře obyvatel ČR v okresech Obrázek 3: Jednotlivé druhy kategorií v porovnán podle barevného spektra (od od nejmenšího počtu po černá pro Z počtu okresů a kategorií nám vyplývá, že nejvhodnější časové okno, se kterým budeme dále pracovat viz Obrázek 4. Obrázek 4 demografické struktuře Martináková, Nováková, Vespalcová 9 é druhy kategorií v letech 1921 – 2011 → počet kategorií revného spektra (od nejsvětlejší po nejtmavší odstín nejmenšího počtu po největší; šedá barva pro rok 1961 – data zcela chybí; černá pro chybějící druhy kategorií) počtu okresů a kategorií nám vyplývá, že nejvhodnější časové okno, se pracovat, sestává z roků 1970, 1980, 1991, 2001 a 2011, 4: Zvolené časové okno a jeho výhody Martináková, Nováková, Vespalcová počet kategorií nejtmavší odstín – data zcela chybí; počtu okresů a kategorií nám vyplývá, že nejvhodnější časové okno, se 1991, 2001 a 2011, a jeho výhody Změny v demografické struktuře Martináková, Nováková, Vespalcová obyvatel ČR v okresech 10 4. kapitola ČIŠTĚNÍ DAT Tato kapitola obsahuje soubor chyb a nesrovnalostí, se kterými jsme se musely vypořádat předtím, než jsme mohly dále s daty pracovat. V první řadě jsme při čištění dat narazily na duplicity ve formě zdvojených okresů. V rámci jednotlivých období jsme našly duplicitní okresy buď všechny (r. 1991), nebo pouze některé (r. 1980). Za zmínku stojí okres Cheb, u kterého v jedné z duplicit chyběla některá data, musely jsme tedy brát ohled i na to, zda zachováváme Cheb s kompletními informacemi. Další okres, který byl původně zdánlivě duplicitní, je okres Vyškov, u kterého jsme posléze zjistily, že není zdvojený, ale rozpůlený, takže bylo třeba sečíst data z obou jeho částí. V datech se nám dále objevovaly zdvojené kategorie, a to v oblasti národnostní struktury rozdělené na dvě části. Některé kategorie se nacházely v obou částech totožně (národnost polská), jiné byly v druhé části rozděleny na podrobnější podkategorie národností z první části (národnost ruská a ukrajinská). Jako třetí skupina objektů k vyřešení byly v rámci různých období kategorie navíc, ať už jako celé soubory kategorií (kategorie rodáci), nebo samostatně (národnost vietnamská; česká, moravská a slezská). Ty bylo třeba promazat, případně sloučit. Narazily jsme také na chybějící a chybná data v buňkách či celých sloupečcích, například v roce 2001 se v kategorii celkového počtu obyvatel objevovaly hodnoty řádově tisíckrát vyšší. V obou případech jsme hodnoty mohly dopočítat, s čímž souvisí i následující část čištění dat. Změny v demografické struktuře Martináková, Nováková, Vespalcová obyvatel ČR v okresech 11 Abychom se ujistily o správnosti dat v různých sloupcích, případně našly další chybné hodnoty, provedly jsme kontrolu součtů mužů a žen na celé obyvatelstvo, dále pak všech podkategorií na vyšší kategorie (jako například součty podkategorií z počtu mužů ve věku 0 – 14 let) a kategorií na celkové počty mužů a žen. Jako poslední úpravu jsme provedly sjednocení názvů okresů v rámci jednotlivých let (tzn. aby se nám v některých letech neobjevovalo např. Ústí n. Orlicí a v dalších Ústí nad Orlicí), což potřebujeme k následující práci s tímto souborem dat. Změny v demografické struktuře Martináková, Nováková, Vespalcová obyvatel ČR v okresech 12 5. kapitola TRANSFORMACE DAT DO SPSS Pro testování hypotéz bylo nutné již vyčištěný datový soubor upravit a z Excelu transformovat do softwaru SPSS. Nejprve jsme sjednotily názvy kategorií, aby se shodovaly ve všech obdobích, a připojily jsme k nim příslušné roky tak, aby byly ve tvaru rok+název kategorie, tedy například „1970 o_bo_m“ (zkratka pro celkový počet mužů). Data jsme také přepočítaly na řádkové a sloupcové relativní četnosti, a tím jsme dostaly procentuální zastoupení obyvatelstva v rámci souboru okresů a souborů kategorií, tedy například procentuální zastoupení osob pracujících v sektoru priméru, sekundéru a terciéru. Tímto krokem jsme umožnily srovnání jednotlivých období mezi sebou (v případě řádkové standardizace) a srovnání jednotlivých okresů (v případě sloupcové standardizace). Z těchto dat jsme následně vycházely při výběru testů pro testování hypotéz. Poté jsme již pracovaly s SPSS, kde jsme pomocí funkce „merge files“ pospojovaly samostatné listy do jednoho celku a seřadily jsme jednotlivé kategorie v rámci po sobě jdoucích let. Změny v demografické struktuře Martináková, Nováková, Vespalcová obyvatel ČR v okresech 13 6. kapitola ZVOLENÉ OBLASTI PRO TESTOVÁNÍ HYPOTÉZ V prvé řadě jsme si zobrazily některé charakteristiky našeho časového okna v různých grafech (viz Graf 5 – 10), z některých jsme čerpaly při vytváření hypotéz (viz 7. kapitola). Dalším krokem, který jsme provedly, byla volba oblastí a hypotéz. V této kapitole tedy tyto oblasti nastíníme. Jako první jsme si vybraly věkovou strukturu, která je rozdělená na tři části: děti (ve věku 0 – 14 let), obyvatelstvo v produktivním věku (15 – 64 let) a senioři (od 65 let výše). My jsme se v této oblasti zaměřily na zastoupení dětí a seniorů v populaci. Druhá oblast, kterou jsme si vybraly, je národnostní struktura, kde máme vyjma české národnosti nejvíce v datech zastoupeny národnosti slovenskou, polskou, německou, ukrajinskou a ruskou, dále také některé národnosti, které se objevují pouze v určitých obdobích, například národnost vietnamská nebo cikánská. V této části jsme se rozhodly sledovat podíl občanů české národnosti vůči cizincům a podíl občanů slovenské národnosti vůči ostatním cizincům. Poslední oblastí je ekonomická struktura, rozdělená do tří kategorií, priméru, sekundéru a terciéru. Do priméru jsou řazeny profese ze sekce zemědělství, lesnictví a rybářství, do sekundéru pak profese ze sekce průmyslu a stavebnictví a do terciéru vše ostatní, což jsou profese informačních služeb, dopravy, obchodu, pohostinství, ubytování, administrativy či vzdělávání a zdravotní, či sociální péče. Zde nás zaujal přesun profesí ze sekundéru do terciéru. Změny v demografické struktuře obyvatel ČR v okresech 7. kapitola 7.1. Věková struktura 7.1.1. Podíl seniorů V oblasti věkové struktury jsme se zaměřily nejprve na republiky stárne. Zkoumaly jsme podíl seniorů (obyvatel nad okresech, a to v okrajových letech našeho časového okna, 2011. Graf 1: Procentuální rozložení věkové struktury obyvatelstva ČR Přesné znění nulové a alternativní hypotézy jsme formulovaly takto: H0: podíl obyvatelstva staršího 65 let v obyvatelstva staršího 65 let v 14,27% 21,22% 0% 10% 20% 2011 1970 čas(roky) Procentuální rozložení věkové struktury věk 0-14 demografické struktuře Martináková, Nováková, Vespalcová 14 TESTOVÁNÍ HYPOTÉZ Věková struktura díl seniorů oblasti věkové struktury jsme se zaměřily nejprve na to, jak populace České republiky stárne. Zkoumaly jsme podíl seniorů (obyvatel nad 65 let) v okrajových letech našeho časového okna, tedy v roce 1970 a v Graf 1: Procentuální rozložení věkové struktury obyvatelstva ČR Přesné znění nulové a alternativní hypotézy jsme formulovaly takto: obyvatelstva staršího 65 let v roce 1970 v okresech ČR = podíl va staršího 65 let v roce 2011 v okresech ČR 69,63% 66,59% 20% 30% 40% 50% 60% 70% 80% procentuální zastoupení věkových kategorií Procentuální rozložení věkové struktury obyvatelstva ČR 14 věk 15-64 věk 65 a více věk neznámý Martináková, Nováková, Vespalcová to, jak populace České 65 let) v jednotlivých roce 1970 a v roce Graf 1: Procentuální rozložení věkové struktury obyvatelstva ČR Přesné znění nulové a alternativní hypotézy jsme formulovaly takto: okresech ČR = podíl 15,76% 12,19% 80% 90% 100% Procentuální rozložení věkové struktury Změny v demografické struktuře Martináková, Nováková, Vespalcová obyvatel ČR v okresech 15 H1: podíl obyvatelstva staršího 65 let v roce 1970 v okresech ČR ≠ podíl obyvatelstva staršího 65 let v roce 2011 v okresech ČR Pro správný výběr testu jsme nejprve musely otestovat normalitu dat. Ta byla Shapiro-Wilkovým i Kolmogo-Smirnovovým testem na 5% hladině významnosti potvrzena, proto jsme zvolily párový t-test. Na 5% hladině významnosti nám vyšla p-hodnota menší než 0,001, nulovou hypotézu jsme tedy zamítly a přiklonily se k alternativní hypotéze, že podíl obyvatelstva staršího 65 let se v letech 1970 a 2011 mění. Dle Tabulky 2 a Grafu 1 vidíme, že podíl obyvatel starších 65 let se mezi testovanými roky zvýšil. Roky 1970 2011 Podíl obyvatel nad 65 let 0,1219 0,1569 Podíl obyvatel 0 – 14 let 0,2181 0,1461 Tabulka 2: Průměry podílů seniorů a dětí v letech 1970 a 2011 7.1.2. Podíl dětí Dále jsme chtěly zjistit, zda se statisticky významně mění i podíl dětí, otestovaly jsme tedy obdobné hypotézy pro obyvatele ve věku 0 – 14 let v tomto znění: H0: podíl obyvatelstva ve věku 0 – 14 let v roce 1970 v okresech ČR = podíl obyvatelstva ve věku 0 – 14 let v roce 2011 v okresech ČR H1: podíl obyvatelstva ve věku 0 – 14 let v roce 1970 v okresech ČR ≠ podíl obyvatelstva ve věku 0 – 14 let v roce 2011 v okresech ČR Změny v demografické struktuře Martináková, Nováková, Vespalcová obyvatel ČR v okresech 16 Po ověření normality dat, jež byla potvrzena, jsme se opět rozhodly pro použití párového t-testu. Výsledek byl stejný – p-hodnota menší než 0,001, nulová hypotéza byla na 5% hladině významnosti zamítnuta a podíly dětí se v uvedených letech liší. Dle Tabulky 2 a Grafu 1 vidíme, že podíl obyvatel 0 – 14 let se mezi testovanými roky snížil. 7.2. Národnostní struktura 7.2.1. Podíl Slováků Jako další oblast našeho zkoumání jsme si zvolily národnostní strukturu jednotlivých okresů. Zajímalo nás, zda rozdělení Československa v roce 1993 mělo nějaký vliv na podíl obyvatel se slovenskou národností. Testovaly jsme tedy jejich podíl v letech 1991 a 2001. Kvůli poměrně vysokému podílu neznámé národnosti v roce 2001 bylo nutné tuto skutečnost nějak ošetřit a jako nejkorektnější se nám jevilo rozpočítat obyvatele s neznámou národností spravedlivě mezi zbylé kategorie. Po této úpravě jsme přistoupily opět k testování normality dat, která byla Shapiro-Wilkovým i Kolmogoro-Smirnovovým testem na 5% hladině významnosti potvrzena. Změny v demografické struktuře obyvatel ČR v okresech Graf 2: Procentuální podíl Z toho důvodu jsme pro t-test. Hypotézy jsme stanovily následovně: H0: podíl Slováků ku všem cizincům Slováků v ČR v roce 2001 H1: podíl Slováků ku všem cizincům Slováků v ČR v roce 2001 P-hodnota nám vyšla menší než 0,001 proto zamítly nulovou hypotézu ve slovenskou národností v roce 1991 j národností v roce 2001 a podle uvedenými roky snížil. Dá se tedy předpokládat, že po na dva samostatné státy se část Slováků vrátila na výsledek však není úplně spolehlivý kvůli rozpočítání neznámé národnosti mezi ostatní, které jsme provedly demografické struktuře Martináková, Nováková, Vespalcová 17 2: Procentuální podíl jiných než českých národností v ČR v 2001 důvodu jsme pro otestování níže uvedených hypotéz vybraly test. Hypotézy jsme stanovily následovně: ku všem cizincům v okresech ČR v roce 1991 = podíl roce 2001 ku všem cizincům v okresech ČR v roce 1991 roce 2001 hodnota nám vyšla menší než 0,001, na 5% hladině významnosti jsme nulovou hypotézu ve prospěch alternativní. Podíl obyvatel se roce 1991 je tedy odlišný od podílu obyvatel se slovenskou roce 2001 a podle Tabulky 3 a Grafu 2 je vidět, že se tento podíl mezi Dá se tedy předpokládat, že po rozdělení Československa táty se část Slováků vrátila na své domovské území. výsledek však není úplně spolehlivý kvůli rozpočítání neznámé národnosti ostatní, které jsme provedly před testováním této hypotézy. Martináková, Nováková, Vespalcová ČR v letech 1991 a uvedených hypotéz vybraly párový roce 1991 = podíl roce 1991 ≠ podíl 5% hladině významnosti jsme prospěch alternativní. Podíl obyvatel se podílu obyvatel se slovenskou je vidět, že se tento podíl mezi rozdělení Československa své domovské území. Tento výsledek však není úplně spolehlivý kvůli rozpočítání neznámé národnosti Změny v demografické struktuře obyvatel ČR v okresech Roky Podíl Slováků Tabulka 3: Průměry 7.2.2. Podíl obyvatel s Podobně jako podíl Slováků jsme se rozhodly otestovat i podíl obyvatel s českou národností, a to v hranic na množství obyvatel jsme použily neparametrický Wilcoxonův rozdělení. Graf 3: Procentuální rozložení národnostní struktury obyvatelstva ČR Hypotézy jsme formulovaly takto: H0: podíl občanů s občanů s českou národností v 0% 10% 20% 1991 1980 čas(roky) Procentuální rozložení národnostní Češi Slováci Rusové a Ukrajinci demografické struktuře Martináková, Nováková, Vespalcová 18 1991 0,6588 ůměry podílů Slováků v letech 1991 a 2001 Podíl obyvatel s českou národností Podobně jako podíl Slováků jsme se rozhodly otestovat i podíl obyvatel českou národností, a to v letech 1980 a 1991, neboť nás zajímal vliv otevření množství obyvatel v jednotlivých okresech ČR. U testování této hypotézy použily neparametrický Wilcoxonův párový test, neboť data neměla Graf 3: Procentuální rozložení národnostní struktury obyvatelstva ČR Hypotézy jsme formulovaly takto: českou národností v okresech ČR v roce 1980 = pod českou národností v roce 1991 94,89% 94,77% 30% 40% 50% 60% 70% 80% Procentuální podíl jednotlivých kategorií Procentuální rozložení národnostní struktury obyvatelstva ČR Rusové a Ukrajinci Němci Poláci Maďaři jiná nár. Martináková, Nováková, Vespalcová 2001 0,4436 letech 1991 a 2001 Podobně jako podíl Slováků jsme se rozhodly otestovat i podíl obyvatel letech 1980 a 1991, neboť nás zajímal vliv otevření stování této hypotézy párový test, neboť data neměla normální Graf 3: Procentuální rozložení národnostní struktury obyvatelstva ČR roce 1980 = podíl 5,11% 5,23% 80% 90% 100% struktury jiná nár. neznámá Změny v demografické struktuře Martináková, Nováková, Vespalcová obyvatel ČR v okresech 19 H1: podíl občanů s českou národností v okresech ČR v roce 1980 ≠ podíl občanů s českou národností v roce 1991 Výsledkem testu byla p-hodnota 0,025, tedy menší než 0,05 (testovaly jsme opět na 5% hladině významnosti). Nulovou hypotézu jsme zamítly a přiklonily se k alternativní hypotéze, tedy k tomu, že podíly obyvatel s českou národností se v letech 1980 a 1991 různí. Dle Tabulky 4 a Grafu 3 je vidět, že se tento podíl mezi testovanými roky mírně snížil. Z toho zároveň vyplývá, že po revoluci se na našem území zvýšil počet cizinců. Roky 1980 1991 Podíl obyvatel s českou národností 0,9677 0,9669 Tabulka 4: Mediány podílů obyvatel s českou národností 1980 a 1991 7.3. Ekonomická struktura 7.3.1. Podíl terciéru Jako poslední se pod naším drobnohledem ocitla ekonomická struktura. Rozhodly jsme se prozkoumat, jak probíhal proces tercializace v okresech ČR. Protože jde o proces postupný, pokusily jsme se zmapovat jeho průběh mezi roky 1970, 1991 a 2011. Změny v demografické struktuře obyvatel ČR v okresech Graf 4: Zobrazení ekonomické struktury obyvatelstva ČR Testovaly jsme mezi sebou všechny dvojice roků, hypotézy jsme stanovily následovně: H0: podíl terciéru v v okresech ČR H1: podíl terciéru v v okresech ČR H0: podíl terciéru v v okresech ČR H1: podíl terciéru v v okresech ČR H0: podíl terciéru v v okresech ČR H1: podíl terciéru v v okresech ČR 3,17% 11,96% 18,42% 0% 2011 1991 1970 čas(roky) Procentuální rozložení ekonomické demografické struktuře Martináková, Nováková, Vespalcová 20 Graf 4: Zobrazení ekonomické struktury obyvatelstva ČR Testovaly jsme mezi sebou všechny dvojice roků, hypotézy jsme stanovily roce 1970 v okresech ČR = podíl terciéru v roce 1970 v okresech ČR ≠ podíl terciéru v roce 1991 v okresech ČR = podíl terciéru v roce 1991 v okresech ČR ≠ podíl terciéru v roce 1970 v okresech ČR = podíl terciéru v roce 1970 v okresech ČR ≠ podíl terciéru v 37,66% 46,19% 61,55% 59,17% 41,85% 20,03% 20% 40% 60% 80% procentuální zastoupení ekonomických sektorů Procentuální rozložení ekonomické struktury obyvatelstva ČR Primér Sekundér Terciér Martináková, Nováková, Vespalcová Graf 4: Zobrazení ekonomické struktury obyvatelstva ČR Testovaly jsme mezi sebou všechny dvojice roků, hypotézy jsme stanovily okresech ČR = podíl terciéru v roce 1991 ≠ podíl terciéru v roce 1991 okresech ČR = podíl terciéru v roce 2011 ≠ podíl terciéru v roce 2011 h ČR = podíl terciéru v roce 2011 ≠ podíl terciéru v roce 2011 20,03% 100% Změny v demografické struktuře Martináková, Nováková, Vespalcová obyvatel ČR v okresech 21 Pro všechny hypotézy jsme po zamítnutí normality dat vybraly Wilcoxonův párový test, jehož p-hodnoty vyšly po řadě menší než 0,001, 0,001 a menší než 0,001. Ve všech případech jsme tedy na 5% hladině významnosti nulovou hypotézu zamítly ve prospěch alternativní hypotézy. Z těchto výsledků vyplývá, že podíl terciéru se ve všech třech letech mění a dle Tabulky 5 a Grafu 4 tento podíl ve sledovaných letech roste na úkor sekundéru. Tím jsme tedy potvrdily probíhající proces tercializace. Roky 1970 1991 2011 Podíl terciéru 0,0739 0,1860 0,1922 Tabulka 5: Mediány podílů terciéru v letech 1970, 1991, 2011 Změny v demografické struktuře Martináková, Nováková, Vespalcová obyvatel ČR v okresech 22 8. kapitola VÝSLEDKY TESTOVÁNÍ HYPOTÉZ Výsledky testování hypotéz jsme shrnuly v Tabulce 6. H0 použitý test testovaná hladina významnosti p-hodnota Zamítáme H0 podíly obyvatel nad 65 let v letech 1970 a 2011 párový t-test 5% <0,001 ano podíly obyvatel 0 – 14 let v letech 1970 a 2011 párový t-test 5% <0,001 ano podíly Slováků v letech 1991 a 2001 párový t-test 5% <0,001 ano podíly Čechů v letech 1980 a 1991 neparametrický Wilcoxonův párový test 5% 0,025 ano podíly terciéru v letech 1970 a 1991 neparametrický Wilcoxonův párový test 5% <0,001 ano podíly terciéru v letech 1991 a 2011 neparametrický Wilcoxonův párový test 5% 0,001 ano podíly terciéru v letech 1970 a 2011 neparametrický Wilcoxonův párový test 5% <0,001 ano Tabulka 6: Výsledky testování hypotéz Změny v demografické struktuře Martináková, Nováková, Vespalcová obyvatel ČR v okresech 23 9. kapitola VIZUALIZACE DAT V ARCGISU V závěrečné části naší práce jsme vizualizovaly pozorovaná data pomocí geoinformatického softwaru ArcGIS. Kromě věkové struktury, kterou jsme zkoumaly i při testování hypotéz, jsme se ještě zaměřily na problematiku suburbanizace, tedy vývoj okrajových částí velkých měst. Podkladovou mapu ČR, kterou jsme posléze obarvovaly, pro nás upravily vedoucí našeho projektu (původní zdroj je uveden v 12. kapitole). Jednotlivé okresy jsou na mapkách popsány zkratkami, jejichž seznam naleznete v Tabulce 7 na konci této kapitoly, procenta uvedená v legendách jsou zaokrouhlena. 9.1. Věková struktura Z oblasti věkové struktury jsme se rozhodly nejprve pro porovnávání podílu seniorů, a to v různých souvislostech. První srovnání jsme provedly pro procentuální zastoupení obyvatel nad 65 let v jednotlivých okresech, a to mezi hraničními roky našeho časového okna. Na Obrázku 5 a 6 můžeme pozorovat, jaké jsou podíly seniorů v okresech ČR v letech 1970 a 2011. Obarvená mapa nám dobře ilustruje rostoucí podíl seniorů, což jsme prokázaly již dříve při testování hypotéz (viz kapitola 7). Změny v demografické struktuře Martináková, Nováková, Vespalcová obyvatel ČR v okresech 24 5,50-13,50% 13,51-15,00% 15,01-16,50% 16,51-17,50% data nejsou k dispozici 12,00-13,50% 13,51-15,00% 15,01-16,50% 16,51-18,00% Obrázek 5: Podíl seniorů v okresech v roce 1970 Obrázek 6: Podíl seniorů v okresech v roce 2011 Dále nás zajímalo rozložení seniorů mezi jednotlivými okresy, tedy jaké podíly můžeme v okresech pozorovat, zvolíme-li si jako 100% celkový počet seniorů v daném roce. Tyto podíly jsme vizualizovaly opět pro roky 1970 a 2011 (viz Obrázek 7 a 8). Zvyšující se koncentraci seniorů můžeme pozorovat především ve větších městech ČR, kam se starší lidé mohou stěhovat například kvůli vyšší Změny v demografické struktuře Martináková, Nováková, Vespalcová obyvatel ČR v okresech 25 0,25-1,00% 1,01-2,50% 2,51-4,00% 4,01-13,00% data nejsou k dispozici 0,35-1,00% 1,01-2,50% 2,51-4,00% 4,01-12,00% úrovni občanské vybavenosti, lepší dostupnosti lékařské péče či kontaktům s potomky, kteří zde pracují. Obrázek 7: Rozložení seniorů v okresech v roce 1970 Obrázek 8: Rozložení seniorů v okresech v roce 2011 Změny v demografické struktuře Martináková, Nováková, Vespalcová obyvatel ČR v okresech 26 15,00-15,50% 15,51-17,50% 17,51-18,00% 18,01-29,00% data nejsou k dispozici 12,00-15,50% 15,51-17,50% 17,51-18,00% 18,01-18,50% Podobně jako podíl seniorů jsme si v jednotlivých okresech znázornily i podíl obyvatel ve věku 0 – 14 let, opět pro roky 1970 a 2011. Z Obrázku 9 a 10 můžeme vidět, že mezi zvolenými roky došlo k poklesu podílu dětí ve všech okresech, což je závěr shodný s výsledkem, k jakému jsme dospěly i při testování hypotéz (viz 7. kapitola). Obrázek 9: Podíl dětí v okresech v roce 1970 Obrázek 10: Podíl dětí v okresech v roce 2011 Změny v demografické struktuře Martináková, Nováková, Vespalcová obyvatel ČR v okresech 27 0,45-1,00% 1,01-2,50% 2,51-4,00% 4,01-8,00% data nejsou k dispozici 0,25-1,00% 1,01-2,50% 2,51-4,00% 4,01-7,50% Dle Obrázku 12 je v roce 2011 dobře pozorovatelný vyšší podíl obyvatel do 14 let v okolí větších měst, kde se často mladé rodiny s dětmi usazují, zatímco v roce 1970 dle Obrázku 11 jsou děti rozptýleny rovnoměrněji mezi jednotlivými okresy (vyšší podíly můžeme pozorovat především na Moravě a v horských oblastech na severozápadě Čech). Obrázek 11: Rozložení dětí v okresech v roce 1970 Obrázek 12: Rozložení dětí v okresech v roce 2011 Změny v demografické struktuře Martináková, Nováková, Vespalcová obyvatel ČR v okresech 28 0,45-0,80% 0,81-1,50% 1,51-2,50% 2,51-4,00% 4,01-11,00% data nejsou k dispozici 9.2. Suburbanizace Obarvené mapy, které dokumentují postupný proces suburbanizace, znázorňují rozvrstvení obyvatel mezi jednotlivé okresy v uvedených letech. Při porovnávání Obrázků 13 až 17 si můžeme všimnout, že zatímco mezi roky 1970 a 1980 se lidé stěhují do okresů s většími, především krajskými městy (kromě Prahy, Brna a Ostravy např. Pardubice, Hradec Králové či Liberec), od roku 1991 spíše osidlují jejich okolní oblasti, neboť zde nacházejí příjemnější prostředí pro život. Obrázek 13: Rozložení obyvatel v okresech v roce 1970 Změny v demografické struktuře Martináková, Nováková, Vespalcová obyvatel ČR v okresech 29 0,45-0,80% 0,81-1,50% 1,51-2,50% 2,51-4,00% 4,01-11,50% data nejsou k dispozici 0,45-0,80% 0,81-1,50% 1,51-2,50% 2,51-4,00% 4,01-12,00% data nejsou k dispozici Obrázek 14: Rozložení obyvatel v okresech v roce 1980 Obrázek 15: Rozložení obyvatel v okresech v roce 1991 Změny v demografické struktuře Martináková, Nováková, Vespalcová obyvatel ČR v okresech 30 0,40-0,80% 0,81-1,50% 1,51-2,50% 2,51-4,00% 4,01-11,50% 0,40-0,80% 0,81-1,50% 1,51-2,50% 2,51-4,00% 4,01-12,00% Obrázek 16: Rozložení obyvatel v okresech v roce 2001 Obrázek 17: Rozložení obyvatel v okresech v roce 2011 Změny v demografické struktuře Martináková, Nováková, Vespalcová obyvatel ČR v okresech 31 Název okresu Zkratka Název okresu Zkratka Benešov BN Nymburk NB Beroun BE Olomouc OC Blansko BK Opava OP Brno-město BM Ostrava-město OV Brno-venkov BI Pardubice PU Bruntál BR Pelhřimov PE Břeclav BV Písek PI Česká Lípa CL Plzeň-jih PJ České Budějovice CB Plzeň-město PM Český Krumlov CK Plzeň-sever PS Děčín DC Praha PH Domažlice DO Praha-východ PY Frýdek-Místek FM Praha-západ PZ Havlíčkův Brod HB Prachatice PT Hodonín HO Prostějov PV Hradec Králové HK Přerov PR Cheb CH Příbram PB Chomutov CV Rakovník RA Chrudim CR Rokycany RO Jablonec nad Nisou JN Rychnov nad Kněžnou RK Jeseník JE Semily SM Jičín JC Sokolov SO Jihlava JI Strakonice ST Jindřichův Hradec JH Svitavy SY Karlovy Vary KV Šumperk SU Karviná KI Tábor TA Kladno KD Tachov TC Klatovy KT Teplice TP Kolín KO Trutnov TU Kroměříž KM Třebíč TR Kutná Hora KH Uherské Hradiště UH Liberec LI Ústí nad Labem UL Litoměřice LT Ústí nad Orlicí UO Louny LN Vsetín VS Mělník ME Vyškov VY Mladá Boleslav MB Zlín ZL Most MO Znojmo ZN Náchod NA Žďár nad Sázavou ZR Nový Jičín NJ 9.3. Seznam zkratek okresů Tabulka 7: Zkratky okresů Změny v demografické struktuře Martináková, Nováková, Vespalcová obyvatel ČR v okresech 32 10. kapitola ZÁVĚR Z velkého množství dat, které jsme měly k dispozici, jsme se snažily vybrat to, co jsme považovaly za zajímavé. Vybrané oblasti jsme poté zkoumaly a dospěly k následujícím závěrům. V oblasti věkové struktury jsme prokázaly zvyšující se podíl seniorů v okresech mezi roky 1970 a 2011, a to jak pomocí testování hypotéz a grafů, tak pomocí obarvených mapek. Zjistily jsme, že největší část seniorů nalezneme především ve velkých městech ČR. Dále jsme pozorovaly značné snížení podílu dětí v okresech mezi roky 1970 a 2011. Kromě snížení procentuálního zastoupení se změnilo i jejich rozvrstvení, a to kvůli tomu, že rodiny s dětmi si vybírají jiné lokality pro život. V oblasti národnostní struktury jsme prokázaly po otevření hranic v roce 1989 snížení podílu Čechů, zároveň tedy zvýšení podílu cizinců v našich okresech. Také se nám podařilo zjistit, že po rozdělení Československa v roce 1993 se podíl Slováků v okresech ČR snížil. Jak však bylo dříve řečeno, tento výsledek jsme získaly z dostupných dat, kde jsme rozpočítávaly podíl neznámé národnosti, tudíž je zde určitá pravděpodobnost chyby. V oblasti ekonomické struktury jsme pomocí grafů i hypotéz doložily probíhající proces tercializace, tedy zvyšující se podíl lidí pracujících v sektoru služeb. Jako nedostatek vnímáme přítomnost kategorie „neznámá“ či „nezjištěno“, a to jak ve věkové, tak především v národnostní struktuře. Pokud by byla tato data známá, všechny výsledky by pak byly přesnější a spolehlivější. Změny v demografické struktuře obyvatel ČR v okresech 11. kapitola Graf 5: Srovnání počtu obyvatel v Graf 6: Srovná 94 95 96 97 98 99 100 101 102 103 104 105 1970 početjedinců(statisíce) Srovnání počtu obyvatel v letech 1970 44 45 46 47 48 49 50 51 52 53 54 55 1970 početjedinců(statisíce) Srovnání počtu žen a mužů v letech 1970 demografické struktuře Martináková, Nováková, Vespalcová 33 PŘÍLOHA Graf 5: Srovnání počtu obyvatel v letech Graf 6: Srovnání počtu žen a mužů v letech 1980 1991 2001 čas (roky) Srovnání počtu obyvatel v letech 1970 – 1980 1991 2001 čas (roky) Srovnání počtu žen a mužů v letech 1970 – ženy muži Martináková, Nováková, Vespalcová 2011 2011 2011 – 2011 Změny v demografické struktuře obyvatel ČR v okresech Graf 7: Procentuální počet obyvatel Graf 8: Procentuální rozložení věkové struktury obyvatelstva ČR 0,0% 0,5% 1,0% 1,5% 2,0% 2,5% 3,0% 3,5% 1970 1980 početobyvatelvokresechkucelkovémupočtu obyvatel Procentuální počet obyvatel vybraných okresů v letech demografické struktuře Martináková, Nováková, Vespalcová 34 : Procentuální počet obyvatel – vybrané okresy v : Procentuální rozložení věkové struktury obyvatelstva ČR 1980 1991 2001 2011 čas (roky) Procentuální počet obyvatel vybraných okresů v letech Martináková, Nováková, Vespalcová vybrané okresy v letech : Procentuální rozložení věkové struktury obyvatelstva ČR Procentuální počet obyvatel vybraných okresů v letech Karviná Ostrava-město Plzeň-město Praha-východ Praha-západ Šumperk Změny v demografické struktuře obyvatel ČR v okresech Graf 9: Procentuální rozložení věkové struktury žen/mužů ČR 14,95% 17,04% 22,18% 24,75% 22,47% 0% 10% 20% 2011 2001 1991 1980 1970 čas(roky) Procentuálnírozloženívěkové struktury mužů ČR věk0demografické struktuře Martináková, Nováková, Vespalcová 35 : Procentuální rozložení věkové struktury žen/mužů ČR 71,66% 72,02% 68,00% 64,44% 67,70% 30% 40% 50% 60% 70% 80% procentuální zastoupení věkových kategorií Procentuálnírozloženívěkové struktury mužů ČR -14 věk15-64 věk65 a více věkneznámý Martináková, Nováková, Vespalcová : Procentuální rozložení věkové struktury žen/mužů ČR 13,00% 10,90% 9,81% 10,81% 9,83% 90% 100% Procentuálnírozloženívěkové struktury mužů ČR 51,1 49,8 50,6 49,9 47,5 početobyvatel(desetitisíce) Změny v demografické struktuře Martináková, Nováková, Vespalcová obyvatel ČR v okresech 36 Graf 10: Procentuální rozložení věkové struktury – poměr žen/mužů 20,8 65,3 12,0 početobyvatel(desetitisíce) 60,93% 50,77% 48,73% 39,07% 49,23% 51,27% 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% věk65 a více věk15-64 věk0-14 procentuální zastoupení věkových kategorií jednotlivévěkovékategorie Procentuálnírozloženívěkové strukturyžen/mužůČR v roce 1970 ženy muži 14,9 72,7 16,4 0,444,14% 59,62% 49,61% 48,69% 55,86% 40,38% 50,39% 51,31% 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% neznámý věk věk65 a více věk15-64 věk0-14 procentuální zastoupení věkových kategorií jednotlivévěkovékategorie Procentuálnírozloženívěkové struktury žen/mužůČR v roce 2011 ženy muži početobyvatel(desetitisíce) 37 Tabulka1:Souhrnúdajůzezdrojovýchdat Kategorie\Roky2011192119301947195019611970198019912001 okresy78328330163182chybí 77(nenítam Jeseník) 77(nenítam Jeseník) 78(odtohoto rokuiJeseník) 78 věková struktura podlepohlaví po5letech 3kategorie, jinévěkové členění (15-59) 3kategorie podlepohlaví po5letech, od65let dohromady méně podrobná- členěníjen na3 kategorie chybí podlepohlaví po5letech chybícelkový součetobyvatel (dásedopočítat) Podlepohlavípo5 letech,chybípočet sneznámýmvěkem aprůměr(dáse dopočítat) Podlepohlaví po5letech, chybípočet sneznámým věkem Podle pohlavípo5 letech rodinnýstav15kategorií20kategorií 21kategorií (jednak.2x) chybí15kategoriíchybí15kategorií15kategorií15kategorií15kategorií vzdělání 21kategorií, věknad15let chybíchybíchybíchybíchybí 21kategorií, věkneohraničen 21kategorií,věk nad15let,základní vzd.pouze dokončené 21kategorií, věknad15let, základnívzd. pouze dokončené 21kategorií, věknad15 let národnost 21kategorií, aleopakujíse chybí 14kategorií, opakujíse chybí 8kategorií bez opakování chybí 17kategorií,ale opakujíse 17kategorií,opakují se,česká,mor.a slez.dohromady, chybíromskáa vietn. 18kategorií, opakujíse,jiná aneznámá dohromady, chybí vietnamská 21kategorií, opakujíse náboženství 21kategorií, aleopakujíse chybí 19kategorií, opakujíse chybí 19kategorií, aleopakují se chybíchybíchybí8kategorií 19kategorií, opakujíse ekonomická struktura 13kategoriíchybí 13kategorií, některé sloučené/roz dělené chybí12kategoriíchybí11kategorií14kategorií15kategorií13kategorií rodáci6kategoriíchybí1kategoriechybíchybíchybíchybíchybí3kategorie.6kategorií domyabyty7kategoriíchybí 6kategorií, jenvobcích nad10ସ ob. 4kategorie5kategoriíchybí14kategorií14kategorií7kategorií7kategorií Změny v demografické struktuře Martináková, Nováková, Vespalcová obyvatel ČR v okresech 38 12. kapitola ZDROJE Použité zdroje 1. Sčítání lidu, domů a bytů – Český statistický úřad, https://www.czso.cz/csu/sldb 2. Historie sčítání lidu a průběžné evidence obyvatelstva, https://is.muni.cz/el/1431/jaro2004/Z0044/Scitani_lidu_bezna_evidence.pdf 3. Sčítání lidu – E-Dějiny, http://www.edejiny.cz/?s=Sčítání+lidu 4. Sčítání lidu – Wikipedie, https://cs.wikipedia.org/wiki/Sčítání_lidu 5. Demografický informační portál, http://www.demografie.info Použité mapy pro Obrázek 1 a 2 1. Územní členění v roce 1950, https://www.czso.cz/documents/10180/23212448/1950uc.jpg/6eb44963-d71d- 4ff5-b8d6-31281adbcf1e?version=1.0&t=1418381898029 2. Územní členění v roce 2005, https://www.czso.cz/documents/10180/23212448/2005uc.jpg/44348e02-0f8d- 4b14-b797Použitá mapa ČR pro obarvování v ArcGISu 1. Datová sada ArcČR® 500 ve verzi 3.0, pro účely projektu modifikováno Mgr. Michaelou Kučerovou a Bc. Renatou Chloupkovou