1
Kohortní analýza jako alternativa panelového výzkumu (Tomáš Katrňák, 20/9/2009)
Zkoumáme-li sociální, kulturní či politické změny, nebo analyzujeme-li vývoj
vybraného sociálního fenoménu, musíme použít data z longitudinálních výzkumů. Jedním
z nich je panelový výzkum. V panelu jsou jedni a ti samí jedinci v určitém časovém intervalu
opakovaně dotazováni na jednu a tu samou věc. Rozlišením respondentů podle věku,
studujeme v panelu fenomény podle roku narození respondentů a jejich stárnutí. Panelový
výzkum tím rozšiřujeme o podstatnou dimenzi. V takovém případě je však nezbytné vyrovnat
se nejen s efekty vysvětlujících proměnných (a jejich změnou v čase) na vysvětlovanou
(závisle) proměnnou, ale také s efekty kohort (vymezených rokem narození respondentů),
věku (biologického stárnutí respondentů) a doby (roky sběru dat), které jdou ruku v ruce.
Takový typ výzkumu označujeme intrakohorní panelový výzkum (Ruspini, 2002).
Modely pro rozlišení efektů věku, doby a kohort narozených v odlišných obdobích
nejsou v intrakohortním panelovém výzkumu zatím zdokumentované. Jako badatelské téma
jsou výzvou pro následující léta (srov. Yang, 2007; 2008a). Jediný způsob, jak odlišit
v panelových datech efekt věku od efektů doby a kohort narozených v jiných letech, zůstává
prosté procentuální srovnání. Například věkovou skupinu 25-27 let a 15-17 let srovnáme po
deseti letech trvání panelu (kdy skupina 15-17 let dosáhne věku 25-27 let) a rozdíly mezi nimi
interpretujeme jako efekt věku. Nebo změny ve věkové skupině 15-17 let po deseti letech
trvání panelu srovnáme se změnami v té samé věkové skupině v populaci a pokud nejsou tyto
změny odlišné, můžeme je interpretovat jako efekt doby (čas deseti let trvání panelu). Či
rozdíly mezi věkovou skupinou 15-17 let a tou samou věkovou skupinou po deseti letech
trvání panelu lze interpretovat jako efekt kohorty narozené před 15 až 17 lety (po deseti let
trvání panelu narozené před 25-27 lety) na zkoumanou problematiku. Všechny tyto
procentuální komparace jsou ovšem problematické, jelikož procentuální změna v datech je
způsobena jak změnou ve zkoumaném fenoménu, tak výběrovou chybou nevyhnutelnou pro
vzorek respondentů z populace.
Máme-li k dispozici výběrová šetření z jednotlivých let, která obsahují informace o
zkoumané proměnné, můžeme použít jako alternativu k intrakohortnímu panelovému
výzkumu kohortní analýzu. Počátky této analýzy spadají do první čtvrtiny 20. století (v
demografii analýza porodnosti a úmrtnosti; v epidemiologii analýza nemocnosti a specifické
úmrtnosti) (Mason, Wolfinger, 2002). V polovině 60. let. 20. století Norman Ryder (1965)
publikoval esej The Cohort as a Concept in the Study of Social Change a zavedl koncept
kohorta narozených (birth cohort) jako explanační nástroj sociální změny do sociologie. Od té
2
doby byla napsána řada metodologických i věcně zaměřených studií, rozpracovávajících nebo
využívajících kohortní analýzu v sociologických výzkumech, které ukázaly výhody, jakožto i
nevýhody tohoto přístupu k datům (srov. např. Mason, Mason, Winsborough, Poole, 1973;
Hobcraft, Menken, Preston, 1982; Fienberg, Mason, 1985; Wilmonth, 1990; Glenn, 1994;
1999; Alvin, McCammon, 1999; Yang, 2008b).
Kohortní analýza usiluje o vysvětlení zkoumané problematiky pomocí rozdílů mezi
kohortami narozenými v jiné době (čas, od kdy jsou jedinci součástí společnosti), při
zohlednění rozdílů mezi věkovými skupinami (čas, jak dlouho jsou součástí společnosti) a
dobou (roky, v nichž je zkoumaná problematika analyzována) (Mason, Wolfinger, 2002).
Jedná se o analýzu sociální, politické, kulturní nebo ekonomické změny z hlediska kohort,
které se narodily v jiných letech, mají tudíž jinou historickou zkušenost a jsou nositeli jiných
sociálních fenoménů (Glenn, 1977; 2005). Používá se pro ni také označení analýza věku,
období a kohort (Age-Period-Cohort analysis, zkráceně APC analysis nebo také APC models).
Nejedná se o statistickou techniku, ale o specifický přístup k datům, která - aby byla kohortní
analýza použitelná - musejí obsahovat alespoň dva údaje ze tří: informaci o letech, z nichž
data pocházejí, a informaci o věku jedinců zkoumané populace.1
Na rozdíl od (intrakohortního) panelového šetření, v kohortní analýze nemáme údaje
o stejných jedincích v čase, ale pracujeme s proměnnými (z populace či vzorků)
z jednotlivých let (není tedy pravděpodobné, že jsou dotazováni jedni a ti samí jedinci).
Kohortní analýza není o jedincích (a změnách u nich), jak je tomu v panelovém výzkumu, ale
o sociálních celcích, které jedinci reprezentují - o věkových skupinách, obdobích nebo
kohortách narozených v jiných obdobích. Například víme-li, že ve věkové skupině 25-27 let
preferovalo ODS v roce 1995 30 % respondentů a v roce 2005 byla preference ODS ve
věkové skupině 35-37 let rovněž 30 %, kohortní analýza nám řekne, že nedošlo ke změně
preferencí během deseti let u této kohorty narozené v letech 1968-1970 (jedná se o informaci
o čisté změně/stabilitě v populaci). To ovšem neznamená, že reprezentanti této kohorty
nezměnili své politické preference. Jak je změnili, kolik z nich se odvrátilo od ODS, kolik
z nich naopak začalo ODS preferovat, zjistíme panelovým výzkumem, který je schopen
identifikovat individuální změnu (konceptualizovanou oproti populační změně v panelovém
výzkumu jako hrubá změna).
V sociální vědě jsou dnes čím dál dostupnější reprezentativní data z jednotlivých let
za jednotlivé země. Sociální vědci a vědkyně v současnosti již nejsou odkázáni na práci s daty
1
Oba tyto údaje jsou součástí každého výběrového šetření, v němž je výzkumnou jednotkou jedinec.
3
z jednoho časového okamžiku, ale mohou z hlediska zkoumaných proměnných odpovídající
data spojovat a analyzovat v nich efekty věku, doby a kohort na zkoumanou problematiku. Ve
výběrových (surveyových) datech za jednotlivé roky máme informace o narozených
kohortách, pokud jsou přítomné informace o věku respondentů (kohorta narozených rovná se
rok sběru dat mínus věk). Modely pro odlišení efektu věku, doby a kohort byly v průběhu
posledních 30. let v sociální statistice zdokumentované a jsou poměrně snadno aplikovatelné.
Zabýváme-li se tedy dnes vývojem vybraného sociálního fenoménu v čase, je kohortní
analýza adekvátní alternativou k panelovému šetření.
V následujícím textu nejprve vymezím základní koncepty kohortní analýzy. Ukáži,
jakou roli hrají kohorty narozené v jiné době při sociologické explanaci sociálních procesů a
představím kohortní výměnu jako podstatu sociální změny. Ve zbylé části textu se budu
zabývat metodologií kohortní analýzy. Zaměřím se na standardní kohortní tabulku a budu se
zabývat problémem, který komplikuje identifikaci efektů věku, období a narozených kohort
v datech (identifikační problém). Způsoby řešení tohoto problému budu prezentovat na datech
(příkladech) z české společnosti, jimiž jsou v prvním případě data populační (tištěné
v pravidelných přehledech Pohyb obyvatelstva Českým statistickým úřadem) a ve druhém
případě data výběrová (oba příklady se týkají živě narozených dětí v České republice).
Nakonec obě řešení, včetně výsledků kohortní analýzy, srovnám a budu je diskutovat. Jelikož
kohortní analýza není zatím u nás příliš rozšířená, cílem tohoto textu je nejen představit tuto
techniku jako nástroj analýzy sociální změny k panelovému šetření, ale také přispět k její
popularizaci v českém sociálněvědném bádání.
Věk, období a kohorty narozených jedinců
V kohortní analýze zohledňujeme při explanaci sociálního fenoménu věk, období a
příslušnost ke kohortě narozené v určitém roce. Jedná se o tři věcně odlišitelné koncepty,
které jsou v realitě (u každého člověka) provázané. To je ústřední problém při identifikaci
jejich efektů na vysvětlovanou proměnnou. Metodologickou otázkou je, jak odlišit kohortní
efekt od efektů věku a doby, a který z těchto efektů nejsilněji poznamenává změny ve
zkoumané problematice.
Věk (age) indikuje nejen biologický proces stárnutí člověka, ale je spojen také
s životní etapou. Označuje fázi života, v níž se člověk zrovna nachází. Jedná se o individuální
proměnnou, typickou pro jednoho konkrétního člověka. Je to indikátor fyziologických změn
člověka, jeho životních zkušeností, sociálních rolí a sociálního postavení ve společnosti. Lidé
stejného věku tvoří věkovou skupinu (age group).
4
Období (period) je čas, v němž žijeme. Efekt doby působí na všechny společenské
skupiny. Pokud společnost prochází ekonomickými, sociálními, politickými nebo kulturními
změnami (války, ekonomické krize, změna politického režimu, pandemie), nejsou tyto změny
zaměřené na určité věkové, sociální nebo ekonomické segmenty společnosti, ale mění
společnost jako celek.
Jedinci patřící do kohorty narozené ve stejném roce (birth cohort) prochází
společenským systémem dohromady (jejich biologické stáří je totožné). Osvojují si typy
sociálního jednání ve stejné době. Jsou vystaveni společenským změnám, historickým
událostem, sociálním tlakům a incentivám ve stejném věku (Glenn, 1977; 2005). Tím se
odlišují od reprezentantů kohort narozených v jiných letech. Lidi narozené ve stejném roce
obvykle spojuje specifická historická zkušenost. Mají podobný způsob myšlení a obvykle i
jednání. Zažili stejnou politickou, ekonomickou nebo kulturní událost ve stejném věku. Jednu
kohortu taková událost ovlivní, jiná kohorta zůstane vůči ní indiferentní, protože ji zažila
v jiném životním období a vnímá ji odlišně.
Původní termín kohorta (cohort) odkazuje k římské vojenské jednotce. Ve slovnících
bývá definována jako skupina vojáků či bojovníků (Glenn, 1977). Pokud dnes hovoříme
v sociální vědě o kohortě, máme většinou na mysli kohortu jedinců narozených ve stejném
kalendářním roce či jinak vymezeném časovém období. Kohorta nicméně nemusí být nutně
vymezená rokem narození, ale mnohem šířeji. Například jako skupina mužů a žen, kteří prošli
určitým sociálním hnutím, nebo uzavřela sňatek, či získala vysokoškolské vzdělání v určité
době. Kohortou může být ale také skupina tučňáků ohrožená lidskou aktivitou, či typ
automobilů mající specifickou konstrukční vadu. Vždy záleží na kritériu, které k vymezení a
pojmenování určitého souboru zvolíme ­ nikoliv pouze na časovém údaji (Glenn, 1977; 2005).
I když je kohortní analýza aplikovatelná na jakkoliv vymezené kohorty, je spojená převážně
s analýzou kohort jedinců narozených v jiných obdobích.2
Proč je odlišení věku, období a kohort v analýze dat důležité?
Nositelé sociálních fenoménů vyrostli (obvykle) v různých dobách. Jedná se o
představitele kohort narozených v jiných letech. V případě, že zavedeme čas do zkoumané
problematiky, je nezbytné zohlednit nejen jeho efekt, ale také kohortní efekt. V sociologické
2
Jako synonymum pro kohortu narozených se někdy používá termín generace. Oproti kohortě, explicitně
vymezené dobou narození, se jedná však o širší a vágnější koncept (více k tomu srov. Ryder, 1965; Glenn, 2005;
Mannheim, 2007). Konceptem generace odlišujeme buď rodiče od jejich potomků nebo jedince narozené
ve stejném roce (např. generace babyboomu) nebo jedince vymezené určitým typem jednání (např. facebooková
generace).
5
terminologii se tento jev označuje jako kohortní výměna (cohort replacement). Dříve
narozené kohorty odcházejí. Jejich místo zaujímají později narozené kohorty. Jejich
reprezentanti mají odlišnou životní zkušenost (vyrůstali v jiné historické době). Kohortní
výměna je tudíž podstatou společenské změny (působí na proměnnu zkoumaného fenoménu).
V případě, že v analýze kohortní efekt neodlišíme od efektu doby (roků) a navíc ještě od
efektu věku (biologického stárnutí), efekty všech tří proměnných jsou v analýze spojené a
není jasné, zdali roky sběru dat, kohortní výměna, či biologické stárnutí lidí ovlivňují změny
ve zkoumané problematice. A to může být zdrojem mnoha interpretačních chyb.
Kohortní výměna je mnoha autory považována za příčinu sociální změny ve
stabilních demokraciích. Náhradou starších věkových skupin mladšími se západní
demokratické společnosti permanentně mění, ať už se jedná o oblast sociálních nebo
vzdělanostních nerovností, porodnosti, úmrtnosti nebo sociální mobility. Podle Rydera (1965)
musíme takovou změnu chápat jako strukturní (kompoziční) a zároveň permanentní. Nejedná
se o (náhlou) změnu v jednání jedince, ale o změnu v rovině společenské (populační), kdy se
v agregátu jedinců proměňují typy jednání. Kohorty narozené v jiných letech se od sebe liší
obsahem školního vzdělání, socializací v rámci vrstevnické skupiny a historickou zkušeností.
Reprezentanti později narozených kohorty si s sebou přinášejí specifické (a v mnoha
případech inovativní) pojetí kulturního a sociálního dědictví, čímž se odlišují od reprezentantů
dříve narozených kohort. Pokud by kohortní výměna neproměňovala společnost, kohorty
podle roku narození by se nelišily. Postoje, názory, vnímání a typy jednání by byly stejné jak
u mladých, tak starých lidí. Rok narození nediferencoval sociální a kulturní život.
V západních demokratických společnostech se to prakticky neděje. Drtivá většina
sociologických průzkumů ukazuje, že sociální fenomény se liší podle doby narození. Není-li
příčinou sociální a kulturní proměny náhlý (revoluční) zvrat, kohortní (kompoziční) výměnu
bychom měli při explanaci vývoje většiny sociálních fenoménů brát v potaz, konstatuje Ryder
(1965).
Standardní kohortní tabulka
Data pro kohortní analýzu jsou obvykle prezentována v kontingenční tabulce,
nazývané jako standardní kohortní tabulka (Mason, Mason, Winsborough, Poole, 1973;
Glenn, 1977). Jedná se o prezentaci zkoumané problematiky (vyjádřené v závisle proměnné)
podle věku (obvykle v řádcích tabulky) a roků (obvykle ve sloupcích tabulky). Tabulka 1
prezentuje míry plodnosti dle věku žen v letech 1990 až 1995 v České republice (vyjádřenou
6
v procentech).3
Údaje v řádcích tabulky ukazují, jak se závisle proměnná mění v čase (v
letech) podle věku. Například u žen ve věku 22 let míra plodnosti klesá mezi roky 1990 až
1995 z 18.11 % na 10.94 %. Sloupce kohortní tabulky ukazují změnu závisle proměnné podle
věku v jednotlivých letech. Například v roce 1990 nejvyšší míra plodnosti připadala na ženy
ve věku 21. let., v roce 1995 to bylo na ženy ve věku 23 let. A konečně na diagonálách
kohortní tabulky vidíme změnu v závisle proměnné u kohort vymezených rokem narození žen.
Například u kohorty, která se narodila v roce 1972 (rok mínus věk: 1990 - 18) je míra
plodnosti nejvyšší v roce 1992 a v dalších letech klesá (v tabulce označena jako kohorta 18).
U výrazně dříve narozených kohort ­ například v roce 1968 (kohorta 14) nebo v roce 1958
(kohorta 4) ­ je míra plodnosti nejvyšší v roce 1990 a ve sledovaném období se pouze snižuje.
zde vlož tabulku 1
Známe-li rozpětí věku (nebo počet věkových skupin V) a počet roků (R), počet
narozených kohort (K) dopočítáme podle vzorce: K = R + V ­ 1. V tabulce 1 máme
k dispozici 25 narozených kohort (reprezentovaných čísly v margináliích tabulky). Tím, že
řádky tabulky ukazují vývoj závisle proměnné podle věku v čase, umožňují identifikovat
kohortní výměnu (Ryder 1965; Glen 1977). Představitelé věkových skupin se v letech mění a
tím se také mění povaha zkoumaného fenoménu (závisle proměnné). Sloupce kohortní
tabulky nabízejí interkohortní komparaci. Zkoumaný fenomén srovnáváme s ohledem na rok
narození jeho nositelů. Intrakohortní srovnání nabízejí diagonály kohortní tabulky. V
jednotlivých letech (čase) vidíme vývoj závisle proměnné u kohort, který můžeme mezi
kohortami komparovat.4
Graf 1 ukazuje tento vývoj a jeho kohortní komparaci na základě dat
tabulky 1. Součástí grafu jsou vybrané kohorty narozené mezi lety 1967 až 1977 (kohorta 13
až 23). Míra plodnosti od roku 1990 do roku 1995 u žen ve věku 21. let klesá. Tento pokles je
výrazný u kohort narozených v letech 1971 až 1974. U dříve narozených kohort (v letech
1969 a 1970) dochází k tomuto poklesu až ve věku 22. let ženy. Mezi 19. a 20. rokem ženy se
u nich naopak míra plodnosti zvyšuje. Společenská, ekonomická a politická změna, kterou
česká společnost prochází po roce 1989, sice působí plošně, nicméně protože se z hlediska
3
Jedná se o poměr počtu živě narozených dětí ženám v určitém věku ke střednímu stavu žen v tom samém věku
v jednotlivých letech. Míra plodnosti se standardně vyjadřuje jako promile (na 1000 žen), v tomto případě je
však prezentována z důvodů analytických v procentech (na 100 žen).
4
Ve standardní kohortní tabulce nemohou být nikdy všechny kohorty narozených prezentovány v celé své šíři
(období). Některé kohorty jsou zachyceny pouze v jednom časovém okamžiku, jiné v řadě časových okamžiků
(roků). Transformace kohortní tabulky, kdy kohorty narozených jsou v řádcích nebo sloupcích tabulky podle
roků nebo věku, tento problém neřeší.
7
počtu narozených dětí dotýká kohort žen narozených v jiných letech, její efekt je u nich
časově zpožděný.
zde vlož graf 1
Podle Rydera (1965) je uspořádání dat podle věku a období do podoby kontingenční
tabulky důležité pro věcné pochopení významu kohort narozených v jiných letech (ve
srovnání s věkovými skupinami a obdobími) na zkoumanou problematiku. Problémem
kohortní tabulky nicméně je, že v procentuálních distribucích podle věku a roků kohortní
efekt na zkoumanou problematiku neidentifikujeme. I když máme oprávnění domnívat se, že
tento efekt existuje, v kohortní tabulce je promíchán buď s efektem věku nebo období.
Rozdíly v procentuálních distribucích podle věkových skupin můžeme interpretovat jako
rozdíly dané věkem, ale také jako rozdíly mezi kohortami narozenými v jiných letech.
Podobně jsou interpretovatelné rozdíly mezi roky - mohou být výsledkem efektu věku, stejně
jako kohortního efektu.
Pokud bychom připustili, že jeden z těchto efektů na závisle proměnnou neexistuje
(například efekt věku), procentuální rozdíly, které v kohortní tabulce vidíme, by byly
interpretovatelné pouze hlediska zbylých dvou proměnných (kohort a roků). Problémem
ovšem je, že z kohortní tabulky nepoznáme, která z proměnných (a jestli vůbec) nemá na
závisle proměnnou vliv. To je nutné buď vědět předem, nebo to předpokládat. Zjistit to lze
však pouze z analýzy všech tří proměnných dohromady.
Problém empirické identifikace efektů věku, období a kohort
I když jsou na teoretické rovině efekty věku, období a kohort pochopitelné, odlišení
těchto efektů v datech je technicky problematické. Data ve standardní kohortní tabulce
můžeme mít jednak v podobě tabulkových četností a jim odpovídajících sdružených procent
(v takovém případě pracujeme s jednou kohortní tabulkou), nebo jako četnosti zkoumané
události (narození, úmrtí, počet nemocných, zločinnost) oproti exponované populaci
(populace vystavené danému jevu) v daném poli kohortní tabulky (v takovém případě máme
k dispozici dvě kohortní tabulky ­ jednu pro výskyt jevu a jednu pro exponovanou populaci).
Model pro odlišení efektů věku, období a kohort zapíšeme (v podobě lineárně regresní
rovnice) pro standardní kohortní tabulku následovně:
8
/ ,ij ij ij i j c ijD F P           (1)
kde Dij označuje poměr výskytu jevu Fij oproti exponované populaci Pij v i-té věkové
kategorii (i = 1..., I) a j-tém roce (j = 1..., J) (v tabulce 1 počet živě narozených dětí podle
věku žen v jednotlivých letech oproti počtu žen podle jejich věku v těch samých letech); 
označuje posunutí (intercept) (pro tabulku 1 průměrnou hodnotu počtu živě narozených
v případě, že efekt věku, roků a kohort je nulový); i označuje efekt věků (v každém i-tém
řádku kohortní tabulky); j označuje efekt roků (pro každý j-tý sloupec kohortní tabulky); c
označuje kohortní efekt (pro každou c-tou kohortu na diagonále kohortní tabulky) a konečně
ij označuje odchylku (chybu) jednotlivých pozorování od regresní přímky, kdy
předpokládáme E(ij) = 0.5
Pokud je věk vymezen stejnou jednotkou (intervalem) jako období (např.
kalendářním rokem), existuje mezi věkem, roky a narozenými kohortami (perfektní) lineární
závislost. Model zapsaný v rovnici 1 pak nelze odhadnout (rovnice má nekonečně mnoho
řešení). Kohorty narozené v různých letech jsou funkcí roků a věku, věk je funkcí roků a
narozených kohort, a roky jsou funkcí narozených kohort a věku. Informace o dvou
proměnných dostačují k tomu, abychom určili hodnotu třetí (zbylé) proměnné (kohorta = rok
­ věk). Například víme-li, že žena má 21. let v roce 1993, víme také, že reprezentuje kohortu
narozenou v roce 1972 (kohorta 18 v tabulce 1). Nebo víme-li, že se například žena narodila
v roce 1968 (kohorta 14 v tabulce 1), víme také, že v roce 1994 měla 26. let. Tento problém se
nazývá identifikační problém (Blalock, 1966; Fienberg, Mason, 1985) a je příčinou potíží
s určením, jaká část vysvětlované proměnné připadá na vrub věku, roků a kohort narozených
v odlišných letech.
Jedná se o poměrně typický problém sociální vědy. Na teoretické rovině jsme
schopni analyticky odlišit (a také zdůvodnit) koncepty věku, období a narozených kohort,
empiricky je však obtížné je identifikovat kvůli jejich provázanosti.6
Každý z těchto efektů
má své teoretické opodstatnění, každý z nich určitým způsobem formuje lidské jednání. Jejich
5
K identifikaci takového modelu je nezbytné parametry buď centrovat (tzv. ANOVA omezení), kdy suma
jednotlivých parametrů i, j, a c odpovídá číslu 0, nebo můžeme zvolit alternativní omezení, nazývané jako
dummy omezení, kdy jednu variantu z každé proměnné věku, období a kohort zvolíme jako referenční kategorii.
V prvním případě výsledky interpretujeme vzhledem k průměrné hodnotě proměnných, ve druhém případě je
interpretujeme vzhledem k referenčním kategoriím proměnných (více k tomu srov. Řeháková, 2008).
6
Podobné je to například v sociálně stratifikačním výzkumu se strukturní (vynucenou) a čistou (intenční)
sociální mobilitou. Obě tyto mobility jsou teoreticky zdůvodněné a analyticky pochopitelné, nicméně v datech je
od sebe ex-post odlišit v dokončeném sociálně mobilitním pohybu člověka není možné. Obě mobility spolu
empiricky koexistují, pravděpodobně se posilují, z dat ovšem nelze poznat, jakou část z mobilitního procesu
způsobují změny v zaměstnanecké struktuře a jakou úsilí člověka (více k tomu srov. Goldthorpe, 2007).
9
oddělení je tudíž pro badatele výzvou již po více jak 40. let. V současnosti existuje několik
způsobů řešení tohoto problému.
Řešení empirické identifikace efektu věku, období a narozených kohort
Literatura k odlišeni efektů věku, roků a narozených kohort je na poli demografie,
sociologie, biostatistiky a epidemiologie poměrně rozsáhlá (srov. např. Fienberg, Mason, 1979,
1985; Osmond, Gardner, 1982; Kupper, Janis, Karmou, Greenberg, 1985; Clayton, Shifflers,
1987; Hobcraft, Menken, Preston, 1982; Wilmont, 1990; Holford, 1992; Robertson, Boyle,
1998; Fu, 2000; O'Brien 2000). Nebudeme se zde zabývat všemi těmito řešeními (k jejich
přehledu srov. Kupper, Janis, Karmous, Greenberg, 1985; Robertson, Gandini, Boyle, 1999).
Představíme si pouze dvě poslední a tedy nejslibnější z nich.7
A to jednak pro populační
(demografická) data a jednak pro výběrová (surveyová) data. Obě tato řešení budou
demonstrována na reálných datech z české společnosti.
Řešení identifikace efektů APC u populačních dat
V případě populačních (často agregovaných) dat máme většinou k dispozici
standardní kohortní tabulku (věk v řádcích tabulky, období ve sloupcích tabulky a kohorty na
diagonálách tabulky), což znamená, že máme omezené možnosti pro manipulaci s intervaly
věku a období (fixně dány).
Na začátku 70. let byl identifikační problém řešen pomocí volby více omezení
(kontrastů) u věku, období nebo kohort (Mason, Mason, Winsborough, Poole, 1973; Fienger,
Mason, 1979; 1985; Mason, Smith, 1985). V praxi to vypadalo tak, že všechny tři proměnné
byly pojímány jako kategoriální. U jedné z nich se namísto jednoho kontrastu (referenční
kategorie, k níž jsou ostatní kategorie proměnné interpretovány) zvolila rovnost dvou
kontrastů (např. vek1 = vek2 nebo rok1 = rok2). Tím se zrušila perfektní multikolinearita
mezi proměnnými a efekty věku, období a kohort na vysvětlovanou proměnnou mohly být
identifikovány. Pro toto řešení se ustálil název početní model věku, období a kohort
(age-period-cohort accounting model). Problémem je, že výsledky tohoto modelu se liší podle
zvolených kontrastů (referenční kategorií) a tudíž jsou ambivalentní. Bez dodatečné
informace o distribuci alespoň jednoho z efektů věku, období nebo kohort na zkoumanou
proměnnou není možné rozhodnout, který model s ohledem na zvolené kontrasty přijmout.
V případě, že se jeden ze tří efektů ukazuje jako zanedbatelný, lze jej z modelu odstranit a
7
Nejslibnější proto, že v sobě kumulují poznání všech předcházejících a dosud známých řešení.
10
odhadnout model pouze se zbylými dvěma efekty (k tomuto postupu srov. např. Breen,
Jonsson 2007). To ovšem není adekvátní řešení identifikačního problému.
Od poloviny 80. let minulého století sílí volání po speciální odhadovací metodě
(funkci), pomocí níž by byly všechny tři efekty v datech zcela jednoznačně identifikovány.
(srov. Holford, 1983; 1991; 1992; Kuplet et al. 1983; 1985; Robertson, Gandini, Boyle, 1999).
Reakcí na tuto výzvu byl návrh tzv. skutečné odhadovací metody IE (intrinsic estimator)
efektů věku, období a kohort, v níž není arbitrárnost výsledků modelových parametrů již
přítomna (Fu, 2000; 2008; Fu, Hall, 2006). Podstatou této metody je, že neomezujeme
vybrané kategorie proměnných, ale v rámci odhadu parametrů modelu je omezena
geometrická orientace jejich vektorů v parametrickém prostoru. Tím se stávají odhady
parametrů na sobě nezávislými. 8
Odhadovací metoda IE byla na populačních datech
několikrát použita a validita jejích výsledků byla otestována jak v komparaci s původním
přístupem rovnosti vybraných kontrastů (početní model věku, období a kohort), tak na datech,
v nichž efekty věku, období a narozených kohort na vysvětlovanou proměnnou byly známé
(srov. Yang, Fu, Land, 2004; Yang, Fu, Shulhofer-Wolf, Land, 2008). V současnosti je tento
přístup posledním, a proto velmi slibným řešením identifikace efektů věku, období a kohort
na populačních datech.
Odhadovací IE metodu použiji na data z Českého statistického úřadu. Data se týkají
živě narozených dětí a otázka, na níž budu s jejich pomocí odpovídat zní: Jaký je efekt věku,
období a kohort žen na narození dítěte v České republice od konce druhé světové války do
současnosti?
Tabulka 2 ukazuje počet živě narozených dětí podle věku ženy v letech 1948 až 2007
v České republice (tabulkové N = 8411973). Tabulka 3 ukazuje počty žen podle věku v letech
1948 až 2007 v České republice (tabulkové N = 122079044).9
Obě tabulky mají uspořádání
standardní kohortní tabulky (věk v řádcích, období ve sloupcích tabulky). Jak věk (29
kategorií), tak roky (60 kategorií) jsou prezentovány v intervalu jednoho roku. Na
diagonálách obou tabulek identifikujeme 88 kohort žen narozených v rozdílných letech.10
Z dat lze spočítat míry plodnosti pro jednotlivé kohorty žen. Těmito deskriptivními
charakteristikami se zde nebudeme zabývat a přejdeme rovnou k odhadům k sobě navzájem
8
K algebraickému, geometrickému a verbálnímu popisu tohoto odhadu srov. Yang, Fu, Shulhofer-Wolf, Land
(2008).
9
Za přípravu těchto dat děkuji Bc. Zdence Lechnerové.
10
Kohorta = rok + věk - 1 (88 = 60 + 29 - 1).
11
kontrolovaných efektů věku, roků a kohort žen na počty narozených dětí pomocí metody IE.11
zde vlož tabulku 2 a 3
Velikost těchto efektů ukazují grafy 2, 3 a 4.12
Efekt věku na narození dítěte má
v České republice parabolický průběh (graf 2). Do 22. či 23. roku ženy věk působí pozitivně
na narození dítěte. Poté ­ do 34. roku ženy ­ věk narození dítěte oslabuje a od 35. roku ženy
věk působí negativně na narození dítěte (bez ohledu na to, v kterém roce a jaké kohortě žen se
dítě narodí).
Oproti věku efekt období (roků) odráží společenské změny a kohortní efekt jejich
chápání a reakci na ně. Graf 3 ukazuje, že roky 1948-1956 mírně zvyšují počty narozených
dětí. Poté období socialismu počty narozených dětí oslabuje až do roku 1990. Výkyvy v tomto
trendu vidíme letech 1963 a 1964 a od roku 1970 do roku 1974, kdy se počet narozených dětí
zvyšuje. První polovina 90. let 20. století, doba významných politických, sociálních a
ekonomických změn, znamená významné snížení počtu narozených dětí v České republice a
od roku 1996 se trend obrací. Doba začíná působit pozitivně na narození dítěte (při kontrole
věku a kohort žen v modelu).
Kohortní efekt na narození dítěte se u žen narozených mezi lety 1904 až 1991
v České republice podobá periodě (graf 4). U žen narozených v letech 1904 až 1930 kohortní
efekt snižuje počty narozených dětí. Počínaje kohortami narozenými v letech 1931 a 1932,
které začínají rodit po konci druhé světové války, kohortní efekt začíná zvyšovat počty
narozených dětí až ke kohortám žen narozených v letech 1972 a 1973. U následujících kohort
(ženy narozené v letech 1974 až 1987, které rodí po roce 1989) kohortní efekt začíná opět
snižovat počty narozených dětí a u kohort žen narozených v letech 1988 až 1991 kohortní
efekt začíná opět zvyšovat počty narozených dětí.
zde vlož graf 2, 3 a 4
11
Odhad modelu APC pomocí metody IE je velmi snadné provést ve statistickém programu Stata, kde autoři
této metody připravili adofile apc_ie (adofile je automaticky spustitelný soubor). Součástí tohoto souboru je i
možnost odhadu početního modelu efektů věku, období a kohort, pojmenovaného zde jako CGLIM (constrained
generalized linear models estimator) s volbou totožnosti jakýchkoliv dvou kontrastů u věku, období nebo kohort.
Komparace výsledků obou přístupů je pak nabíledni.
12
Stata syntaxt modelu: apc_ie f, age(age) period(period) cohort(cohort) family(poisson) link(log) exposur
e(pop) scale(x2). Velikost modelové konstanty je ­4.97 (SE = 0.02; z = ­281.70); Log likelihood modelu je
­26916.32362.
12
Všechny tři efekty se ukazují jako významné při explanaci vývoje počtu narozených
dětí v České republice v letech 1948 až 2007. I když je období socialismu spojeno
s představou pro rodinných a pro populačních opatření (více k tomu srov. Rabušic, 1990),
statistické odlišení efektů věku, období a narozených kohort žen ukázalo, že nikoliv doba (s
výjimkou roků 1963 a 1964 a první poloviny 70. let minulého století),13
ale po sobě narozené
kohorty žen a tedy jejich ,,zkušenost" s tehdejším společenských uspořádání působily
pozitivně na počty narozených dětí v letech 1948 až 1989. U každé mladší kohorty žen byla
plodnost soustředěna do stále užšího a brzkého věkového rozmezí, které šlo ruku v ruce
s nemožností realizace v jiných sférách společenského života (studium, práce, cestování,
pracovní kariéra), než byla rodina (Možný, Rabuši, 1998). Socialistická společnost tak
prostřednictvím omezených životních šancí působila prostřednictvím kohortní výměny
pozitivně na porodnost. Nemůžeme to ovšem interpretovat jako výsledek jejích pro
populačních a pro rodinných opatření, ale jako důsledek socialistického režimu omezujícího
životní šance mladých lidí, dělících se do kohort podle doby narození.
Náš příklad ukázal, že odhady efektů věku, roků a kohort metodou IE nejsou
ambivalentní, jsou smysluplné a logicky interpretovatelné. V odhadovací metodě IE mají
v současnosti sociální vědci a vědkyně silnou a přesvědčivou metodu pro analýzu vývoje
sociálních fenoménů v čase (při zohlednění efektů věku a narozených kohort). Kohortní
analýzu bychom měli na základě této metody považovat za adekvátní alternativu
k panelovému výzkumu.
Řešení identifikace efektů APC u výběrových dat
Výběrová (surveyová) data mají jiný charakter než data populační. Zatímco data
populační vypovídají o zkoumaném fenoménu obvykle (tabulkovými) četnostmi (oproti
exponované populaci), data výběrová vypovídají o vzorku respondentů a jejich sociálních
charakteristikách. Populační data jsou vyčerpávající (charakterizují celou populaci bez
výběrové chyby), informace v nich jsou však v drtivé většině případů omezené na několik
málo proměnných. Výběrová data poznamenává výběrová chyba, obsahují však informace o
řadě proměnných, jejichž vliv lze s ohledem na zkoumanou problematiku analyzovat. To je
jejich výhodou oproti populačním datům. Máme-li k dispozici řadu vzorků z jednotlivých let,
data umožňují nejen identifikovat efekt času, věku a narozených kohort, ale také efekt dalších
13
V obou těchto obdobích byly implementovány opatření tehdejší státní politiky. V první polovině 60. let byl
jednak zpřísněn potratový zákon a byla prodloužena mateřská dovolená z 18 na 22 měsíců. V první polovině 70.
let se jednalo o celý komplex pronatalitních opatření (více k tomu srov. Rabuši, 1990; Aleš, 1992; Možný,
Rabušic, 1998).
13
vysvětlujících proměnných (kontrolovaný pro věk, roky a kohorty) na závisle proměnnou. To
lze udělat pomocí standardní regrese (je-li závisle proměnná spojitá), pokud nezvolíme pro
věk a období stejné časové intervaly. Touto jednoduchou úpravou se sice vyhneme
identifikačnímu problému (věk již není perfektní funkcí roků a kohort), nicméně Yangová a
Land (2006) ukazují, že v takovém případě nelze dosáhnout jednoho z předpokladů
regresního modelu, jímž je nezávislost residuí. Lineární regresní model (jako aproximace dat
a procesů v nich) pak není příliš spolehlivý a v interpretaci dat nám nepomůže.
Z tohoto důvodu Yangová (2006) a Yangová a Land (2006, 2008) formulují
hierarchický (víceúrovňový) model věku, období a kohort (hierarchical age-period-cohort
model, HAPC), který řeší tento problém. Ve výběrových datech informace o věku, rocích
sběru dat a narozených kohortách nemají stejný ontologický status. Věk je individuální
proměnná, která charakterizuje každého jednotlivého respondenta. V datech ji Yangová a
Land (2006, 2008) navrhují držet jako spojitou proměnnou, jejíž efekt by měl být analyzován
dohromady s ostatními vysvětlujícími proměnnými. Oproti tomu rok (období) a narozená
kohorta jsou nadindividuální (kontextuální) proměnné. Nejedná se o vlastnost jednoho
konkrétního jedince, ale o charakteristiku skupiny, do které jedinec přináleží. Efekt těchto
proměnných lze považovat za kvalitativně odlišný od efektů individuálních proměnných.
Zatímco věk indikuje biologické stáří člověka (a míru sociální zkušenosti či mentální zralosti),
období a kohorty zachycují vůči člověku vnější sociální tlaky. Působí na nositele zkoumaného
fenoménu jiným způsobem než věk. Yangová a Land (2008) navrhují tyto dva druhy
proměnných a jejich efekty na lidské jednání proto v analýze dat oddělit. V duchu
víceúrovňových modelů (k tomu viz Soukup, 2006) konceptualizují individuální proměnné
jako efekty první úrovně (věk a další vysvětlující proměnné) a skupinové proměnné (období a
kohorty) jako efekty vyšší, druhé úrovně, jež jsou na efektech první úrovně nezávislé.
Tímto způsobem ­ jako hierarchický model věku, období a kohort ­ řeší
identifikační problém u výběrových dat.14
Ve druhé (kontextuální) úrovni proměnných spolu
koexistují dvě proměnné: období a kohorty ­ hierarchický model věku, období a kohort musí
být v takovém případě specifikován jako model náhodných křížených efektů (Cross-Classified
Random-Effects Model ­ CCREM). Náhodný (kontextuální) efekt každého období na
vysvětlovanou proměnnou je identifikován jako průměrný napříč všemi kohortami a náhodný
(opět kontextuální) efekt kohort je identifikován jako průměrný napříč všemi roky (obdobími).
Protože jsou analyticky efekty roků a kohort oddělené (a nezávislé) od efektu věku, není
14
Návrh tohoto řešení, i když bez možnosti jeho realizace pomocí odpovídajícího statistického programu, viz
také Fienberg, Mason (1985)
14
nutné pracovat se stejnými věkovými, časovými a kohortními intervaly.15
Pro ilustraci tohoto přístupu použiji data z tabulky 2 a 3. Odečtením četností tabulky
2 od četností tabulky 3 dostaneme informaci o počtech dětí, které se nenarodili podle věku
v jednotlivých letech (tabulkové N = 122079044 ­ 8411973 = 113667071). Roky jsem
agregoval do 30 kategorií po 2 letech (z původních 60 kategorií pro léta 1948-2007). Data
jsem poté transformoval do individuální podoby, kde jsem v každém řádku měl informaci o
věku ženy, období (vymezení intervalem 2 let) a zdali k narození dítěte došlo (ano/ne).
S ohledem na věk a závisle proměnnou (narození dítěte) jsem v každém období provedl
náhodný výběr (30 náhodných výběrů) o velikosti jednoho promile původní dat z daném
období. Data za jednotlivá období jsem poté sloučil do jedné matice (celkové N vzorku =
122257). Odečtením věku od roků jsem v tomto vzorku identifikoval 87 kohort žen (první
kohorta se narodila v roce 1905 a poslední v roce 1991), které jsme sloučil po 3 letech do 29
kohort (první kohorta 1905/1907, druhá kohorta 1908/1910.... poslední kohorta 1989/1991).
Otázka, na kterou nyní odpovídám, je stejná jako v případě populačních dat. Jaký je
efekt věku, období a kohort na narození dítěte v České republice? Oproti populačním datům
mám nyní dispozici náhodný výběr, jinak specifikovanou závisle proměnnou (binární, nikoliv
počet živě narozených dětí z populace žen) a s roky a narozenými kohortami pracuji jako s
agregáty delších časových úseků.
Závisle proměnná (narození) má dvě kategorie (ano/ne). Pro její explanaci pomocí
nezávisle proměnných věku, období a kohort zvolím model binární logistické regrese
s náhodnými kříženými efekty období a kohort na modelovou konstantu. Rovnice modelu je
následující:
2
0 1 2logit ( ) ,ijk jk ijk ijk ijky věk věk       (2) úroveň 1
0 0 0 0 ,jk j k      (3) úroveň 2
2
0 1 2 0 0logit ( ) ,ijk ijk ijk j k ijky věk věk           (4) kombinace úrovně 1 a 2
kde i označuje ženu (i = 1, 2,..., njk) v rámci jednotlivých období j (j = 1,..., 30) a kohort k (k
= 1,..., 29). V tomto víceúrovňovém modelu je přirozený logaritmus narození oproti
nenarození dítěte u ženy i (logit) modelován jako funkce věku a kvadratického věku
(předpoklad nelineárního vztahu mezi věkem a narozením dítěte) v rámci každého roku j a
15
Yangová a Land (2008) navrhují věk vymezovat po roce, období (pokud to data umožňují) rovněž po roce a
kohorty delším časovým intervalem pěti let.
15
kohorty k. Konstanta 0 jk je směrnice, neboli průměrný přirozený logaritmus šance na
narození dítěte v roce j a kohortě k; 1 je fixní efekt věku na logit narození dítěte; ijk je
náhodný (individuální) efekt v rámci první úrovně; 0 je hlavní modelový průměr (logit
narození pro všechny ženy ve vzorku), 0 j je náhodný (residuální) efekt období j (tedy efekt
roků na logit narození) a 0k je náhodný efekt kohorty k (tedy efekt kohort na logit narození).
Průměrný logit narození dítěte v rámci kohort k pak dostaneme jako 0 0 0j j    a v rámci
roků j jako 0 0 0k k    .
Tabulka 4 ukazuje statistické charakteristiky tohoto modelu. V první části tabulky
vidíme efekt věku a kvadrátu věku (dohromady parabolický efekt) na logit závisle proměnné
(přirozený logaritmus narození versus nenarození), včetně intervalů spolehlivosti (95%
hladina významnosti) a modelovou konstantu. Druhá část tabulky ukazuje variabilitu
(směrodatnou odchylku) konstanty napříč kohortami narozených žen a obdobími, včetně
intervalů spolehlivosti (95% hladina významnosti). Mezi kohortami konstanta variuje ve větší
míře než mezi roky (explanační potenciál závisle proměnné je vyšší). To, ve kterém roce se
žena narodí, silněji poznamenává narození či nenarození jejího dítěte v České republice než
rok, v němž se dítě narodí.
Grafy 5, 6 a 7 ukazují odhadnuté modelové efekty pro věk a kvadrát věku, období a
kohorty žen na logit narození dítěte, včetně intervalů spolehlivosti (95% hladina významnosti).
Graf 5 (stejně jako graf 2) ukazuje, že efekt věku na narození dítěte je nesilnější okolo 22 či
23 roku života ženy a poté šance na narození dítěte věk snižuje. V grafu 3 jsme viděli, že
období 1957 až 1990 s výkyvy v polovině 60. a první polovině 70. let 20. století působilo
negativně na narození dítěte. Tyto výkyvy jsou v grafu 6 zřejmé, nicméně trend oslabování
šancí na narození dítěte mimo tyto výkyvy není z grafu 6 patrný. Po roce 1991 je již trend
v obou grafech stejný: do konce poloviny 90. let minulého století značné oslabení šancí na
narození dítěte a od té doby čas působí ve prospěch narozených dětí.
Poslední komparaci trendů nabízí graf 7 a 4. Z grafu 4 víme, že počínaje kohortami
žen, které začaly rodit po druhé světové válce (narodili se v roce 1931 a později), kohortní
efekt na narození dítěte roste až ke kohortám žen, které začaly rodit po roce 1989 (narodili se
v roce 1974 a později). Poté kohortní efekt prudce oslabuje a teprve u kohort narozených na
konci 80. let 20 století a později začíná opět růst. I když graf 7 ukazuje v kohortních efektech
podobné trendy jako graf 4, není růst křivky pro kohorty narozené mezi 30. lety až polovinou
70. let 20. století tak explicitní. Pokles kohortního efektu poté je již v obou grafech stejný.
16
Jeho vzrůst u nejpozději narozených kohort žen však graf 7 nedokumentuje. Nicméně velké
rozpětí intervalu spolehlivosti u nejpozději narozených kohort žen znamená, že tomu takto
může být (existuje zde však velká míra nejistoty, daná nízkým počtem narozených dětí u žen
těchto kohort ve výběrových datech).
zde vlož graf 5, 6 a 7
I v tomto případě analýza dat pomocí hierarchického (binárně logistického) modelu
s kříženými náhodnými efekty období a kohort na modelovou konstantu ukázala, že všechny
tři proměnné (věk, období a kohorty narozených žen) nejsou při explanaci narozených dětí
v České republice zanedbatelné. Základní struktura ve výběrových datech, i když závisle
proměnná byla jiného charakteru a období a kohorty měly jiné intervaly, odpovídá struktuře
populačních dat, kterou jsme odhalili pomocí metody IE. Tato komparace nejen ukázala, že
hierarchický (víceúrovňový) přístup je řešením identifikačního problému kohortní analýzy,
pracujeme-li s výběrovými daty, ale také naznačila, že existuje-li v datech dominantní
struktura, lze ji identifikovat více adekvátně zvolenými statistickými technikami.
Závěr
Zkoumáme-li dnes vývoj sociálních fenoménů, kohortní analýza je alternativou
k panelovému výzkumu. Kohortní analýzu není nutné oproti panelovému výzkumu dopředu
nijak zvlášť plánovat. Máme-li k dispozici data za jednotlivé roky, která obsahují informaci o
věku zkoumaných (a pochopitelně informaci o zkoumané problematice), máme rovněž
informace o narozených kohortách. Kohortní analýza je v takovém případě použitelná. Pokud
se jedná o data populační (obvykle jde o vyjádření jevu v podobě četností ze zkoumané
populace), text ukázal, že výzkumníci a výzkumnice mají v současnosti k dispozici
odhadovací metodu IE. Tato metoda neambivalentně identifikuje efekty věku, narozených
kohort a období na zkoumanou problematiku, i když mezi těmito proměnnými existuje
perfektní multikolinearita (údaj jedné proměnné je vždy výsledkem údajů zbylých dvou
proměnných). V případě, že pracujeme s výběrovými daty za jednotlivé roky, adekvátním
řešením je použití hierarchického (víceúrovňového) modelu s náhodnými kříženými efekty
období a kohort na modelovou konstantu. V tomto případě jsou efekty období a kohort
pojímány jako kvalitativně odlišné (jedná se o skupinové efekty) oproti efektu věku, který je
definován jako individuální (typický pro každého jednotlivého člověka), což je umožňuje
nejen od sebe oddělit, ale také v empirických datech identifikovat.
17
I když byla v tomto textu představena zatím dvě poslední řešení pro odlišení efektů
věku, období a kohort narozených, je nezbytné konstatovat, že konečné řešení identifikačního
problému není demografickou, epidemiologickou nebo sociologickou komunitou zatím
jednomyslně akceptováno. Text ukázal, že významným posunem na cestě k tomu řešení je
pojímání populačních a surveyových (výběrových) dat jako kvalitativně odlišných. I když se
odhadovací metoda IE jeví jako velmi slibné řešení pro populační data, je nezbytné provést
další testy a zevrubně tento způsob odhadu efektů věku, období a narozených kohort otestovat.
Víceúrovňový model s kříženými efekty období a kohort na modelovou konstantu se zdá být
jako nezpochybnitelné řešení v případě surveyových dat. Problém tohoto řešení však spočívá
v tom, že zavedením složitějších interakcí a dalších proměnných do modelu narážíme na
limity statistického poznání a znalostí, jak model odhadnout. Zvláště interakce mezi efekty
věku, období a kohort jsou výzvou pro budoucnost (například identifikace kohortě
specifického efekt věku). Teoreticky se dnes sice už ví, že dané interakce by mělo být možno
odhadnout (Yang, 2007; 2008a), nicméně prakticky (pomocí dostupných statistických
programů) nejsou zatím modely s těmito interakcemi na poli statistiky nejen identifikované,
ale ani zdokumentované. S ohledem na tuto skutečnost budou následující léta v badání
modelů kohortní analýzy velkým příslibem. Doufejme, že jak se budou rozvíjet víceúrovňové
modely s kříženými efekty, budeme svědky nejen metodologických, ale i věcných posunů na
poli bádání statistických modelů pro kohortní analýzu.
18
Literatura
Aleš, M.: ,,Populační politika ­ ano či ne?" Demografie (1992), 1, 54-55.
Alwin, D. F. and R. J. McCammon. 1999. ,,Aging Versus Cohort Interpretations of
Intercohort Differences in GSS Vocabulary Scores." American Sociological Review 64:
272-86.
Blalock, H. M. 1966. ,,The Identification Problem and Theory Building." American
Sociological Review 31 (1): 52-61.
Breen, R. and J. O. Jonsson. 2007. ,,Explaining Change in Social Fluidity: Educational
Equalization and Educational Expansion in Twentieth-Century Sweden." Američan
Journal of Sociology 112:1775-1810.
Clayton, D., and E. Schifflers. 1987. "Models for Temporal Variation in Cancer Rates II:
Age-Period-Cohort Models." Statistics in Medicine 6 (4):469­81.
Fienberg, S. E., Mason, W. M. 1985. ,,Specification and Implementation of Age, Period, and
Cohort Models." Pp. 45-88 in Mason, W. M., Fienberg, S. E. (ed.). Cohort Analysis in
Social Research. New York: Springer.
Fienberg, S. E.; Mason, W. M. 1979. ,,Identification and Estimation of Age-Period-Cohort
Models in the Analysis of Discrete Archival Data." Sociological Metodology 10 (1): 1-67.
Fu, W. J. 2000. "Ridge Estimator in Singular Design with Application to Age-Period- Cohort
Analysis of Disease Rates." Communications in Statistics Theory and Method 29
(2):263­78.
Fu, W. J. 2008. "A Smoothing Cohort Model in Age-Period-Cohort Analysis with
Applications to Homicide Arrest Rates and Lung Cancer Mortality Rates." Sociological
Methods and Research 36 (3): 327­61.
Fu, W. J., Hall, P. 2006. "Asymptotic Properties of Estimators in Age-Period- Cohort
Analysis." Statistics and Probability Letters 76 (17):1925­29.
Glenn, N. D. 1994. ,,Television Watching, Newspaper Reading, and Cohort Differences in
Verbal Ability." Sociology of Education 67:216-30.
Glenn, N. D. 1997. Cohort Analysis. London: Sage.
Glenn, N. D. 1999. ,,Further Discussion of the Evidence for an Intercohort Decline in
Education-Adjusted Vocabulary." American Sociological Review 64: 267-71.
Glenn, N. D. 2005. Cohort Analysis. London: Sage.
Goldthorpe, J. H. 2007. ,,Outline of a Theory of Social Mobilty." Pp. 154-185 in. Goldthorpe,
J. H. (ed.). On Sociology. 2.vydání. Stanford: Stanford University Press.
Hobcraft, J., J. Menken, and S. Preston. 1982." Age, Period, and Cohort Effects in
Demography: A Review." Population Index 48:4-43.
Hobcraft, J., Menken, J., Preston, S. 1982. "Age, Period, and Cohort Effects in Demography:
A Review." Population Index 48 (1): 4­43.
Holford, T. R.. 1992. "Understanding the Effects of Age, Period, and Cohort on Incidence and
Mortality Rates." Annual Review of Public Health 12 (1): 425­57.
Kupper, L. L., Janis, J. M., Karmous, A., Greenberg B. G. 1985. "Statistical
Age-Period-Cohort Analysis: A Review and Critique." Journal of Chronic Disease 38
(10): 811-830.
Mannheim, K. 2007. ,,Problém generací." Sociální studia 4 (1-2): 11-44.
Mason, K. O., Mason, W. H., Winsborough, H. H., Poole, K. 1973. ,,Some Methodological
Issues in Cohort Analysis of Archival Data." American Sociological Review 38 (2):
242-258.
Mason, K. O., W. H. Mason, H. H. Winsborough, and K. Poole. 1973. ,,Some Methodological
Issues in Cohort Analysis of Archival Data." American Sociological Review 38: 242-58.
19
Mason, W. H., Smith, H. L. 1985. "Age-Period-Cohort Analysis and the Study of Deaths
from Pulmonary Tuberculosis." Pp. 151­228 in Mason, W. M., Fienberg, S. E. (eds.).
Cohort Analysis in Social Research. New York: Springer-Verlag.
Mason, W. M., Wolfinger, N. H. 2002. ,,Cohort Analysis." Pp. 2189-2194 in Smelser, N. J.,
Baltes, P. B. (eds.) International Encyclopedia of the Social & Behavioral Sciences. New
York: Elsevier 2002.
Možný, I.; Rabušic, L.: ,,Česká rodina, sňatkový trh a reprodukční klima." In. Večerník, J. ;
Matějů, P.: Zpráva o vývoji české společnosti. Academia, Praha 1998, 92-110.
O'Brien, R. M. 2000. "Age Period Cohort Characteristic Models." Social Science Research
29 (1): 123­39.
Osmond, C., Gardner, M. J. 1982. "Age, Period, and Cohort Models Applied to Cancer
Mortality Rates." Statistics in Medicine 1 (3): 245­59.
Rabušic, L.: ,,Manifestní a latentní funkce československé populační politiky." Demografie
(1990), 3, 234-238.
Rabušic, L.: Česká společnost stárne. MU a Georgetown, Brno 1995.
Řeháková, B. ,,Kontrasty v logistické regresi." Sociologický časopis 44 (4): 745-765.
Robertson, C., Boyle, P. 1998. "Age-Period-Cohort Analysis of Chronic Disease Rates I:
Modeling Approach." Statistics in Medicine 17 (12): 1305­23.
Robertson, C., Gandini, S., Boyle, P. 1999. "Age-Period-Cohort Models: A Comparative
Study of Available Methodologies." Journal of Clinical Epidemiology 52 (6): 569-583.
Ruspini, E. 2002. Introduction to Longitudinal Research. London: Routledge.
Ryder, N. 1965. ,,The Cohort As A Concept in the Study of Social Change." American
Sociological Review 30 (6): 843-861.
Soukup, P. 2006. ,,Proč užívat hierarchické lineární modely?" Sociologický časopis 42 (5):
987-1012.
Wilmoth, J. R. 1990. "Variation in Vital Rates by Age, Period, and Cohort." Sociological
Methodology 20: 295­335.
Wilmoth, J. R. 1990. ,,Variation in Vital Rates by Age, Period, and Cohort." Sociological
Methodology 20:295-335.
Yang, Y. 2006. "Bayesian Inference for Hierarchical Age-Period-Cohort Models of Repeated
Cross-section Data." Sociological Methodology 36 (1): 39­74.
Yang, Y. 2007. "Age/Period/Cohort Distinctions". Pp. 20-22 in Markides, K. S. (ed.).
Encyclopedia of Health and Aging. London: Sage Publications.
Yang, Y., Fu, W. J., Land, K. C. 2004. "A Methodological Comparison of AgePeriod-Cohort
Models: Intrinsic Estimator and Conventional Generalized Linear Models."
Sociological Methodology 34 (1): 75­110.
Yang, Y., Land, K. C. 2006. "A Mixed Models Approach to the Age-Period-Cohort Analysis
of Repeated Cross-section Surveys, with an Application to Data on Trends in Verbal Test
Scores." Sociological Methodology 36 (1): 75­97.
Yang, Yang and Kenneth C. Land. 2008. "Age-Period-Cohort Analysis of Repeated
Cross-Section Surveys: Fixed or Random Effects?" Sociological Methods and Research
36: 297-326.
Yang, Yang, Sam Schulhofer-Wohl, Wenjiang Fu, and Kenneth Land. 2008. ,,The Intrinsic
Estimator for Age-Period-Cohort Analysis: What It Is and How to Use It?" American
Journal of Sociology. 113: 1697-1736.
Yang, Yang. 2008a "Age, Period, Cohort Effects." Pp. 6-10 in Encyclopedia of the Life
Course and Human Development, Deborah Carr (ed). New York: Gale Publishing.
Yang, Yang. 2008b. ,,Social Inequalities in Happiness in the U.S. 1972-2004: An
Age-Period-Cohort Analysis." American Sociological Review 73: 204-226.
20
Tabulka 1. Počet živě narozených dětí na 100 žen podle věku a období v ČR
období (roky)
rok narozenívěk 1990 1991 1992 1993 1994 1995 kohorty
16 0,60 0,64 0,62 0,61 0,49 0,46 25 1979
17 2,44 2,70 2,43 2,30 1,79 1,34 24 1978
18 7,30 7,85 7,08 6,44 4,77 3,45 23 1977
19 14,11 13,87 12,86 11,73 8,60 6,56 22 1976
20 17,60 17,69 14,96 14,05 11,51 8,53 21 1975
21 18,49 17,94 16,27 14,82 12,24 10,23 20 1974
22 18,11 17,73 16,07 15,16 12,50 10,94 19 1973
23 17,36 16,70 15,30 14,71 12,71 11,07 18 1972
24 15,66 15,46 14,33 13,96 12,07 10,74 17 1971
25 14,43 13,55 12,79 12,51 10,96 10,25 16 1970
26 12,14 11,88 11,03 11,01 10,02 9,46 15 1969
27 10,04 10,01 9,32 9,63 8,58 7,95 14 1968
28 8,39 8,06 7,95 7,88 7,19 7,08 13 1967
29 6,80 6,68 6,45 6,49 6,24 5,90 12 1966
30 5,69 5,49 5,28 5,21 5,19 4,99 11 1965
31 4,36 4,44 4,17 4,35 3,97 4,06 10 1964
32 3,80 3,45 3,44 3,64 3,52 3,33 9 1963
33 3,01 2,90 2,64 2,95 2,67 2,68 8 1962
34 2,34 2,36 2,20 2,32 2,23 2,28 7 1961
35 1,92 1,78 1,64 1,85 1,75 1,75
kohorty 1 2 3 4 5 6
rok narození 1955 1956 1957 1958 1959 1960
Graf 1. Počet živě narozených dětí na 100 žen podle věku a období v ČR
1995
1994
1993
1992
1990
1991
1973
1974
1975
1976
1972
1977
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35
věk
Roky (období)
Kohorty narozených
1971
1970
1969
1968
1967
21
Tabulka 2.Počet živě narozených dětí podle věku ženy v letech 1948-2007 v ČR.
22
Tabulka 3. Počet žen podle věku v letech 1948-2007 v ČR.
23
Graf 2. Efekt věku ženy na narození dítěte v ČR
-4,0
-3,0
-2,0
-1,0
0,0
1,0
2,0
3,0
4,0
5,0
6,0
16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44
věk
Graf 3. Efekt roků (období) na narození dítěte v ČR
-1,5
-1,0
-0,5
0,0
0,5
1,0
1949
1951
1953
1955
1957
1959
1961
1963
1965
1967
1969
1971
1973
1975
1977
1979
1981
1983
1985
1987
1989
1991
1993
1995
1997
1999
2001
2003
2005
2007
roky
Graf 4. Efekt kohort na narození dítěte v ČR
-3,0
-2,0
-1,0
0,0
1,0
2,0
3,0
1905
1907
1909
1911
1913
1915
1917
1919
1921
1923
1925
1927
1929
1931
1933
1935
1937
1939
1941
1943
1945
1947
1949
1951
1953
1955
1957
1959
1961
1963
1965
1967
1969
1971
1973
1975
1977
1979
1981
1983
1985
1987
1989
1991
kohorty narozených žen
24
Tabulka 4. Binárně logistický model náhodně křížených efektů období a kohort na
modelovou konstantu.
Mixed-effects logistic regression Number of obs = 122257
--------------------------------------------------------------------------
| No. of Observations per Group Integration
Group Variable | Groups Minimum Average Maximum Points
----------------+---------------------------------------------------------
_all | 1 122257 122257.0 122257 1
period | 30 3604 4075.2 4358 1
--------------------------------------------------------------------------
Wald chi2(2) = 2059.77
Log likelihood = -27942.663 Prob > chi2 = 0.0000
------------------------------------------------------------------------------
birth | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
C_age | .6847682 .0181245 37.78 0.000 .6492448 .7202916
C_age2 | -.0143389 .0003428 -41.82 0.000 -.0150108 -.0136669
_cons | -3.231371 .1822799 -17.73 0.000 -3.588633 -2.874109
------------------------------------------------------------------------------
------------------------------------------------------------------------------
Random-effects Parameters | Estimate Std. Err. [95% Conf. Interval]
-----------------------------+------------------------------------------------
_all: Identity |
sd(R.cohort) | .9476724 .1491123 .6961859 1.290004
-----------------------------+------------------------------------------------
period: Identity |
sd(_cons) | .2028878 .0348972 .1448262 .2842266
------------------------------------------------------------------------------
LR test vs. logistic regression: chi2(2) = 750.81 Prob > chi2 = 0.0000
25
Graf 5 . Efekt věku ženy na narození dítěte v ČR
-4,0
-3,0
-2,0
-1,0
0,0
1,0
2,0
3,0
4,0
5,0
6,0
16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44
věk
Graf 6. Efekt (roků) období na narození dítěte v ČR
-1,5
-1,0
-0,5
0,0
0,5
1,0
1949
1951
1953
1955
1957
1959
1961
1963
1965
1967
1969
1971
1973
1975
1977
1979
1981
1983
1985
1987
1989
1991
1993
1995
1997
1999
2001
2003
2005
2007
roky
Graf 7. Efekt kohort na narození dítěte v ČR
-3,0
-2,0
-1,0
0,0
1,0
2,0
3,0
1907
1910
1913
1916
1919
1922
1925
1928
1931
1934
1937
1940
1943
1946
1949
1952
1955
1958
1961
1964
1967
1970
1973
1976
1979
1982
1985
1988
1991
kohorty narozených ženy