EVALUAČNÍEVALUAČNÍ
VÝZKUMVÝZKUM
ONDŘEJ HORA, MIROSLAV SUCHANEC, MARTIN ŽIŽLAVSKÝ
ONDŘEJHORA,MIROSLAVSUCHANEC,MARTINŽIŽLAVSKÝEVALUAČNÍVÝZKUM
ISBN 978-80-210-6886-5
Publikace vychází v rámci projektu Internacionalizace,
inovace, praxe: sociálně-vědní vzdělávání pro 21. století,
CZ.1.07/2.2.00/28.0225.
Autoři se v knize zabývají aplikací výzkumných metod a technik při
evaluaci sociálních programů. Kladou důraz na situační rozměr této
aplikace. Aplikace je ukázána při evaluacích různých programových
stadií nebo aspektů programu: posouzení potřeb, program ve stadiu
plánování, program v implementačním stadiu a měření dopadů
programu.
O AUTORECH:
Ondřej Hora je odborným asistentem na Katedře sociální politiky
a sociální práce Fakulty sociálních studií Masarykovy univerzity. Výzkumně
se zabývá oblastí sociální politiky, a to především ve vztahu
k sociálnímu vyloučení, chudobě a nezaměstnanosti. Je vyučujícím
metodologických předmětů a předmětů tvorby diplomových prací
pro bakalářské a magisterské studium.
Miroslav Suchanec působí na FSS MU jako vyučující statistiky
a kvantitativního výzkumu a výzkumně se zabývá evaluací programů
aktivní politiky zaměstnanosti. Jeho obecnými profesními zájmy
jsou metodologie a statistika.
Martin Žižlavský je členem akademického sboru Fakulty sociálních
studií Masarykovy univerzity. Jeho pedagogická činnost pokrývá
oblasti ekonomiky sociálního státu a metod a technik výzkumu ve
veřejné politice a sociální práci. Výzkumně se zabývá zejména ekonomickou
a organizační stránkou sociálních programů.
EVALUAČNÍ VÝZKUM
Masarykova univerzita
Brno 2014
Ondřej Hora
Miroslav Suchanec
Martin Žižlavský
© 2014 Masarykova univerzita
© 2014 Ondřej Hora, Miroslav Suchanec, Martin Žižlavský
ISBN 978-80-210-6887-2
ISBN 978-80-210-6886-5 (brož. vaz.)
Recenzoval:
PhDr. Martin Smutek, Ph.D.
Tato publikace vznikla v rámci projektu OP VK „Internacionalizace, inovace, praxe:
sociálně-vědní vzdělávání pro 21. století“ s registračním číslem CZ.1.07/2.2.00/
28.0225. Tento projekt je spolufinancován Evropským sociálním fondem a státním
rozpočtem České republiky. Více informací k projektu naleznete zde:
http://www.fss.muni.cz/cz/site/struktura/projekty/sova.
Vědecká redakce Masarykovy univerzity:
prof. PhDr. Ladislav Rabušic, CSc.
Mgr. Iva Zlatušková
Ing. Radmila Droběnová, Ph.D.
Mgr. Michaela Hanousková
doc. Mgr. Jana Horáková, Ph.D.
doc. JUDr. Josef Kotásek, Ph.D.
Mgr. et Mgr. Oldřich Krpec, Ph.D.
prof. PhDr. Petr Macek, CSc.
PhDr. Alena Mizerová
doc. Ing. Petr Pirožek, Ph.D.
doc. RNDr. Lubomír Popelínský, Ph.D.
Mgr. David Povolný
Mgr. Kateřina Sedláčková, Ph.D.
prof. RNDr. David Trunec, CSc.
prof. MUDr. Anna Vašků, CSc.
prof. PhDr. Marie Vítková, CSc.
doc. Mgr. Martin Zvonař, Ph.D.
5Shrnutí / Summary
SHRNUTÍ
Autoři se zabývají aplikací výzkumných metod a technik při evaluaci
sociálních programů. Kladou důraz na situační rozměr této aplikace.
Aplikace je ukázána při evaluacích různých programových stadií nebo
aspektů programu: posouzení potřeb, program ve stadiu plánování,
program v implementačním stadiu a měření dopadů programu.
SUMMARY
Authors deal with an application of research methods and techniques
at social programme evaluation. They put stress on a  situational dimension
of the application. The application is shown at evaluation of
different programme stages or programme aspects: needs assessment,
programme planning stage, programme implementation stage, and
programme impact measurement.
7Obsah
OBSAH
Martin Žižlavský
Úvod.........................................................................................................9
Martin Žižlavský
1 Aplikace metod a technik výzkumu při evaluaci programů............11
	 1.1	Úvod........................................................................................................ 11
	 1.2	Situační podmíněnost aplikace metod a technik výzkumu.............. 11
	 1.3	Učení a osvojování aplikace metod a technik výzkumu................... 12
	 1.4	Závěr........................................................................................................ 15
Ondřej Hora
2 Přístupy k analýze sociálních problémů
z hlediska veřejné a sociální politiky....................................................17
	 2.1	Definice sociálního problému.............................................................. 17
	 2.2	Různé vědecké přístupy k definici sociálního problému.................. 18
	 2.3	Legitimita sociálních problémů a veřejná diskuze............................ 21
	 2.4	Vztah mezi výsledky vědy a využitím těchto výsledků..................... 22
	 2.5	Analytická hlediska významná
pro analýzu sociálních problémů......................................................... 23
	 2.6	Vybrané metody a postupy analýzy sociálních problémů................ 28
	 2.7	Příkladová analýza sociálního problému [Jordan et al. 1992]......... 34
Martin Žižlavský
3 Evaluace programu ve stadiu plánování............................................43
	 3.1	Úvod........................................................................................................ 43
	 3.2	První ukázka: Plán rozvoje sociálních služeb
v Moravskoslezském kraji..................................................................... 44
	 3.3	Druhá ukázka: Národní akční plány
sociálního začleňování vybraných států Evropské Unie................... 52
	 3.4	Závěr........................................................................................................ 59
Evaluační výzkum8
Ondřej Hora
4 Procesní evaluace................................................................................63
	 4.1	Definice procesní evaluace................................................................... 63
	 4.2	Základní přístupy k problému procesní evaluace.............................. 65
	 4.3	Průběh a klíčové kroky procesní evaluace.......................................... 68
	 4.4	Proces evaluace programu.................................................................... 70
	 4.5	Příklad provedení procesní evaluace................................................... 75
Miroslav Suchanec
5 Evaluace dopadu.................................................................................85
	 5.1	Reprezentace kontrafaktuality.............................................................. 88
	 5.2	Náhodnost výběru a povaha analyzovaného efektu ......................... 89
	 5.3	Interní validita........................................................................................ 90
	 5.4	Jednoskupinové designy........................................................................ 93
	 5.5	Víceskupinové designy.......................................................................... 94
	 5.6	Efekty „selekce“...................................................................................... 95
	 5.7	Průřezový estimátor............................................................................... 97
	 5.8	Experimentální design s posttestem.................................................... 99
	 5.9	Posttest design s napárovanou kontrolní skupinou......................... 100
	 5.10	DID estimátor....................................................................................... 101
	 5.11	Nespojitá regrese.................................................................................. 102
	 5.12	Statistická významnost dopadu.......................................................... 106
	 5.13	Příklad z praxe...................................................................................... 106
	 5.14	Závěr...................................................................................................... 107
Martin Žižlavský
Závěr.....................................................................................................109
Literatura..............................................................................................110
Jmenný rejstřík.....................................................................................111
9Úvod
ÚVOD
Martin Žižlavský
Autoři této knihy chápou evaluační výzkum jako situačně podmíněnou
aplikaci metod a  technik výzkumu v  evaluaci sociálních programů.
Aplikaci metod a  technik výzkumu autoři ukazují v  evaluacích různých
programových stadií. Tuto situačně podmíněnou aplikaci metod
a technik výzkumu autoři v textu označují výrazy „evaluační výzkum“
nebo „evaluace“. Při psaní textů kapitol měli autoři na mysli především
čtenáře s malými zkušenostmi s evaluačním výzkumem, nováčky
v evaluačním výzkumu, a to jak studenty, tak pracovníky zabývající se
sociálními programy (dále v textu také jen „programy“). Texty kapitol
tudíž obsahují obecná, nesituační pravidla aplikace metod a  technik
výzkumu v evaluaci programů. Kapitoly této knihy se však neomezují
na představení výše zmíněných pravidel. Každá kapitola pojednávající
o  aplikaci metod a  technik výzkumu v  evaluaci určitého programového
stádia obsahuje autorsky upravenou ukázku skutečné aplikace
metod a technik výzkumu v evaluaci daného programového stádia.
Souvislost mezi adekvátní aplikací metod a  technik výzkumu
a  dovednostmi plynoucími ze souboru zkušeností s  různými evaluačními
situacemi vysvětluje Martin Žižlavský v  kapitole 1 Aplikace
metod a  technik výzkumu při evaluaci programů. Kapitoly o  aplikaci
metod a technik výzkumu jsou řazeny podle programových stadií. Tak
Ondřej Hora píše v kapitole 2 Přístupy k  analýze sociálních problémů
z hlediska veřejné a sociální politiky o různých pojetích sociálního problému
a z nich vycházejících způsobů jeho analýzy. Martin Žižlavský
pak v  kapitole 3 Evaluace programu ve stadiu plánování ukazuje na
příkladech dvou evaluačních výzkumů aplikaci metod a  technik výzkumu
při evaluaci plánů regionálního a  národního programu. Ještě
implementovaný program nebo už implementovaný program je předmětem
procesní evaluace, píše Ondřej Hora v kapitole 4 Procesní evaluace.
Miroslav Suchanec potom v kapitole 5 Evaluace dopadu rozebírá
různé designy a praxí ustálené aplikace metod a technik výzkumu při
evaluaci efektů a výsledků programu.
111 Aplikace metod a technik výzkumu při evaluaci programů
1 APLIKACE METOD A TECHNIK VÝZKUMU
PŘI EVALUACI PROGRAMŮ
Martin Žižlavský
Motto: „Výzkum je stejně jako diplomacie uměním možného.“ [Patton
1990: 13]
1.1 Úvod
Adekvátnost aplikace metod a  technik výzkumu sociálního světa při
evaluaci určitého programu se nevyjevuje tomu, kdo evaluaci dělá, jednoznačně.
Situace, v  níž jsou evaluace programů vykonávány, se různí
a s nimi se také adekvátnost aplikace metod a technik výzkumu sociálního
světa. Výsledkem aplikace metod a technik výzkumu při evaluaci
programů či sociálních intervencí je podle Rossiho, Lipseyho a  Freemana
[2004] evaluační výzkum. „Evaluátoři používají metody sociálního
výzkumu, aby studovali, posuzovali a  pomáhali zdokonalit sociální
programy včetně dobré úrovně diagnóz sociálních problémů, na které
se zaměřují programy, na způsob, jakým jsou programy konceptualizovány
a implementovány, na výsledky jichž dosahují a na jejich účinnost.“
[Rossi, Lipsey, Freeman 2004: 3] Podobně chápe evaluační výzkum, tedy
jako aplikaci metod a  technik v  evaluaci programů, Clarke [viz 1999:
vi] nebo Smutek [viz 2005: 6]. Zmíněná situační různost klade zvýšené
nároky na evaluátorovu dovednost rozpoznat v  dané evaluační situaci
kritéria adekvátnosti aplikace metod a technik výzkumu. Právě na situační
podmíněnost aplikace metod a technik výzkumu při evaluaci programu
a osvojování dovedností adekvátně aplikovat metody a techniky
výzkumu při evaluaci programu evaluátorem se zaměřuje tato kapitola.
1.2 Situační podmíněnost aplikace metod a technik výzkumu
Autor těchto řádek si je vědom skutečnosti, že situačně podmíněné
pojetí aplikace metod a technik výzkumu v evaluaci programu nezastupuje
jediné pojetí uznávané evaluátory. Zhruba lze pojetí či pohledy na
Evaluační výzkum12
aplikaci metod a technik výzkumu v evaluaci programu dělit na univerzalistický
pohled a situačně podmíněný pohled. „Univerzalistický pohled
trvá na univerzální nadřazenosti určitých evaluačních přístupů a metod
oproti jiným.“ [Chen 2005: 11] Chen také výstižně vymezuje situačně
podmíněný pohled (contingency view) na aplikaci metod a  technik
výzkumu v  evaluaci programu. „Alternativní pohled, ze kterého lze
konceptualizovat, rozvíjet a aplikovat principy, přístupy a metody evaluace
programů je situačně podmíněný pohled, který tvrdí, že neexistuje
žádný nejlepší způsob jak vést evaluaci programu; volba přístupů a metod
evaluace programu by měla být spíše situační.“ [Chen 2005:  11]
Určitou evaluační situaci také ustavuje konfigurace hodnot, zájmů
a přístupů různých kategorií lidí zainteresovaných na daném sociálním
programu. Třeba požadavek na vědeckou přesnost, jehož si cení evaluátor
z vědecké komunity, se potkává s požadavkem na užitečnost, který
je upřednostňován zadavateli evaluace. Jak toto „setkání“ dopadne, lze
stěží předvídat, natož jeho podobu vtěsnat do nějakého standardu.
Inspirován uznávanými autoritami v  oblasti evaluačního výzkumu
(viz [Chen 2005], [Patton 1990]) a  rovněž vlastními zkušenostmi
s  evaluačním výzkumem se autor přiklání k  situačně podmíněnému
pohledu na aplikaci metod a  technik výzkumu v  evaluaci programů.
Hlavním důvodem je větší efektivita evaluačního výzkumu vedeného
ze situačně podmíněného pohledu při naplnění specifických potřeb
subjektů zainteresovaných na evaluovaném programu. Potřeby subjektů
zainteresovaných na evaluovaném programu se totiž mění s časem
a místem.
1.3 Učení a osvojování aplikace metod a technik výzkumu
Evaluátor při aplikaci metod a technik výzkumu v evaluaci programů
využívá jak teoretické vědomosti, tak praktické dovednosti. Pro evaluátora
nováčka teoretické vědomosti obsažené v učebnici nebo příručce
představují východisko, „první etapu“ osvojování dovednosti aplikace
metod a technik výzkumu v evaluaci programů. Čím více má nováček
zkušeností s  aplikací metod a  technik výzkumu v  evaluaci programu,
tím více ustupují teoretické vědomosti do pozadí. Zlepšování dovednosti
při adekvátní aplikaci metod a technik výzkumu v evaluaci programu
jde ruku v  ruce s  rostoucí rolí zkušenostně založené intuice na úkor
131 Aplikace metod a technik výzkumu při evaluaci programů
analytického rozumu. Tuto skutečnost empiricky zkoumali při osvojování
dovedností lidmi v různých profesích Stuart E. Dreyfus a Hubert
L. Dreyfus a rozlišili pět posloupných úrovní osvojení určité dovednosti
(viz [Dreyfus, Dreyfus 1980] a [Dreyfus, Dreyfus a Athanasiou 1986]).
Tyto úrovně ukáže autor této kapitoly na osvojení dovednosti adekvátní
aplikace metod a technik výzkumu v evaluaci programů.
1. Nováček. Během studia se nováček učí skutečnostem a charakteristikám
evaluační situace, které jsou důležité pro adekvátní aplikaci metod
a technik výzkumu v evaluaci programu. Rovněž se je naučí rozeznávat,
jakmile se objeví. Na tomto základě se nováček učí pravidlům jednání.
Skutečnosti, charakteristiky a  pravidla jsou definována obecně,
nezávisle na evaluační situaci. Nováček je tak rozpozná i bez odkazu
na určité souvislosti, i bez přispění zkušenosti. „První pravidla jsou nezbytná
pro získání počátečních zkušeností, ale tato pravidla se rychle
stanou překážkou procesu učení a aby nováček dělal pokroky, musejí
být odložena stranou.“ [Flyvbjerg 2001: 11] Rozumové použití pravidel
adekvátní aplikace metod a technik výzkumu začne od určitého okamžiku
vytvářet překážku dalšímu učení svou relativní pomalostí.
2. Pokročilý začátečník. S  rostoucími zkušenostmi se pokročilý začátečník
naučí rozpoznat důležité prvky pro adekvátní aplikaci metod
a technik výzkumu v dané evaluační situaci. Důvodem je, že pokročilý
začátečník vidí podobnosti vzhledem k  předešlým výskytům stejné
evaluační situace. Učí se zásadám, které již předpokládají zkušenosti
s adekvátní aplikací metod a technik výzkumu v evaluaci programů.
3. Zkušený praktik. Zvětšující se zkušenosti postupně přinášejí nové rysy
a aspekty situací, které musí evaluátor brát v potaz při aplikaci metod
a  technik výzkumu. Informační zahlcení mu znemožňuje stanovovat
priority. Aby zvládl narůstající množství informací, naučí se používat
rozhodování založené na hierarchii. Evaluátor přezkoumává jen malou
sadu rysů a aspektů důležitých pro adekvátní aplikaci metod a technik
výzkumu v  evaluaci programu. Činí tak vědomě, volbou plánu, podle
něhož uspořádává informace v konkrétní situaci. Výběr vhodného plánu
není samozřejmý, je to ryze osobní volba, která pak vede ke ztotožnění
se zkušeného praktika s aktivitou, pociťuje za ni osobní odpovědnost.
Evaluační výzkum14
4. Velmi zkušený praktik. Evaluátor na této úrovni intuitivně rozezná
evaluační situaci, plán a cíle aplikace metod a technik výzkumu v evaluaci
programu na základě svých zkušeností. Poté evaluátor prověřuje
logickou analýzou intuitivně rozpoznanou evaluační situaci, plán
a cíle s ohledem na dříve naučená pravidla a zásady, aby dospěl k rozhodnutí
o nejvhodnější aplikaci metod a technik výzkumu v evaluaci
programu.
5. Expert. Intuitivně rozeznává nejen evaluační situace, ale také adekvátní
aplikace metod a technik v evaluačním výzkumu. Evaluátor na
úrovni experta zapojuje racionální analýzu jen když narazí na neznámou
situaci, se kterou nemá opakovanou zkušenost.
Od nováčkovské úrovně až po úroveň zkušeného praktika hraje důležitou
roli analytické uvažování, racionalita. Tabulka 1.1 ukazuje, že zatímco
nováček aplikuje metody a techniky výzkumu v evaluaci programu přemýšlením
o naučených nesituačních pravidlech z pohledu od situace odděleného
pozorovatele, velmi zkušený praktik pak používá rozum jenom
při posuzování adekvátnosti intuitivně vybrané aplikace metod a technik
Tabulka 1.1 Pět úrovní osvojení dovedností
Dovednostní
úroveň
Složky Perspektiva
rozeznání důležitých
rysů
Rozhodo-
vání
Pohlcení evaluátora
situací
1. Nováček Nesituační Žádná Analytické Oddělen
2. Pokročilý
začátečník
Nesituační
a situační
Žádná Analytické Oddělen
3. Zkušený
praktik
Nesituační
a situační
Zvolená Analytické Oddělen při porozumění
a rozhodování. Pohlcen
při výsledku
4. Velmi zkušený
praktik
Nesituační
a situační
Zažitá Analytické Oddělen při rozhodování.
Pohlcen při porozumění
a výsledku
5. Expert Nesituační
a situační
Zažitá Intuitivní Pohlcen
Pramen: Dreyfus, Dreyfus a Athanasiou 1986: 50; vlastní překlad; úpravy autor.
151 Aplikace metod a technik výzkumu při evaluaci programů
výzkumu s ohledem na danou evaluační situaci. Expert běžně racionální
analýzu od situace odděleného pozorovatele nepoužívá, jenom v  situacích,
kdy je „zaskočen“ evaluační situací, s níž nemá zkušenosti.
1.4 Závěr
Praktické dovednosti aplikace metod a  technik výzkumu v  evaluaci
programu adekvátní evaluační situaci jsou vázány na evaluátorovu
osobu skrze ryze osobní zkušenost. Povaha těchto dovedností znemožňuje
jejich předání z osoby, která je má, na jinou osobu ústním nebo
písemným sdělením. Dovednosti adekvátní aplikace metod a  technik
výzkumu v evaluaci programu tudíž spadají do kategorie nesdělitelných
znalostí (tacit knowledge, viz [Polanyi 1983]). Pokud evaluátor na vyšších
úrovních osvojení adekvátní aplikace metod a  technik výzkumu
v  různých evaluačních situacích využívá většinou svojí intuice založené
na kumulovaných zkušenostech, pak je tato činnost spíše řemeslem.
„Řemeslo, které nemůže být specifikováno do detailu, nemůže být
přeneseno předpisem, protože pro něj žádný předpis neexistuje. Může
být předáno dál jenom příkladem od mistra k učni.“ [Polanyi 1962: 53]
Jestliže vědomosti lze nastudovat z  učebnice nebo příručky, pak dovednosti
si lze osvojit jen dlouhodobým praktickým nácvikem, nejlépe
za podpory někoho zkušenějšího. Například pro některé univerzitní
studenty, evaluátory nováčky, představuje studium teorie evaluačního
výzkumu počátek pomyslné cesty k  expertní úrovni výkonu evaluačního
výzkumu. Tito studenti se tak ocitají v situaci podobné té, v níž se
nacházejí studenti humánního nebo veterinárního lékařství či studenti
právní vědy: další pokrok je možný jen dlouhodobou odbornou praxí
po skončení univerzitního studia.
Literatura
Chen, H. 2005. Practical Program Evaluation: Assessing and Improving Planning,
Implementation, and Effectiveness. Thousand Oaks, Calif.: Sage.
Clarke, A. 1999. Evaluation Research. An Introduction to Principles, Methods and
Practice. London: SAGE.
Dreyfus, S. E., H. L. Dreyfus. 1980. A Five-Stage Model of The Mental Activities
Involved in Directed Skill Acquisition. Berkeley: University of California.
Evaluační výzkum16
Dreyfus, H., S. Dreyfus, T. Athanasiou. 1986. Mind over Machine: the Power of
Human Intuition and Expertise in the Era of the Computer. New York: Free
Press.
Flyvbjerg, B. 2001. Making Social Science Matter: Why Social Inquiry Fails and
How It Can Succeed Again. Cambridge: Cambridge University Press.
Patton, M. Q. 1990. Qualitative Evaluation and Research Methods. SAGE: Newbury
Park.
Polanyi, M. 1983. The Tacit Dimension. Gloucester: Peter Smith.
Polanyi, M. 1962. Personal Knowledge: towards a Post-critical Philosophy. Chicago:
University of Chicago Press.
Rossi, P., M. Lipsey, H. Freeman. 2004. Evaluation: a Systematic Approach.
Thousand Oaks: Sage.
Smutek, M. 2005. Evaluace sociálních programů. Hradec Králové: Gaudeamus.
172 Přístupy k analýze sociálních problémů z hlediska veřejné a sociální politiky
2 PŘÍSTUPY K ANALÝZE SOCIÁLNÍCH PROBLÉMŮ
Z HLEDISKA VEŘEJNÉ A SOCIÁLNÍ POLITIKY
Ondřej Hora
V  této kapitole se zabýváme diskuzí a  definicí sociálních problémů
jako předmětu lidského zájmu a základními přístupy k analýze sociálních
problémů. Analýzu v tomto textu chápeme jako rozklad obsahu
a  procesu výzkumu sociálních problémů na určité analytické prvky.
Jako taková má analýza sociálních problémů tří základní významy:
a) aplikační význam, v němž analýza pomáhá připravit podklady pro
informovanější rozhodnutí b) výzkumně procesní význam, v  němž
analýza umožňuje výzkumníkovi v  rozumné míře uchopit a  zjednodušit
komplexní jevy c) didakticko metodický význam, díky němuž
může výzkumník přiblížit postupy analýzy dalším výzkumníkům.
Analýza sociálních problémů je současně často jednou z fází celé řady
komplexnějších evaluačních postupů.
2.1 Definice sociálního problému
Jednu ze základních perspektiv chápání sociálních problémů vymezil
C. W. Mills [1959] v knize Sociologická imaginace, kde mj. rozlišil dvě,
podle autora tohoto textu, základní podmínky analýzy sociálních problémů:
studium širšího společenského kontextu a potřebu sociální problém
definovat. Sociální problémy ovšem mohou být definovány různými
aktéry. Ti, kdo sociální problém definují, mohou, ale nemusí být
těmi, kterých se problém ve svých důsledcích bezprostředně týká (viz
[Navrátil 1998], [Veselý 2009]). Veselý [2009] rozlišuje sociální problém
a veřejně politický problém. Za veřejně politický přitom považuje pouze
ten sociální problém, který je řešen v rámci politického vyjednávání.
V  tomto textu na sociální problém nahlížíme převážně z  hlediska
akademické perspektivy. Na základě literatury (např. [Blumer 1971],
[Veselý 2009], [Carl 2011]) jsme identifikovali následující podmínky
typické pro existenci sociálních problémů. Jako sociální problém označujeme
situace, stavy či okolnosti, které:
Evaluační výzkum18
1
Vezměme příklad jediného člověka, který přicestoval do země nakažen závažnou,
snadno se šířící nemocí. Na tuto situaci se můžeme dívat jako na individuální problém
této konkrétní osoby nebo jako na problém potřeby ochránit dosud zdravou populaci
před následky rozšíření onoho závažného onemocnění.
2
Blumer [1971] uvádí, že rozpoznání sociálních problémů je vysoce výběrový proces,
který je též předmětem (politického) soutěžení (zápolení) a  v  němž jen některé problémy
jsou uznány jako sociální problémy.
	 a)	se bezprostředně týkají člověka či jeho vztahu k  dalším lidem
(odlišení od ekonomických či ekologických problémů)
	 b)	přinášejí negativní důsledky konkrétním osobám, skupinám
osob či společnosti jako celku (pro jejich existenci) anebo je nějak
ohrožují. U sociálních problémů můžeme tedy rozlišovat tzv.
individuální a celospolečenské důsledky.1
	 c)	jsou větším počtem osob identifikovány (rozpoznávány) jako:
1) problematické, 2) nutné či potřebné řešit a 3) možné řešit2
. Řešení
přitom zpravidla není snadné a někdy ani známé [viz Veselý 2009].
	 d)	jsou z  důvodu jejich významu celospolečensky (významnými
aktéry, kolektivně) řešeny nebo existuje alespoň zájem na jejich
řešení. Jejich řešení se zaměřuje na změny sociálních institucí
[Durant 1917].
Jen některé problémy získávají status a  význam sociálního problému
[Navrátil 1998]. Mnozí autoři poukazují na dynamický charakter
so­ciálních problémů (vznikají, trvají, zanikají). Z  tohoto důvodu
může sociálním problémem být i  něco, co v  současnosti neexistuje,
ale přitom je to potenciální hrozbou. Někteří autoři též upozorňují, že
události či jevy označované jako sociální problémy nemusí přinášet
všem účastníkům, kterých se týkají, bezprostřední negativní důsledky.
Proto tito autoři častěji pracují s  pojmem sociální rizika (viz např.
[Taylor-Gooby 2004], [Armingeon a Bonoli 2006]).
2.2 Různé vědecké přístupy k definici sociálního problému
Nejprve se budeme stručně věnovat různým pojetím (přístupům k)
porozumění sociálním problémům v akademických diskurzech uplatňovaných
v sociálních vědách. Chápání různých pojetí sociálního problému
je významné, neboť „představivost je schopnost (výzkumníka)
přepnout se z  jedné perspektivy do druhé“ [Mills 1959]. Sociálnímu
192 Přístupy k analýze sociálních problémů z hlediska veřejné a sociální politiky
problému ve společnosti nelze porozumět, aniž bychom určitým způsobem
chápali, jaká tato společnost je. Lyotard [1984] upozorňuje, že
společnost je v akademické prostředí chápána buď jako funkční celek
(positivistické myšlení), anebo je chápána jako části v  konfliktu (kritické
myšlení).
Funkcionalismus (strukturální funkcionalismus), jehož základními
představiteli jsou např. T. Parsons a R. K. Merton [1982] vnímá společnost
jako celek, jehož jednotlivé části jsou propojeny a vzájemně se
ovlivňují (přispívají k  fungování celku). Je možné rozlišovat manifestované
(záměrné, rozpoznané, zjevné) a  latentní (nezáměrné, skryté)
funkce. Na první pohled příjemné či potřebné věci mohou mít nezáměrné
či skryté negativní důsledky a opačně věci zdánlivě nežádoucí
mohou mít některé pozitivní důsledky. Funkcionální přístup definuje
sociální problémy jako objektivní podmínky nebo uspořádání existující
ve společnosti (jsou ukotveny v existujících sociálních strukturách).
Sociální problémy jsou chápány jako odchylky od zavedených
struktur (disfunkce), které zabraňují dosažení společenských cílů.
„První a  základní složkou sociálního problému je významný rozpor
mezi široce sdíleným sociálním standardem a  aktuálními podmínkami
sociálního života.“ [Merton 1976: 47–48]
Sociální problémy mohou být tedy také latentní či manifestované.
Funkcionalistická analýza sociálního problému se zaměřuje především
na obsahové vymezení (výčet či rozbor) těchto sociálních problémů.
Jsou analyzovány příčiny a  především důsledky těchto problémů.
Lyotard [1984] se domnívá, že řešení sociálních potřeb vychází z domněnky,
že snížení nouze povede ke zlepšení výkonosti celého systému
nebo odvrátí jeho destabilizaci [viz Lyotard 1984: 62–63]. Analýza sociálních
problémů je chápána jako předpoklad řešení těchto problémů
(tzv. reaktivní přístup).
Odlišně od strukturálních funkcionalistů vnímají společnost představitelé
teorie konfliktu (např. [Coser 1957], [Collins 1993]). Coser
[1957] upozorňuje na odlišné osobní zájmy (vested interests) jednotlivých
zájmových skupin a  na jejich rozdílnou roli při prosazování
změny či zabraňování změně. Tvorba skupin s  obdobnými zájmy je
předpokladem vytvoření nových modelů chování a  jejich prosazení.
Konflikt v Coserově perspektivě tedy může být prospěšný v tom, že je
předpokladem sociální transformace. Collins [1993] teorie konfliktu
obohatil o  koncept emocionální, morální a  symbolické mobilizace
Evaluační výzkum20
3
V  tomto kontextu si můžeme povšimnout např. toho, jaké pojmy jsou spojovány
s  definicí sociálních problémů: „nežádoucí“, „nepříznivý“, „nezdravý“, „patologický“,
„deviantní“, „utrpení“, „mizérie“, „bída“, „strádání“, „tenze“, „zhoršení“, „úpadek“.
jako předpokladu pro prosazení skupinových zájmů a  poukázal na
emoční náboj vznikající během konfliktů.
Kultura skupiny během konfliktu je emočně nabitá, nikoliv odtržená
nebo neutrální. Lidé ztrácí schopnost vidět věci v  širším kontextu.
Jejich vnímání se stává vysoce selektivním. Při ideologické polarizaci
každá ze stran vnímá na svých protivnících jen to nejhorší. Z tohoto
důvodu se vysoce mobilizované konflikty stávají ritualizovanou výměnou
krutostí. [ibid. 1993:293]
Třetí odlišný přístup k  analýze sociálního světa nabízí symbolický
interakcionalismus [Blumer 1971] a sociální konstruktivismus [Berger
a  Luckmann 1971]. V  individuální rovině sociální problémy vznikají
určitou interakcí jedinců s  prostředím nebo interakcí mezi jedinci
navzájem. Sociální problém vzniká v procesu společenské a kolektivní
definice sociálního problému [Blumer 1971].
„Sociální problém existuje především v  tom (z  hlediska toho), jak
je definován a jaká je o něm společenská představa, namísto toho, aby
byl objektivní podmínkou.“ [Blumer 1971: 300] Blumer [1971] tvrdil,
že sociální problém pro společnost neexistuje, dokud tato společnost
nerozpozná, že existuje. Studenti sociálních problémů by měli studovat
proces, ve kterém společnost rozpoznává své sociální problémy.
K porozumění sociální realitě významně přispěl též filosof Jean-Francois
Lyotard [1984]. Lyotard (v návaznosti na Wittgensteina) zdůrazňuje
význam jazyka, jeho ustálených pravidel (např. v institucích) a tzv. řečových
her pro přenos informací.3
Vědění ve společnosti je zpravidla
narativní povahy. Informace jsou přenášeny ve formě sdílených příběhů,
které pomáhají vytvářet pravidla, upevňovat sociální vazby a tvořit kritéria
kompetencí, podle nichž je možné posuzovat svět. Lyotard věřil, že
postmoderní společnost je společnost, v  níž přestávají platit (dominovat)
velké, v celé společnosti sdílené narativní příběhy. Každý jednotlivec
je účastníkem určitých sociálních vztahů a vazeb, v rámci nichž sdílí informace.
V rámci jednotlivých sítí nemusí být stejná pravidla řečových
her a záměrem jednotlivců nemusí být vždy dosažení konsenzu (kterého
je možné dosáhnout spíše v jednom čase a lokálně).
212 Přístupy k analýze sociálních problémů z hlediska veřejné a sociální politiky
4
„Uznání“, „rozpoznání“, „odsouhlasení“, „schválení“ či „potvrzení“ problému. J. F.
Lyotard [1984] spojuje legitimitu s  procesem legalizace řešení sociálního problému.
Legitimita též může být chápána jako kontrolní mechanismus vedoucí k tomu, aby byly
společensky řešeny jen ty správné problémy.
5
Podle Schöna a Reina [1994 in Veselý 2009] veřejně politické kontroverze považujeme
za spory, ve kterých se jednotlivé strany sporu drží protichůdných rámců (přesvědčení,
vnímání a uvědomění).
2.3 Legitimita sociálních problémů a veřejná diskuze
Pro sociální problémy je klíčovým prvkem legitimita4
. U  mnoha sociálních
problémů se setkáváme s rozdílnými názory na příčiny, průběh
a důsledky těchto problémů, ale především s různými názory na
potřebnost a  způsob řešení sociálních problémů. Společnost vytváří
arény veřejného mínění, kde značnou roli hrají média, rozhodnutí politiků,
vliv veřejného mínění, veřejných organizací a církví [viz Blumer
1971]. V mnoha případech jsou definice sociálního problému i přístup
k  jeho řešení historicky a  kulturně podmíněné [Veselý 2009, Carl
2011]. Významnou roli mohou hrát ideologie coby soubory hodnot
a  přesvědčení sdílených jednotlivci, skupinami a  společnostmi, které
ovlivňují jejich chování [viz George, Wilding 1994]. Pokud nepanuje
ve společnosti shoda o  konkrétním sociálním problému, můžeme ho
považovat za kontroverzní5
.
V tomto ohledu je podstatné, odkud je odvozována legitimita jednotlivých
sociálních problémů. Někteří autoři (např. [George 1883],
[Lyotard 1984], [Bonoli 2006]) zdůrazňují, že legitimita sociálních
problémů není odvozena jen od státu, ale od názorů a konání lidí žijících
v dané společnosti.
Politologové vědí, že problémy samy o  sobě netvoří politiky, ale
vznik nového problému prožívaného velkými částmi voličů ve fungující
demokracii, probudí zájem politických podnikatelů chtějících
získat hlasy a vyústí v přenesení nového problému na politické kolbiště.
[Bonoli 2006: 14]
Vnímání legitimity problému je založeno na tom, jak spravedlivý,
přiměřený a vhodný je proces řešení konkrétního problému či jakých
výsledků bylo při řešení problému dosaženo [viz Maguire, Cartwright
2008]. Určité riziko ovšem představuje možnost, že veřejnost může být
Evaluační výzkum22
o  problému málo informována nebo se může rozhodovat na základě
nepravdivých či dokonce zmanipulovaných informací [Veselý 2009].
Pro sociálního vědce z  toho vyplývá zajímavá otázka: nakolik se
daná konstrukce sociálního problému opírá o  skutečné sociální podmínky
[Veselý 2009]. Mnozí autoři se zaměřovali na rozpor mezi vědou
a obecnou (intuitivní, na zkušenosti založenou) představou o sociálním
problému ([Blumer 1971], [Veselý 2009]). Věda si pro poznání
sociálních problémů stanovuje svá vlastní pravidla (zakotvená v  tzv.
metodologii vědy). Různí autoři spatřují možnou roli vědy při poznání
sociálních problémů např. ve verifikaci (ověření), redukci komplexity
či v  posílení přesvědčivosti. Praxe ovšem ukázala, že ne vždy věda
přináší lepší výsledky než intuice [viz Veselý 2009]. V některých případech
lze zachytit podstatu sociálního problému jen velmi obtížně
(příklad práce na černo).
2.4 Vztah mezi výsledky vědy a využitím těchto výsledků
Vědci v  mnoha případech reagují na objednávku ohledně výzkumu
sociálních problémů především od politiků [Rossi, Lipsey, Freeman
2004]. Věda ovšem může též být aktérem v  tom ohledu, že může
upozornit na potenciální problémy. Vědci stejně jako studenti veřejné
politiky mohou zkoumat i  oblasti, které nejsou ve společnosti jednoznačně
rozpoznány jako sociální problémy, pokud je sami považují za
potenciálně závažné.
Věda pouze vytváří poznatky, coby předpoklady pro efektivní veřejné
rozhodování. Věda může, ale také nemusí, mít vliv na veřejnou
debatu [viz Veselý 2009]. K využití výsledků by mělo dojít v důsledku
procesu tzv. diseminace (součástí může být i popularizace vědy, snaha
převést výsledky do příběhů). Vztah mezi politiky a vědci bývá často
neujasněný (rizika, role moci, legitimita, očekávání ohledně nalezení
řešení). Velmi diskutována jsou též „rizika politického procesu“ z hlediska
diseminace. V  některých případech je od výzkumníků vyžadováno,
aby výzkumy či odbornými stanovisky legitimizovali cíle a stanoviska
představitelů jednotlivých politických stran [viz Veselý 2009].
Naopak sama publikace výsledků výzkumů může být zablokována,
pokud nevyhovuje záměrům politiků [Lyotard 1984].
232 Přístupy k analýze sociálních problémů z hlediska veřejné a sociální politiky
6
Zájemcům o tento proces doporučuji např. Dunnův přístup ke strukturaci sociálních
problémů [viz Veselý 2009: 112–114].
2.5 Analytická hlediska významná pro analýzu sociálních
problémů
Podle autora tohoto textu není možné prohlásit, že existuje jeden
ideální přístup k  analýze sociálních problémů. Jak je naznačeno již
výše v  textu, rozdílné přístupy k  analýze sociálního problému nejsou
vedeny pouze odlišnými záměry jednotlivých výzkumníků, ale také
jejich odlišnými perspektivami, hodnotami a  životními zkušenostmi.
Významnou pomocí ve výzkumu je ovšem znalost jednotlivých teoretických
přístupů, reflexe výzkumníka ohledně jeho vlastního metodologického
postupu, stejně jako určitá tolerance k odlišnosti přístupů
ostatních vědců. V  této části se zaměřujeme především na tvorbu
základního analytického rámce. Preferujeme proto ta hlediska, která
mohou být významná pro většinu výzkumníků bez ohledu na volbu
konkrétního postupu analýzy sociálního problému.
2.5.1 Vymezení cíle
Každou analýzu sociálního problému musí předcházet jednoznačné vymezení
poznávacího cíle. Poznávací cíl by měl být formulován v návaznosti
na aplikační cíle výzkumu (účel výzkumu) tak, aby byly získány
poznatky, které jsou relevantní a které mohou být využitelné při řešení
sociálního problému. Vymezení poznávacího cíle by mělo autora výzkumu
vždy vést k prvotní definici klíčových pojmů a dimenzí jeho výzkumu.
Jedná se o proces, v němž se mnohdy nejednoznačné koncepty
stávají jasně vymezenými konstrukty6
. Jasná konstrukce sociálního
problému je zde klíčová, neboť zaměření na rozdílné aspekty jednoho
sociálního problému může vést k  návrhu zcela odlišných intervencí
[Rossi, Lipsey, Freemann 2004]. Autor by měl problém vždy definovat
tak, aby publikum (čtenáři) mohlo dobře porozumět jeho pojetí
sociálního problému, případně aby bylo možné ověřit jeho výzkumné
výsledky. Analýza sociálního problému vychází ze snahy o porozumění
sociálnímu problému. Zde lze spatřovat dva základní přístupy v  návaznosti
na to, zda se vědec domnívá, že problém je dostatečně znám,
anebo se domnívá, že problém je třeba více poznat [viz Veselý 2009].
Evaluační výzkum24
7
Příkladem takového kontextu může být např. legislativní úprava pomoci v hmotné
nouzi či sociálního bydlení.
8
V principu se jedná o otázku, nakolik jsou sociální problémy jevy nezávislé na pozorovateli
[viz Veselý 2009].
2.5.2 Vymezení perspektivy (makro-mezo-mikro)
Metodologie vědy v uvažování o podstatě analýzy sociálního problému
umožňuje v návaznosti na C. W. Millse [1959] rozlišit perspektivu malého
rozsahu (mikro), tj. zpravidla lokální či komunitní, a perspektivu
velkého rozsahu (makro), tj. zpravidla národní či nadnárodní. V praxi
se též setkáváme s  přístupem mezo (středního rozsahu), který je na
pomezí mikro a makro perspektivy, kdy sociální problém je zkoumán
na území většího rozsahu (např. v některém z regionů). Z praktického
hlediska jde jak o  prostorové a  časové vymezení (ohraničení) našeho
výzkumu, tak také o volbu perspektivy nahlížení na sociální problém
[viz Van Dijk 2001]. Při výzkumu sociálních problémů vždy musíme
zvažovat, nakolik do jeho výzkumu zahrneme též identifikaci klíčového
kontextu problému, bez jehož pochopení není možné problému
dobře porozumět.7
2.5.3 Objektivita a subjektivita
Další dimenzí významnou pro analýzu sociálních problémů je objektivita
a subjektivita. Rozdíl mezi oběma pojmy je chápán dvěma poněkud
odlišnými způsoby:
	 a)	Podle některých autorů objektivita znamená přistupovat k  problému
nestranně bez osobních předsudků a  zkreslení, ať již vedených
vlastními hodnotami, zkušenostmi či politickou orientací
[Carl 2011]. K tomu by mělo sloužit odpoutání výzkumníka od
sociálního problému. Někteří autoři ovšem upozorňují, že domnívat
se, že se vědec může zcela odpoutat od svých hodnot, je
poměrně naivní.
	 b)	V  druhé dimenzi je významné rozlišovat mezi povahou (podstatou)
sociálního problému a  názory lidí na sociální problém8
.
V  kvalitativním stejně jako v  kvantitativním výzkumu jsou lidé
často informanty o povaze věcí. Pro výzkumníka proto může být
významné sledovat problém z  více perspektiv těch, „kterých se
252 Přístupy k analýze sociálních problémů z hlediska veřejné a sociální politiky
problém týká“ [Veselý 2009] a snažit se co nejvíce přiblížit tam,
„kde se něco děje“. V některých případech může být řešením též
tzv. výzkumná triangulace, tedy vhodná kombinace více výzkumných
postupů či alespoň reflexe výsledků vlastního výzkumu ve
srovnání se zjištěními jiných autorů.
2.5.4 Závažnost sociálního problému
Výzkumník může zvažovat též závažnost sociálního problému. Jakkoliv
je určení závažnosti problému ve více ohledech obtížné a problematické,
výzkumníkovi tato úvaha může pomoci v rozhodnutí, zda se má
problémem zabývat. Užitečnými hledisky pro posouzení významnosti
sociálního problému mohou být:
	 a)	časová tíseň anebo problém priorit (např. tzv. problém tekoucího
kohoutku)
	 b)	míra ohrožení sociálním problémem
	 c)	schopnost resilience, tedy schopnost jednotlivých aktérů, komunit
či společnosti reagovat – řešit problém [viz Maguire, Cartwright
2008]. Do jaké míry můžeme očekávat, že se problém vyřeší sám
bez vnějšího zásahu?
2.5.5 Rozsah sociálního problému
Dalším klíčovým hlediskem analýzy sociálního problému je definice
rozsahu sociálního problému. Jako rozsah sociálního problému zpravidla
chápeme definici toho, kolika osob či skupin osob se konkrétní
sociální problém týká. S  pojmem rozsah sociálního problému jsou
spojovány též termíny distribuce sociálního problému, incidence
a prevalence. Vždy tedy měříme rozsah sociálního problému v určitém
čase na určitém místě. Při určování rozsahu sociálního problému můžeme
pracovat též s pojmy „analýzy potřeb“ cílová populace (všichni,
kdo splňují určité podmínky typické pro sociální problém) a  cílová
skupina (ti, kdo jsou vhodní k zařazení do programu a mají o něj zájem).
Pro kvalitní definici rozsahu cílové populace je důležité stanovení
jednoznačných kritérií (např. věk nebo místo pobytu), která pomáhají
určit, kdo bude do cílové populace započítán a kdo započítán nebude
[viz Rossi, Lipsey, Freeman 2004]. Závažným problémem při určování
rozsahu sociálního problému je riziko špatného usuzování o rozsahu.
Evaluační výzkum26
9
Povahou sociálního problému zde máme na mysli výsledek podrobného popisu
různých výskytů jevu, který nás zajímá, případně jeho příčin či následků s cílem jevu
porozumět.
Často k  němu dochází z  důvodu upřednostnění subjektivismu, anekdotismu
a  také z  důvodu neadekvátního zobecňování pozorovaného
na větší celky [viz Carl 2011].
Tabulka 2.1 Způsoby definice velikosti sociálního problému
Rozsah udává, kolika jednotek se sociální problém týká
Distribuce udává např. v jakých částech vymezeného území se problém
nejčastěji vyskytuje
Intenzita udává rozsah problému ve vztahu k referenční jednotce (např.
k populaci žijící na sledovaném území)
Incidence počet nových případů určitého jevu v daném čase na určitém území
Prevalence počet existujících případů určitého jevu v daném čase na určitém
území
Riziková populace populace, u níž je pravděpodobné, že dojde k určitému jevu
Cílová populace definuje skupinu, která je potenciálními klienty programu z hlediska
jeho cílů
Cílová skupina definuje skupinu, která naplňuje kritéria pro zařazení do programu
a chce se programu zúčastnit
Zdroj: Rossi, Lipsey, Freeman [2004], tabulka autor, upraveno.
2.5.6 Komplexnost sociálního problému
Sociální problémy jsou často jevy komplexní povahy9
, a proto je složité
jim dobře porozumět. U  sociálních problémů se zpravidla zajímáme
kromě samotné povahy sociálních problémů též o jejich další důsledky.
Jedním z důležitých aspektů může být skrytá podstata sociálního problému,
která spočívá v tom, že známe pouze symptomy problému, ale
neznáme jeho podstatu či jeho příčiny. Ve výzkumu sociálních problémů
se proto můžeme zajímat o příčiny vzniku sociálních problémů,
ale je třeba reflektovat, že ne ve všech případech je možné na základě
rozpoznání příčin problému identifikovat vhodná řešení sociálních
272 Přístupy k analýze sociálních problémů z hlediska veřejné a sociální politiky
problémů (např. pokud by příčinou sociálního problému byla vichřice
nebo autonehoda, nelze již řešit v  konkrétních případech důsledky
těchto konkrétních událostí nápravou příčin).
2.5.7 Analýza současného řešení problému
Další důležitou dimenzí posuzování sociálních problémů je analýza
současného stavu řešení těchto problémů. Je třeba si uvědomit, že většina
událostí označovaných jako sociální problémy je v současnosti řešena
nebo již byla řešena v minulosti, a to také i více než jedním opatřením
současně. K  analýze stávajících opatření existují dva základní
přístupy. První z nich se zaměřuje na to, jaká část sociálního problému
(z  hlediska rozsahu a  závažnosti) zůstává nevyřešena poté, co jsme
uplatnili intervence sociální politiky. Sociální problém je tedy vyjádřen
jako rozdíl mezi současným stavem řešení určitého sociálního
problému a ideálním stavem řešení tohoto problému (výsledný rozdíl
je označen jako tzv. konfrontační napětí). Druhý přístup se zaměřuje
na to, nakolik konkrétní intervence sociální politiky přispěly k řešení
konkrétních sociálních problémů. Do této kategorie můžeme zařadit
většinu klasických evaluačních studií, tak jak o  nich pojednávají následující
kapitoly. Další přístup se zaměřuje na schopnost společnosti
identifikovat zdroje a  adaptační kapacity, které mohou být využity
k řešení problému [viz Maguire, Cartwright 2008].
2.5.8 Statický nebo procedurální přístup
Pro analýzu sociálních problémů je též významné rozlišení tzv. statického
a  procedurálního přístupu. Veselý [2009] rozlišuje tyto dva přístupy
v závislosti na tom, zda se autoři analýzy zaměřují na samotný
proces vymezení problémů, či ne. Ovšem i v rámci přístupu, kde nesledujeme
proces vymezení problému (ten je definován výzkumníkem)
můžeme uplatnit rozlišení mezi analýzami, které se zaměřují na „výsledek“
problému v určitém časovém bodě, a analýzami, které se zaměřují
na „vývoj“ problému. Klíčovou částí analýzy sociálních problémů se
stala identifikace klíčových aktérů, která je součástí tzv. přístupu stakeholders
[Rossi, Lipsey, Freeman 2004] – viz níže.
Evaluační výzkum28
10
Klíčovou výhodou kvantitativních přístupů je možnost usuzovat na vztahy mezi jevy
na základě souvislostí mezi kódovanými variantami jednotlivých jevů (obdobný postup
je v  kvalitativním výzkumu značně obtížný). I  v  kvantitativním výzkumu je ovšem
usuzování o příčinách a důsledcích jevů mnohdy značně komplikované mj. z důvodu
a) tzv. nepravých souvislosti b) chyb měření c) omezení při vymezení kauzality.
2.6 Vybrané metody a postupy analýzy sociálních problémů
Analýza sociálních problémů je typickým typem výzkumu pro fázi
před zavedením programu. Typickou analýzu sociálních problémů
v sociální politice mohou představovat např. tzv. „state of the art” reporty,
které shrnují, jaký je současný stav vědění o sociálním problému
z mnoha výzkumů v určité oblasti.
V této části se zaměřujeme na jednotlivé metody sociálních věd využívané
pro analýzu sociálních problémů. U každého z přístupů uvádíme
příklady výzkumů, které dobře reprezentují konkrétní metodologický
přístup k  analýze sociálních problémů. Některé výzkumné studie nepoužívají
jednu konkrétní výzkumnou metodu, ale jednotlivé přístupy
kombinují (např. klasická studie [Jahoda, Lazarsfeld, Zaisel 2002]).
2.6.1 Kvantitativní přístupy (survey, indikátorový přístup)
Jako kvantitativní přístupy zde označujeme techniky analýzy, ve kterých
pracujeme s  daty kódovanými do formy numerických či jiných
symbolů. Kvantitativní přístupy jsou často nenahraditelné, zvláště při
analýze rozsahu sociálního problému. Můžeme také zdůraznit potenciální
přínos kvantitativních přístupů při analýze příčin, mechanismů
a důsledků sociálních problémů.10
Typickým nástrojem kvantitativních
přístupů je provedení dotazníkového šetření (survey) nebo i sběr pouze
jednotlivých konkrétních údajů. Pro výzkumy sociálního problému můžeme
také pracovat s různými dalšími numerickými údaji, které jsme
sami nevytvořili (statistiky). V sociálních vědách se pro klíčové údaje,
které více či méně reprezentují sledované sociální konstrukty, zažil termín
sociální indikátory. Celá řada výzkumných studií využívala např.
data o příjmech či o finančním hospodaření domácností (viz [Jahoda,
Lazarsfeld, Zaisel 2002] či [Ginzberg 2004]). Při usuzování na sociální
indikátory je důležité vyhnout se především riziku chybného úsudku
o souvislostech mezi indikovanými jevy – tzv. „ecological fallacy“ (viz
292 Přístupy k analýze sociálních problémů z hlediska veřejné a sociální politiky
11
Analýzy potřeb v  některých případech pro základní vymezení využívají taxononapř.
[Neuman 2007]). Příklady kvantitativních studií sociálních problémů:
[Levitas et al. 2007] nebo [Rowlingson 2011].
2.6.2 Analýza právně-institucionálních charakteristik
Součástí analýzy sociálního problému může být též tzv. analýza institucionálních
charakteristik systémů. Tato analýza zahrnuje především
analýzu legislativních opatření včetně analýzy legislativní podoby
opatření sociální politiky. Takovými analyzovanými opatřeními může
být např. antidiskriminační zákon nebo podoba legislativní úpravy
poskytování rodičovského příspěvku. Příklad analýzy sociálních charakteristik:
[Clasen, Clegg 2011].
2.6.3 Kvalitativní přístupy (interview)
Rozhovory jsou jedním z nejlepších výzkumných nástrojů pro analýzu
sociálních problémů na lokální úrovni. V tomto kontextu jsou rozhovory
využívány k porozumění podstatě sociálních problémů. Máme na
mysli postup, kdy má výzkumník vymezen sociální problém již před
výzkumem a během výzkumu zjišťuje podrobné okolnosti či kontexty,
v nichž sociální problém vzniká, vyskytuje se či zaniká. Tomuto typu
výzkumu se na příkladu věnujeme na konci tohoto textu. Příklady kvalitativní
studie sociálních problémů: [Jordan et al. 1992].
2.6.4 Analýza potřeb
Analýza potřeb je specifickým typem analýzy, která se provádí před
zavedením programu, aby ověřila jeho potřebnost, nebo aby určila, jaké
typy služeb by v rámci programu vedly k nejlepšímu uspokojení potřeb
[Rossi, Lipsey a Freeman 2004]. Cílem může být také zjištění poznatků
o  potenciálních klientech programu, které mohou vést k  lepšímu využití
stávajících služeb. Programy se mohou zaměřovat jak na klienty
služeb, tak na sociální pracovníky (např. vzdělávací programy). Základním
termínem toho typu analýzy je slovo „potřeba“. Potřeba je podle
Rossi, Lipsey, Freeman [2004] sociální konstrukce vyjednaná mezi aktéry
odpovědnými za sociální program a těmi, kdo program využívají.11
Evaluační výzkum30
mii potřeb podle Bradshaw [1972], Bradshaw a  Finch [2001]: (a) pociťované potřeby
definované jednotlivci, (b) vyjadřované potřeby, které se projevují nějakou akcí, (c)
normativní potřeby definované experty, a (d) komparativní potřeby, které srovnávají
potřeby s ostatními.
12
Analýza dostupnosti zahrnuje následující analytická hlediska: (a) kapacita – dostatečnost
rozsahem služby, (míra pokrytí), (b) selektivita (kritéria přijetí), (c) prostorová
dostupnost (dojezdnost), (d) časová dostupnost (otevírací hodiny zařízení) a  finanční
dostupnost (viz např. [Kuchařová a Svobodová 2006]).
13
Viz např. pravděpodobné faktory ovlivňující volbu řešení situace dlouhodobé péče
o seniory v Německu publikované v [Daguerre 2006].
Z  procesního hlediska analýza umožňuje identifikovat, kteří aktéři
program podporují a  kteří jsou proti jeho zavedení či fungování (viz
také níže).
Analýza potřeb může využívat kvantitativní i  kvalitativní postupy
analýzy. Analýza potřeb zahrnuje též např. popis charakteristik cílové
populace, což má mj. zajistit, aby se do programu dostali ti správní
klienti. Výzkum se zaměřuje na ty sociální podmínky, které aktéři
považují za neuspokojivé, a na to, nakolik (případně i proč) jsou potřeby
(ne)naplňovány v rámci existujících intervencí. Součástí analýzy
může být analýza aktivit, kvality a dostupnosti12
současných intervencí.
V neposlední řadě se analýza potřeb může zaměřovat na otázku, nakolik
jsou jednotlivé intervence koordinovány [WHO 2000].
2.6.5 Procesní přístupy k analýze sociálních problémů
V procesním přístupu k sociálním problémům je pro výzkumníka významné,
jak se sociální problémy vyvíjejí v čase. Analýzy se zaměřují
na události, klíčová rozhodnutí a  dále na názory, postoje a  strategie
aktérů. Síla procesní analýzy je především v možnosti odkrýt povahu
sociálních problémů a mnohdy i skryté zájmy jednotlivých aktérů.13
Někteří autoři rozdělují průběh sociálních problémů do určitých
fází (viz tabulka 2.2). Model Herberta Blumera [1971] implicitně předpokládá,
že dochází k řešení problémů (v každé z fází ovšem jsou nebo
mohou být některé problémy odmítnuty). Oproti tomu model Spector
a Kitsuse [1987] předpokládá, že se sociální problém nepodaří vyřešit,
respektive že může docházet k  poklesu v  řešení sociálních problémů
a  že některé skupiny ve společnosti nemusí být spokojeny s  řešením
problému. Plested, Edwards, Jumper-Thurman [2006] pracují s termí-
312 Přístupy k analýze sociálních problémů z hlediska veřejné a sociální politiky
nem připravenost (readiness), který chápou jako stupeň, ve kterém je
komunita připravena k činu.
Tabulka 2.2 Fáze formulace sociálních problémů podle vybraných autorů
Model řešení pro-
blému
Model přirozeného řešení Model připravenosti komunity
Blumer [1971] Spector a Kitsuse [1987] Kelly et al. [2003], Plested, Edwards,
Jumper-Thurman [2006]
(1) vznik/objevení
sociálního problému
(1) transformace problému ze
soukromého do veřejného
(1) bez vědomí problému; problém
je akceptován
(2) legitimizace
problému
(2) legitimizace problému,
akceptace problému veřejnou
autoritou
(2) odmítnutí problému; mohl by
existovat, ale ne v naší lokalitě
(3) mobilizace aktérů
směrem k řešení
problémů
(3) fáze konfliktu, problematičnost
současných řešení
(3) nejasné vědomí problému; problém
asi existuje, ale chybí motivace
pro jeho řešení
(4) formulace oficiálního
plánu akcí
(4) fáze odcizení nebo radikální
změny, hledání vlastního řešení,
tvorba vlastních institucí
(4) předplánovací fáze; je rozpoznáno,
že problém by se měl řešit,
formují se první málo zřejmé snahy
o řešení
(5) implementace
plánu akcí
(5) přípravná fáze; začíná plánování,
komunita poskytuje určitou
podporu
(6) zavedení řešení; je k dispozici
dostatek informací, začínají aktivity
(7) stabilizace; aktivity jsou podporovány
autoritami, personál je
vyškolen
(8) potvrzení/rozšíření; aktivity jsou
zavedeny, členové komunity jsou
spokojeni
(9) přijetí problému komunitou;
existuje značná znalost o problému
a jeho řešení
Zdroje: Blumer [1971], Spector a Kitsuse [1987], Kelly et al. [2003], Plested, Edwards, Jumper-Thurman
[2006], upraveno autorem.
Evaluační výzkum32
Bonoli [2006] vysvětluje změny v sociální politice na základě a) závažnosti
problému a  vlivu časování vývoje v  jednotlivých zemích,
b)  přímé a  nepřímé politické moci a  mobilizace jednotlivých aktérů,
c) institucionální setrvačnosti (např. komu vyhovuje a  nevyhovuje
současný stav).
Základem pro výzkum sociálních problémů je rozpoznání klíčových
aktérů neboli stakeholderů (termín poprvé užil [Freeman 1984]).
Podle Rossi, Lipsey a Freeman [2004] jsou významnými hledisky pro
identifikaci klíčových skupin: a) kdo může využít výsledky, tj. zpravidla
realizátoři programu, b) kdo může být výsledky ovlivněn, tj. zpravidla
klienti programu. Hooper a  Longworth [2002] rozlišují tři skupiny
aktérů: a) ti, kdo mají potřebné znalosti, b) ti, kdo mají moc ovlivnit
výsledky programu, c) ti, kdo mají zájem účastnit se na programu. Na
základě přechozích poznatků jsme definovali v tabulce 2.3 potenciální
procesní analytická hlediska.
Tabulka 2.3: Analytická hlediska pro procesní analýzu sociálních
problémů
Definice
sociálního
pro-
blému
- jak vznikají sociální problémy?
- kdo sociální problém definuje?
- jaká je historie sociálního problému a komunity [Maguire, Cartwright
2008]?
- jak se definice sociálního problému odlišuje v jednotlivých fázích?
Stakehol-
deři
- jak jednotliví stakeholdeři reagují?
- kdo podporuje určité řešení problému?
- kdo se snaží zabránit tomuto řešení?
- kdo je pověřen řešením problému (má odpovědnost)?
- jakou roli hrají média?
- jaké názory na problém převažují?
Spolu-
práce
a rivalita
- kdo s kým spolupracuje při prosazení a řešení sociálního problému?
- kdo vytváří koalici [viz Daguerre 2006]?
Události - jaké události mají vliv na (způsob) řešení sociálního problému (viz
např. situaci dovolání žen k ústavnímu soudu v Německu a její důsledky
[Anderson, Meyer 2006])
332 Přístupy k analýze sociálních problémů z hlediska veřejné a sociální politiky
Legiti-
mita
- nakolik jsou v jednotlivých fázích sociální problémy akceptovány či
legitimizovány
- jakou roli v tom hraje jednání jednotlivých aktérů
- kdo může ovlivnit podobu problému
- nakolik mohou problém ovlivnit ti, jichž se bezprostředně týká
- kdo další má zájem na řešení problému
Řešení - jaká řešení jsou v jednotlivých fázích přijímána
- jak se řešení v průběhu času mění
- nakolik jsou jednotlivá řešení úspěšná (kritéria úspěšnosti)
Zdroje - jaké jsou zdroje, odkud (od koho) pocházejí a jak jsou využívány
- jak spolu jednotlivé skupiny aktérů bojují o využití zdrojů (viz např.
[Huber, Stephens 2006])
2.6.6 Analýzy textu a jazyka (diskurzivní analýza)
Psané dokumenty mohou být významným zdrojem informací o  sociálních
problémech. Různé podoby diskurzivní analýzy (analýza
diskurzů) se zaměřují na způsob, jakým jsou sociální problémy definovány
v  rámci psaných projevů, významných dokumentů nebo
veřejných prohlášení.
„Pokračujíce v  tradici, která odmítá možnost na hodnotách nezávislé
vědy, argumentují, že věda a především vědecký diskurz, jsou
nedílnou součástí sociální struktury, kterou jsou ovlivněny, a  vznikají
v sociální interakci.“ [Van Dijk 2001: 352]
Diskurzivní analýza se zaměřuje na psaný i  mluvený jazyk jako
na základní předmět výzkumu. Jedna z  forem diskurzivní analýzy
– kritická diskurzivní analýza (CDA) – se přímo zaměřuje na studium
sociálních problémů v kontextu moci a kontroly (viz [Van Dijk 2001],
[Jorgensen, Phillips 2002]).
2.6.7 Akční výzkum
Specifickou součástí některých procesních přístupů je tzv. akční výzkum,
ve kterém je vědec současně účastníkem změny či opačně účastník
změny je zároveň vědcem. Jeho role pak spočívá v poskytování in-
Evaluační výzkum34
formací, které napomáhají při realizaci projektu či dokonce v působení
na ostatní účastníky projektu (viz např. [Coghlan, Brannick 2010]).
2.7 Příkladová analýza sociálního problému
[Jordan et al. 1992]
V této části se zaměříme na ilustraci toho, jakým způsobem lze kvalitně
provést analýzu sociálního problému. Pro příkladovou analýzu
sociálního problému jsme vybrali zdařilou studii Jordana a  jeho kolegů
Trapped in Poverty? Labour-market Decisions in Low Income Households
[Jordan et al. 1992]. Tato analýza byla vybrána pro svá kvalitní
teoretická východiska, originální design, detailní popis metodologie
a  vysokou kvalitu zpracování výzkumu. Užitečné jsou též poznámky
autorů o  problémech, s  nimiž se autoři potýkali během výzkumného
procesu. Všechny poznatky uvedené v  této kapitole čerpáme přímo
z výše zmíněné knihy.
2.7.1 Cíle studie
Autoři studie charakterizovali svůj výzkumný záměr následujícími
větami:
Kniha poskytuje detailní studii toho, jak se muži a ženy v domácnostech
s dětmi s nízkými příjmy rozhodují, jakou práci dělat, za jakou
mzdu, kolik hodin pracovat a s jakými vyhlídkami. Ukazuje, jak jsou
rozhodnutí o příchodu na trh práce a rozhodnutí o odchodu z trhu
práce navázána na jistotu zaměstnání, příjem, daňový systém, sociální
dávky, rodinné závazky, způsoby hospodaření a další faktory.
Také analyzuje vzájemný vztah rozhodnutí jednotlivých  partnerů
a do jaké míry partneři sledují společnou strategii.
Autoři uvádějí následující výzkumné otázky: [ibid.: 68]
	 •	Jak domácnosti rozhodují o množství placené a neplacené práce
prováděné každým z partnerů?
	 •	Počítají domácnosti čistý zisk příjmu domácnosti (včetně daní,
příspěvků na sociální pojištění, ztráty sociálních dávek a výdajů
352 Přístupy k analýze sociálních problémů z hlediska veřejné a sociální politiky
14
Autoři ukazují např. situace zpoždění či nevyplacení sociálních dávek či situace,
kdy lidé nemohou rozhodovat o  povaze svého zaměstnání, např. kolik hodin budou
pracovat.
na cestování a péči o děti) dříve, než se rozhodnou, zda přijmout
málo placené zaměstnání?
	 •	Uvědomují si respondenti past nezaměstnanosti či past chudoby,
a pokud ano, jak se na základě toho rozhodují?
	 •	Jaké prvky trhu práce, daňového systému a  systému sociálních
dávek a  jaké interakce mezi těmito prvky uvádějí respondenti
jako zásadní pro jejich rozhodnutí?
2.7.2 Teoretické zakotvení studie
Studie byla provedena třemi výzkumníky: ekonomem, sociologem
a sociálním politikem. I proto autoři studie vnímali rozpor mezi několika
základními teoretickými proudy. První proud reprezentuje ekonomický
individualismus (reprezentovaný především teorií racionální
volby a teorií her). Zde je rozhodování chápáno především jako otázka
racionálního kalkulu (vyplatí se či nevyplatí za daných podmínek pracovat).
Další teoretické proudy zdůrazňují etické, skupinové, komunitní
a společenské faktory. Zde autoři ukazují, jak dělba rolí v rodině,
sociální sítě, morální hlediska, pociťované povinnosti a  reciprocita
ovlivňují chování respondentů. Pro vysvětlení uplatnění moci mezi
oběma partnery jsou prezentovány také levicové a  feministické teorie.
Třetí proud reprezentují teorie z oblasti sociální politiky, které se
zaměřují na ekonomickou situaci chudých, strategie nezaměstnaných,
pobírání sociálních dávek, vliv ideologie a na morální debatu o řešení
situace chudých v různých ideových proudech [ibid.: 38 a dále]. Kniha
se též dotýká tématu, jak je jednání aktérů omezeno strukturálními
faktory.14
2.7.3 Volba metody a provedení studie
Autoři upřednostnili kvalitativní výzkumnou strategii. Autoři studii
označují jako explorační, vycházeli z  induktivní logiky a  jejich cílem
byla tvorba hypotéz a teorie [ibid.: 54–55]. Autoři v metodologii stanovují
následující podmínky pro generování teorie z dat [ibid.: 69]:
Evaluační výzkum36
15
Kontextuální informace o podobě systému sociálních dávek v době provádění výzkumu
jsou uvedeny v příloze č. 1.
	 1)	Vnitřní ucelenost vysvětlení, které je doplněno jak o  běžné, tak
i o extrémní případy.
	 2)	Teorie musí vycházet z  poznatků různých oborů, jako je např.
ekonomie nebo sociologie, a také musí poznatky doplňovat.
	 3)	Teorie musí překročit rámec mikroroviny vysvětlení rozhodování
jednotlivců a rodin tak, aby ukázala širší sociální vztahy a mohla
přispět k politické debatě.
	 4)	Teorie musí být schopná propojovat informace ze svého výzkumu
s poznatky dalších výzkumů.
	 5)	Teorie musí být podrobitelná falsifikaci, tj. musí rozlišovat nezbytné
a  dostatečné podmínky, být schopná rozlišit odlišující se
případy, poskytnout jakékoli dostupné kvantifikované výsledky
a vždy zvážit alternativní vysvětlení sledovaných dat.
Podle autorů bylo jedinou cestou, jak prozkoumat uvažování lidí
o trhu práce, zeptat se jich na jejich příběh. Jejich úkolem bylo popsat,
jak rozumí dostupným možnostem [ibid.: 55]. Cílem tedy nebylo zjistit
objektivní stav (v případě rozporů hledat pravdu), ale prozkoumat, jak
je chápou (rekonstruují) respondenti. Ve výzkumu byly využity rozhovory
a  terénní poznámky o  průběhu výzkumu15
. Autoři reflektují,
že studie neposkytuje „přesné“ informace běžné pro kvantitativní typ
výzkumu (viz diskuze [ibid.: 67]) a  výsledky nelze zobecňovat mimo
lokalitu [ibid: 80]. K určitému zkreslení výpovědí může docházet z důvodu
snahy respondentů o  vylepšení sebeprezentace (viz [ibid.: 74]
a diskuze níže).
Ve fázi sběru dat byl výzkum proveden jedinou výzkumnicí (Helen
Kay), a to během období šestnácti měsíců. Výzkum byl prováděn
v  lokalitě nejvíce zanedbané (deprivované) čtvrti Exeteru, devadesátitisícového
městečka na jihozápadě Anglie. Jedná se o  meziválečnou
zástavbu zanedbaných polořadových domků. Lokalita byla vybrána na
základě výsledků předchozích výzkumů, dostupných statistik a rozhovorů
s  experty. Zkoumání respondentů z  jedné lokality má výhodu
v tom, že respondenti jsou z jednoho prostředí a mají stejné podmínky
(např. veřejná doprava, trh práce).
372 Přístupy k analýze sociálních problémů z hlediska veřejné a sociální politiky
16
Zjišťování příjmu je podle autorů spojeno se třemi základními problémy [ibid.: 55–
56]: a) zda brát v úvahu hlavní příjem domácnosti nebo příjem všech členů domácnosti
(mají členové domácnosti vzájemně přehled o  svých příjmech), b) jak sledovat příjem
v  domácnostech, kde dochází k  častým změnám příjmové situace, c) obava autorů, že
zjišťování příjmu na začátku výzkumu povede pro svou citlivost k odmítnutí rozhovorů.
17
Stejně tak platí, že z obdobných studií nelze bez dalšího usuzovat na rozsah sledovaného
sociálního problému mimo sledovanou lokalitu (poznámka autora tohoto textu).
18
Základní charakteristiky respondentů jsou popsány na [ibid.: 66]. Základní charakteristiky
domácností jsou popsány v příloze č. 2.
Cílovou skupinou výzkumu byly nízkopříjmové domácnosti. Autoři
se rozhodli nedotazovat se domácností na jejich příjem16
, ale provést
rozhovory s  respondenty ochotnými k  výzkumu v  uvedené lokalitě,
kde většina domácností má nízké příjmy. Autoři studie uvádějí, že
zkoumané domácnosti představují malou a  atypickou část britské
populace. Autoři též upozorňují, že uvedené domácnosti nemusí být
typickými představiteli této části populace. (Daný typ studie neusiluje
o reprezentativnost.)17
Cílem výzkumu bylo provést výzkum ve čtyřiceti dvou domácnostech
s  dětmi, přičemž v  každé měly být provedeny tři rozhovory.
Autoři předpokládali, že pro analýzu budou moci uplatnit další
hlediska srovnání mezi jednotlivými subkategoriemi [viz ibid.: 57].
Respondenti byli kontaktováni přes různé sociální instituce působící
ve zkoumané oblasti a přes jejich pracovníky (komunitní centrum, mateřské
centrum). Část respondentů byla získána tímto způsobem. Další
část respondentů byla získána skrze kontakt přímo v  domácnostech
respondentů (zaklepání na dveře). Celkem byly provedeny rozhovory
s  třiceti šesti partnerskými dvojicemi s  dětmi.18
V  každé domácnosti
výzkumnice prováděla více rozhovorů. Nejprve hovořila s  každým
z  partnerů zvlášť a  poté, bylo-li to možné, s  oběma partnery dohromady.
Pro srovnání provedla též rozhovory se sedmi samoživitelkami
a samoživiteli. Provádění rozhovorů bylo velmi časově náročné.
2.7.4 Politické souvislosti, etické aspekty a obtížnost výzkumu
Autoři se rozhodli pro výzkum na základě politické debaty o reformě
sociálního systému [ibid.: 54]. Výzkum byl podle autorů studie obtížný
v  tom ohledu, že všechny respondenty bylo možné v  době výzkumu
označit za chudé; všichni měli zkušenost s pobíráním sociálních dávek
Evaluační výzkum38
a ve třetině domácností nikdo nepracoval. Z toho vyplývala politická
citlivost zkoumaného tématu. Autoři se v době publikování studie obávali
politického dopadu publikování výsledků.
Dalším obtížným momentem výzkumu bylo získat dostatečný počet
respondentů, zajistit kvalitu výzkumu a také etickou dimenzi výzkumu.
Během výzkumu výzkumník otevíral citlivá témata, narušoval intimní
prostor domácností, mimoděk se dozvídal intimní informace a  byl
svědkem partnerských konfliktů. Autoři studie uvádějí [ibid.: 61]:
V této fázi bylo zjevné, že lidé své pracovní zkušenosti silně prožívají
a  že otázky, které vyvstávaly během výzkumu, se stávaly extrémně
citlivými, když se autoři pokusili uvést je do kontextu domácnosti.
Dokonce i  u  relativně harmonických, spolupracujících párů se vyskytovaly
určité tenze a tabuizované oblasti.
V  některých případech se stávalo, že partneři vypovídali odlišně.
Bylo obtížné uskutečnit druhý (s partnerem) a třetí (společný) rozhovor.
Bylo obtížné uskutečnit individuální rozhovory bez přítomnosti
partnera. Přítomnost partnera při individuálních rozhovorech někdy
pravděpodobně narušovala validitu rozhovoru (vstupování partnera
do rozhovoru, obava mluvit před partnerem). Základním požadavkem
pro provádění výzkumu by vždy měl být informovaný souhlas respon-
denta.
2.7.5 Zpracování výsledků
Rozhovory byly nahrávány na magnetofon a  poté detailně přepsány.
Ve fázi analýzy dat se výzkumu zúčastnili dva výzkumníci. Autoři plánovali
analyzovat data tak, aby využili vlastní koncepty respondentů
pro definování objevujících se témat. Ve druhé fázi výzkumu mělo
následovat kognitivní mapování, které mělo přiřadit ke konceptům
odpovídající procesy tak, aby bylo možné vytvořit teorii a tu diskutovat
mezi jednotlivými výzkumníky [ibid.: 57]. Autoři usilovali o to, aby
provedený typ analýzy byl přesvědčivý [ibid.: 68]. V  obdobném kontextu
se často u  kvalitativního výzkumu píše o  potřebě autentičnosti
a důvěryhodnosti.
Autoři pracovali tím způsobem, že každý z nich vypracoval vlastní
draft a následně diskutovali získané poznatky. U interpretace výsledků
392 Přístupy k analýze sociálních problémů z hlediska veřejné a sociální politiky
nebylo vždy snadné dosáhnout konsenzu ohledně významů jednotlivých
výpovědí z  hlediska rozdílných teoretických východisek autorů
[viz ibid.: 69–70]. Nejprve využívali jakési mentální mapy jednotlivých
rozhovorů, ale nebyli schopni se shodnout ohledně interpretací. Z toho
důvodu využili autoři kódování (např. bydlení, daně, dávky, osoba samostatně
výdělečně činná, hospodaření). Z  rozhovorů s  respondenty
ovšem bylo jasné, že jednotliví respondenti interpretují stejná slova
jinak a přikládají jim různé významy. Kromě rozdílného chápání jednotlivých
slov se ve výpovědích projevily různé odkazy na sociální
kontext (sociální vztahy) a  morální kritéria ospravedlnění rozhodování
(odkazy na normy a požadavky kultury komunity a společnosti,
ve které respondent žije).
Studie je organizována následujícím způsobem: samostatné kapitoly
jsou věnovány výpovědím mužů, výpovědím žen a společným výpovědím,
informacím o bydlení a výpovědím samoživitelek a samoživitelů.
Každá kapitola je strukturována kolem několika specifických témat.
Výzkumný materiál je ve studii prezentován formou úryvků dialogu
z  jednotlivých rozhovorů, popisy jednotlivých situací (zde dochází
k  propojení informací z  rozhovoru partnera a  partnerky, případně
společného rozhovoru). Informace získané z  rozhovorů jsou propojovány
s teoriemi prezentovanými na začátku výzkumné studie. Závěrečná
kapitola propojuje výsledky studie s teoretickými poznatky.
2.7.6 Komentář k provedení výzkumu
Uvedená studie je cenná tím, že přestože přinesla zajímavé výsledky,
autoři zde poukazují na celou řadu problematických míst výzkumu,
která jsou v  obdobných studiích obvykle zamlčena: náročnost rozhovorů,
obtížnost analýzy velkého množství dat, problémy ve shodě
v  interpretaci výsledků mezi jednotlivými výzkumníky, změna výzkumníků
v  průběhu výzkumu, obtížné materiální a  další podmínky
pro výzkum, etické aspekty výzkumu a citlivost prezentovaných údajů.
Z tohoto důvodu je uvedený výzkum jako celek cenným zdrojem poznatků
o analýze sociálních problémů.
Evaluační výzkum40
Literatura
Anderson, K. M., T. Meyer. 2006. „New Social Risks and Pension Reform in
Germany and Sweden.“ Pp. 171–191 in Armingeon, K., Bonoli, G. (eds)
Industrial Welfare States: Adapting Post-war Social Policies to New Social Risks.
New York: Routledge.
Armingeon, K., G. Bonoli. (eds.) 2006. Industrial Welfare States: Adapting Post-war
Social Policies to New Social Risks. New York: Routledge.
Berger, P. L., T. Luckmann. 1971. The Social Construction of Reality: A Treatise in
the Sociology of Knowledge. Harmondsworth, Middlesex: Penguin University
Books.
Blumer, H. 1971. „Social Problems as Collective Behavior. “ Social Problems 13 (3):
298–306.
Bonoli, G. 2006. „New Social Risks and the Politics of Post-industrial Social
Policies.“ Pp. 3–26 in Armingeon, K., Bonoli, G. (eds.) Industrial Welfare States:
Adapting Post-war Social Policies to New Social Risks. New York: Routledge.
Bradshaw, J. R. 1972. „The Concept of Social Need.“ New Society 496: 640–643.
Bradshaw, J., N. Finch. 2001. Core Poverty. Paper for a Seminar at Centre for the
Analysis of Social Exclusion LSE, London. York: University of York.
Carl, J. D. 2011. Think Social Problems. Boston: Pearson Education.
Clasen, J., D. Clegg. 2011. Regulating the Risk of Unemployment. Oxford: Oxford
university press.
Coghlan, D., T. Brannick. 2010. Doing Action Research in Your own Organization.
London: Sage Publications.
Collins, R. 1993. „What Does Conflict Theory Predict about America‘s Future?
1993 Presidential Address.“ Sociological Perspectives 36(4): 289–313.
Coser, L. A. 1957. „Social Conflict and the Theory of Social Change.“ The British
Journal of Sociology 8(3): 197–207.
Daguerre, A. 2006. „Childcare policies in diverse European welfare states.“ Pp.
211–226 in Armingeon, K., G. Bonoli. (eds.) Industrial Welfare States: Adapting
Post-war Social Policies to New Social Risks. New York: Routledge.
Durant, W. 1917. Philosophy and the Social Problem. Norwood: Norwood Press.
Freeman, R.E. 1984. Strategic Management: A Stakeholder Approach. Boston, MA:
Pitman.
George, H. 1884. Social Problems. Chicago: Belford, Clarke & Co.
George, V., P. Wilding. 1994. Welfare and Ideology. Hemel Hempstead: Harvester
Wheatsheaf.
Ginzberg, E. 2004. The Unemployed. Piscataway, New Jersey: Transaction
Publishers.
Hooper, J., P. Longworth. 2002. Health Needs Assessment Workbook. London:
Health Development Agency.
Huber, E., J. D. Stephens. 2006. „Combating Old and New Social Risks.“ Pp.
143–168 in Armingeon, K., G. Bonoli. (eds.) (2006) Industrial Welfare States:
Adapting Post-war Social Policies to New Social Risks. New York: Routledge.
Jahoda, M., P. F. Lazarsfeld, H. Zaisel. 2002. Marienthal: the Sociography of an
Unemployed Community. New Brunswick: Transaction Publishers.
412 Přístupy k analýze sociálních problémů z hlediska veřejné a sociální politiky
Jorgensen M., L. J. Phillips. 2002. Discourse Analysis as Theory and Method.
London, Thousand Oaks, New Delhi: SAGE Publications.
Jordan, B., S. James, H. Kay, M. Redley. 1992. Trapped in Poverty? Labour Market
Decisions in Low Income Households, London: Routledge.
Kelly, K. J., B. A. Plested, R. W. Edwards, P. Jumper-Thurman, M. L. Comello, M. D.
Slater. 2003. „The Community Readiness Model: A Complementary Approach
to Social Marketing.” Marketing Theory 3(4): 411–425.
Kuchařová, V., K. Svobodová. 2006. Síť zařízení denní péče o děti předškolního věku
v ČR. Praha: VÚPSV.
Lyotard, J. F. 1984. The Postmodern Condition: A Report on Knowledge.
Minneapolis: University of Minnesota Press.
Levitas, R., C. Pantazis, E. Fahmy, D. Gordon, E. Lloyd, D. Patsios. 2007. The
Multi-dimensional Analysis of Social Exclusion, Bristol: Townsend Centre for
the International Study of Poverty and Bristol Institute for Public Affairs,
University of Bristol.
Merton, R. K. 1982. Social Research and the Practicing Professions. Cambridge,
Mass: Abt Books.
Mills, C. W. 1959. The Sociological Imagination. New York: Oxford University
Press.
Maguire, B., S. Cartwright. 2008. Assessing a Community’s Capacity to Manage
Change: A Resilience Approach to Social Assessment. Canberra: Bureau of Rural
Sciences.
Navrátil, P. 1998. „Sociální práce jako sociální konstrukce.“ Sociologický časopis 34
(1): 37–50.
Neuman, W. L. 2007. Basics of Social Research. Boston, USA: Pearson Education.
Plested, B. A., R. W. Edwards, P. Jumper-Thurman. 2006. Community Readiness:
A Handbook for Successful Change. Fort Collins, CO: Tri-Ethnic Center for
Prevention Research.
Rossi, P. H., M. W. Lipsey, H. W. Freeman. 2004. Evaluation: A Systematic Approach.
Thousand Oaks: Sage Publications.
Rowlingson, K. 2011. Does Income Inequality Cause Health and Social Problems?
York: Joseph Rowntree Foundation.
Schön, D. A., M. Rein. 1994. Frame Reflection: Toward the Resolution of Intractable
Policy Controversies. New York: Basic Books.
Spector, M., J. I. Kitsuse. 1987. Constructing Social Problems. Hawthorne, NY:
Aldine de Gruyter.
Taylor-Gooby, P. (ed.) 2004. New Risks, New Welfare: the Transformation of the
European Welfare State. New York: Oxford University Press.
Van Dijk T. A. 2001. „Critical Discourse Analysis“ Pp. 352–371 in Tannen, D., D.
Schiffrin, H. Hamilton. (eds) Handbook of Discourse Analysis. Oxford: Blackwell.
Veselý, A. 2009. Vymezení a strukturace problému ve veřejné politice. Praha:
Karolinum.
WHO 2000. Workbook 3: Needs Assessment. Geneva: World Health Organisation,
United Nations International Drug Control Programme, European Monitoring
Center on Drugs and Drug Addiction.
433 Evaluace programu ve stadiu plánování
3 EVALUACE PROGRAMU VE STADIU PLÁNOVÁNÍ
Martin Žižlavský
3.1 Úvod
Tato kapitola ukazuje aplikace metod a  technik výzkumu sociálního
světa při evaluaci programu ve stadiu plánování pomocí komentovaných
ukázek skutečných evaluačních výzkumů. Členění určitého programu
na stadia autor převzal od Chena [2005: 48]. Ve stadiu plánování
se daný program „rodí“. Po stadiu plánování následuje stadium počáteční
implementace. Podle Chena [ibid.] plán programu slouží jako
základ pro organizaci a  implementaci programu v  budoucím období.
Chen [ibid.] se domnívá, že řádný plán programu obsahuje zdůvodnění
existence programu a plán implementace programu. Jinými slovy,
řádný plán programu ve stadiu plánování obsahuje jak symbolickou
část zdůvodňující význam zamýšleného programu odkazem na určitý
sociální problém, tak implementační část pojednávající o  uskutečňování
programu. Evaluace programu ve stadiu plánování pak pomáhá
naplnit potřebu subjektů zainteresovaných na programu dozvědět se
od evaluátora odborné „evaluační koncepty, strategie a činnosti, které
mohou pomoci při navrhování a rozvinutí programového zdůvodnění
a plánu programu.“ [Chen 2005: 50]
Výběr ukázek evaluace programu ve stadiu plánování byl omezen
malým množstvím publikovaných písemných zpráv na toto téma.
Většina písemných evaluačních zpráv má totiž povahu soukromé věci
náležející k  soukromému obchodnímu kontraktu mezi evaluátorem
a  jeho zákazníkem. Konečně, účastníci evaluací si často nepořizovali
písemné záznamy a  vše, co se dělo při evaluacích programů ve fázi
plánování tak zůstává skryto před veřejností v paměti přímých účastníků
evaluací. Výběr ukázek evaluace programu ve fázi plánování byl
tudíž omezen na veřejně dostupné písemné zprávy o  evaluacích programových
plánů. Autor této kapitoly vybral ty zprávy, které nejvíce
naplňovaly kritérium transparentního popisu metodiky evaluačního
výzkumu programu ve fázi plánování.
Evaluační výzkum44
3.2 První ukázka: Plán rozvoje sociálních služeb
v Moravskoslezském kraji
Plán programu může informovat občany o  politikách, které plánují
politikové územně správního celku, například kraje. To je případ Střednědobého
plánu rozvoje sociálních služeb v  Moravskoslezském kraji na
léta 2010–2014 (dále v textu také jen „komunitní plán“). Prvotní účel
vybraného komunitního plánu samozřejmě spočívá v podpoře návrhu
a  uskutečňování rozvoje sociálních služeb v  Moravskoslezském kraji
zainteresovanými stranami. Tento komunitní plán je jedním z dílčích
plánů, které se vážou k jednotlivým krokům procesu plánování rozvoje
sociálních služeb v  Moravskoslezském kraji. Hodnocený komunitní
plán se váže k druhé fázi plánování rozvoje sociálních služeb v Moravskoslezském
kraji. První fáze, 2008 až 2009, se zaměřila na stabilizaci
současného stavu poskytování sociálních služeb; druhá fáze, 2010 až
2014, se týkala vytváření systému rozvoje sociálních služeb v  kraji
(návrh decentralizace, návrh nového systému odměňování); třetí fáze,
2015 až 2018, se bude soustřeďovat na rozvoj sociálních služeb a vytvoření
strategie k jejich zajištění (vytvoření sítě poskytovatelů a také
systému sledování a hodnocení plánu rozvoje sociálních služeb). (Podrobněji
viz [Bareš 2011: 36].)
3.2.1 Cíl evaluace. Evaluační strategie
Protože evaluace programu uspokojuje informační potřebu nejen
evaluátora (či evaluátorů), ale také subjektů majících zájem na programu
(angl. „stakeholders“), tak zpravidla nevymezuje cíle evaluace
a  prostředky k  jejich dosažení sám evaluátor. Chen nazývá takový
soubor evaluačních cílů a  prostředků evaluační strategií. „Evaluační
strategie je obecný směr nebo orientace, kterým se ubírají evaluátoři
a subjekty mající zájem na programu, aby naplnili daný účel evaluace.“
[Chen 2005: 51] Evaluátor může například poskytnout svoje znalosti
a  dovednosti subjektům majícím zájem na programu formou expertízy.
Evaluátor také vystupuje v  roli konzultanta nebo moderátora
diskuse pracovní skupiny složené ze zástupců stran zainteresovaných
na plánovaném programu. Podkladem pro konzultace je mimo jiné
text plánu programu. Jedním z výstupů této evaluační strategie, napomáhající
rozvoji programu, může být výzkumná zpráva nebo článek
453 Evaluace programu ve stadiu plánování
v  odborném časopise. Veřejně přístupná výzkumná zpráva obsahuje
důležitá sdělení jak pro jiné evaluátory, tak pro tvůrce podobných programů
v  jiných územně správních celcích. A  to je případ výzkumné
zprávy Pavla Bareše nazvané Cíle, priority a  opatření v  plánu rozvoje
sociálních služeb Moravskoslezského kraje. Jeho výzkumná zpráva rozšířila
informační základnu pro tvůrce komunitních plánů v  ostatních
krajích České republiky. Bareš o  své evaluaci píše [2011: 26]: „Jejím
cílem je zachytit, jakým způsobem byly formulovány a  v  dokumentu
jsou prezentovány cíle, priority, opatření a aktivity, respektive v jakých
ohledech lze zvolený přístup k jejich formulaci a prezentaci považovat
za přínosný a jaké má zvolený přístup limity.“
3.2.2 Metody a techniky výzkumu použité v evaluaci.
Evaluační přístup
Konkrétní prvky postupu v  rámci dané evaluační strategie ukazuje
evaluační přístup. Chen [2005: 52] píše, že „evaluační přístup ustavuje
systematický soubor určitých procedur a  východisek k  usměrnění
navrhování a  vedení evaluace.“ Do procedur a  východisek spadají
také určité metody a techniky výzkumu sociálního světa. Výchozí bod
evaluačního výzkumu představují výzkumné otázky. Bareš [2011: 26]
formuluje několik výzkumných otázek: „Je z hlediska těchto aspektů
dokument navržen adekvátně a  je z  tohoto ohledu logicky strukturován?
Umožňuje relevantní dokumentace dostatečně ,zrekonstruovat‘
použitý postup pro stanovení priorit a  je zvolený postup
adekvátní?“
Z  uvedených výzkumných otázek vyplývá, že jednotku zkoumání
představovaly určité vlastnosti komunitního plánu: logická struktura
komunitního plánu, postup pro stanovení priorit v komunitním plánu
a adekvátnost postupu pro stanovení priorit v komunitním plánu. Empirická
data Bareš čerpal z dokumentu obsahujícího text s komunitním
plánem Moravskoslezského kraje. Přiměřeně povaze dat v  této jednotce
zjišťování (dokument s  komunitním plánem) Bareš přizpůsobil
techniku šetření empirických dat a techniku analýzy a interpretace dat.
Přesněji řečeno, použil obsahovou analýzu textu. Bareš se v obsahové
analýze zaměřil na nalezení znaků textu komunitního plánu, které definoval
pomocí Metodiky pro plánování sociálních služeb Ministerstva
práce a sociálních věcí České republiky [viz Skříčková 2007]. Přestože
Evaluační výzkum46
v obsahové analýze postupoval kvalitativně, nenacházelo se v ohnisku
jeho výzkumného zájmu hledání původních významů v textu, ale identifikace
předem vymezených znaků v  textu. Autoři označují takovou
variantu obsahové analýzy sice různými, ale významově totožnými výrazy.
Mayring [2000] píše o „aplikaci deduktivních významových kategorií“,
Hsieh a Shannon [2005] se zmiňují o „řízené obsahové analýze“.
Výstižněji a  podrobněji vysvětluje tuto variantu obsahové analýzy
textu Krippendorff [2013] a nazývá ji aplikací analytických konstruktů
v podobě standardů za účelem hodnocení textového obsahu. „Aplikace
standardů pro identifikaci, hodnocení nebo audit zahrnuje dva kroky:
(a) srovnání z textu odvozené proměnné s daným nebo předpokládaným
standardem pro tuto proměnnou a (b) posouzení, co z  tohoto
(srovnání, pozn. autora) plyne.“ [ibid.: 179]
Bareš hledal obsahovou analýzou textu komunitního plánu pomocí
aplikace standardů odpovědi na svoje výzkumné otázky. Výsledkem
Barešovy obsahové analýzy byly logické vývody (závěry) plynoucí
z  výsledku srovnání standardu s  textem plánu (viz obrázek 3.1).
Barešovu analýzu rámoval kontext politiky budování krajských sítí
sociálních služeb, metodicky usměrňovaný pracovníky Ministerstva
práce a  sociálních věcí České republiky. Metodické usměrňování ze
strany Ministerstva práce a  sociálních věcí České republiky a  rovněž
metodika plánování sociálních služeb vypracovaná na popud stejného
ministerstva se nesly v  nezávazném, doporučujícím duchu. Pracovní
týmy v  jednotlivých krajích tudíž disponovaly značnou volností při
vypracovávání krajských plánů sociálních služeb. Tato skutečnost
dominovala kontextu Barešovy obsahové analýzy textu komunitního
plánu Moravskoslezského kraje.
Metodika pro plánování sociálních služeb [Skříčková 2007] poskytla
Barešovi standardy plánu sociálních služeb, které dále rozpracoval do
empiricky použitelného kódovacího schématu, nebo, dle jeho vlastních
slov, do empiricky použitelného „kategorizačního klíče“. Podle tohoto
kategorizačního klíče Bareš vyhledával a třídil části textu plánu sociálních
služeb v Moravskoslezském kraji.
473 Evaluace programu ve stadiu plánování
Obrázek 3.1 Proces obsahové analýzy textu
Pramen: Krippendorff 2013: 83; vlastní překlad.
Krajský plán rozvoje sociální služeb vybíral Bareš záměrně. Plán vybraný
ze souboru všech krajských plánů musel splňovat následující
kritéria:
	 –	skončení platnosti plánu v roce 2012 a později;
	 –	začátek platnosti plánu v roce 2010 nebo v roce 2011;
	 –	přičemž plán nesměl být aktualizací předchozího plánu.
Těmto kritériím vyhověly tři komunitní plány. Následně Bareš vybral
z těchto tří plánů jeden pomocí následujících kritérií:
	 –	určité charakteristiky prvního krajského komunitního plánu;
	 –	návaznost na minulé dokumenty týkající se sociálních služeb
v kraji;
	 –	vývoj koncepce plánování rozvoje sociálních služeb v minulosti;
	 –	koncepce a strukturace aktuálního plánu s důrazem na priority.
Pomyslným sítem posledně zmíněných kritérií prošel Střednědobý plán
rozvoje sociálních služeb v Moravskoslezském kraji na roky 2010 až 2014.
Evaluační výzkum48
3.2.3 Postup a výsledky evaluace
Bareš si nejprve ujasnil význam slova „priorita“ [2011: 27], přičemž
konstatoval, že „v  plánu MS (Moravskoslezského, pozn. autora) kraje
je akcentováno především to, že se jedná o určitou tematickou oblast.“
Slovo „priorita“ používali autoři textu plánu Moravskoslezského kraje
tak, že nebrali v potaz důraz na pořadí, na přednost či prvenství cílů.
Bareš dospěl k závěru, že v plánu Moravskoslezského kraje má „priorita“
spíše význam geografický a věcný, označuje spíše určitou skupinu
témat. Z  tohoto důvodu reformuloval původní výraz „priority“ na
„prioritní oblasti“ a  dále původní výraz textu plánu Moravskoslezského
kraje „vlastní priority“ na „akcentované obsahy a  preferované
postupy“ [viz Bareš 2011: 29]. Další překážku pro obsahovou analýzu
textu plánu Moravskoslezského kraje představovalo nesystematické
používání výrazů „priorita“ a „vlastní priority“. Bareš na jejich identifikaci
a kategorizaci použil níže zmíněný kategorizační klíč.
Barešův kategorizační klíč obsahuje následující významové kategorie:
	1.	obsahové akcenty („co bude akcentováno“ – A), lze rozlišit dvě pod-
kategorie:
	 a.	vyjádřené konkrétně či přímo (KA)
	 b.	vyjádřené obecně či nepřímo (OA);
	2.	preferované postupy („jaké postupy jsou preferovány při dosahování
stanovených cílů a priorit“ – P), opět lze rozlišit dvě podkate-
gorie:
	 a.	obsah a rozsah (P-O)
	 b.	podmínky a okolnosti (P-P). [Bareš 2011: 30]
Přiřazení jednotlivých kategorií částem, „útržkům“, textu plánu Moravskoslezského
kraje umožnilo Barešovi systematickou obsahovou
analýzu textu. Ještě než k  ní Bareš přistoupil, tak si kvůli obsahové
různorodosti prioritních oblastí v  analyzovaném textu plánu vyjasnil
indikátory pro přímé obsahové akcenty a  nepřímé obsahové akcenty
(viz tabulka 3.1).
493 Evaluace programu ve stadiu plánování
Tabulka 3.1 Kritéria dělení obsahových akcentů na přímé a nepřímé
v jednotlivých prioritních oblastech
prioritní oblast /
obecná kategorie
konkrétnější specifikace /
přímé obsahové akcenty
obecnější rámec / nepřímé obsahové
akcenty
1. prioritní oblast
– procesy při
plánování
akcenty na určité konkrétní
aspekty v oblasti sociálních
služeb
akcenty obecnější povahy
2. prioritní oblast
– rozvoj služeb
parametry sociálních služeb
dle zákona o sociálních službách
(druh či forma poskytování),
deklarace potřebnosti obcí
jiná charakteristika prioritních typů
sociálních služeb (cílové skupiny,
„alternativní a navázané služby“
apod.)
3. prioritní oblast
– kvalita služeb
akcenty na určité konkrétní
aspekty, akcenty přímo se
týkající poskytování sociálních
služeb podle zákona o sociálních
službách
akcenty obecnější povahy, akcenty
týkající se širšího zaměření politiky
sociálních služeb („poskytovatelé
sociálních služeb nenahrazují
běžně dostupné veřejné služby“
apod.)
4. prioritní oblast
– financování
služeb
konkrétní požadované předpoklady,
jež musejí sociální služby
naplňovat, mají-li být financovány
z rozpočtu kraje
obecnější charakteristiky týkající
se širšího zaměření politiky sociálních
služeb („vyjednání veřejného
závazku ve smyslu vymezení služeb
jako služby veřejného zájmu
včetně nastavení spolufinancování“
apod.)
Pramen: Bareš 2011: 31
Bareš nejprve prošel text plánu Moravskoslezského kraje za účelem
rozpoznání pasáží podle kategorizačního klíče. Po rozpoznání shodnosti
významu textové pasáže s významem určité kategorie z kategorizačního
klíče Bareš tuto textovou pasáž označil kódem této kategorie.
Pomocí kódů pak Bareš systematicky třídil pasáže roztroušené na
různých místech textu plánu Moravskoslezského kraje podle určité významové
kategorie. Tento postup Bareš aplikoval na každou prioritní
oblast (Podpora procesu střednědobého plánování rozvoje sociálních
služeb v Moravskoslezském kraji; Podpora rozvoje potřebných sociálních
služeb; Podpora zvyšování kvality sociálních služeb; Podpora nastavení
funkčního a  transparentního systému financování potřebných
a kvalitních sociálních služeb). Že identifikace významových kategorií
pro každou prioritní oblast nutně vedla mimo textové oddíly explicitně
věnované určité prioritní oblasti, dokládá sám Bareš [2011: 43]:
Evaluační výzkum50
Všechny čtyři uvedené prioritní oblasti sice napovídají, které oblasti
budou v  rámci plánu MS kraje řešeny, žádná z  nich však nevypovídá
nic o  konkrétních ani obecnějších akcentech či preferencích.
Představu o  obsahových akcentech a  preferovaných postupech si
lze vytvořit až studiem obsahu jednotlivých podkapitol, v nichž jsou
tyto čtyři prioritní oblasti důkladněji rozebrány.
Výsledky nalezení významových ekvivalencí a  přiřazení významových
kategorií pro každou prioritní oblast Bareš prezentoval v přehledové
tabulce, kterou opatřil komentářem. Tabulka 3.2 ukazuje přehledovou
tabulku s  výsledkem kategorizace podle obsahových akcentů
a  preferovaných postupů pro první prioritní oblast Podpora procesu
střednědobého plánování rozvoje sociálních služeb v  Moravskoslezském
kraji.
Tabulka 3.2 Aplikace kategorizačního klíče v analýze textu první prioritní
oblasti
Číslo
obec.
princ.
obecný princip klasifikace
1 Procesy plánování rozvoje sociálních služeb probíhají v souladu
s Metodikami pro plánování sociálních služeb a Kritérii kvality
plánování sociálních služeb.
P-O/P-P
2 Zapojení obcí do procesu plánování je nezbytným předpokladem
pro efektivní plánování rozvoje sociálních služeb na úrovni celého
kraje.
P-P
3 Kraj deklaruje podporu obcím na území MS kraje, které plánují
rozvoj sociálních služeb.
P-P
4A Obec zjišťuje potřeby poskytování sociálních služeb osobám nebo
skupinám osob na svém území.
KA
4B Tyto informace společně s možnostmi jejich uspokojování sděluje
kraji.
P-P
5A Zadavatelé identifikují potřeby KA
5B a navzájem spolupracují při síťování sociálních služeb. P-P
6 Pro posílení komplexnosti procesu střednědobého plánování
rozvoje sociálních služeb na území kraje je žádoucí, aby obce
v procesu plánování sociálních služeb vzájemně spolupracovaly
a vytvářely tak vhodné prostředí pro síťování sociálních služeb.
Spolupráce obcí je dobrovolná.
P-P
513 Evaluace programu ve stadiu plánování
7 Struktura území, v němž probíhá proces plánování sociálních
služeb, odpovídá území vymezenému působností úřadu obce
s pověřeným obecním úřadem, nezvolí-li si obce jinou formu
plánování (např. území obce, svazku obcí, mikroregion).
P-O
8 Při realizaci procesu střednědobého plánování rozvoje sociálních
služeb na všech úrovních je nezbytné zaměřovat se na kvalitu
sociálních služeb.
OA
9 V rámci střednědobého plánování rozvoje sociálních služeb
na všech úrovních je nezbytné propojení potřebnosti, kvality
a financování sociálních služeb.
P-O
10 Pro posílení skladebnosti krajského plánu je vytvořena doporučená
struktura obecních střednědobých plánů.
P-O/P-P
11A Ve střednědobých plánech rozvoje sociálních služeb obcí je
žádoucí ukotvit stávající a nové sociální služby, příp. i na ně
navazující aktivity
KA
11B včetně zajištění udržitelného způsobu financování. P-P
Pramen: Bareš 2011: 45
Legenda: KA – akcenty na určité konkrétní aspekty v oblasti sociálních služeb; OA – akcenty
obecnější povahy; P-O – obsah a rozsah preferovaných postupů; P-P – podmínky a okolnosti
preferovaných postupů.
Přístup ke stanovení priorit v  plánu Moravskoslezského kraje nevyústil
ve stanovení pořadí důležitosti, píše Bareš, což dokládá významový
posun výrazu „priorita“ v textu plánu Moravskoslezského kraje
do významu, v němž se jakákoli priorita či pořadí ztratily. Pozitivním
přínosem Bareš shledává rozlišení čtyřech prioritních oblastí, přesněji
to, že se tyto oblasti tematicky nepřekrývají. Umístění prioritní oblasti
„Podpora procesu střednědobého plánování rozvoje sociálních služeb
v  Moravskoslezském kraji“ na první místo vyjmenovaných prioritních
oblastí se Barešovi jeví účelným, neboť je procedurálně svázána
s  ostatními prioritními oblastmi. Tato prioritní oblast totiž obsahuje
metodiky pro plánování v ostatních prioritních oblastech. Negativum
Bareš spatřoval v nepřehlednosti textu plánu Moravskoslezského kraje,
čemuž byl podle něj na vině nestrukturovaný „beletristický“ styl.
Bareš také hodnotil „zvolený přístup tematizace priorit, opatření
a  aktivit“ v  textu plánu. Kromě pojmové volnosti, volného nakládání
s termíny ukotvenými v oficiální (byť nezávazné) metodice [viz Skříčková
2007], zde našel negativum, a to nejasné vazby mezi prioritními
oblastmi na jedné straně a  opatřeními a  aktivitami na straně druhé.
Evaluační výzkum52
V  textu plánu není jasně zmíněn způsob stanovení opatření a  aktivit
vzhledem k  tematizovaným prioritním oblastem. Není objasněn postup,
metodika, jakou se dospělo k propojení prioritních oblastí s opatřeními.
Obecně řečeno, nepřítomnost popisu postupu Bareš shledává
nedostatkem plánu. Rovněž přístup k  formulaci prioritních oblastí
byl poněkud neprůhledný. Proto Bareš nemohl zcela rekonstruovat
postup stanovení priorit a rovněž nemohl řádně posoudit adekvátnost
postupu stanovení priorit. Sdělení obsažená v  textu plánu Moravskoslezského
kraje Barešovi dovolila posoudit adekvátnost postupu pouze
rámcově vzhledem k  celému procesu plánování sociálních služeb
v  Moravskoslezském kraji. Vzhledem k  příslušnosti hodnoceného
plánu do druhé fáze procesu plánování sociálních služeb v Moravskoslezském
kraji shledává Bareš postup stanovení priorit adekvátním.
Přesto Bareš navrhuje systemizaci a  strukturaci obsahových akcentů
a  preferovaných postupů pro zlepšení věcného propojení prioritních
oblastí s  opatřeními a  aktivitami. To pak podle něj následně umožní
sestavení pořadí obsahových akcentů a preferovaných postupů.
3.3 Druhá ukázka: Národní akční plány sociálního začleňování
vybraných států Evropské Unie
V druhé ukázce evaluace programu ve stadiu plánování hodnotí Miroslava
Rákoczyová vybrané národní akční plány sociálního začleňování
z období 2003 až 2005 (v případě národních akčních plánů sociálního
začleňování Dánska, Německa a  Velké Británie) a  z  období 2004 až
2006 (v  případě národních akčních plánů sociálního začleňování
České republiky a  Maďarska). Národní akční plány sociálního začleňování
vypracovávaly členské státy Evropské unie v tzv. Lisabonském
plánovacím období (2000 až 2010) pomocí otevřené metody koordinace.
Otevřená metoda koordinace byla vytvořena a  vyzkoušena
v  procesu sbližování politik zaměstnanosti jednotlivých členských
států Evropské unie. Pak byla v  plánovacím desetiletí 2000 až 2010
rozšířena na další politiky, které jsou v  kompetenci vlád členských
států Evropské unie, mimo jiné také na politiku sociálního začleňování.
„Otevřená metoda koordinace vytváří rámec pro spolupráci členských
států, jejichž národní politiky jsou takto směřovány k určitým společným
cílům.“ [Europa 2014]
533 Evaluace programu ve stadiu plánování
Konvergenční proces podporoval společné definování cílů politiky
sociálního začleňování a  společné stanovování způsobů měření cílů
politiky sociálního začleňování politickými zástupci jednotlivých
členských států v Radě Evropské unie. Národní akční plán sociálního
začleňování pak ukazoval, které ze společných cílů určitý členský stát
sleduje, jaké jsou výchozí a cílové kvantity těchto cílů, měřené společně
stanovenými způsoby měření, a  konečně, jakými prostředky (politikami)
chtějí politikové a  státní úředníci daného státu dosáhnout stanovených
cílů. Za dohledu Evropské komise jsou Národní akční plány
sociálního začleňování jednotlivých členských států Evropské unie
navzájem srovnávány jednak za účelem rozpoznání úrovně výkonu
jednotlivých členských států při sledování společných cílů, jednak za
účelem mezistátní výměny příkladů dobré praxe. Úředníci Komise
Evropské unie pak v  pravidelných dvouletých intervalech zhodnotí
proces srovnávání výkonů při sledování společných cílů a  výměnu
příkladů dobré praxe v dokumentu „Společná zpráva“ (Joint Report).
3.3.1 Cíl evaluace. Evaluační strategie
Rákoczyová vykonala evaluaci z pohledu experta stojícího mimo proces
hodnocení v rámci otevřené metody koordinace. Popud k evaluaci
národních akčních plánů sociálního začleňování tudíž nevzešel z  potřeb
subjektů zainteresovaných na tvorbě národních akčních plánů
sociálního začleňování, ale vzešel z  odborného zájmu expertky dlouhodobě
se zabývající sociální politikou v České republice a v Evropské
unii. Protože výsledky svého evaluačního výzkumu Rákoczyová publikovala
v odborném časopise, plnila její studie pomocnou informační
funkci pro tvůrce národního akčního plánu sociálního začleňování,
a to zejména v České republice. Podobně jako výše Bareš, Rákoczyová
při své evaluaci národních akčních plánů sociálního začleňování sledovala
evaluační strategii napomáhající rozvoji programu. Poznávací cíl
evaluace vybraných národních akčních plánů sociálního začleňování
vystihují následují věty: „Cílem předkládané studie je srovnání národních
akčních plánů sociálního začleňování České republiky a čtyř vybraných
členských států Evropské unie. Zaměřujeme se především na
opatření cílená na jednotlivé skupiny ohrožené sociálním vyloučením
a na stanovené cíle.“ [Mareš, Rákoczyová, Sirovátka 2006: 28]
Evaluační výzkum54
3.3.2 Metody a techniky výzkumu použité v evaluaci.
Evaluační přístup
Rákoczyová hledala odpověď na pomyslnou výzkumnou otázku (pomyslná
je proto, že Rákoczyová v textu své výzkumné zprávy explicitně
výzkumnou otázku neuvádí, je implicitní): jak jsou ve vybraných národních
akčních plánech sociálního začleňování vymezeny jednak skupiny
ohrožené sociálním vyloučením, jednak cíle a opatření sociálního
začlenění těchto skupin? Ze zaměření výzkumu vyplynuly následující
jednotky zkoumání: vymezení opatření cílená na jednotlivé skupiny
ohrožené sociálním vyloučením; vymezení cílů. Údaje potřebné k nalezení
odpovědi na výzkumnou otázku Rákoczyová vyhledala z jednotky
zjišťování, kterou představovaly dokumenty s texty národních akčních
plánů sociálního začleňování.
Dokumenty s národními akčními plány sociálního začleňování Rákoczyová
vybírala tak, aby zastupovaly co nejpestřejší podoby plánů
ke srovnání s  plánem České republiky. Základní soubor, ze kterého
Rákoczyová vybírala, představovaly národní akční plány sociálního
začleňování států Evropské unie za roky 2003 až 2005 a za roky 2004 až
2006 pro státy, jež vstoupily do Evropské unie v roce 2004. Zmíněnou
pestrost Rákoczyová nejprve zajistila pomocí výběrového kritéria „typ
sociálního státu podle Esping-Andersena“. Podle tohoto kritéria Rákoczyová
vybrala národní akční plán sociálního začleňování Velké Británie
(typ liberálního sociálního státu), plán Dánska (typ sociálně-demokratického
sociálního státu) a konečně plán Německa (typ korporativního
sociálního státu). Poslední národní akční plán sociálního začleňování
Rákoczyová vybrala pomocí dalšího výběrového kritéria: „postkomunistická
země ze střední Evropy s podobnými demografickými a ekonomickými
ukazateli“. Druhému výběrovému kritériu nejvíce vyhovoval
plán Maďarska. Výběrový soubor pak tvořily národní akční plány
Velké Británie, Dánska a  Německa na roky 2003 až 2005 a  národní
akční plány Maďarska a České republiky na roky 2004 až 2006.
Ačkoli se na první pohled může zdát, například podle názvu kapitoly
s  textem evaluační zprávy Miroslavy Rákoczyové a  tvrzením
v  úvodním oddíle, že jde o  mezinárodní komparaci, ve skutečnosti
Rákoczyová použila interpretační poznávací metodu. Vedle obsahové
analýzy textů národních akčních plánů sociálního začleňování představovala
komparace jednu z použitých technik. Mezinárodní kompa-
553 Evaluace programu ve stadiu plánování
race zde byla použita ne jako metoda, ale jako technika. Komparační
metoda je jistou obměnou experimentální metody. Komparační metodou
se v praxi zkoumání sociálního světa rozumí zkoumání několika
málo případů. Tyto případy badatele zajímají kvůli jejich okolnostem
(kontextu), přesněji kvůli historicky specifickým okolnostem. Případy
jsou většinou geograficky a  historicky vymezené konfigurace událostí
a struktur [viz Ragin 2004]. Výzkumník je studuje za účelem „porozumění
nebo interpretace specifických historických jevů v malém počtu
případů“ [Ragin 1987: 17]
Komparační technika spočívá ve srovnávání podle kritéria za účelem
stanovení odlišností a  podobností (např. srovnání naměřených hodnot,
„větší než“, „menší než“). Jestliže v komparační metodě je určení
podobností a  odlišností prostředkem, pak v  komparační technice je
určení podobností a odlišností cílem [viz Říchová 1997]. Rákozcyová
srovnala text národního akčního plánu sociálního začleňování České
republiky s  texty vybraných národních akčních plánů sociálního začleňování
za účelem identifikace jejich odlišností a podobností. Rákoczyová
tedy použila komparační techniku.
To, co podle Krippendorffa [2013: 93] badatel v  takovém případě
srovnává, „nejsou rozdíly nebo shody mezi vlastnostmi textu, ale rozdíly
mezi závěry vyvozenými z různých textů, které jsou funkcí přímo
nepozorovaného předpokládaného kontextu.“ Jak ukazuje obrázek 3.2,
analytik nejprve aplikuje v  obsahové analýze stejné standardy na
všechny texty. Výsledkem je tolik odpovědí na určitou výzkumnou
otázku, kolik je obsahově analyzovaných textů. Pak se srovnávají jednotlivé
odpovědi komparační technikou. Rákoczyová nejprve analyzovala
texty jednotlivých vybraných národních plánů sociálního začleňování
aplikací standardu v  podobě Evropskou komisí určených druhů
cílů a  následovně aplikací standardů „vymezení skupin ohrožených
sociálním vyloučením“ a  „popis opatření na sociální začlenění vymezených
skupin ohrožených sociálním vyloučením“, přičemž Rákoczyová
analyzovala obsah textů jednotlivých národních akčních plánů
sociálního začleňování v kontextu Lisabonské strategie Evropské unie
a  otevřené metody koordinace. Poté Rákoczyová navzájem srovnala
výsledky obsahových analýz textů jednotlivých národních plánů sociálního
začleňování. Tímto srovnáním Rákozcyová identifikovala odlišnosti
a podobnosti mezi národními plány sociálního začleňování.
Evaluační výzkum56
Obrázek 3.2 Komparace podobných jevů vyvozených z různých textů
Pramen: Krippendorff 2013: 94, vlastní překlad.
3.3.3 Postup a výsledky evaluace
Určení skupin osob ohrožených sociálním vyloučením se ve vybraných
plánech shodlo na příslušnících etnických menšin, přistěhovalcích,
zdravotně postižených, bezdomovcích a dlouhodobě nezaměstnaných.
Tato shoda mohla podle Rákoczyové ukazovat pomyslné společné
„jádro“ sociálně vyloučených na území Evropské unie [viz Mareš, Rákoczyová,
Sirovátka 2006: 52]. K  přehlednému zobrazení podobností
a odlišností ve vymezeních skupin ohrožených sociálním vyloučením
v  jednotlivých národních akčních plánech zaměstnanosti Rákoczyová
použila tabulku (viz tabulka 3.3). Podobnosti a odlišnosti ve vymezení
skupin ohrožených sociálním vyloučením ukazují symboly v  řádcích.
Symbol „X“ označuje, že v národním akčním plánu sociálního začleňování
byla daná skupina shledána ohroženou sociálním vyloučením.
Symbol „(X)“ označuje, že v dané skupině se sociální ohrožení vztahuje
pouze na její část (podskupinu). Prázdná buňka v tabulce označuje, že
v národním akčním plánu nebyla daná skupina zařazena do kategorie
skupin ohrožených sociálním vyloučením.
573 Evaluace programu ve stadiu plánování
Tabulka 3.3 Skupiny ohrožené sociálním vyloučením vymezené
v národních plánech
Maďarsko Velká
Británie
Německo Dánsko Česká
republika
Romové/etnické minority X X X X
Zdravotně postižení X X X X X
Drogově závislí a alkoholici X X X X X (jen mladí drogově
závislí)
Psychicky nemocní a mentálně
postižení
X (X) (X) X X
Bezdomovci X X X X X
Přistěhovalci a uprchlíci X X X X X
Nadměrně zadlužené
domácnosti
X X X (X) jen ve vztahu
k určitým ohroženým
skupinám, např.
Romům nebo bezdo-
movcům
Početné domácnosti X X X (X) ohrožení chu-
dobou
Jobless domácnosti X X
Dlouhodobě nezaměstnaní X X X X
Nízkokvalifikovaní a nekva-
lifikovaní
X (X) X (X)
Oběti domácího násilí X X X X (X)
Senioři X X X X
Děti X X X X X
Osoby propuštěné z výkonu
trestu
X X
Kočovníci X
Těhotné dospívající dívky X
Domácnosti samoživitelů X X X (X) jen ohrožení
chudobou
Jednočlenné domácnosti X (X) jen osamělé
důchodkyně
Prostitutky X
Osoby opouštějící ústavní
výchovu
X
Pramen: Mareš, Rákoczyová, Sirovátka 2006: 35
Evaluační výzkum58
Hlavní odlišnost spočívala podle Rákoczyové v  pojetí fenoménu
sociální exkluze. V  této odlišnosti se zračily různé národní okolnosti
(kontexty). Tvůrci národního akčního plánu sociálního začleňování
Velké Británie uchopili fenomén sociálního vyloučení skrze chudobu.
To se pak promítlo do povahy jednotlivých opatření a jejich struktury.
V britském národním akčním plánu sociálního začleňování jsou zdůrazněny
ekonomické pobídky k  námezdní práci. Oproti tomu tvůrci
dánského národního akčního plánu sociálního začleňování akcentovali
neekonomické dimenze sociálního vyloučení. Z  tohoto důvodu
se podle Rákoczyové vztahovala opatření v dánském národním plánu
sociálního začleňování na specifické potřeby jednotlivých ohrožených
skupin, přičemž prvotním cílem těchto opatření nebylo začlenění do
trhu práce. Ve vymezení skupin ohrožených sociálním vyloučením
a  ve vymezení opatření k  jejich sociálnímu začlenění v  českém národním
plánu sociálního začleňování se zračí nerozvinutost politiky
sociálního začleňování a  jejího plánování, konstatovala Rákoczyová.
Tak například autoři českého národního plánu sociálního začleňování
většinou popisují výchozí stav sociálního vyloučení pro jednotlivé skupiny
a opatření pro sociální začlenění navrhují jen pro některé skupiny
ohrožené sociálním vyloučením.
Kategorizaci cílů politik sociálního začleňování ve vybraných národních
akčních plánech sociálního začleňování Rákoczyová přebírá
ze zprávy Evropské komise o  stavu sbližování politik sociálního začleňování
v  jednotlivých členských státech Evropské unie (tzv. „joint
report“). Cíle spadají do následujících kategorií:
	„(a)	přímé cíle, které se vztahují přímo k celkovému výsledku politiky
sociální inkluze, tedy k redukci chudoby a sociálního vyloučení
	 (b)	nepřímé cíle, jejichž dosažení může přispět k  redukci chudoby
a sociálního vyloučení
	 (c)	vstupní cíle, které mají charakter zvýšení policy effort.“ [Mareš,
Rákoczyová, Sirovátka 2006: 29]
Pouze dva z hodnocených národních akčních plánů sociálního začleňování
uváděly všechny kategorie cílů, a to plán britský a plán maďarský.
V českém národním plánu sociálního začleňování Rákoczyová
nalezla jenom nepřímé a  vstupní cíle. Český plán patřil také k  těm
plánům, v  nichž se nenacházely kvantifikované cíle. „Jediný kvan-
593 Evaluace programu ve stadiu plánování
tifikovaný cíl je převzat z  Národního akčního plánu zaměstnanosti
a má charakter vstupního cíle (jedná se o cíl zvýšit podíl dlouhodobě
nezaměstnaných zařazených do některého programu APZ na 20 % do
roku 2006).“ [Mareš, Rákoczyová, Sirovátka 2006: 29] Tato skutečnost
vedla Rákoczyovou k závěru, že kvalitativní, deklaratorní povaha cílů
v českém národním akčním plánu sociálního začleňování nevytvářela
potřebné podmínky pro uplatnění řízení podle cílů v  české politice
sociálního začleňování.
3.4 Závěr
Bareš a  Rákoczyová evaluovali plány programů v  situaci, kdy nebyli
přímými účastníky tvorby plánu a  nevykonali evaluaci na podnět
subjektů zainteresovaných na plánovaném programu. Bareš a  Rákoczyová
evaluovali plány programů na základě vlastních badatelských
potřeb a  z  pozic odborníků na danou problematiku, stojících mimo
sestavování hodnocených plánů. Protože jedinými jednotkami zjišťování
(zdroji dat) byly texty plánů programů, příhodně se nabízela
technika obsahové analýzy textů. Bareš a Rákoczyová hodnotili plány
programů pomocí varianty obsahové analýzy textu, která spočívala
v aplikaci jimi stanovených expertních standardů. Z obsahové analýzy
textů plánů vzešly aplikací expertních standardů poznatky, které Barešovi
a  Rákoczyové dovolily vyslovit doporučení k  dalšímu rozvoji
plánů programů na vyšší kvalitativní úroveň. Co je však důležité,
svoje evaluační výstupy v podobě zmíněných doporučení formulovali
s  ohledem na okolnosti, ve kterých byl evaluovaný plán používán.
Bareš sepsal svá doporučení na vylepšení Střednědobého plánu rozvoje
sociálních služeb v Moravskoslezském kraji na léta 2010–2014 s ohledem
na okolnosti dlouhodobě založeného procesu plánování sociálních
služeb v Moravskoslezském kraji. Rákoczyová zase ve svých postřezích
pro tvorbu národního akčního plánu sociálního začleňování České
republiky brala v potaz jak historické dědictví institucionálního rámce
politik sociálního začleňování v  České republice, tak podmínky otevřené
metody koordinace politik sociálního začleňování jednotlivých
států v rámci Evropské unie.
Pokud by byla evaluační situace jiná než výše uvedené evaluační
situace Bareše a  Rákoczyové, pak by evaluátor mohl aplikovat jiné
Evaluační výzkum60
metody a techniky výzkumu sociálního světa, a to metody a techniky
příhodnější dané evaluační situaci. Čistě hypotetický příklad: evaluátor
je přizván subjekty zainteresovanými na určitém programu k práci
na plánu tohoto programu. Evaluátor se osobně účastní pracovních
schůzek k plánu programu se subjekty zainteresovanými na programu.
Podobu evaluační strategie utvářejí kromě evaluátorových potřeb také
potřeby subjektů zainteresovaných na programu. Evaluátor může
v této situaci při evaluaci plánu programu aplikovat nejen obsahovou
analýzu textu plánu programu, ale také nějakou techniku individuálního
rozhovoru, skupinového rozhovoru či techniku zúčastněného,
nestrukturovaného pozorování. Nelze tudíž zjednodušeně spojit evaluaci
programu ve stadiu plánování s určitou metodou nebo technikou
výzkumu a  stanovit všeobecně platné, na evaluační situaci nezávislé
pravidlo jejich aplikace v  evaluačním výzkumu, například pravidlo,
že evaluace programu ve stadiu plánování se vykonává pomocí obsahové
analýzy textu. Takové „univerzální“ pravidlo by vedlo evaluátora
k  aplikaci metod a  technik výzkumu neadekvátních evaluační situaci
a  v  konečném důsledku k  povrchní a  neprofesionální evaluaci pro-
gramu.
Literatura
Bareš, P. 2011. Cíle, priority a opatření v plánu rozvoje sociálních služeb
Moravskoslezského kraje. VÚPSV: Praha.
Chen, H. 2005. Practical Program Evaluation: Assessing and Improving Planning,
Implementation, and Effectiveness. Thousand Oaks, Calif.: Sage.
Europa. 2014. EUROPA. Summaries of EU Legislation. Glossary. http://europa.eu/
legislation_summaries/glossary/open_method_coordination_en.htm. Citováno
18. 2. 2014.
Hsieh, H., S. E. Shannon. 2005. „Three Approaches to Qualitative Content
Analysis.“ Qualitative Health Research. Volume 15, No. 9, pp. 1277–1288.
Krippendorff, K. 2013. Content Analysis: an Introduction to Its Methodology. Los
Angeles: SAGE.
Mareš, P., M. Rákoczyová, T. Sirovátka. 2006. Sociální vyloučení a sociální
začleňování v České republice jako veřejně politická agenda. CESES FSV UK:
Praha.
Mayring, P. 2000. „Qualitative Content Analysis.“ Forum: Qualitative Social
Research. Volume 1, No. 2, Article 20.
Ragin, C. C. 2004. Comparative Method. In Lewis-Beck, M., A. Bryman, T. Liao.
(eds.) The Sage Encyclopedia of Social Science Research Methods. Thousand
Oaks: Sage Publications, pp. 148–151.
613 Evaluace programu ve stadiu plánování
Ragin, C. C. 1987. The Comparative Method: Moving beyond Qualitative and
Quantitative Strategies. Berkeley: University of California Press.
Říchová, B. 1997. „Komparativní metoda v politologii.“ Politická revue. Číslo 2,
s. 3–34.
Skříčková, Z. (ed.) 2007. Metodiky pro plánování sociálních služeb. MPSV ČR:
Praha.
634 Procesní evaluace
19
Tato kapitola se zabývá hodnocením procesů existujících mimo program pouze
ve vztahu k tomuto programu. Jinými (zde nezahrnutými) formami procesní evaluace
jsou např. hodnocení implementace opatření na národní úrovni či hodnocení fungování
spolupráce aktérů na lokální či národní úrovni (viz např. [Winkler, Klimplová,
Žižlavský 2005]). Dále zde zpravidla nejsou zahrnuty postupy, které hodnotí finanční
přínosy jednotlivých opatření (hodnocení efektivity) a  makroekonomické výsledky
programů.
4 PROCESNÍ EVALUACE
Ondřej Hora
Motto: „Mnoho kroků je potřeba k tomu, aby se z konceptu stal plně
fungující program, a je třeba mnoho úsilí, aby byl zachován původní
záměr a design programu.“ [Rossi et al. 1999: 192]
4.1 Definice procesní evaluace
Při hodnocení jednotlivých sociálních programů se zpravidla zajímáme
o  výsledky, případně efekty těchto programů (tzv. evaluace
vlivu – viz následující kapitola této knihy). Cílem tohoto typu evaluace
je tedy především zhodnotit, nakolik program naplnil své programové
cíle, respektive jakého dosáhl efektu. V  praxi se ale často setkáváme
s  tím, že program nebyl realizován podle očekávání. K  získání informací
o průběhu programu využíváme procesní evaluaci.19
Procesní evaluace (též může být označena jako evaluace implementace)
se využívá v celé řadě oborů lidské činnosti: při hodnocení programů
aktivní politiky zaměstnanosti, vzdělávací politiky, programů
zdravotní péče, programů řešení zadlužení, soudnictví, programů pro
propuštěné z výkonu trestu a dalších opatření. Procesní evaluace není
definována jednotně, ale je souborem různých pojetí, přístupů a  po-
stupů.
Cílem procesní evaluace je často řešit problém tzv. „black box“
neboli problém černé skříňky [viz Rossi et al. 1999]. Tato pomyslná
černá skříňka obsahuje všechny aktivity, které se udály během
realizace programu a  které v  evaluaci vlivu často nejsou sledovány.
Evaluační výzkum64
Chen [2005] k  tomu uvádí, že procesní evaluace poskytuje klíčové
kontextuální informace o implementaci, bez nichž je obtížné interpretovat
vztah mezi programem a jeho výsledkem. Ke zlepšení fungování
programu dochází skrze změny provedené na základě porozumění
tomu, jak program reálně funguje [WHO 2000]. Jedním ze základních
cílů procesních evaluací je též identifikovat silné a slabé stránky (nedostatky)
programu [Gelmon, Foucek, Waterbury 2005].
Podle Pattona [1997] je pro procesní evaluaci důležité, abychom
určili a změřili přesně to, od čeho je v konkrétním programu očekáván
efekt. Procesní evaluace často vychází ze srovnání konkrétního procesu
implementace s  programovou teorií [Chen 2005]. To znamená,
že výzkumník by měl znát programovou teorii, která popisuje, jakým
způsobem v programu dosáhnout výsledku.
Někteří autoři ovšem upozorňují, že ne vždy může být programová
teorie při implementaci dodržena (zvláště pak u  velkých programů),
neboť program je třeba přizpůsobit místním podmínkám a vývoji situace
(viz např. [Chen 2005]). „Běžnější je určitý stupeň inkrementální
implementace, ve které se program rozvíjí postupně a  přizpůsobivě
v závislosti na nově se rozvíjejících situacích a předchozích zkušenostech.“
[Patton 1997: 201]
Tento fakt někdy vyžaduje, aby se procesní evaluace přizpůsobila
měnícím se podmínkám v  programu [Frechtling et al. 2010]. Chen
[2005] uvádí, že míra změny v  programu by měla být v  souladu se
„zralostí“ tohoto programu (změny lze spíše očekávat ve fázi zavádění
programu).
4.1.1 Aplikační význam procesní evaluace
Praktický (aplikační) význam procesní evaluace je podle jednotlivých
autorů možné spatřovat například v následujících aplikacích:
	 •	v  ověření, zda byl program poskytnut cílové populaci [Rossi et al.
1999];
	 •	v ověření, že program skutečně proběhl [Patton 1997] a peníze byly
vhodně využity [WHO 2000];
	 •	v ověření stálé kvality programu [Hughes, Black, Kennedy 2008];
	 •	v ověření efektivního výkonu programu [Rossi et al. 1999];
	 •	v ověření, zda program proběhl podle plánu [Rossi et al. 1999];
654 Procesní evaluace
	 •	ve zjištění vztahu mezi provedením konkrétní části programu a výsledkem
[Saunders, Evans, Joshi 2005];
	 •	ve zjištění, proč program nedosáhl očekávaných výsledků;
	 •	v získání podkladů pro řešení problémů identifikovaných před evaluací
[Chen 2005];
	 •	v  možnosti provádět dílčí změny vedoucí ke zlepšení programu
[Gelmon, Foucek, Waterbury 2005], [Frechtling et al. 2010] či při
potřebě rozhodovat o  zachování, rozšíření či zrušení konkrétních
programů [Rossi et al. 1999];
	 •	v ověření funkčnosti, pokud se jedná o zkoušení nového typu programu
(tvorbu tzv. pilotních programů) či o  přenos osvědčeného
programu do nových podmínek [WHO 2000, Rossi et al. 1999];
	 •	v možnosti zlepšit úsudek o udržitelnosti programu;
	 •	v možnosti posílit legitimitu hodnocených programů [Winkler 2005].
4.2 Základní přístupy k problému procesní evaluace
Dva základní přístupy k  procesní evaluaci v  sobě zahrnují její dva
typické cíle:
	 a)	posoudit kvalitu implementace programu (Jak dobře je program
implementován?)
	 b)	zjistit faktory, které ovlivňují implementaci programu (Jaké determinanty
[faktory] ovlivnily průběh a výsledek programu?)
Těmito otázkami se budeme nyní zabývat.
4.2.1 Posouzení kvality implementace programu
U  tohoto přístupu jsou jednotlivé části programu hodnoceny na základě
evaluačních kritérií, stanovených programovou teorií, evaluátorem
nebo na základě vnějších standardů [Rossi et al. 1999]. Frechtling
et al. [2010] rozlišují: a) implementační evaluaci, která se zabývá tím,
zda projekt probíhá tak, jak bylo plánováno a b) evaluaci postupu, která
sleduje, nakolik se program přibližuje k dosažení programových cílů.
Kritéria pro posouzení dosažení uspokojivé úrovně jednotlivých
částí programu jsou stanovena buď ještě před zahájením programu,
Evaluační výzkum66
20
Pro příklad hodnotitelem předem stanovených kritérií hodnocení viz Horák
[2009].
nebo jsou formulována dodatečně.20
Pokud jsou pro evaluaci stanoveny
teoretické předpoklady, měly by být velmi dobře definovány, aby
bylo možné je ověřit. Dosažený výkon (performance) v  jednotlivých
částech programu či adekvátnost aktivit může být posuzována například
z hledisek uvedených v tabulce 4.1.
Tabulka 4.1 Hlediska dosaženého výkonu a adekvátnosti aktivit
hledisko alternativní definice
A dostupnost služeb míra pokrytí [Chen 2005]
B kvalita aktivit a služeb síla intervence během jednoho sezení
[Chen 2005]
C kvantita aktivit a služeb intenzita intervence [Chen 2005]
D dodržení požadovaného standardu
výstupů
E dodržení příslušných legislativních
a metodických požadavků a standardů
implementace [Horák 2009]
přesnost doručení služeb [Chen 2005]
F cena
4.2.1 Zjištění příčin dosaženého výsledku programu
Evaluace může pomoci administrátorům a  tvůrcům identifikovat bariéry
úspěšné implementace a  doručení programu, která mohou být
vnímána jako oblasti pro zlepšení [Gelmon, Foucek, Waterbury 2005].
Přínos tohoto typu evaluace spočívá především v tom, že pomáhá odkrýt
běžně neznámé příčiny implementačních selhání (např. konkrétní
postoje a motivaci účastníků programu – viz např. [Horáková 2010]).
Zároveň je možné identifikovat ty prvky programu, které nejvíce přispívají
k výsledkům vzdělávacích programů [Horáková 2010]. Z toho
vyplývá, že součástí některých procesních evaluací je sběr informací
o výsledcích programu [Rossi et al. 1999].
Jedním z  typických problémů, které bývají odhaleny v  rámci procesní
evaluace, jsou špatné plány a chybné předpoklady (viz [Rossi et
674 Procesní evaluace
21
Pro návod k  hodnocení cílů programu viz např. [Gelmon, Foucek a  Waterbury
2005].
al. 1999]). Ty mohou být součástí programové teorie nebo implementace
konkrétního programu.
Faktory, které ovlivňují průběh a výsledek programu, mohou působit
jak uvnitř (nedostatek kvalifikovaných lektorů), tak vně programu
(situace na trhu práce). Pokud se program nepodařilo realizovat způsobem,
jak bylo plánováno z důvodů uvnitř programu, hovoříme o implementačních
selháních či o  implementačních deficitech (viz [Rossi
et al. 1999]). Příklady determinujících faktorů a  implementačních
deficitů uvádíme v tabulce 4.2.
Tabulka 4.2 Determinanty a implementační deficity
Determinanty Implementační deficity
vnější situace (např. ekonomická; vnější
politické vlivy)
nejasná programová teorie, příliš obecné či
nerealizovatelné cíle programu21
profil účastníků programu nerealizace aktivit (intervence neproběhla)
předchozí zkušenosti účastníků a realizátorů
programu
intervence nebyla dostatečná
motivace (potenciálních) účastníků
programu k účasti na programových
aktivitách
intervence nebyla dobře zvolena
homogenita/heterogenita účastníků
programu
nevhodné načasování aktivit
skupinová dynamika zpoždění aktivit
chybějící materiální podmínky pro realizaci
programu
nespolupráce aktérů
nedostatečná zralost programu problémy se zvládnutím aktivit
nedokončení aktivit
intervence se bez odůvodnění
u jednotlivých účastníků nekontrolovaně
velmi lišila
Pramen: Konceptualizace autora, zdroje některých informací: Rossi et al. 1999, Chen 2005,
Frechtling et al. 2010.
Evaluační výzkum68
4.3 Průběh a klíčové kroky procesní evaluace
Programová evaluace sleduje základní lineární model výzkumu, a  to:
záměry programu, cíle programu, klíčové koncepty, klíčové indikátory,
metody a  zdroje dat [Gelmon, Foucek, Waterbury 2005]. Autor evaluace
by měl mít k  dispozici programovou teorii. Pokud programová
teorie neexistuje v  písemné podobě, je vhodné ji vytvořit na základě
setkání s klíčovými stakeholders programu [viz Chen 2005].
Rossi et al. [1999] a Frechtling et al. [2010] doporučují pro hodnocení
vymezit zvlášť jednotlivé části programu (někdy nazývané komponenty).
Pokud jsou realizátory stanoveny dílčí cíle pro jednotlivé
části programu, je možné hodnotit dosažení těchto dílčích cílů [Hora,
Suchanec 2012]. Jednotlivé kroky evaluačního postupu by měly být
vzájemně provázány tak, aby bylo možné zkontrolovat jejich logickou
návaznost (např. za pomoci evaluační matice – viz [Gelmon, Foucek,
Waterbury 2005] a/nebo tzv. logického modelu – viz níže).
4.3.1 Stanovení dílčích výzkumných otázek
Základním krokem procesní evaluace je stanovení dílčích výzkumných
otázek. Následující otázky byly získány z  různých metodik
procesní evaluace či realizovaných evaluačních studií anebo byly odvozeny
z  provedených výsledků těchto studií. V  některých případech
byly otázky pro potřeby tohoto textu mírně upraveny při současném
zachování jejich základního významu.
V  případě evaluace konkrétního programu jsou formulovány specifičtější
otázky, které reagují na konkrétní podmínky programu [Rossi
et al. 1999] – viz také příklad na konci této kapitoly. Frechtling et al.
[2010] uvádějí, že evaluační otázky by měly být formulovány ve spolupráci
se subjekty zainteresovanými na programu a  publikem, které
bude danou evaluaci využívat.
694 Procesní evaluace
Tabulka 4.3 Typické dílčí výzkumné otázky
Předpro-
gramová/
předevaluační
fáze
Jaké jsou záměry zadavatelů evaluace [Chen 2005]?
Je k dispozici programová teorie [Chen 2005]?
Nakolik přinese evaluace či její část informace, které nejsou nyní dostupné
[Frechtling et al. 2010]?
Kdo a jak může využít získané informace [Frechtling et al. 2010]?
Vstup a přístup
do
programu
Kdo je cílovou skupinou programu [Patton 1997]?
Jak se účastníci dostali do programu [WHO 2000]?
Jakým způsobem jsou lidé do programu vybíráni [Horáková 2010]?
Byly zvoleny vhodné strategie výběru [Frechtling et al. 2010]?
Jaký je (byl) stav účastníků ve věci, kvůli které by měli být podle programové
teorie zapojeni do programu [WHO 2000, Chen 2005]?
Na základě čeho se účastníci dostali do programu [WHO 2000]?
Jak dostupný byl program pro osoby z cílové populace [Rossi et al. 1999]?
Byla naplněna kapacita programu [Rossi et al. 1999]?
Kolik zájemců (a jakých) se do programu nedostalo [Rossi et al. 1999]?
Jaké jsou demografické charakteristiky účastníků programu [WHO 2000],
kdo jsou účastníci programu [Chen 2005]?
Byli do programu zapojeni ti, kdo do něj měli být podle programové teorie
zapojeni [WHO 2000]?
Je účast v programu dobrovolná [Rossi et al. 1999]?
Aktivity Odpovídají stanovené cíle a aktivity programu problémům
a specifikům cílové populace [Horáková 2010]?
Z jakých části se program skládá [Patton 1997]?
Jaké aktivity byly v programu realizovány [Grinnell 2001]?
V jakém rozsahu byl program realizován [Rossi et al. 1999]?
Má program všechny požadované části [Patton 1997]?
Které aktivity jsou klíčové pro fungování programu [Chen 2005]?
Jak dlouho program trval? Kolik hodin intervence [WHO 2000]?
Jsou aktivity účastníkům poskytovány univerzálně nebo individuálně
[Horák 2009]?
Je program navázán na další opatření [Horáková 2010]?
Kdo program nedokončil a proč [WHO 2000, Rossi et al. 1999]?
Jaké jsou klíčové podpůrné funkce programu [Rossi et al. 1999]?
Jsou jednotlivé prostředky a zdroje programu dostatečné [Rossi et al. 1999]?
Jak je program monitorován [Grinnell 2001]?
Evaluační výzkum70
22
Viz indikátory a dimenze spolupráce [WHO 2000: 18–19].
Realizátoři,
aktéři
Kdo realizoval jednotlivé aktivity [Hora a Suchanec 2012]?
Mají pracovníci dostatečnou kvalifikaci [Patton 1997], [Rossi et al. 1999],
[Grinnell 2001]?
Je pracovníků dostatečný počet [Rossi et al. 1999]?
Jaký vztah je mezi počtem pracovníků a počtem klientů [Patton 1997]?
Jaká je pracovní zátěž realizátorů programu [Rossi et al. 1999]?
Kdo je zapojen do tvorby programu [Patton 1997]?
Jak se jednotliví aktéři zapojili do programu? (Jak obtížné bylo zapojit
jednotlivé aktéry do programu?)
Jak probíhala spolupráce aktérů [WHO 2000]?22
Jaké je řízení programu [Horák 2009]?
Jaká je koordinace aktérů v programu [Rossi et al. 1999]?
Procesy/
výsledky
Probíhaly jednotlivé aktivity v souladu s programovou teorií
[Colman et al. 2007]?
Jaký je rozdíl mezi programovou teorií a realitou [Grinnell 2001]?
Fungují požadované části dle očekávání [Patton 1997]?
Přibližují se účastníci v jednotlivých fázích programu k naplnění cílů programu
[Frechtling et al. 2010]?
Naplňuje služba požadovaný/očekávaný standard [WHO 2000], jaká je kvalita
poskytovaných služeb [Chen 2005]?
Je rozsah programu (počet účastníků) dostatečný [Chen 2005]?
Proč program dosáhl či nedosáhl požadovaných výsledků?
Co (které části, případně které okolnosti) a jak v programu přispělo k dosažení
programových výsledků [Chen 2005]?
Jaké byly neočekávané (nezáměrné, vedlejší) výsledky programu [Chen 2005]?
Jaké možnosti ke zlepšení identifikují účastníci programu [Egbert 2006]?
4.4 Proces evaluace programu
Postup monitorování programu by měl být raději naplánován a zajištěn
ještě před zahájením programu [Chen 2005], [Frechtling et al. 2010].
Plánování procesní evaluace zahrnuje následující otázky [WHO 2000],
[Saunders, Evans, Joshi 2005], [Gelmon, Foucek, Waterbury 2005]:
714 Procesní evaluace
23
Gelmon, Foucek, Waterbury [2005] uvádějí následující příklady: manažer programu,
ředitel organizace, realizátoři programu, hodnotitelé, účastníci programu, externí stake-
holdeři.
24
V procesní evaluaci můžeme rozlišit dva základní přístupy: sebehodnocení (typické
pro manažerské monitorování výkonu a  evaluaci formou akčního výzkumu – [Rossi
et al. 1999] v některých případech doporučují nezávislé ověření) a nezávislou evaluaci
(bývá upřednostňována právě z  důvodu větší důvěryhodnosti výsledků [Frechtling et
al. 2010]). S evaluací jsou spojena některá související rizika: a) realizátoři programu se
mohou cítit procesní evaluací ohroženi, b) data, která evaluátor získává nepřímo, mohou
být spojena s obdobnými problémy jako při sekundární analýze dat, c) zadavatelé
či realizátoři programu mohou mít tendenci bránit zveřejnění výsledků evaluace, pokud
nejsou výsledky příznivé, e) jak role člena, tak role cizince může limitovat přístup k datům
(viz [Shaw 1999]), f) chod programu může být uzpůsobován, aby byly naplněny
konkrétní indikátory (viz [Rossi et al. 1999]).
	 •	Co má být evaluováno?
	 •	Kdo má být do evaluace zapojen?23
	 •	Vlastnosti čeho či koho mají být zjišťovány [Rossi et al. 1999]?
	 •	Jaké jsou zdroje dat?
	 •	Bude docházet k  výběru výzkumného vzorku a  jakým způsobem
[Frechtling et al. 2010]?
	 •	Kdy a kde mají být sbírána data?
	 •	Jaké evaluační metody a nástroje potřebujeme ke sběru dat?
	 •	Jak bude probíhat sběr dat?
	 •	Jak budou data uchovávána?
	 •	Jak budou data analyzována?
	 •	Jak budou data využita?
	 •	Jak jsou na sebe jednotlivé části evaluace časově navázány?
	 •	Kdo je zodpovědný za jednotlivé úkoly spojené s  evaluací? Při
evaluaci by měla být zvážena obtížnost jednotlivých výzkumných
postupů a  též nakolik jsou odpovědné osoby a  pověřené osoby
informované a  kompetentní k  provedení jednotlivých kroků/úkolů
evaluace.
	 •	Do jaké míry je hodnotitel nezávislý na hodnocení, které provádí
[Rossi et al. 1999]?24
	 •	Jak zajistit, aby hodnotitel hodnocením nenarušil program anebo
chod organizace [Saunders, Evans, Joshi 2005], [Frechtling et al.
2010]?
	 •	Jako jsou náklady (časové, finanční) na evaluaci [Frechtling et al.
2010]?
Evaluační výzkum72
25
Viz [ibid.: 28] pro příklad metodické pomůcky pro operacionalizaci kritérii.
4.4.1 Koncepty a jejich indikace v procesní evaluaci
Teorie procesní evaluace programu neboli logický model programu
rozlišuje v  jednom z  nejčastěji užívaných pojetí následující evaluační
koncepty (prvky) [Hatry 1999], [Frechtling et al. 2010]: vstupy (inputs),
aktivity (activities), výstupy (outputs), krátkodobé a  dlouhodobé výsledky
(outcomes).
	-	Vstupy zahrnují zdroje fungování programu [Frechtling et al.
2010].
	-	Aktivity jsou např. v programu poskytnuté služby, poskytnuté materiály
nebo realizované akce [Frechtling et al. 2010].
	-	Termín výstup (output) je v  procesní evaluaci často využíván
k  označení produktů či služeb vzniklých z  programových aktivit
[Rossi et al. 1999], [Gelmon, Foucek, Waterbury 2005]: např. počet
vytištěných brožur, počet účastníků vzdělávacího programu, kvalita
poskytovaných služeb, počet odučených hodin.
	-	Termín výsledek (outcome) se naopak vztahuje k výsledkům těchto
aktivit [Rossi et al. 1999]: např. počet klientů, kteří si našli zaměstnání,
zlepšené výsledky žáků ve škole. Výsledky programu nás informují,
jak rozsáhlý je problém, který sledujeme před programem a po
programu, případně též zda v rámci běhu (běhů) programu dochází
ke zlepšení či zhoršení sledovaných charakteristik. Hlavní nevýhodou
těchto výsledků je ovšem jejich obtížná interpretace bez dobré
znalosti kontextuálních údajů (viz [Rossi et al. 1999] a  kapitola 5
níže).
Uvedené koncepty pomáhají vytvořit logickou mapu toho, co a jak má
být v  programu evaluováno. Je ovšem třeba hledat k  nim odpovídají
indikátory, respektive indikace. Chen [2005] uvádí, že i když základem
pro výběr indikací je konceptuální rámec programové teorie, nemělo
by to být překážkou v hledání indikací důležitých věcí v teorii neuvedených.
Zároveň je nutné brát v úvahu, že získání odpovědí na některé
výzkumné otázky může být obtížné z hlediska operacionalizace a měřitelnosti
indikací validním a  reliabilním způsobem [Frechtling et al.
2010].25
Manhood [1997] upozorňuje, že často potřebujeme širokou
734 Procesní evaluace
škálu indikátorů, protože program má mnoho dimenzí, z nichž žádná
by neměla být opomenuta. Často pak máme k  dispozici indikátory
vstupů, výstupů a výsledků, ale zachycení vztahů mezi těmito indikátory
může být obtížné.
4.4.2 Metody a techniky procesní evaluace
Procesní evaluace může využívat jak kvantitativní, tak kvalitativní
přístupy. Některé evaluace též využívají tzv. design smíšených metod
(mixed-method design) [Frechtling et al. 2010]. Standardní metody
sociálně vědního výzkumu, jako jsou rozhovory, dotazníková šetření
či sekundární analýza dat, zde nejsou popisovány, ač jsou základními
evaluačními postupy. Referujeme spíše k  postupům méně známým
a specifickým pro procesní evaluaci.
	 -	Gelmon, Foucek a Waterbury [2005] nabízejí jako jeden z možných
nástrojů procesní evaluace tzv. zprávu o důležitých událostech (critical
incident report). V  této zprávě jsou od realizátorů, případně
od účastníků programu, retrospektivně zjišťovány důležité události,
které pozitivním či negativním způsobem ovlivnily průběh programu
tím, že a) napomohly (urychlily) splnění cílů, b) představovaly
překážky pro splnění cílů nebo c) pomohly překonat překážky
splnění cílů.
	 -	Další výzkumnickou alternativou je pravidelné průběžné zapisování
informací během průběhu programu deníkovou formou [ibid.].
V  některých případech (např. u  lékařů či sociálních pracovníků)
jsou tyto zápisky prováděny za jiným účelem a  nezávisle na hodnocení.
V  takovém případě je třeba ověřit, zda jsou vhodné pro
evaluaci a dostupné z důvodu ochrany osobních údajů.
	 -	Další formou či obdobou procesní evaluace může být monitoring.
Jako monitoring chápeme soustavné a pravidelné sledování toho, jak
si program vede ve svých klíčových funkcích [Patton 1997], [Rossi et
al. 1999], [Chen 2005]. Proces monitorování zahrnuje zpravidla dlouhodobé
shromažďování určitých (převážně kvantitativních) údajů.
Chen [2005] uvádí, že monitoring je zpravidla rozsahově jednodušší
než ostatní formy procesní evaluace. Za účelem monitoringu jsou
využívány elektronické informační systémy a  databáze, například
tzv. Manažerský informační systém (MIS). MIS je primárně určen
Evaluační výzkum74
26
Zhodnocení se může týkat též organizačních aspektů projektu: např. zda je projektová
dokumentace vedena správným způsobem.
pro manažery konkrétních programů, ale informace z něj je možné
použít i pro nezávislou procesní evaluaci [Rossi et al. 1999].
	 -	Významným zdrojem informací o  programu je hodnocení od participantů
(např. hodnocení spokojenosti). Někteří autoři [Rossi et al.
1999], [Horák 2009] uvádějí, že hodnocení (spokojenosti) participantů
může být pro evaluaci významné, neboť poskytuje jinou perspektivu
hodnocení programu (např. k ověření toho, jaké aktivity byly
skutečně realizovány či které aspekty programu byly pro účastníky
obtížné, co by mělo změnit). Rossi et al. [1999], Shaw [1999] a Frechtling
et al. [2010] ovšem upozorňují na případy, kdy hodnocení názorů
a spokojenosti může být nepřesné (např. z důvodu, že účastníci mají
nízké aspirace či že chtějí „chránit“ realizátory programu).
	 -	Jako vhodná metoda procesní evaluace bývá uváděno též pozorování.
Pozorování ovšem může narušovat autentičnost výsledků,
neboť subjekty výzkumu si uvědomují, že jsou pozorovány [Rossi
et al. 1999]. Dalším obtížným úkolem při pozorování pro evaluaci
může potřeba standardizovat pozorované výsledky [ibid.].
	 -	Cenným zdrojem informací může být také benchmarking – např.
srovnání s  předchozími výsledky stejného programu nebo s  výsledky
jiných programů. Srovnání s  kontrolní skupinou využívané
pro evaluaci vlivu není typickou součástí procesní evaluace.
	 -	Procesní evaluace může využít i  další techniky sociálně vědního
výzkumu, jako je např. analýza sociálních sítí, focus group, různé
formy auditů26
nebo testy znalostí [viz Frechtling et al. 2010].
4.4.3 Rizika procesní evaluace
Provádění procesní evaluace lze z více hledisek označit za jeden z nejobtížnějších
výzkumných úkolů. Provádění procesní evaluace může
být podle autorů spojeno s těmito riziky:
	 •	Podstatným rizikem pro procesní evaluaci je přílišná velikost programu
nebo jeho značná heterogenita [viz Patton 1997].
	 •	Evaluátoři se mohou setkávat s  projevy rezistence k  provádění
procesní evaluace [Gelmon, Foucek, Waterbury 2005], [Chen 2005]
anebo s rezistencí k publikaci výsledků.
754 Procesní evaluace
	 •	Nejsou dostupná potřebná data [Chen 2005].
	 •	Aktéři programu se před evaluací či v  průběhu evaluace mění
[Chen 2005].
	 •	Cíle programu mají tendenci být formulovány pomocí toho, co lze
snadno změřit, což ale nemusí představovat nejdůležitější aktivity
programu [Manhood 1997].
	 •	Jsou získány neužitečné poznatky nebo jsou nedůvěryhodné a  nesrozumitelné
[Frechtling et al. 2010].
	 •	Evaluátoři nezachytí podstatné změny, které nastaly v průběhu realizace
programu [Frechtling et al. 2010].
	 •	Experti (a tedy i evaluátoři) mohou mít tendenci podléhat stranickosti
[viz Winkler 2005].
	 •	Přílišná nákladnost evaluace. Náklady na evaluaci se mohou odlišovat
podle cíle evaluace. Frechtling et al. [2010] doporučují věnovat
deset procent nákladů projektu na evaluaci. Podle zkušeností autora
textu mohou být náklady na evaluaci například v  případě malých
pilotních projektů podstatně vyšší. Chen [2005] proto doporučuje
vždy před provedením procesní evaluace zvážit, zda je daný program
vhodným kandidátem pro procesní evaluaci.
4.4.4 Tvorba evaluační studie
Součástí procesní evaluace je zpravidla tvorba evaluační studie. Tento
proces je popsán v učebnicích metodologie a není třeba k němu referovat.
Zde upozorníme toliko na specifika procesní evaluace. Zpráva
o  procesní evaluaci by měla obsahovat dostatek informací o  evaluovaném
programu, o metodách a o postupu evaluace. Evaluátor by měl
své základní výzkumné výsledky opřít o  klíčová data či zjištění, tedy
taková, která pomáhají odpovědět na výzkumné otázky a/nebo taková,
která jsou průkazná, neočekávaná (nová), která si vzájemně odporují
či která jsou zajímavá z hlediska dosažených výsledků programu [viz
Frechtling et al. 2010].
4.5 Příklad provedení procesní evaluace
Jako příkladovou studii jsme zvolili evaluaci, kterou jsme prováděli
v letech 2010 a 2011 jako součást mezinárodního programu Progress
Evaluační výzkum76
27
Místní akční výzkumná skupina (Local action research group).
„Social experimentation for active ageing“ VS/2010/0045 (viz [Hora,
Suchanec, Soukup 2010], [Hora, Suchanec, Soukup 2011], [Hora, Suchanec
2012]). Cílem české části projektu bylo vyzkoušet program
podpory drobného podnikání pro cílovou skupinu osob nad padesát
let. Program měl tedy dvě základní roviny: realizaci projektu podnikání
pro cílovou skupinu osob nad padesát let (tzv. pilotáž) a evaluaci tohoto
pilotního projektu. Projekt zde komentuji z pozice jeho evaluátora, což
je též důvod, proč byla vybrána právě tato evaluace (jako účastník mám
dobrý přehled o realizaci projektu). V tomto textu nereferujeme k výsledkům
evaluace, ale pouze ke způsobu realizace evaluace.
Významným krokem procesní evaluace je určení klíčových aktérů
(stakeholders). V našem případě byli klíčoví aktéři určeni v předprogramové
fázi hlavním koordinátorem programu (hlavním tvůrcem
programu). Pokud v  některém programu nejsou klíčoví aktéři určeni
tvůrci programu, je na evaluátorech, aby určili klíčové aktéry, neboť
jejich znalost je nutná pro vlastní evaluaci. Je třeba brát v  úvahu, že
klíčoví aktéři se mohou v  průběhu programu měnit; je tedy potřeba
identifikovat klíčové osoby a  instituce i  v  průběhu projektu a  přizvat
je ke spolupráci na evaluaci (určit jejich roli při evaluaci).
Projekt byl realizován ve spolupráci několika subjektů. Vybraní zástupci
těchto subjektů a další účastníci (mj. jeden z podnikatelů, který
se dříve účastnil obdobného programu) vytvořili tzv. skupinu LARG27
.
LARG se pravidelně scházel v  horizontu jednoho či dvou měsíců.
V rámci schůzek se aktéři podíleli na tvorbě projektu, vzájemně se informovali
o průběhu projektu, řešili identifikované problémy, plánovali
další postup realizace a evaluace programu. Schůzky LARG byly také
přímo či nepřímo využívány k  evaluaci. Jednotliví účastníci skupiny
měli též za úkol předávat informace ostatním účastníkům projektu
a zajistit spolupráci institucí, které členové LARG reprezentovali.
Před začátkem projektu byla zpracována tzv. základní studie (baseline
study) [Hora, Suchanec, Soukup 2010]. Jedná se o určitou formu analýzy
potřeb před realizací programu, jež přináší realizátorům programu
informace využitelné při tvorbě programové teorie. Studie zahrnovala
zhodnocení situace cílové populace na trhu práce, existujících opatření
pro sledovanou cílovou populaci a rozdílu mezi současným stavem řešení
a ideálně očekávaným stavem řešení (konfrontační napětí).
774 Procesní evaluace
Při evaluaci projektu jsme vycházeli z programové teorie vytvořené
hlavním koordinátorem programu. Programová teorie má pro evaluátora
následující významy: pomáhá mu porozumět teorii modelu
změny (jakým způsobem má být dosaženo výsledku), pomáhá mu
rozpoznat, jaké výsledky je nutné zachytit a  také jaký je časový plán
realizace projektu (to je významné pro vytvoření obsahového a časového
plánu evaluace).
Tabulka 4.4 Výtah z programové teorie programu
celkové cíle projektu - zahájení a udržení samostatného podnikání
- zvýšení lidského a sociálního kapitálu účastníků
- zvýšení kvality jejich života
cílová populace
projektu
Nezaměstnaní starší padesáti let v okrese České Budějovice, kterým
zbývá alespoň 2,5 roku do odchodu do důchodu, mají čistý trestní
rejstřík a jsou z města České Budějovice nebo jeho okolí
teoretické vymezení
jednotlivých etap
projektu
1. etapa (A): zvýšení zájmu o podnikání
2. etapa (B): založení podnikání
3. etapa (C): udržení podnikání
operační cíle pro
jednotlivé etapy
(A) zvýšit zájem o podnikání v cílové skupině
(B) pomoci podnikání zahájit
(C) pomoci podnikání udržet
indikátory naplnění
těchto operačních
cílů
A1: získat alespoň 40 zájemců o kurz„Základy podnikání“
A2: naplnění kapacity kurzů (2krát 10 osob)
B1: podíl účastníků, kteří dostali dotaci (alespoň 50 procent)
B2: podíl účastníků v OSVČ/zaměstnání vs. podíl neúčastníků
s podobnými charakteristikami
C1: podíl dotovaných (alespoň 70 procent, kteří po šesti měsících
stále podnikají)
C2: subjektivní pocit účastníků o perspektivnosti podnikání
C3: subjektivní pocit zvýšení lidského kapitálu účastníků
C4: subjektivní pocit zvýšení sociálního kapitálu účastníků
C5: subjektivní pocit zvýšení kvality života účastníků
aktivity A1: informační letáčky
A2: informace od zprostředkovatele
A3: informační schůzky pro nové zájemce
A4: informačně-motivační schůzky
A5: schůzky realizátorů se zájemci
B1: vzdělávací blok k podnikání (individuální poradenství)
B2: tvorba podnikatelského plánu
B3: obhajoba podnikatelského plánu
C1: finanční dotace
C2: individuální poradenství
C3: workshopy pro začínající podnikatele
Evaluační výzkum78
Podle programové teorie (model změny) mělo u  cílové skupiny osob
nad 50 let dojít k posílení zájmu o podnikání. U účastníků druhé fáze
programu (vzdělávání) mělo dojít ke zvýšení jejich znalostí v  oblasti
podnikání a  vytvoření podmínek, které ulehčují začátek podnikání
(poradenství, finanční podpora). Ve třetí fázi měl program skrze pokračující
podporu (další vzdělávání a poradenství) dosáhnout toho, že
podnikání bude pokračovat.
Na základě programové teorie jsme vytvořili plán evaluace. Evaluační
plán vycházel z  fází definovaných v  programové teorii. Ne vždy
ale evaluace probíhá v  reálném čase (informace jsou často získávány
zpětně, zvláště jedná-li se o  dodatečné zhodnocení). Evaluační plán
se v průběhu času mění v závislosti na vývoji situace (data klíčových
setkání mohou být změněna, lidé mohou onemocnět atd.).
Pro program byly stanoveny následující základní evaluační cíle:
	 -	zhodnocení míry naplnění cílů programu (dosažení očekávaných
výsledků) a zjištění vedlejších a neočekávaných „efektů“;
	 -	zhodnotit, nakolik jednotlivé komponenty programu či jiné
faktory (mimo program) přispěly k úspěšné či neúspěšné implementaci
programu v jednotlivých fázích;
	 -	zhodnotit, nakolik je program podpory podnikání vhodnou
formou intervence pro cílovou skupinu (na základě dosažení
programových cílů, zhodnocení výsledků programu, srovnání
úspěšnosti programu s  jinými formami intervence a  posouzení
úspěšnosti programu účastníky programu a členy LARG).
Jako evaluátoři jsme si kladli dílčí výzkumné otázky, které jsou uvedené
v tabulce 4.5.
Tabulka 4.5 Výzkumné otázky použité ve výzkumu
První fáze Bylo dosaženo operačního cíle programu pro první fázi programu? Jaké
aktivity či okolnosti mohly mít vliv na (ne)dosažení tohoto cíle?
Jací účastníci se účastnili informačně-motivačních schůzek?
Jací účastníci se rozhodli vstoupit do programu?
Jaká byla motivace osob z cílové populace a zájemců ke vstupu do programu
či k odmítnutí vstoupit do programu?
794 Procesní evaluace
Druhá fáze Bylo dosaženo operačního cíle programu pro druhou fázi programu? Jaké
aktivity či okolnosti mohly mít vliv na (ne)dosažení tohoto cíle?
Jak probíhaly aktivity (vzdělávací blok, příprava podnikatelského plánu,
obhajoba podnikatelského plánu)?
Jak hodnotí realizátoři a účastníci programu jednotlivé aktivity?
Jaké identifikují pozitivní a negativní aspekty realizace aktivit?
Jaké jsou případné další přínosy realizovaných aktivit?
V jakém oboru byly vypracovány podnikatelské plány?
Zahájili účastníci přípravu na podnikání?
Jaká byla motivace účastníků k zahájení podnikání?
Třetí fáze Bylo dosaženo operačního cíle programu pro třetí fázi programu? Jaké aktivity
či okolnosti mohly mít vliv na (ne)dosažení tohoto cíle?
Jak probíhaly aktivity (finanční dotace, individuální poradenství, skupinové
workshopy)?
Jaké identifikují pozitivní a negativní aspekty realizace aktivit?
Jaké jsou případné další přínosy realizovaných aktivit?
Jaká byla motivace účastníků k podnikání ve třetí fázi?
Jaká byla situace účastníků programu v rozhodném období z hlediska
programových cílů? (ekonomická situace, životní situace - kvalita života, jak
podnikají, vliv na lidský a sociální kapitál)
Jaká byla ekonomická situace účastníků ve srovnání se skupinou neúčastníků
programu?
Jak celkově hodnotí program členové LARG?
Jaké byly náklady na program ve srovnání s výsledky programu?
Jaké byly náklady na program ve srovnání s jinými programy?
4.5.1 Použité metody a techniky evaluace v jednotlivých fázích
evaluace
Nyní popíšeme techniky výzkumu využité v  jednotlivých fázích výzkumu.
Data pro evaluaci byla získávána průběžně po celou dobu
tvorby a  realizace programu. Evaluátoři si z  každé aktivity, které se
zúčastnili, psali terénní poznámky a ty následně využili pro evaluaci.
Původním záměrem bylo více využít dotazníky, ale vzhledem k  malému
počtu účastníků a nízké ochotě účastníků dotazníky vyplnit jsme
se rozhodli upřednostnit rozhovory.
Pro první fázi (zvýšit zájem o  podnikání v  cílové skupině) jsme
využili:
Evaluační výzkum80
28
Jako evaluátoři jsme nemohli zhodnotit znalosti účastníků v  oblasti podnikání.
Proto jsme pracovali s bodovým hodnocením testů a se slovním komentářem lektora
k tomuto hodnocení.
29
Skupinu neúčastníků programu tvořili účastníci informačních schůzek, kteří projevili
zájem o program a zanechali na sebe kontakt, ale kteří se rozhodli do programu
nevstoupit. Provedení klasického experimentu by v  tomto případě bylo příliš velkým
narušením průběhu programu a mohlo by narušit jeho samotnou realizaci.
	 -	nezúčastněné pozorování informačně-motivačních schůzek;
	 -	dotazník ke zjištění informací o cílové populaci programu. Tento
dotazník byl distribuován na informačně-motivačních schůzkách.
Zjišťoval názory cílové populace na podnikání;
	 -	individuální rozhovor s  realizátorem, který zajišťoval rozhovory
pro vyhodnocení jejich průběhu;
	 -	skupinové diskuze se členy LARG.
Pro druhou fázi (pomoci podnikání zahájit) jsme využili:
	 -	nezúčastněné pozorování (evaluátoři se v  rozsahu jednoho či
dvou dnů účastnili většiny programových aktivit, tedy výuky,
obhajob podnikatelských plánů a workshopů);
	 -	rozhovory s  realizátory programu (komentář realizátorů k  průběhu
programu, ke zhodnocení výstupních testů a  kvalitě zpracování
podnikatelských plánů);28
	 -	skupinové diskuze se členy LARG.
Pro třetí fázi (pomoci podnikání udržet) jsme využili:
	 -	individuální rozhovory s  účastníky programu, kde jsme retrospektivně
zjišťovali informace o  všech předchozích fázích programu
a  o  situaci účastníků. V  případě odmítnutí rozhovoru
účastníky programu jsme telefonicky získávali alespoň základní
informaci o jejich situaci po programu;
	 -	skupinové diskuze se členy LARG. V rámci závěrečné fáze hodnocení
jsme realizovali jedno setkání LARG (focus group), které
bylo celé věnováno evaluaci a kde jednotliví aktéři hodnotili průběh
a výsledky programu;
	 -	součástí této evaluace bylo i  srovnání výsledků účastníků programu
z  hlediska ekonomického postavení po absolvování programu
ve srovnání s kontrolní skupinou neúčastníků.29
	
Informace jsme získávali ze dvou základních zdrojů: z rozhovorů
s  účastníky a  vybranými neúčastníky programu a  z  kvantitativních
dat získaných z databáze úřadu práce.
814 Procesní evaluace
30
Uveďme příklad: do vzdělávacího programu nastoupilo devět účastníků z deseti plánovaných
účastníků. Program dokončili čtyři účastníci. Takovou informaci lze dále interpretovat.
Také je možné zjišťovat, z jakého důvodu účastníci program nedokončili.
31
V souladu s teorií stakeholders se využívají dvě základní hlediska: a) kdo je přímo
zapojen do fungování programu, b) kdo má zásadní vliv na fungování programu či kdo
je programem zásadně ovlivněn.
4.5.2 Komentář k provedení evaluace
Základní informaci o  průběhu programu jsme získávali monitorováním
výstupů (output) relevantních pro jednotlivé fáze programu. Evaluátor
musí určit jednotlivé výstupy, které je třeba sledovat. Ty nemusí
být dány jen programovou teorií.30
Otázky, jak probíhaly jednotlivé aktivity a účast evaluátorů na jednotlivých
aktivitách, byly klíčové, neboť ukázaly mimo jiné účast či
neúčast nezaměstnaných v  jednotlivých aktivitách. Pozorování bylo
prospěšné také proto, že účastníci programu díky němu znali evaluátory
a bylo snazší získat jejich důvěru při rozhovorech.
V  případě této evaluace byla celá řada „efektů“ zjišťována pomo-
cí  polostandardizovaných rozhovorů na úrovni slovní reakce účastníků
programu. Fakt, že se jednalo o kvalitativně zaměřenou evaluaci,
prohloubil validitu výzkumu a porozumění situaci z hlediska jednání
aktérů v  konkrétních situacích (např. proč se účastníci rozhodli nepodnikat).
Konkrétní evaluační podmínky ale mohou (též v  závislost
na zadavateli evaluace) vyžadovat i více reliabilní výsledky.
Ve výzkumu jsme se zaměřovali na motivaci k podnikání (viz dílčí
výzkumné otázky). Výsledky ale ukázaly, že za rozhodnutím podnikat
či nepodnikat stojí širší okruh faktorů rozhodování (např. posouzení
vlastních schopností, podmínek existujících v  ekonomice nebo osobnost
konkrétního nezaměstnaného).
Pro procesní evaluaci je klíčová spolupráce jednotlivých aktérů při
realizaci programu. Je důležité zapojit klíčové aktéry31
a  být s  nimi
v  pravidelném kontaktu. V  průběhu evaluace se ukázalo, že cíle realizátorů
programu a  evaluátorů mohou být ve vzájemném konfliktu
ohledně způsobu realizace programu, postupu evaluace a role při evaluaci.
Evaluace totiž může narušovat průběh programu. Evaluátor musí
vždy osobně vykonat evaluaci anebo zajistit, aby evaluaci v daném čase
a místě provedla kompetentní osoba. Evaluátor musí být včas informován
o všech změnách v programu.
Evaluační výzkum82
32
Tento fakt ale u procesní evaluace nepředstavuje takový problém jako např. u evaluace
vlivu.
33
V našem případě byl postup práce a konečné výsledky projektu prezentovány při
různých příležitostech asi desetkrát. Z toho vyplývá, že diseminace výsledků může být
náročná a evaluátor s tím musí počítat.
34
Z tohoto důvodu je např. často nemožné důsledně prezentovat všechny teoretické
a  metodologické aspekty studie. Někteří členové publika preferují číselné údaje, zatímco
jiní považují číselné výsledky za nedostatečné [Frechtling et al. 2010].
Jako důležité se projevilo též časové hledisko evaluace. Projekt byl
omezen poměrně krátkým časovým obdobím pro realizaci a evaluaci.
To mělo za následek, že projekt (a také evaluace) mohl či nemohl být
realizován i v méně vhodných obdobích roku jako jsou období letních
prázdnin či vánočních svátků. Zároveň program nemohl být hodnocen
s dostatečným časovým odstupem od ukončení programu.32
V neposlední
řadě je třeba brát v úvahu, že procesní evaluace tohoto typu
je časově náročná.
Jednalo se o  malý program. V  takových případech jsme jako evaluátoři
určitým způsobem omezeni z  hlediska využití kvantitativních
postupů. Je třeba zdůraznit, že výsledky evaluace je nutné v tomto kontextu
chápat jako jedinečné – mohou být zdrojem poznání pro realizátory
obdobných programů, ale nelze je v žádném případě zobecňovat
mimo uvedený program.
Nedílnou součástí většiny procesních evaluací je diseminace výsledků.
Diseminace probíhá formou předání výsledků výzkumu relevantním
stakeholderům a formou prezentace výsledků před objednavateli
výzkumu a  dalšími zájemci.33
Diseminace výsledků procesních
evaluací může být pro evaluátory náročná, neboť evaluátor je často
vystaven potřebě či požadavku publika prezentovat výsledky jazykem
blízkým respondentům34
při současném malém obsahovém a časovém
prostoru pro prezentaci. Součástí procesní evaluace by měla být formulace
doporučení.
Literatura
Chen, H. 2005. Practical Program Evaluation: Assessing and Improving Planning,
Implementation, and Effectiveness. Thousand Oaks: Sage.
Colman, R. et al. 2007. The New York State Care Coordination Pilot Project: Process
& Impact Evaluation Study Findings. New York: New York State Office of
Children & Family Services.
834 Procesní evaluace
Frechtling, J. et al. 2010. The 2010 User-Friendly Handbook for Project Evaluation.
Rockville: Directorate for Education and Human Resources.
Egbert, S. C. 2006. Child Abuse Prevention in Utah: A Process Evaluation. Salt Lake
City: Social Research Institute.
Gelmon, S. B., A. Foucek, A. Waterbury. 2005. Program Evaluation: Principles and
Practices. Portland: Northwest Health Foundation.
Grinnell, R. M. 2001. Social Work Research and Evaluation. Belmont, USA:
Thomson Learning.
Hatry, H. 1999. Performance Measurement: Getting Results. Washington, DC:
Urban Institute Press.
Hora, O., M. Suchanec, T. Soukup. 2010. Local Mapping/baseline Report THE
CZECH REPUBLIC: Situation of Target Group and Activities in the Region of
České Budějovice. Praha: VÚPSV.
Hora, O., M. Suchanec, T. Soukup. 2011. THE CZECH REPUBLIC: Social
Experimentation: Supporting People 50+ in Entrepreneurship. Praha, Brno:
VÚPSV.
Hora, O., M. Suchanec. 2012. „Podpora a rozvoj podnikání osob nad 50 let:
Evaluační studie sociálního experimentu formou akčního výzkumu.“ Fórum
sociální politiky 6(2): 2–8.
Horák, P. 2009. „Implementace české aktivační politiky na lokální úrovni
a princip individualizace.“ S. 148–179 in Sirovátka, T., J. Winkler, M. Žižlavský.
(eds.) Nejistoty na trhu práce. Brno: Albert.
Horáková, M. 2010. „Důvody a možnosti hodnocení výcvikových a vzdělávacích
programů a jejich účinků pro nízkokvalifikované osoby: návrh komplexního
hodnotícího přístupu.“ Forum sociální politiky 4(1): 8–16.
Hughes R., C. Black, N. P. Kennedy. 2008. Public Health Nutrition Intervention
Management: Process evaluation. Dublin: JobNut Project, Trinity College.
Manhood, C. 1997. „Performance Measurement in the United Kingdom (1985–
1995). “ Pp. 134–144 in Chelimsky, E., W. R. Shadish. (eds.) Evaluation for the
21st
Century. Thousand Oaks: Sage Publications.
Patton, M. Q. 1997. Utilization-Focused Evaluation. The New Century Text.
Thousand Oaks: Sage Publications.
Rossi, P., H. Freeman, M. Lipsey. 1999. Evaluation: A Systematic Approach.
Thousand Oaks: Sage Publications.
Sanders, R., M. Evans, P. Joshi. 2005. „Developing a Process-Evaluation Plan for
Assessing Health Promotion Program Implementation: A How-to Guide.“
Health Promotion Practice 6(2): 134–147.
Shaw, I. 1999. Qualitative Evaluation. London: Sage Publications.
Winkler, J. 2005. „Role expertízy při tvorbě sociálních programů.“ S. 59–65 in
Winkler, J., L. Klimplová, M. Žižlavský. (eds.) Účelové programy na lokálních
trzích práce. Brno: FSS.
Winkler, J., L. Klimplová, M. Žižlavský. 2005. „Hodnocení programů z hlediska
partnerství a adekvátního plánování.“ S. 208–217 in Winkler, J., L. Klimplová,
M. Žižlavský. (eds.) Účelové programy na lokálních trzích práce. Brno: FSS.
WHO 2000. Process Evaluation (Workbook 4). Geneva: World Health
Organization.
855 Evaluace dopadu
5 EVALUACE DOPADU
Miroslav Suchanec
Evaluaci dopadu (impact evaluation) lze zasadit do širšího rámce
evaluace sociálních programů. Sociálními programy se rozumí široká
škála intervencí, jejichž cílem je zlepšení sociálních podmínek,
které jsou vnímány klíčovými aktéry (tvůrci politik, občanskými
iniciativami) jako více či méně problematické či nežádoucí [Rossi et
al. 2003]. Takovou definici naplňují např. programy aktivní politiky
zaměstnanosti (rekvalifikace atd.) jakožto nástroje „řešení“ nezaměstnanosti.
Evaluace (tedy i evaluace dopadu jako její specifický druh) je
potom doslova „ohodnocení“ programu použitím výzkumných metod
a  technik. V  důsledku je tedy aplikovaným výzkumem, jehož cílem
je oproti základnímu výzkumu přímo přispět ke zlepšení sociálních
podmínek ve společnosti skrze ohodnocení „ne/fungování“ sociálního
programu.
Ačkoli pozitivní změna v  sociálních podmínkách má význam bez
ohledu na zdroje této změny, evaluační literatura v tomto ohledu rozlišuje.
Evaluace efektu se liší od hodnocení výsledků programu (tzv.
outcome monitoring/evaluation) svou kauzální nadstavbou. Nejedná
se o pouhé zjištění naplnění indikátorů programových cílů (též někdy
nazývaných evaluačními kritérii) po uplynutí realizace programu (ať
již se jedná o absolutně definovaná kritéria, jako například do půl roku
od ukončení programu si polovina účastníků najde zaměstnání, nebo
o relativně definovaná kritéria, která považují výsledky účastníků relativně
k určitému předcházejícímu časovému období nebo jiné skupině
osob, jako například urychlení odchodu nezaměstnaných z  registru,
zvýšení míry pravděpodobnosti nalezení zaměstnání, lepší výsledky
než jiný program atd.), nýbrž o snahu o úzké (pokud možno kauzální)
propojení těchto výsledků s programem. Evaluace vlivu tak eliminuje
souvislosti mezi programem a výsledkem na nekauzální bázi (tzv. matoucí
efekty, které jsou způsobeny vlivem třetího faktoru).
Terminologie v  evaluační literatuře však není tak jednotná, jak je
zde uvedeno. Zaprvé, je důležité rozlišovat mezi výsledky (outcomes)
Evaluační výzkum86
a výstupy (outputs). Výstupy představují finální (dokončené) produkty
a  služby programu (např. počet účastníků rekvalifikace), nicméně
samy o sobě neříkají nic o dosažených výsledcích programu, ačkoli se
očekává, že k očekávaným výsledkům povedou. Výstupy jsou tedy činy,
které implementující personál programu (např. lektoři) vykonal, nikoli
změny, kterých bylo dosaženo vně programu (např. na jeho účastnících
– nezaměstnaných) [Hatry 1999]. Výstupy jsou vnitřní součástí programu.
Oproti tomu výsledky (outcomes) představují jevy a  události,
popřípadě změny v sociálních podmínkách nebo chování participantů
programu, které indikují posun směrem k  programovým cílům. Výsledky
tedy nejsou to, co program vykonal, nýbrž důsledek této aktivity.
Výsledky programu zahrnují i vedlejší efekty, ať již záměrné nebo nezáměrné,
pozitivní nebo negativní.
Z  hlediska hodnocení efektu je pro některé autory podstatné
rozlišení mezi průběžnými (intermediate) a  koncovými (end / final)
výsledky a  také mezi krátkodobými a  dlouhodobými výsledky,
přičemž i  brzy se vyskytující výsledek může být koncový [Hatry
1999]. Od průběžných výsledků se očekává, že povedou ke koncovým
výsledkům, ale samy o  sobě konečné nejsou. Příkladem může být
počet účastníků dobrovolného programu, kteří jej dokončili. Takový
indikátor tak umožňuje posoudit, jak úspěšný byl program nejen při
motivaci nezaměstnaných ke vstupu do programu, ale i k jeho dokončení.
Dokončení programu je nicméně pouze mezikrok ke koncovému
výsledku, kterým je zlepšení podmínek absolventů programu na trhu
práce (např. zvýšení lidského kapitálu, zvýšení zaměstnatelnosti, získání
stabilního zaměstnání nebo zvýšení mzdy). Průběžné výsledky již
z definice předcházejí koncovým cílům a jsou někdy z časových i metodologických
důvodů pro evaluátory programu lépe hodnotitelné.
Některé koncové výsledky se projeví až v  dlouhodobém horizontu
a  mohou být i  více ovlivnitelné vnějšími faktory v  porovnání s  průběžnými
výsledky. Na druhou stranu průběžné výsledky mohou, ale
nemusí vést ke koncovým výsledkům.
Jak již je uvedeno výše, efekty neboli impakty nejsou v  odborné
literatuře chápány, nebo alespoň popisovány, identicky. Nejčastěji se
v literatuře objevuje:
(a) kauzální definice efektu založena na kontrafaktualitě (kontra-faktualita,
tedy stav, který je v  rozporu se skutečností, neboť není
možné, aby účastník v téže čase v programu byl a zároveň nebyl, proto
875 Evaluace dopadu
lze kontrafaktualitu česky též přeložit jako stav „co by kdyby“), kdy
efekt představuje rozdíl mezi situací účastníků po intervenci a  jejich
hypotetické (kontrafaktuální) situace, kdyby bývali program neabsolvovali
[Kluwe 2005], [Hujer 2004], [Heckman, Smith 1999];
(b) kauzální definice efektu založena na rozkladu korelace a posouzení
míry její kauzální podstaty, kdy efekt představuje „rozsah v jakém
program způsobil výsledky“ [Hatry 1999: 21]. Někteří autoři také
hovoří o  impaktu jako o  společenských efektech, na rozdíl od efektů
individuálních [Hatry 1999: 24]. Viertel [2004: 195] hovoří o evaluaci
impaktu jako o vztahu mezi okamžitými a celkovými cíli programu.
Rossi et al. [2003: 234] popisují evaluaci vlivu jako posouzení vlivu
(impact assessment), jehož předmětem je zjistit, zda program způsobuje
zamýšlený efekt. Evaluátoři posuzují efekt programu porovnáním
informací o  výsledcích účastníků programu s  odhady jejich situace,
kdyby se programu neúčastnili (toto je příklad kontrafaktuální definice
impaktu). Problematika posouzení impaktu je identická s posouzením,
zda je program příčinou nějakého efektu.
Na jiném místě Rossi et al. [ibid.: 206] hovoří také o  úrovni výsledku
(outcome level), změně výsledku (outcome change) a  čistém
efektu programu. Úroveň výsledku je stav výsledku v  určitém časovém
bodě (např. úroveň lidského kapitálu nezaměstnaného před
programem). Změna výsledku je pak rozdíl mezi úrovněmi výsledku
v různých časových bodech (např. rozdíl mezi úrovní lidského kapitálu
nezaměstnaného před zahájením programu a po jeho ukončení). Efekt
programu pak představuje tu část této změny výsledku, která může být
přisouzena výhradně programu, na rozdíl od vlivu jiných faktorů.
Shrňme tedy vymezení evaluace impaktu programu vůči jiným evaluačním
procedurám. Zaprvé, evaluace impaktu se liší od hodnocení
výsledků. Monitoring výsledků bere v úvahu pouze výsledky účastníků
programu (např. jaká část účastníků programu nalezla zaměstnání),
zatímco evaluace impaktu porovnává tyto výsledky s  hypotetickými
výsledky participantů, kdyby se bývali programu nezúčastnili. Zadruhé,
evaluace impaktu se liší od evaluace procesu (viz kapitola 4,
výše). Evaluace procesu se zabývá fungováním (činností, provozem)
programu a jejím cílem je poskytnout manažerům programu zpětnou
vazbu, zda program funguje podle plánů a efektivně, co se týče vynaložených
nákladů (inputs) na činnosti (activities) [Rossi et al. 2003],
[Hatry 1999].
Evaluační výzkum88
5.1 Reprezentace kontrafaktuality
Definovali jsme tedy impakt a  již víme, čím se evaluace impaktu zabývá.
Impakty lze však dále dělit podle mnoha hledisek a v závislosti
na tom, jakou volbu z  určitého hlediska zvolíme, následně volíme
i příslušnou statistickou metodu analýzy dat. Pouze jedinou vlastnost
mají všechny impakty společnou – abychom vůbec mohli impakt měřit
jakožto změnu stavu, ke které má intervence přispět, je vždy nutné
srovnání dvou veličin / proměnných (pokud tedy pouze změříme stav
účastníků programu po jeho skončení bez jakéhokoli srovnání, pak
se nejedná z  hlediska impakt analýzy o  relevantní výzkumný design
– k  adekvátním designům se dostaneme později). První veličinou je
stav experimentální skupiny (skupina, která absolvuje intervenci) po
programu – například úroveň lidského kapitálu účastníků rekvalifikačního
programu, jejich situace na trhu práce atd. Druhou veličinou
je situace, kterou si zvolíme jako vhodnou reprezentaci kontrafaktuality
– tedy hypotetické situace, v jaké by se ocitli účastníci intervence,
pokud by se bývali intervence nezúčastnili. Takovou reprezentací
kontrafaktuality může být například stav lidského kapitálu účastníků
rekvalifikace, potažmo jejich situace na trhu práce před programem,
nebo stav lidského kapitálu, případně situace na trhu práce po programu
jiné skupiny lidí, tzv. kontrolní / srovnávací skupiny. (Pokud se
na moment zaměříme na konkrétní techniku analýzy dat, tak z  uvedeného
plyne, že základní měření impaktu lze provést základními
statistickými nástroji, jako je srovnávání průměrů nebo proporcí – ke
konkrétním nástrojům se však vrátíme později.) Pokud by naše zvolená
reprezentace kontrafaktuality nebyla vhodnou reprezentací, tedy
existovaly by opodstatněné důvody, proč by se reprezentace kontrafaktuality
neměla shodovat s  potenciálním stavem účastníků programu
po jeho skončení, pak by naměřený impakt mohl být tímto zkreslen
(vychýlen) – naměřený impakt by neodpovídal reálnému impaktu. Takováto
situace může například nastat, když jako reprezentaci kontrafaktuality
zvolíme stav účastníků rekvalifikace před programem a  na
lidský kapitál neúčastníků s podobnými vlastnostmi, jakými disponují
účastníci rekvalifikace by v průběhu měsíční rekvalifikace jejich kolegů
působily alternativní paralelní vlivy, které by úroveň lidského kapitálu
zvyšovaly. Pokud by bylo pravděpodobné, že stejné vlivy by působily
i na účastníky, kdyby se bývali rekvalifikace neúčastnili, pak by námi
895 Evaluace dopadu
zvolená reprezentace kontrafaktuality nebyla v souladu s potenciálním
stavem účastníků po programu a  impakt programu by byl nadhodnocen,
neboť by „nepočítal“ s  potenciálním alternativním navýšením
lidského kapitálu. Žádný kauzální odhad se tedy neobejde bez předpokladů,
úkolem evaluátora je, aby tyto předpoklady byly co nejvíce
platné. Abychom naměřili nezkreslený („opravdový“) impakt, je tedy
důležité pokusit se o eliminaci „paralelních“ vlivů, které vstupují do hry
a „tváří“ se jako efekt programu, ačkoliv jde o vlivy, které s programem
nesouvisí. Tyto matoucí efekty představují tzv. hrozby interní validity,
které lze eliminovat prostřednictvím vhodného výzkumného designu
anebo dodatečně pomocí statistické kontroly. Tuto problematiku ještě
rozebereme hlouběji.
5.2 Náhodnost výběru a povaha analyzovaného efektu
Prvním místem, na kterém lze přístupy k impakt analýze začít dělit, je
u sběru dat – konkrétně u způsobu výběru vzorku do experimentální
a  kontrolní skupiny. Pokud totiž chceme výsledky z  výběrového souboru
zobecnit (přenést) na populaci, z  níž byl vybrán, je nutné, aby
výběrový soubor byl náhodný (pozor, nikoli nahodilý) – tedy aby byl
vybrán prostřednictvím náhodného mechanismu (např. losování) ze
všech členů populace. Pokud tedy máme možnost výběr vzorku ovlivnit,
popřípadě víme, že námi vybraná datová matice pochází z náhodného
výběru, pak si můžeme klást otázku, jaký je efekt programu na
náhodně vybrané členy populace. Tato otázka je z  pohledu sociální
politiky zajímavá například v situaci, kdy je zvažováno, že by byl program
implementován na univerzální bázi a byl by například povinný.
Pokud bude naplněna podmínka náhodného výběru, pak se nemusíme
strachovat, že zjištěné efekty intervence by byly platné pouze u  naší
experimentální skupiny nebo by maximálně byly přenositelné na
osoby se stejnými charakteristikami, jako mají účastníci programu.
Tomuto typu efektu se říká průměrný efekt participace (zkratka ATE)
a jedná se o průměrný efekt participace programu pro každého člena
populace, například nezaměstnaných. Pokud náhodný výběr nemáme,
pak nejčastěji mluvíme o tzv. průměrném efektu programu na účastníky
(zkratka AETT). Tento efekt představuje průměrný efekt programu
na aktuální účastníky. Tento efekt je užitečné znát, uvažujeme-li o po-
Evaluační výzkum90
kračování programu stejným způsobem jako funguje doposud a  zda
by měl být program zachován pro podskupiny nezaměstnaných, pro
kterou funguje v současnosti.
Pokud je efekt programu identický pro všechny členy populace
(což ale jen stěží lze předpokládat), pak nezáleží na výběru efektu,
oba budou odhadovat stejné efekty. Je-li však efekt heterogenní v závislosti
na různých vlastnostech nezaměstnaných, kdy má například
program tendenci pomáhat relativně nejvíce osobám s vícenásobným
znevýhodněním, a tyto osoby jsou do programu vybrány, pak efekt na
účastníky programu (AETT) bude pozitivnější než efekt participace
v  populaci (ATE). Kromě těchto efektů lze definovat také tzv. distribuční
efekty [Khandker et al. 2010: 115]. Jedná se o  rozlišení efektů
programů podle různých charakteristik participantů, podle toho, kde
v distribuci různých proměnných se nacházejí. V případě nezaměstnaných
může být například zajímavé, která ze skupin nezaměstnaných
těží z programu relativně nejvíce. Pokud tedy v naší hypotetické situaci
program relativně nejvíce pomáhá osobám s vícenásobným znevýhodněním,
jejichž šance na trhu práce by bez programu byla v průměru
mizivá, a kromě těchto osob jsou v programu ještě účastníci s pouze
jedním znevýhodněním, pak distribuční efekt pro vícenásobné znevýhodněné
je pozitivnější, než průměrný efekt na účastníky (AETT).
Ten je pak pozitivnější než průměrný efekt participace (ATE), neboť
v  programu nejsou zastoupeny skupiny populace, kterým program
pomáhá relativně nejméně (kteří jsou na tom dobře i bez programu).
Pokud shrneme všechny uvedené efekty, lze říci, že ATE je relevantní
pouze při splnění podmínky náhodného výběru. Pokud jsou naše výsledky
zobecnitelné na populaci, pak o  nich mluvíme jako o  externě
validních výsledcích.
5.3 Interní validita
Podmínkou možnosti generalizovat zdrojovou populaci je kromě náhodného
vzorku i  nezkreslenost (jazykem ekonometrie nestrannost,
nevychýlenost) výsledných odhadů efektů programu a z toho plynoucí
interní validita [Campbell, Stanley 1966], neboť není příliš užitečné
mít možnost zobecňovat interně neplatné (invalidní) výsledky. Interní
validita se zabývá otázkou kauzality, tedy vztahem příčiny a následku
915 Evaluace dopadu
mezi dvěma proměnnými – například programu APZ a  jeho výsledkem.
Ptáme se, zda rozdíl v závislé proměnné (např. zaměstnatelnost
mezi účastníky a  neúčastníky programu po jeho skončení) není dán
jinými faktory, než právě programem, který má být naším kýženým
hybatelem. Nebyli například účastníci rekvalifikace „šikovnější“ (vzdělanější,
motivovanější atd.) než neúčastníci a  právě z  tohoto důvodu
(a  nikoli z  důvodu programu) byli v  důsledku úspěšnější? Nebo
v  případě alternativní kontrafaktuality v  podobě předprogramového
měření (pretestu) účastníků, nevstoupil v  průběhu programu na trh
nový „velký“ zaměstnavatel, díky kterému byli uchazeči nakonec tak
úspěšní? Tyto a jiné „alternativní“ vysvětlení výsledku představují tzv.
hrozby interní validity. Pro analýzu impaktu je tedy naplnění interní
validity, na rozdíl od validity externí, klíčové. Je nezbytně nutné již
v  situaci, kdy výzkumník považuje výsledky analýzy platné pouze ve
zkoumaném vzorku a nemá ambice je generalizovat na zdrojovou populaci.
Již Campbell a Stanley [1966] představili výčet hrozeb kauzality,
které lze více či méně eliminovat vhodným výzkumným designem či
posléze statistickou kontrolou. Stejně jako Trochim [2000] je budeme
nazývat hrozby interní validity pro jednoskupinové designy, tedy pro
výzkumné designy, které postrádají kontrolní skupinu.
1. Historie. V průběhu trvání programu není jeho účastník v izolaci, ale
je vystaven působení mnoha faktorů, které ho směřují stejným směrem
jako program. Historie tedy představuje hrozbu, kdy se v průběhu programu
APZ vyskytne u participantů faktor, který ovlivní jejich výsledek
po programu a výzkumník chybně vliv tohoto faktoru považuje za
vliv programu. V případě APZ by se například mohlo jednat o skutečnost,
že by uchazeč souběžně absolvoval i jiný program, který by zvýšil
jeho šanci na nalezení zaměstnání, popřípadě by například získal práci
přes svého známého.
2. Zrání. V  průběhu programu čas nestojí a  v  účastníkovi dochází
k přirozeným procesům. Jedná se o situaci, kdy proces běhu času má
vliv na výsledek. Participant se například může právě nacházet v období,
kdy je již obvyklé, že si uchazeč najde práci, a tudíž by si ji našel
i bez programu. Alternativně, uchazeč se postupem času může stávat
zkušenějším v hledání práce.
Evaluační výzkum92
3. Testování. Ověřování stavu indikace měřeného cíle pomocí testu má
svá úskalí. Hrozba testování je aktuální tehdy, když pro zjištění situace
účastníka před programem, například jeho schopností práce s  počítačem,
je použit test, který následně ovlivňuje účastníkovy výsledky,
když je po skončení programu testován, zda se jeho schopnosti zlepšily.
V případě, že je test stejný, může se účastník test naučit, popřípadě ho
první test může motivovat k tomu, aby v druhém testu dosáhl lepšího
výsledku. V  obou případech by na změnu výsledku neměl vliv program,
ale vnější faktor.
4. Instrumentace. S  procedurou testování je spojená i  další hrozba
interní validity. Jedná se o  hrozbu, která je opět přítomna, užije-li
výzkumník alespoň dvou testů měření participantových schopností,
nejčastěji před zahájením programu a po jeho ukončení, a to v případě,
kdy dojde ke změně měřicích nástrojů, popřípadě změně výzkumníka,
posuzujícího situaci na základě rozhovoru, pozorování nebo jiné metody.
V případě programu APZ se může jednat o situaci, kdy například
dojde ke změně lektorů a hodnocení bude ovlivněno jejich subjektivními
a vzájemně se lišícími metodami.
5. Regrese k průměru. Vybere-li výzkumník účastníky programu na základě
jejich extrémního výsledku (například podprůměrného) v úvodním
pretestu, je pravděpodobné, že při dalším měření (po programu) si
polepší pouze na základě pravděpodobnostních zákonitostí; extrémní
výsledky budou mít tendenci se stávat méně extrémními, nikoli však
na základě programu.
6. Mortalita. Může se stát, že v  průběhu programu bude z  různých
důvodů docházet k  systematickému úbytku participantů. V  situaci,
kdy nezaměstnaní nejsou k účasti v programu dostatečně motivováni
nebo jejich motivace poklesne, může dojít k tomu, že ti méně přesvědčení,
odhodlaní či méně motivovaní program opustí. Pokud ale míra
odhodlání ovlivňuje i výsledek na trhu práce, pak bude výsledek celé
skupiny bez účastníků, kteří se rozhodli odejít, vychýlen směrem nahoru
– bude pozitivnější, a to bez přičinění programu.
935 Evaluace dopadu
5.4 Jednoskupinové designy
Jednoskupinové designy jsou typicky dva. Prvním je nejjednodušší
design vůbec, kdy změříme účastníky programu po jeho skončení
(X O), přičemž předpokládáme, že poprogramový stav je výsledkem
programu. Tento výsledek můžeme přirovnat k určitému kritériu naplnění
cíle programu. Tento design však neodpovídá naší úvodní definici
impaktu, neboť postrádá referenční měření a ve svém důsledku se tak
jedná pouze o zhodnocení výsledku. Design je také citlivý na všechny
jednoskupinové hrozby interní validity.
Druhým jednoskupinovým designem je pretest-posttest design
(také známý jako pre-post srovnání, před-po estimátor, before-after
estimátor [BAE]). Tento přístup porovnává výsledek účastníků před
programem a  po programu, kdy jako kontrolní skupinu využívá samotné
participanty před programem. Hlavním identifikačním předpokladem
této metody je, že pozorovaný výsledek participantů před
programem je stejný jako kontrafaktuální výsledek participantů po
programu, kdyby ho byli bývali neabsolvovali. Stav participantů před
programem tedy slouží jako aproximace jejich kontrafaktuálního stavu
po programu. Průměrný efekt programu na účastníky je pak odhadnut
jako rozdíl mezi stavem participantů po programu a před programem
[Hujer et al. 2004: 144]. Platnost tohoto předpokladu závisí zejména
na několika okolnostech. Zaprvé, anticipace (očekávání) programu nesmí
ovlivnit výsledek budoucích participantů před programem. Tato
hrozba je označována jako Ashenfelterův pokles [Hujer et al. 2004:
145], kdy aktivita v  hledání zaměstnání budoucích účastníků programu
může kvůli anticipaci programu poklesnout a  efekt programu
tak bude nadhodnocen o míru poklesu v předprogramové fázi (jedná
se o  tzv. sociální hrozbu interní validity, kterou si představíme dále).
Za druhé, platnost tohoto předpokladu je citlivá vůči jakýmkoli faktorům
měnícím se v čase mezi pretestem a posttestem (hrozba historie)
a všem ostatním jednoskupinovým hrozbám interní validity. Je-li
například národní ekonomika před programem v  recesi a  v  průběhu
programu se dostane do expanze, bude tento efekt chybně pokládán
za efekt programu. Tento estimátor je s ohledem na náročnost měření
výhodný, neboť nevyžaduje kontrolní skupinu, což se ovšem „vyruší“
tím, že vyžaduje longitudinální data v podobě dvou měření u skupiny
účastníků (ačkoli jsou případy, kdy hodnota pretestu je jasná – např.
Evaluační výzkum94
hodnota pretestu je = 1 / není = 0 zaměstnán v případě měření impaktu
rekvalifikace na získání práce u  uchazečů o  zaměstnání je implicitně
0). V  závislosti na úrovni měření (kategorická vs. kardinální) závisle
proměnné volíme pro tento design buď párové porovnání proporcí (ať
již pomocí binomického testu nebo uměle pomocí „párového t-testu
pro proporce“) nebo párové porovnání průměrů pomocí párového
t-testu. Oproti předchozímu designu má tento výhodu, že již disponuje
referenčním měřením, čímž naplňuje definici impaktu.
5.5 Víceskupinové designy
Pokud opustíme designy s pouhou jednou skupinou, pak všechny tyto
hrozby eliminujeme pouhou existencí kontrolní / srovnávací skupiny
(tedy pouze prostřednictvím vhodného designu), ovšem pouze za
předpokladu, že vytvořená kontrolní skupina je s experimentální srovnatelná.
Jinými slovy, čím více budou rozdíly mezi skupinami vybalancovány
(skupiny si budou z hlediska distribuce určité proměnné rovny,
například stejné vzdělanostní složení obou skupin), tím lépe. Vybalancovat
rozdíly mezi skupinami lze prostřednictvím náhodného výběru,
náhodného rozdělení do experimentální a kontrolní skupiny (což není
totéž jako náhodný výběr, což si vysvětlíme později) nebo dodatečně
pomocí metody párování, popřípadě částečně statistickou kontrolou.
Pokud tedy skupiny nejsou srovnatelné (jsou selektivní), je design
citlivý na tzv. víceskupinové hrozby interní validity, což jsou jednak
jednoskupinové hrozby, které se ovšem u skupin „nevykrátí“, neboť nejsou
shodné u obou skupin, a nelze tedy u obou z nich očekávat stejný
efekt hrozby, nýbrž míra hrozby je pro každou skupinu různá. Jsou to
tedy hrozby působící spolu se selekcí. Například hrozba selekce-historie
znamená, že obě skupiny měly svou vlastní historii, kupříkladu že
nový zaměstnavatel, který vstoupil na trh práce, je specializovaný na
výzkum a potřebuje pouze vysoce vzdělané uchazeče. Pokud je na tom
tedy experimentální skupina co se týče vzdělání lépe než kontrolní,
pak je hrozba v podobě nového zaměstnavatele přítomna pouze u experimentální
skupiny. Kromě interakce s jednoskupinovými hrozbami
však působí selekce samostatně ­– pokud jsou skupiny díky selekci
rozdílné ve skutečnostech, které ovlivňují výsledek programu, pak
všechny tyto rozdíly jsou hrozbou pro interní validitu. Například již
955 Evaluace dopadu
výše zmíněný rozdíl v úrovni vzdělání může působit samostatně tím,
že vzdělanější lidé mohou mít obecně lepší možnost uplatnění na trhu
práce, tedy získají práci i bez programu a bez nového zaměstnavatele.
Teď již k oné selekci podrobněji.
5.6 Efekty„selekce“
Problematika výběru účastníků programu je zásadní nejen s  ohledem
na možnost zobecňování výsledků mimo zkoumaný vzorek, ale
i  pro platnost výsledků uvnitř vzorku jako takovou. Selekce nastává
v  situaci, kdy se skupina participantů a  kontrolní skupina navzájem
odlišují v  charakteristikách, které ovlivňují výsledek po programu.
K  této odlišnosti obou skupin dochází z  mnoha důvodů. Za prvé je
to kvůli absenci randomizačního procesu, kdy nenáhodné přiřazení
do skupin nezajišťuje vybalancování rozdílností mezi skupinami. Za
druhé, v situaci, kdy výzkumník nemá kontrolu nad výběrem uchazečů
do programu, v kterém je účast na dobrovolné bázi (tzv. samovýběr),
kdy do programu mohou vstoupit uchazeči, kteří se domnívají, že
z programu budou mít největší prospěch nebo uchazeči, kteří jsou nejvíce
motivovaní. Třetí příčinou rozdílnosti experimentální a kontrolní
skupiny může být existence určitých výběrových kritérií pro přijetí do
programu, která souvisí s  úspěšností programu (např. výběr nejvíce
znevýhodněných nezaměstnaných).
Ve všech těchto případech je účast v programu determinována další
proměnnou (např. motivací), která je zároveň korelována i  s  výsledkem
programu. Odlišnost skupin pak způsobí odlišnost ve výsledku,
kterou výzkumník může mít tendenci přisuzovat efektu programu.
Eliminovat zkreslení z  důvodu odlišnosti skupin lze řešit vhodným
designem, ex-post prostřednictvím vhodné specifikace modelu nebo
vybalancováním rozdílů mezi skupinami za předpokladu velké velikosti
zkoumaného vzorku, který toto vybalancování umožňuje.
Efekty selekce lze rozlišovat podle toho, zda charakteristiky, které
ovlivňují výběr do programu jsou nebo nejsou výzkumníkem pozorovány.
Pokud jsou pozorovány (např. úroveň vzdělání), jedná se
o  selekci na základě pozorovaných proměnných (selection on observables).
V tomto případě se participanti a neparticipanti liší pouze na
základě pozorovaných proměnných a  nezkresleného efektu programu
Evaluační výzkum96
lze docílit relativně snadnou kontrolou efektů těchto proměnných jejich
zahrnutím do modelu. Pokud charakteristiky nejsou pozorovány
(např. úroveň motivace), jedná se o selekci na základě nepozorovaných
proměnných (selection on unobservables), kterou lze řešit opět vhodným
designem (viz DID estimátor nebo nespojitá regrese) nebo složitější
specifikací modelu (dvoufázové modely, např. Heckmanův model,
mimo obsah tohoto textu).
Již dříve jsme zmínili, že existuje rozdíl mezi náhodným výběrem
z populace (tzv. random sampling) a náhodným rozdělením účastníků
do experimentální a  kontrolní skupiny (random assignment, randomization).
Zde konečně nastal čas k  vysvětlení. Důvodem nutnosti
odlišení je, že obě procedury s  sebou nesou odlišné implikace, co
se validity výzkumu, týče. Náhodný výběr účastníků a  neúčastníků
programu představuje způsob výběru těchto skupin z populace nezaměstnaných
(např. na konkrétním úřadu práce) takovým způsobem,
aby tito vybraní nezaměstnaní co nejlépe reprezentovali populaci
nezaměstnaných na daném úřadu práce a  aby bylo možné výsledky
vzorku zobecňovat na populaci. Náhodný výběr tedy souvisí s externí
validitou, kdy chceme zjistit průměrný efekt participace (ATE). Na
druhou stranu, náhodné rozdělení tohoto výběru na účastníky a neúčastníky
slouží k vybalancování rozdílů mezi skupinami tak, aby rozdíl
mezi skupinami po programu mohl být přisouzen výhradně efektu
programu. Náhodné rozdělení tedy souvisí s  interní validitou, jinými
slovy snažíme se eliminovat hrozby interní validity vybalancováním
rozdílů mezi skupinami tak, aby případný rozdíl v  poprogramovém
výsledku bylo možné přisoudit jedinému faktoru, který je v  obou
skupinách odlišný, a  sice programu. Poté zjišťujeme průměrný efekt
na účastníky (AETT). Tak jako náhodný výběr vytváří obraz populace
v podobě vzorku, tak i náhodné rozdělení do skupin vytváří obraz experimentální
skupiny v podobě skupiny kontrolní. Vztah mezi interní
validitou a externí validitou je takový, že interní validita je předpokladem
externí validity, neboť nemá smysl generalizovat interně invalidní
výsledky. Externí validita nicméně není nutnou podmínkou interní validity.
Jinými slovy, je možné dosáhnout platných nezkreslených efektů
programu, aniž by byl program realizován na vzorku, který vzniknul
náhodným výběrem z populace. Pokud tedy vzorek není náhodný, pak
lze výsledky považovat za kauzálně validní, ale nelze je generalizovat
vně zkoumaného vzorku; výsledky jsou tedy platné maximálně pro
975 Evaluace dopadu
osoby se stejnými charakteristikami, které se vyskytovaly ve vzorku.
Můžeme tedy mít jak výsledky s  interní a  externí validitou (ideální
případ), výsledky s  jednou z  obou validit, nebo výsledky s  žádnou
validitou.
5.7 Průřezový estimátor
Prvním dvouskupinovým designem, který si představíme, je průřezový
estimátor neboli také statické srovnání skupin, static-group comparison,
cross-section estimátor (CSE) (s  různými pojmenováními se setkáváme
proto, že analýza impaktu je multidisciplinární a  názvosloví
se tedy v různých vědách a jazycích různí, třebaže jde o identickou záležitost).
Základní myšlenkou průřezového estimátoru je porovnat stav
participantů po programu s kontrolní skupinou neparticipantů ve stejném
čase. Neparticipanti slouží jako aproximace (nejbližší náhražka)
kontrafaktuality participantů. Přístup je založen na předpokladu, že
výsledek neparticipantů je stejný jako kontrafaktuální výsledek participantů,
kdyby se bývali programu neúčastnili. Efekt programu je pak
odhadnut na základě rozdílu mezi situací participantů po programu
a  neparticipantů ve stejném časovém bodě. Platnost předpokladu lze
zvýšit jeho podmíněním na pozorovaných charakteristikách (statistickým
„vybalancováním“, tedy dodatečnou statistickou kontrolou efektu
programu prostřednictvím jedné nebo více nezávislých proměnných,
které mohou mít vliv na výsledek programu). Jsou-li tyto charakteristiky
rozděleny v obou skupinách různě, neboť skupiny nebyly vybalancovány
randomizací, pak jejich statistickou kontrolou lze eliminovat
systematické rozdíly ve výsledcích. Nicméně, platnost předpokladu
i  tak závisí na nezávislosti participace na nepozorovaných faktorech
(např. motivace), které by zvýšily kontrafaktualitu participantů. Jinými
slovy, musí být platný předpoklad, že distribuce potenciálních výsledků
u  jinak obdobných nezaměstnaných je nezávislá na výběru uchazečů
do skupin [Hujer 2004:146].
Průřezový estimátor se používá v  neexperimentálních (průřezových)
šetřeních (statistické šetření), kdy nemáme kontrolu nad manipulací
s  nezávislou proměnnou (tedy intervencí) – nemáme kontrolu
nad tím, komu a kdy přidělit intervenci, pouze přijímáme data taková,
jaká jsou. Z  tohoto hlediska je administrativně nenáročný, díky exis-
Evaluační výzkum98
tenci kontrolní skupiny eliminuje jednoskupinové hrozby interní
validity a  implicitní eliminaci Ashenfelterova poklesu, neboť dochází
k  měření jen v  jednom časovém bodě. Na druhou stranu disponuje
všemi dvouskupinovými hrozbami interní validity, a to kvůli přítomnosti
selekce, která nebyla eliminována randomizací.
Co se týče statistické analýzy, tak lze použít t-test pro nezávislé
výběry, nicméně kvůli velké pravděpodobnosti selekce je bezpečnější
statisticky kontrolovat efekty matoucích proměnných, a  to buď prostřednictvím
analýzy kovariance (dále jen ANCOVA), nebo metody
nejmenších čtverců (dále jen OLS) regresní analýzy ve tvaru y = a + bx
s libovolným počtem kontrolních proměnných x, kde y je predikovaná
hodnota posttestu (poprogramového výsledku), první x v  pořadí je
dummy proměnná 1 = experimentální skupina a 0 = kontrolní skupina
a  koeficient beta u  této proměnné tedy představuje průměrný rozdíl
v hodnotě posttestu mezi experimentální a kontrolní skupinou. Pokud
zvolíme regresní model ve své základní podobě bez kontrolních proměnných,
pak výsledek bude identický s  výsledkem t-testu. Pokud je
závislá proměnná kategorické úrovně například ve tvaru „do jednoho
měsíce po skončení programu si našel práci = 1 nebo nenašel = 0“, pak
lze alternativně k t-testu použít rozdíly mezi proporcemi nebo podíly
šancí (odds ratios) v kontingenční tabulce. Pokud chceme navíc kontrolovat
efekty jiných proměnných jako v případě OLS regrese, pak použijeme
binární logistickou regresi. V případě základní podoby binární
regrese jsou efekty v podobě podílu šancí shodné s podíly šancí v kontingenční
tabulce. Pokud se nám podaří eliminovat hrozby selekce,
pak efekty, které jsme zmiňovali doposud představují průměrné efekty
programu na jeho účastníky (AETT), popřípadě průměrné efekty participace
(ATE), pokud by se jednalo o náhodně vybrané vzorky. Pokud
bychom ale chtěli znát distribuční efekty, pak je třeba přidat do regresních
modelů další kontrolní proměnnou a interakční člen. Pokud
bychom například chtěli znát distribuční efekt programu pro muže
a  ženy, je třeba formulovat například model OLS regrese do podoby
y = a + b1
(x1
) + b2
(x2
) + b3
(x1
∙ x2
), kde x2
představuje pohlaví (1 = muž,
0 = žena) a x1
∙ x2
interakční člen mezi programem a pohlavím, zachycující
různost velikosti impaktu programu v závislosti na pohlaví. Velikost
distribučního efektu programu pro muže představují koeficienty
b1
+ b3
, velikost distribučního efektu programu pro ženy koeficient b1
a koeficient b3
představuje relativní rozdíl efektu programu pro muže
995 Evaluace dopadu
v  porovnání s  ženami. Ekvivalentně by se postupovalo v  případě binární
logistické regrese.
Průřezový estimátor lze vylepšit a  design nahradit větší kontrolou
nad rozdělením intervence do skupin pomocí randomizace nebo dodatečným
statistickým napárováním účastníků a neúčastníků tak, aby
tvořili, co se charakteristik ovlivňujících účast v programu i jeho efekt
týče, co nejpodobnější páry.
5.8 Experimentální design s posttestem
První zmíněný design se nazývá experimentální design s  posttestem,
nebo také posttest-only control group design. Design je ideální pro
řešení jednoskupinových i  dvouskupinových hrozeb interní validity
a navíc je jednodušší než pravý experiment, který vyžaduje navíc pretest
experimentální i kontrolní skupiny. Náhodný proces rozdělení do
skupin je užitečný z  hlediska elimininace hrozby selekce, na druhou
stranu s sebou přináší riziko přítomnosti nových hrozeb – rizika randomizace
a substituce.
	1)	Zkreslení z  důvodu randomizace (randomization bias) Jedná se
o situaci, kdy nezaměstnaní s nízkou averzí vůči riziku, kteří by
se jinak v režimu bez náhodného rozdělení o program ucházeli, si
v randomizačním režimu rozmyslí uchazečství o program, neboť
raději zvolí jistější alternativy. Osoby s nízkou averzí tak mohou
být z  programu eliminovány a  skupiny participantů se budou
v obou režimech lišit – jedná se o hrozbu randomizačního zkreslení
[Heckman, Smith 1996: 49], [Heckman et al. 1999].
	2)	Zkreslení z důvodu substituce (substitution bias) Jedná se o situaci,
kdy neúspěšní uchazeči, kteří nebyli do programu vybráni, zvolí
alternativní (náhradní) program. Výsledky kontrolní skupiny
pak nebudou rovny výsledkům v  situaci bez programu, a  proto
nemůže být kontrolní skupina užita jako vhodná aproximace
kontrafaktuality participantů.
Pokud se nám však podaří tyto hrozby eliminovat, popřípadě formulujeme
adekvátní předpoklady pro jejich eliminaci, pak lze na tento
design využít jednoduchý t-test pro nezávislé výběry a  komplexnější
Evaluační výzkum100
statistickou kontrolu nepotřebujeme, neboť randomizace vykonala
práci za nás. Pro dodatečnou kontrolu případných zbytkových rozdílů
nevybalancovaných randomizačním procesem můžeme postavit regresní
model s kontrolními proměnnými, nicméně jejich efekt by měl
být marginální a  rozdíl mezi efektem programu zjištěným t-testem
a regresí tudíž zanedbatelný.
5.9 Posttest design s napárovanou kontrolní skupinou
V  pořadí druhým uvedeným vylepšením průřezového estimátoru je
posttest design s napárovanou kontrolní skupinou. Základní myšlenkou
tohoto přístupu je najít mezi neúčastníky takové nezaměstnané, kteří
jsou co nejvíce podobní participantům ve všech relevantních pozorovaných
předprogramových charakteristikách (např. věk, vzdělání, délka
evidence atd.) [Hujer 2004: 147]. Efekt programu je pak definován jako
rozdíl v poprogramovém výsledku mezi participanty a kontrolní skupinou
za předpokladu, že skupiny jsou stejné na základě pozorovaných
předprogramových charakteristik. Konstrukce kontrolní skupiny skrze
párování je založena na předpokladu, že pro individua se stejnými relevantními
charakteristikami ovlivňujícími jak výsledek programu, tak
participaci v programu, bude distribuce jejich potenciálních výsledků
stejná, bez ohledu na to, zda byli vybráni do programu, nebo ne [Heckman,
Smith 1996: 68]. Na rozdíl od průřezového estimátoru bere tedy
tato procedura v  potaz proměnné, které ovlivňují pravděpodobnost
participace v  programu, a  to takovým způsobem, že tyto proměnné
vstupují již do samotné konstrukce párů. Předpokladem je, že pro každého
participanta existuje neparticipant se stejnými charakteristikami,
aby mohli vytvořit pár. Pro každou kombinaci hodnot nezávislých
proměnných je pak spočítán rozdíl mezi participanty a neparticipanty
a efekt programu je odhadnut jako vážený průměr těchto rozdílů. Platnost
tohoto předpokladu se snižuje s rostoucí dimenzialitou proměnných
a s tím souvisejícím počtem kombinací hodnot (buněk). Pokud
je počet proměnných a dimenzí takový, že přesné párování na základě
příslušnosti k buňce není možné, je vhodné alternativně použít například
tzv. „propensity skóre“, které shrnuje informaci z  pozorovaných
proměnných do jednoho indexu, indikujícího pravděpodobnost participace
v  programu na základě předprogramových pozorovatelných
1015 Evaluace dopadu
charakteristik [Hujer 2004: 147]. Tento způsob konstrukce párů probíhá
například tím způsobem, že na základě nezávislých proměnných
prostřednictvím binární logistické regrese predikujeme pravděpodobnost
účasti v  programu a  párujeme k  sobě účastníky a  neúčastníky
se stejnou nebo nejbližší pravděpodobností (tzv. exaktní párování vs.
párování nejbližšího souseda). Pro zjištění efektu programu pak se již
neporovnávají všichni účastníci se všemi neúčastníky, ale pouze jejich
podskupina, která byla napárována. Pro měření impaktu lze opět použít
t-test a OLS, popřípadě logistickou regresi.
Pokud bychom rozšířili měření o pretesty obou skupin, pak se jedná
buďto o DID estimátor nebo pravý experiment, a to v závislosti na tom,
zda skupiny byly vybrány samovýběrem (DID estimátor), nebo zda
byl jejich výběr pod kontrolou prostřednictvím randomizace (pravý
experiment).
5.10 DID estimátor
DID estimátor (neboli difference in difference – tedy „rozdíl v  rozdílu“)
vyžaduje stejně jako BAE longitudinální (konkrétně panelová)
data a  může být vnímán jako jeho rozšíření. DID porovnává změny
mezi předprogramovým a  poprogramovým stavem u  participantů
se změnami ve stejném časovém období u  neparticipantů. Metoda je
založena na dvou předpokladech. Za prvé, změna ve výsledku mezi
předprogramovou a  poprogramovou fází je u  neparticipantů stejná
jako kontrafaktuální změna u  participantů, kdyby se programu nezúčastnili.
Druhým identifikačním předpokladem je neměnnost selekčních
efektů v  čase. Jinými slovy, zkreslení daná nepozorovanými
proměnnými zůstávají v čase stejná jak před, tak po programu, takže
posouzením rozdílu se jejich efekt eliminuje. Výhodou DID estimátoru
je citlivost vůči nepozorovaným zkreslením, nevýhodou naopak citlivost
vůči Ashenfelterovu poklesu.
Nejjednodušším způsobem statistické analýzy je spočítat novou
proměnnou v  podobě rozdílu v  závislé proměnné mezi pretestem
a  posttestem (tzv. gain scores neboli „přírůstky“) a  následně porovnat
velikosti těchto „přírůstků“ mezi účastníky a neúčastníky pomocí
t-testu pro nezávislé výběry. Následně je možné dodatečně eliminovat
efekty jiných faktorů pomocí analýzy ANCOVA. Druhý způsob jak
Evaluační výzkum102
udělat totéž je pomocí OLS regresního modelu y = a + b1
(x1
) + b2
(x2
) +
+ b3
(x1
∙ x2
), kde x1
představuje experimentální vs. kontrolní skupinu,
x2
představuje čas 1 vs. 0 a b3
je pak DID estimátor (rozdíl v rozdílu
mezi pretestem a  posttestem u  účastníků a  neúčastníků). Tento interakční
efekt v OLS regresním modelu má stejnou velikost jako DID
estimátor zjištěný pomocí t-testu, pokud nezahrneme další kontrolní
proměnné. Za třetí je možné použít model OLS y = a + b1
(x1
) + b2
(x2
),
kde rozdíl v hodnotě posttestu (y) mezi účastníky a neúčastníky programu
(x2
) je očištěn o  hodnotu pretestu (x1
). Případné rozdíly mezi
účastníky a neúčastníky v posttestu způsobené rozdílnostmi v pretestu
jsou tak eliminovány.
5.11 Nespojitá regrese
Posledním designem je nespojitá regrese. Nespojitá regrese (regression
discontinuity) představuje zvláštní formu designu. Výběr do
experimentální a  kontrolní skupiny v  tomto případě neprobíhá prostřednictvím
náhodného mechanismu, jak je tomu v případě pravého
experimentu, ale na základě nějaké kvantitativní proměnné. Výzkumník
stanoví na této proměnné hranici (např. hranice potřebnosti)
a lidé spadající pod hranici jsou přiděleni do experimentální skupiny,
zatímco lidé spadající nad tuto hranici poslouží jako skupina kontrolní.
Pokud je rozdělovací proměnná korelována s  poprogramovým
výsledkem, pak je účast v  programu automaticky s  tímto výsledkem
korelována také i v případě naprosté absence efektu programu. Tento
mechanismus tedy nezaručuje podobnost skupin co se týče charakteristik
majících vliv na poprogramový výsledek a  design se tak zdá
býti předurčen k podlehnutí hrozbě selekce. Nicméně prostřednictvím
zahrnutí efektu rozdělovací proměnné do modelu zajistíme nejen
kontrolu efektu proměnné samotné, ale i  eliminaci všech ostatních
relevantních zdrojů selekce a zajistíme tak nezkreslený efekt programu
na poprogramový výsledek. Pokud existuje nějaká společná příčina
participace a poprogramového výsledku kromě rozdělovací proměnné
(např. úroveň motivace) a  tato společná příčina v  modelu absentuje,
pak je její matoucí efekt eliminován skrze přítomnost rozdělovací proměnné.
Vliv části této matoucí proměnné, která je korelována s  rozdělovací
proměnnou, je absorbován (je obsažen) v  rozdělovací pro-
1035 Evaluace dopadu
měnné. Druhá část matoucí proměnné (respektive její vliv), která není
s rozdělovací proměnnou korelována, není korelována ani s intervencí,
jelikož intervenční proměnná je toliko podmnožinou rozdělovací proměnné.
V obou případech tak efekt programu na poprogramový výsledek
zůstává nezkreslen [Mohr, 1992].
Identifikačním předpokladem tohoto designu je však přísné rozdělení
do skupin pouze na základě rozdělovací proměnné (např. index
potřebnosti) tak, že lidé se stejnou hodnotou potřebnosti budou patřit
pouze do jedné ze skupin. Rozdělení do skupin na základě potřebnosti
představuje transparentní a z hlediska cílů sociální politiky relevantní
kritérium. Tento design je také citlivý na multikolinearitu a tuto skutečnost
je třeba brát v potaz při hodnocení efektu programu.
Nespojitou regresi lze namodelovat pomocí OLS modelu y = a  +
+ b1
x1
+ b2
x2
+ b3
(x1
− C) ∙ T, kde b2
představuje průměrný efekt programu
(rozdíl mezi úrovňovými konstantami účastníků a neúčastníků)
bez ohledu na hodnotu připisovací proměnné, a  b3
představuje míru
změny velikosti efektu v  závislosti na hodnotě připisovací proměnné
(rozdíl mezi sklony křivek účastníků a neúčastníků).
Kromě „klasických hrozeb“ interní validity známe i  tzv. sociální
hrozby interní validity [Trochim 2006], které se týkají především
dvouskupinových designů. Tyto hrozby jsou způsobené sociálními
interakcemi mezi zainteresovanými skupinami v  experimentu, ať již
se jedná o účastníky a neúčastníky nebo o implementátory programu,
a nemožností od sebe tyto zainteresované skupiny navzájem „izolovat“.
Při evaluaci impaktu je zapotřebí mít je na paměti a pokusit se jim předejít;
pokud má výzkumník možnost aktivně se účastnit realizace programu,
nelze je však eliminovat pomocí designu ani statisticky ad hoc.
1. Hawthornský efekt. Tento efekt spočívá v  tom, že účastníci naváží
s realizátory programu vztah a chovají se způsobem, který se domnívají,
že je experimentátorem očekáván [Mohr 1992: 64]. Výsledky
v poprogramové fázi tak nemusejí být způsobeny obsahem programu,
nýbrž jeho psychologickým efektem.
2. Difuze / Imitace. Efekt difuze nastává tehdy, když srovnávací skupina
neúčastníků se nějakým způsobem dozvídá informace týkající se
obsahu programu od experimentální skupiny – dochází tak k  difuzi
obsahu mezi skupinami. Srovnávací skupina může také na základě
Evaluační výzkum104
Tabulka 5.1 Designy a jejich odolnost vůči ohrožením interní validity
Design Zdroj ohrožení interní validity
Histo-
rie
Zrání Testo-
vání
Instru-
mentace
Regrese
k prů-
měru
Selek-
ce
Mor-
talita
Jednoskupinový pretest
– posttest design (BAE)35
O X O
− − − − ? + +
Průřezový estimátor
(CSE)36
X O
X O
+ ? + + + − −
Experimentální design
s posttestem37
R X O
R X O
+ + + + + + +
DID estimátor38
O X O
O X O
+ + + + ? + +
Experimentální design
s pretestem i posttestem39
R O X O
R O X O
+ + + + + + +
Nespojitá regrese
A X O
A X O
+ + + ? + + ?
Posttest design s napárovanou
kontrolní skupinou
M X O
M X O
+ + + + + + +
Zdroj: Upraveno autorem z Campbell, Stanley 1966.
Legenda: O = měření, X = intervence (experiment); R = náhodné rozdělení do skupin, A = rozdělení
do skupin na základě připisovací proměnné; M = ad hoc vytvoření párů; + / − = hrozba je /
není eliminována.
35
Též známý jako pre-post srovnání, před-po estimátor, before-after estimátor (BAE).
36
Též statické srovnání skupin, static-group comparison, cross-section estimátor (CSE).
37
Též post-test only control group design.
38
Též difference-in-difference, non-equivalent control group design, kvasiexperimentální
design s neekvivalentními skupinami.
39
Též pretest-posttest control group design.
1055 Evaluace dopadu
znalostí o  obsahu programu vytvořit vlastní svépomocnou skupinu
a imitovat tak program experimentální skupiny. Může tak dojít k vyrovnání
poprogramového rozdílu mezi skupinami skrze změnu výsledku
u srovnávací skupiny a efekt programu tak může být obtížněji
identifikován.
3. Rivalita. Toto zkreslení nastává v situaci, kdy skupina neúspěšných
kandidátů do programu „závidí“ program účastníkům a může tak dojít
k rivalitě mezi skupinami, kdy se srovnávací skupina snaží experimentální
skupině vyrovnat. Měření srovnávací skupiny v  poprogramové
fázi tak může být nadhodnoceno, čímž se rozdíl mezi skupinami smazává
a efekt programu je těžko identifikovatelný.
4. Demoralizace. Tento efekt je opačný k předchozímu efektu. Namísto
rivality je však skupina neúčastníků demotivována, což může mít za
následek ochabnutí úsilí v  hledání práce. V  tomto případě by došlo
k  ještě větší rozdílnosti mezi výsledky obou skupin než v  případě
absence efektu. Došlo by tedy k  vychýlení efektu programu směrem
nahoru.
5. Ashenfelterův pokles. Ashenfelterův pokles představuje situaci, kdy
se těsně před participací v  programu situace budoucích participantů
na trhu práce zhorší. Tato situace může nastat například v  případě,
kdy budoucí účastník programu poleví v aktivitě hledání práce, neboť
anticipuje, že brzy nastoupí do programu. V  důsledku se pravděpodobnost
nalezení zaměstnání sníží. Pretestovaná situace na trhu práce
je tak pro účastníka horší než skutečná situace při absenci poklesu.
V závislosti na míře pozitivity efektu programu pak může výzkumník
dojít k závěru, že je efekt programu větší, než ve skutečnosti je, popřípadě
že efekt programu je pozitivní, i když ve skutečnosti není žádný.
Tento problém je skutečným problémem pouze v situaci, kdy se jedná
o  dočasný pokles, při němž dojde k  rehabilitaci situace v  průběhu
programu. V případě permanentního poklesu by totiž pokles ovlivnil
jak fázi předprogramovou, tak fázi poprogramovou a  nedošlo by ke
zkreslení programového efektu [Hujer 2004: 145].
Evaluační výzkum106
5.12 Statistická významnost dopadu
Jako přidruženou informaci k  velikosti programového impaktu dostáváme
statistickou signifikanci naměřeného výsledku. Standardně
má tato informace za cíl určit pravděpodobnost naměřené velikosti
impaktu za předpokladu, že impakt (ATE) je ve skutečnosti nulový
– eliminuje nám tedy efekt náhodné příčiny získaného impaktu jakožto
jednoho z možných matoucích faktorů. Tato funkce je nicméně
užitečná pouze při splnění podmínky náhodného výběru a náhodného
rozdělení kontrolní a experimentální skupiny. V těchto případech totiž
existuje vysoká pravděpodobnost, že právě náhoda je jediným možným
rušivým elementem při měření impaktu, neboť všechny ostatní
potenciální „rušiče“, jako například selekce, jsou eliminovány. Pokud
nám ovšem chybí náhodný mechanismus výběru z  populace, pak
i  rozdělení pravděpodobností výběrové distribuce je neznámé a  hodnota
pravděpodobnosti získaná statistickým testem není interpretovatelná
standardním způsobem. Jeho funkce je pouze informativní
a  konstruktivní. Kromě náhody je totiž v  těchto situacích třeba brát
v  potaz všechny ostatní rušiče. Pokud tedy naměříme „nenáhodný
efekt“, jeho zdrojem může být kromě programu samotného i jakákoli
hrozba validity. Pokud naopak naměříme efekt, jehož zdrojem může
být s  velkou pravděpodobností náhoda, pak je možné, že ve skutečnosti
efekt existuje, je však překryt některou z hrozeb validity. Signifikantní
efekt je tedy v případě absence nenáhodného výběru zapotřebí
vnímat kontextuálně.
5.13 Příklad z praxe
Příkladem evaluace impaktu sociálního programu v českém prostředí
může být evaluace impaktu aktivní politiky zaměstnanosti České republiky
v  roce 2007 [Kulhavý, Sirovátka 2008]. Autoři sledují impakt
různých aktivizačních politik (např. rekvalifikace, veřejně prospěšné
práce atd.) pomocí srovnání rizik nezaměstnanosti vybraných účastníků
každé politiky s vybranými neúčastníky v různých časových obdobích
po ukončení programu (po třicetidenních úsecích). Kontrolní
skupinu konstruují prostřednictvím párování, konkrétně metodou
exaktního párování pomocí „propensity“ skóre a  následnou analýzu
1075 Evaluace dopadu
impaktu provádějí již na takto „napárovaném“ vzorku. Pro analýzu impaktu
používají jednotlivé modely logistické regrese, kdy porovnávají
riziko nezaměstnanosti (1 = byl v evidenci vs. 0 = nebyl v evidenci po
určitém časovém období od konce programu u  účastníků, respektive
od referenčního bodu u neúčastníků) napárovaných účastníků a neúčastníků
„očištěné“ od potenciálních matoucích efektů několika kontrolních
proměnných (věk, zdravotní stav, vzdělání, délka nezaměstnanosti
atd.). Pro každé časové období po programu (jeden měsíc, dva
měsíce, tři měsíce až jeden rok) modelují logistickou regresi. Výsledkem
je, že pro každé časové období zjišťují autoři různě velké impakty
jednotlivých programů na zaměstnanost. Kupříkladu u  rekvalifikací
je impakt nejvyšší do tří měsíců od konce programu (účastníci mají
poloviční riziko nezaměstnanosti ve srovnání s neúčastníky), v dalším
průběhu je rozdíl mezi účastníky a neúčastníky zanedbatelný a impakt
je opět pozitivní až jeden rok po skončení programu [viz Kulhavý, Sirovátka
2008: 48]. Tyto impakty korespondují s AETT efektem a jedná
se tedy o průměrný efekt programu na konkrétní strukturu účastníků.
Z hlediska designu se jedná o post-test design s napárovanou kontrolní
skupinou, který je realizovaný ve více časových bodech a  je stabilní
vůči všem „klasickým“ hrozbám interní validity. Díky nenáhodnému
rozdělení do skupin je odolný i vůči hrozbám spjatým experimentními
designy. Možný efekt selekce na základě nepozorovaných proměnných
je eliminován implicitním pretestem, kdy účastníci i neúčastníci jsou si
před programem rovni co se týče hodnoty závisle proměnné – všichni
jsou totiž nezaměstnaní.
5.14 Závěr
V této kapitole jsme si představili nástroje statistické analýzy, kterými
lze měřit dopad určitého sociálního programu. Z  přehlídky řady
ohrožení interní validity lze vyvodit, že ačkoli některé designy jsou
jednoznačně stabilnější než jiné, co se odolnosti vůči těmto hrozbám
týče, tak neexistuje žádný univerzálně ideální design a je tedy zapotřebí
vždy vnímat kontext, v kterém byl sociální program realizován. Může
také nastat situace, že evaluátor nemá žádnou kontrolu nad realizací
programu a výběr evaluačních designů a následně statistických metod
tak může být omezený. To však nezamezuje evaluátorovi použít nej-
Evaluační výzkum108
lepší možné nástroje za daných podmínek, neboť i jednoduchá evaluace
s vědomím možných nedostatků a z nich plynoucích zkreslení, je
lepší než evaluace žádná.
Literatura
Campbell, D. T., J. C. Stanley. 1966. Experimental and Quasi-experimental Designs
for Research. Chicago.
Hatry, H. P. 1999. Performance Measurement: Getting Results. The Urban Institute
Press.
Heckman, J. J., R. J. Lalonde, J. A. Smith. 1999. “The Economics and Econometrics
of Active Labor Market Programs.” Handbook of Labor Economics, Volume 3,
Ashenfelter, A. and D. Card, eds., Amsterdam: Elsevier Science.
Heckman, James J./Jeffrey A. Smith. 1996. “Experimental and nonexperimental
evaluation.” In: Schmid, G., O´Reilly, J., Schomann, K. International Handbook
of Labor Market Policy and Evaluation. Cambridge: Cambridge University Press.
Hujer, R., M. Caliendo, D. Radic. 2004. „Methods and Limitations of Evaluation
and Impact Research.“ In: Descy, P., M. Tessaring. (eds.) The Foundations of
Evaluation and Impact Research: Third Report on Vocational Training Research
in Europe: Background Report. Luxembourg: Publications Office (Cedefop
Reference Series, 58), 131–190.
Khandker, S. R., G. B. Koolwal, H. A. Samad. 2010. Handbook on Impact
Evaluation: Quantitative Methods and Practises. New York: The World Bank.
Kluwe, J. 2005. Study of Effectiveness of ALMPs. Essen: RWI.
Kulhavý, V., T. Sirovátka. 2008. Hodnocení efektivity programů APZ a doprovodných
nástrojů a projektů politiky zaměstnanosti v roce 2007. Praha: VÚPSV.
Mohr, L. B. 1992. Impact Analysis for Program Evaluation. Newbury Park: Sage.
Rossi, P. H., H. E. Freeman, M. W. Lipsey. 2003. Evaluation: A Systematic Approach.
Newbury Park: Sage Publications.
Trochim, W. M. The Research Methods Knowledge Base. 2nd Edition. Internet
WWW page, at URL: <http://www.socialresearchmethods.net/kb/> (version
current as of October 20, 2006).
Viertel, E., S. P. Nielsen, D. L. Parkes, S. Poulsen. 2004. “From Project to Policy
Evaluation in Vocational Education and Training – Possible Concepts and
Tools. Evidence from Countries in Transition.“ In: Descy, P., M. Tessaring.
(eds.) The Foundations of Evaluation and Impact Research: Third Report on
Vocational Training Research in Europe: Background Report. Luxembourg:
Publications Office (Cedefop Reference Series, 58), 191–236.
109Závěr
ZÁVĚR
Martin Žižlavský
Motto: „Veškerá zkušenost však ukazuje, že věda je příliš jemné řemeslo,
než aby bylo možno naučit se mu z příručky či učebnice, byť
sebesystematičtější. Skutečného pokroku tu lze dosáhnout jen dlouholetým
výcvikem, trpělivou vlastní prací a postupným získáváním
zkušeností.“ [Možný, Rabušic 1989: 3]
Přestože tato kniha není ani příručkou ani učebnicí, po jejím přečtení
čtenář už ví, že studium písemně zprostředkovaných vědomostí stačí
k ovládnutí evaluačního výzkumu pouze na nováčkovské úrovni. Čtenář
tuší, že ovládnutí aplikace metod a  technik výzkumu v  evaluaci
programů na vyšších úrovních vyžaduje vědomosti nesdělitelné textem,
vědomosti nabývané spíše vlastní zkušeností s různými evaluačními
situacemi.
Evaluační situace jsou rozrůzňovány v několika rovinách. Srozumitelně
lze tyto roviny ukázat pomocí pomyslných otázek, jejichž odpovězení
umožňuje započetí určitého evaluačního výzkumu.
	 1.	Pro koho jsou informace určeny a kdo bude poznatky používat?
	 2.	Jaký druh informací je potřeba?
	 3.	Jak budou informace použity? Za jakým účelem bude evaluace
vykonána?
	 4.	Kdy jsou informace potřeba?
	 5.	Jaké zdroje jsou dostupné k vykonání evaluace?
	 6.	Jaké metody jsou vhodné s  ohledem na odpovědi na výše uvedené
otázky? [Patton 1990: 12]
Z počtu a věcné povahy otázek plyne mnoho možných variant evaluační
situace, v níž evaluátor řeší úkol adekvátní aplikace metod a technik
výzkumu, a  to výčet otázek neukazuje okolnosti, které se vynoří
až při samotném evaluačním výzkumu. Aplikace metod a  technik
adekvátní evaluační situaci pak není samozřejmá a  standardizovaná
předpisem. Volba příhodné metody a  techniky je do jisté míry věcí
Evaluační výzkum110
objektivního standardu a do jisté míry věcí umění, zkušené volby. Tato
míra se liší například v jednotlivých programových stadiích. Evaluace
dopadu (viz kapitola 5) využívá více méně standardizovaných postupů,
které zároveň nastavují meze požadavkům ostatních subjektů zainteresovaných
na hodnoceném programu, takže evaluátor čelí při aplikaci
metod a  technik výzkumu relativně předvídatelné a  kontrolovatelné
evaluační situaci. Evaluátor nemusí v  takové míře spoléhat na svoje
situační zkušenosti a může se opřít o nesituační předpis, kdežto mnohost
použitelných metod a technik jak standardizovaných, tak nestandardizovaných,
a  jejich nesamozřejmá volba vystavují evaluátora při
procesní evaluaci (viz kapitola 4) situaci, kdy adekvátní aplikaci metod
a technik výzkumu řeší především pomocí svých situačních zkušeností
a méně pomocí nesituačních předpisů.
Evaluační výzkum je odborná lidská činnost. Odbornost se tu
váže na vědomosti a  dovednosti. Vědomosti člověk nabývá studiem
teorie a  dovednosti člověk nabývá tréninkem v  rozličných situacích.
Skutečný evaluátor expert disponuje kromě znalostí různých teorií
situačním citem pro aplikaci metod a  technik výzkumu v  rozmanitých
evaluačních situacích. Ovšem k  expertní dovednosti evaluace
programů vede dlouhá cesta, jejíhož konce dosáhne jen několik z těch,
kteří se na ni vydali. A právě pro ty, kteří stojí na začátku cesty, napsali
autoři tuto knihu. Pokud tato kniha napomůže čtenáři k postupnému
osvojení aplikace metod a technik výzkumu příhodné dané evaluační
situaci, potom splnila svůj účel.
Literatura
Možný, I., L. Rabušic. 1989. Úvod do metodologie vědy pro sociology. UJEP: Brno.
Patton, M. Q. 1990. Qualitative Evaluation and Research Methods. SAGE: Newbury
Park.
111Jmenný rejstřík
Gelmon – 64, 65, 68–71, 74
George – 21
Ginzberg – 28
Hatry – 72, 86 ,87
Heckman – 87, 96, 99
Hooper – 32
Hora – 68–70, 76
Horák – 66, 69, 74
Horáková – 66, 69,
Hsieh – 46
Huber – 13, 33
Hughes – 64
Hujer – 83, 87, 97, 100, 101, 105
Chen – 12, 43–45, 53, 64–70, 72–75
Jahoda – 28
Jordan – 29, 34,
Jorgensen – 33
Joshi – 65, 70, 71
Jumper – Thurman – 30, 31
Kay – 36
Kelly – 31
Kennedy – 64
Khandker – 90
Kitsuse – 30, 31
Klimplová – 63
Kluwe – 87
Krippendorff – 46, 47, 55
Kuchařová – 30
Kulhavý – 106, 107
Lazarsfeld – 28
Levitas – 29
JMENNÝ REJSTŘÍK
Anderson – 32
Armingeon – 18
Athanasiou – 13, 14
Bareš – 44–53, 59
Berger – 20
Black – 64
Blumer – 17, 18, 20–22, 30, 31
Bonoli – 18, 21, 32,
Bradshaw – 30
Brannick – 34
Campbell – 90, 91, 104
Carl – 17, 21, 24, 26
Cartwright – 21, 25, 27, 32
Clarke – 11, 15
Clasen – 29
Clegg – 29
Coghlan – 34
Collins – 19
Colman – 70
Coser – 19
Daguerre – 30, 31
Dreyfus – 13
Durant – 18
Edwards – 30, 31
Egbert – 70
Evans – 65, 70, 71
Finch – 30
Flyvbjerg – 13
Foucek – 64, 65, 68, 71–73
Freeman – 11, 23–26
Frechtling – 64, 65, 68
Evaluační výzkum112
Lipsey – 11, 22, 23, 25–27, 29, 32
Longworth – 32
Luckmann – 20
Lyotard – 19–22
Maguire – 21, 25, 27, 32
Manhood – 72, 75
Mareš – 53, 56–59
Mayring – 46
Merton – 19
Meyer – 32
Mills – 17, 18, 24
Mohr – 103
Možný – 109
Navrátil – 17, 18
Neuman – 29
Patton – 64, 69, 70, 73, 74
Phillips – 33
Plested – 30, 31
Polanyi – 15
Rabušic – 109
Ragin – 55
Rákoczyová – 52–58
Rein – 21
Rossi – 85, 87
Rowlingson – 29
Říchová – 55
Shannon – 46
Shaw – 71, 74
Schön – 21
Sirovátka – 53, 56–59
Skříčková – 45, 46, 51
Smith – 87, 99, 100
Smutek – 11
Soukup – 76
Spector – 30, 31
Stanley – 90, 91, 104
Stephens – 33
Suchanec – 68, 70, 76
Svobodová – 30
Taylor – Gooby – 18
Trochim – 91, 103
Van Dijk – 24, 33
Veselý – 17, 18, 21–25, 27
Viertel – 87
Waterbury – 64, 65, 67, 68, 70–74
Wilding – 21
Winkler – 63, 65, 75
Zaisel – 28
Žižlavský – 63
Ondřej Hora, Miroslav Suchanec a Martin Žižlavský
EVALUAČNÍ VÝZKUM
Redakční práce Lucie Mořkovská
Jazyková korektura Zuzana Kačerová
Grafická úprava Kateřina Granátová
V roce 2014 vydala Masarykova univerzita,
Žerotínovo nám. 617/9, 601 77 Brno, www.muni.cz
1. vydání, 2014
www.spsp.fss.muni.cz
www.muni.cz/fss/research/projects/17424
ISBN 978-80-210-6887-2
Publikace vychází v rámci projektu Internacionalizace,
inovace, praxe: sociálně-vědní vzdělávání pro 21. století,
CZ.1.07/2.2.00/28.0225.
Autoři se v knize zabývají aplikací výzkumných metod a technik při
evaluaci sociálních programů. Kladou důraz na situační rozměr této
aplikace. Aplikace je ukázána při evaluacích různých programových
stadií nebo aspektů programu: posouzení potřeb, program ve stadiu
plánování, program v implementačním stadiu a měření dopadů
programu.
O AUTORECH:
Ondřej Hora je odborným asistentem na Katedře sociální politiky
a sociální práce Fakulty sociálních studií Masarykovy univerzity. Výzkumně
se zabývá oblastí sociální politiky, a to především ve vztahu
k sociálnímu vyloučení, chudobě a nezaměstnanosti. Je vyučujícím
metodologických předmětů a předmětů tvorby diplomových prací
pro bakalářské a magisterské studium.
 
Miroslav Suchanec působí na FSS MU jako vyučující statistiky
a kvan­ti­tativního výzkumu a výzkumně se zabývá evaluací programů
aktivní politiky zaměstnanosti. Jeho obecnými profesními zájmy
jsou metodologie a statistika.
 
Martin Žižlavský je členem akademického sboru Fakulty sociálních
studií Masarykovy univerzity. Jeho pedagogická činnost pokrývá
oblasti ekonomiky sociálního státu a metod a technik výzkumu ve
veřejné politice a sociální práci. Výzkumně se zabývá zejména ekonomickou
a organizační stránkou sociálních programů.