EVALUAČNÍEVALUAČNÍ VÝZKUMVÝZKUM ONDŘEJ HORA, MIROSLAV SUCHANEC, MARTIN ŽIŽLAVSKÝ ONDŘEJHORA,MIROSLAVSUCHANEC,MARTINŽIŽLAVSKÝEVALUAČNÍVÝZKUM ISBN 978-80-210-6886-5 Publikace vychází v rámci projektu Internacionalizace, inovace, praxe: sociálně-vědní vzdělávání pro 21. století, CZ.1.07/2.2.00/28.0225. Autoři se v knize zabývají aplikací výzkumných metod a technik při evaluaci sociálních programů. Kladou důraz na situační rozměr této aplikace. Aplikace je ukázána při evaluacích různých programových stadií nebo aspektů programu: posouzení potřeb, program ve stadiu plánování, program v implementačním stadiu a měření dopadů programu. O AUTORECH: Ondřej Hora je odborným asistentem na Katedře sociální politiky a sociální práce Fakulty sociálních studií Masarykovy univerzity. Výzkumně se zabývá oblastí sociální politiky, a to především ve vztahu k sociálnímu vyloučení, chudobě a nezaměstnanosti. Je vyučujícím metodologických předmětů a předmětů tvorby diplomových prací pro bakalářské a magisterské studium. Miroslav Suchanec působí na FSS MU jako vyučující statistiky a kvantitativního výzkumu a výzkumně se zabývá evaluací programů aktivní politiky zaměstnanosti. Jeho obecnými profesními zájmy jsou metodologie a statistika. Martin Žižlavský je členem akademického sboru Fakulty sociálních studií Masarykovy univerzity. Jeho pedagogická činnost pokrývá oblasti ekonomiky sociálního státu a metod a technik výzkumu ve veřejné politice a sociální práci. Výzkumně se zabývá zejména ekonomickou a organizační stránkou sociálních programů. EVALUAČNÍ VÝZKUM Masarykova univerzita Brno 2014 Ondřej Hora Miroslav Suchanec Martin Žižlavský © 2014 Masarykova univerzita © 2014 Ondřej Hora, Miroslav Suchanec, Martin Žižlavský ISBN 978-80-210-6887-2 ISBN 978-80-210-6886-5 (brož. vaz.) Recenzoval: PhDr. Martin Smutek, Ph.D. Tato publikace vznikla v rámci projektu OP VK „Internacionalizace, inovace, praxe: sociálně-vědní vzdělávání pro 21. století“ s registračním číslem CZ.1.07/2.2.00/ 28.0225. Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky. Více informací k projektu naleznete zde: http://www.fss.muni.cz/cz/site/struktura/projekty/sova. Vědecká redakce Masarykovy univerzity: prof. PhDr. Ladislav Rabušic, CSc. Mgr. Iva Zlatušková Ing. Radmila Droběnová, Ph.D. Mgr. Michaela Hanousková doc. Mgr. Jana Horáková, Ph.D. doc. JUDr. Josef Kotásek, Ph.D. Mgr. et Mgr. Oldřich Krpec, Ph.D. prof. PhDr. Petr Macek, CSc. PhDr. Alena Mizerová doc. Ing. Petr Pirožek, Ph.D. doc. RNDr. Lubomír Popelínský, Ph.D. Mgr. David Povolný Mgr. Kateřina Sedláčková, Ph.D. prof. RNDr. David Trunec, CSc. prof. MUDr. Anna Vašků, CSc. prof. PhDr. Marie Vítková, CSc. doc. Mgr. Martin Zvonař, Ph.D. 5Shrnutí / Summary SHRNUTÍ Autoři se zabývají aplikací výzkumných metod a technik při evaluaci sociálních programů. Kladou důraz na situační rozměr této aplikace. Aplikace je ukázána při evaluacích různých programových stadií nebo aspektů programu: posouzení potřeb, program ve stadiu plánování, program v implementačním stadiu a měření dopadů programu. SUMMARY Authors deal with an application of research methods and techniques at social programme evaluation. They put stress on a  situational dimension of the application. The application is shown at evaluation of different programme stages or programme aspects: needs assessment, programme planning stage, programme implementation stage, and programme impact measurement. 7Obsah OBSAH Martin Žižlavský Úvod.........................................................................................................9 Martin Žižlavský 1 Aplikace metod a technik výzkumu při evaluaci programů............11 1.1 Úvod........................................................................................................ 11 1.2 Situační podmíněnost aplikace metod a technik výzkumu.............. 11 1.3 Učení a osvojování aplikace metod a technik výzkumu................... 12 1.4 Závěr........................................................................................................ 15 Ondřej Hora 2 Přístupy k analýze sociálních problémů z hlediska veřejné a sociální politiky....................................................17 2.1 Definice sociálního problému.............................................................. 17 2.2 Různé vědecké přístupy k definici sociálního problému.................. 18 2.3 Legitimita sociálních problémů a veřejná diskuze............................ 21 2.4 Vztah mezi výsledky vědy a využitím těchto výsledků..................... 22 2.5 Analytická hlediska významná pro analýzu sociálních problémů......................................................... 23 2.6 Vybrané metody a postupy analýzy sociálních problémů................ 28 2.7 Příkladová analýza sociálního problému [Jordan et al. 1992]......... 34 Martin Žižlavský 3 Evaluace programu ve stadiu plánování............................................43 3.1 Úvod........................................................................................................ 43 3.2 První ukázka: Plán rozvoje sociálních služeb v Moravskoslezském kraji..................................................................... 44 3.3 Druhá ukázka: Národní akční plány sociálního začleňování vybraných států Evropské Unie................... 52 3.4 Závěr........................................................................................................ 59 Evaluační výzkum8 Ondřej Hora 4 Procesní evaluace................................................................................63 4.1 Definice procesní evaluace................................................................... 63 4.2 Základní přístupy k problému procesní evaluace.............................. 65 4.3 Průběh a klíčové kroky procesní evaluace.......................................... 68 4.4 Proces evaluace programu.................................................................... 70 4.5 Příklad provedení procesní evaluace................................................... 75 Miroslav Suchanec 5 Evaluace dopadu.................................................................................85 5.1 Reprezentace kontrafaktuality.............................................................. 88 5.2 Náhodnost výběru a povaha analyzovaného efektu ......................... 89 5.3 Interní validita........................................................................................ 90 5.4 Jednoskupinové designy........................................................................ 93 5.5 Víceskupinové designy.......................................................................... 94 5.6 Efekty „selekce“...................................................................................... 95 5.7 Průřezový estimátor............................................................................... 97 5.8 Experimentální design s posttestem.................................................... 99 5.9 Posttest design s napárovanou kontrolní skupinou......................... 100 5.10 DID estimátor....................................................................................... 101 5.11 Nespojitá regrese.................................................................................. 102 5.12 Statistická významnost dopadu.......................................................... 106 5.13 Příklad z praxe...................................................................................... 106 5.14 Závěr...................................................................................................... 107 Martin Žižlavský Závěr.....................................................................................................109 Literatura..............................................................................................110 Jmenný rejstřík.....................................................................................111 9Úvod ÚVOD Martin Žižlavský Autoři této knihy chápou evaluační výzkum jako situačně podmíněnou aplikaci metod a  technik výzkumu v  evaluaci sociálních programů. Aplikaci metod a  technik výzkumu autoři ukazují v  evaluacích různých programových stadií. Tuto situačně podmíněnou aplikaci metod a technik výzkumu autoři v textu označují výrazy „evaluační výzkum“ nebo „evaluace“. Při psaní textů kapitol měli autoři na mysli především čtenáře s malými zkušenostmi s evaluačním výzkumem, nováčky v evaluačním výzkumu, a to jak studenty, tak pracovníky zabývající se sociálními programy (dále v textu také jen „programy“). Texty kapitol tudíž obsahují obecná, nesituační pravidla aplikace metod a  technik výzkumu v evaluaci programů. Kapitoly této knihy se však neomezují na představení výše zmíněných pravidel. Každá kapitola pojednávající o  aplikaci metod a  technik výzkumu v  evaluaci určitého programového stádia obsahuje autorsky upravenou ukázku skutečné aplikace metod a technik výzkumu v evaluaci daného programového stádia. Souvislost mezi adekvátní aplikací metod a  technik výzkumu a  dovednostmi plynoucími ze souboru zkušeností s  různými evaluačními situacemi vysvětluje Martin Žižlavský v  kapitole 1 Aplikace metod a  technik výzkumu při evaluaci programů. Kapitoly o  aplikaci metod a technik výzkumu jsou řazeny podle programových stadií. Tak Ondřej Hora píše v kapitole 2 Přístupy k  analýze sociálních problémů z hlediska veřejné a sociální politiky o různých pojetích sociálního problému a z nich vycházejících způsobů jeho analýzy. Martin Žižlavský pak v  kapitole 3 Evaluace programu ve stadiu plánování ukazuje na příkladech dvou evaluačních výzkumů aplikaci metod a  technik výzkumu při evaluaci plánů regionálního a  národního programu. Ještě implementovaný program nebo už implementovaný program je předmětem procesní evaluace, píše Ondřej Hora v kapitole 4 Procesní evaluace. Miroslav Suchanec potom v kapitole 5 Evaluace dopadu rozebírá různé designy a praxí ustálené aplikace metod a technik výzkumu při evaluaci efektů a výsledků programu. 111 Aplikace metod a technik výzkumu při evaluaci programů 1 APLIKACE METOD A TECHNIK VÝZKUMU PŘI EVALUACI PROGRAMŮ Martin Žižlavský Motto: „Výzkum je stejně jako diplomacie uměním možného.“ [Patton 1990: 13] 1.1 Úvod Adekvátnost aplikace metod a  technik výzkumu sociálního světa při evaluaci určitého programu se nevyjevuje tomu, kdo evaluaci dělá, jednoznačně. Situace, v  níž jsou evaluace programů vykonávány, se různí a s nimi se také adekvátnost aplikace metod a technik výzkumu sociálního světa. Výsledkem aplikace metod a technik výzkumu při evaluaci programů či sociálních intervencí je podle Rossiho, Lipseyho a  Freemana [2004] evaluační výzkum. „Evaluátoři používají metody sociálního výzkumu, aby studovali, posuzovali a  pomáhali zdokonalit sociální programy včetně dobré úrovně diagnóz sociálních problémů, na které se zaměřují programy, na způsob, jakým jsou programy konceptualizovány a implementovány, na výsledky jichž dosahují a na jejich účinnost.“ [Rossi, Lipsey, Freeman 2004: 3] Podobně chápe evaluační výzkum, tedy jako aplikaci metod a  technik v  evaluaci programů, Clarke [viz 1999: vi] nebo Smutek [viz 2005: 6]. Zmíněná situační různost klade zvýšené nároky na evaluátorovu dovednost rozpoznat v  dané evaluační situaci kritéria adekvátnosti aplikace metod a technik výzkumu. Právě na situační podmíněnost aplikace metod a technik výzkumu při evaluaci programu a osvojování dovedností adekvátně aplikovat metody a techniky výzkumu při evaluaci programu evaluátorem se zaměřuje tato kapitola. 1.2 Situační podmíněnost aplikace metod a technik výzkumu Autor těchto řádek si je vědom skutečnosti, že situačně podmíněné pojetí aplikace metod a technik výzkumu v evaluaci programu nezastupuje jediné pojetí uznávané evaluátory. Zhruba lze pojetí či pohledy na Evaluační výzkum12 aplikaci metod a technik výzkumu v evaluaci programu dělit na univerzalistický pohled a situačně podmíněný pohled. „Univerzalistický pohled trvá na univerzální nadřazenosti určitých evaluačních přístupů a metod oproti jiným.“ [Chen 2005: 11] Chen také výstižně vymezuje situačně podmíněný pohled (contingency view) na aplikaci metod a  technik výzkumu v  evaluaci programu. „Alternativní pohled, ze kterého lze konceptualizovat, rozvíjet a aplikovat principy, přístupy a metody evaluace programů je situačně podmíněný pohled, který tvrdí, že neexistuje žádný nejlepší způsob jak vést evaluaci programu; volba přístupů a metod evaluace programu by měla být spíše situační.“ [Chen 2005:  11] Určitou evaluační situaci také ustavuje konfigurace hodnot, zájmů a přístupů různých kategorií lidí zainteresovaných na daném sociálním programu. Třeba požadavek na vědeckou přesnost, jehož si cení evaluátor z vědecké komunity, se potkává s požadavkem na užitečnost, který je upřednostňován zadavateli evaluace. Jak toto „setkání“ dopadne, lze stěží předvídat, natož jeho podobu vtěsnat do nějakého standardu. Inspirován uznávanými autoritami v  oblasti evaluačního výzkumu (viz [Chen 2005], [Patton 1990]) a  rovněž vlastními zkušenostmi s  evaluačním výzkumem se autor přiklání k  situačně podmíněnému pohledu na aplikaci metod a  technik výzkumu v  evaluaci programů. Hlavním důvodem je větší efektivita evaluačního výzkumu vedeného ze situačně podmíněného pohledu při naplnění specifických potřeb subjektů zainteresovaných na evaluovaném programu. Potřeby subjektů zainteresovaných na evaluovaném programu se totiž mění s časem a místem. 1.3 Učení a osvojování aplikace metod a technik výzkumu Evaluátor při aplikaci metod a technik výzkumu v evaluaci programů využívá jak teoretické vědomosti, tak praktické dovednosti. Pro evaluátora nováčka teoretické vědomosti obsažené v učebnici nebo příručce představují východisko, „první etapu“ osvojování dovednosti aplikace metod a technik výzkumu v evaluaci programů. Čím více má nováček zkušeností s  aplikací metod a  technik výzkumu v  evaluaci programu, tím více ustupují teoretické vědomosti do pozadí. Zlepšování dovednosti při adekvátní aplikaci metod a technik výzkumu v evaluaci programu jde ruku v  ruce s  rostoucí rolí zkušenostně založené intuice na úkor 131 Aplikace metod a technik výzkumu při evaluaci programů analytického rozumu. Tuto skutečnost empiricky zkoumali při osvojování dovedností lidmi v různých profesích Stuart E. Dreyfus a Hubert L. Dreyfus a rozlišili pět posloupných úrovní osvojení určité dovednosti (viz [Dreyfus, Dreyfus 1980] a [Dreyfus, Dreyfus a Athanasiou 1986]). Tyto úrovně ukáže autor této kapitoly na osvojení dovednosti adekvátní aplikace metod a technik výzkumu v evaluaci programů. 1. Nováček. Během studia se nováček učí skutečnostem a charakteristikám evaluační situace, které jsou důležité pro adekvátní aplikaci metod a technik výzkumu v evaluaci programu. Rovněž se je naučí rozeznávat, jakmile se objeví. Na tomto základě se nováček učí pravidlům jednání. Skutečnosti, charakteristiky a  pravidla jsou definována obecně, nezávisle na evaluační situaci. Nováček je tak rozpozná i bez odkazu na určité souvislosti, i bez přispění zkušenosti. „První pravidla jsou nezbytná pro získání počátečních zkušeností, ale tato pravidla se rychle stanou překážkou procesu učení a aby nováček dělal pokroky, musejí být odložena stranou.“ [Flyvbjerg 2001: 11] Rozumové použití pravidel adekvátní aplikace metod a technik výzkumu začne od určitého okamžiku vytvářet překážku dalšímu učení svou relativní pomalostí. 2. Pokročilý začátečník. S  rostoucími zkušenostmi se pokročilý začátečník naučí rozpoznat důležité prvky pro adekvátní aplikaci metod a technik výzkumu v dané evaluační situaci. Důvodem je, že pokročilý začátečník vidí podobnosti vzhledem k  předešlým výskytům stejné evaluační situace. Učí se zásadám, které již předpokládají zkušenosti s adekvátní aplikací metod a technik výzkumu v evaluaci programů. 3. Zkušený praktik. Zvětšující se zkušenosti postupně přinášejí nové rysy a aspekty situací, které musí evaluátor brát v potaz při aplikaci metod a  technik výzkumu. Informační zahlcení mu znemožňuje stanovovat priority. Aby zvládl narůstající množství informací, naučí se používat rozhodování založené na hierarchii. Evaluátor přezkoumává jen malou sadu rysů a aspektů důležitých pro adekvátní aplikaci metod a technik výzkumu v  evaluaci programu. Činí tak vědomě, volbou plánu, podle něhož uspořádává informace v konkrétní situaci. Výběr vhodného plánu není samozřejmý, je to ryze osobní volba, která pak vede ke ztotožnění se zkušeného praktika s aktivitou, pociťuje za ni osobní odpovědnost. Evaluační výzkum14 4. Velmi zkušený praktik. Evaluátor na této úrovni intuitivně rozezná evaluační situaci, plán a cíle aplikace metod a technik výzkumu v evaluaci programu na základě svých zkušeností. Poté evaluátor prověřuje logickou analýzou intuitivně rozpoznanou evaluační situaci, plán a cíle s ohledem na dříve naučená pravidla a zásady, aby dospěl k rozhodnutí o nejvhodnější aplikaci metod a technik výzkumu v evaluaci programu. 5. Expert. Intuitivně rozeznává nejen evaluační situace, ale také adekvátní aplikace metod a technik v evaluačním výzkumu. Evaluátor na úrovni experta zapojuje racionální analýzu jen když narazí na neznámou situaci, se kterou nemá opakovanou zkušenost. Od nováčkovské úrovně až po úroveň zkušeného praktika hraje důležitou roli analytické uvažování, racionalita. Tabulka 1.1 ukazuje, že zatímco nováček aplikuje metody a techniky výzkumu v evaluaci programu přemýšlením o naučených nesituačních pravidlech z pohledu od situace odděleného pozorovatele, velmi zkušený praktik pak používá rozum jenom při posuzování adekvátnosti intuitivně vybrané aplikace metod a technik Tabulka 1.1 Pět úrovní osvojení dovedností Dovednostní úroveň Složky Perspektiva rozeznání důležitých rysů Rozhodo- vání Pohlcení evaluátora situací 1. Nováček Nesituační Žádná Analytické Oddělen 2. Pokročilý začátečník Nesituační a situační Žádná Analytické Oddělen 3. Zkušený praktik Nesituační a situační Zvolená Analytické Oddělen při porozumění a rozhodování. Pohlcen při výsledku 4. Velmi zkušený praktik Nesituační a situační Zažitá Analytické Oddělen při rozhodování. Pohlcen při porozumění a výsledku 5. Expert Nesituační a situační Zažitá Intuitivní Pohlcen Pramen: Dreyfus, Dreyfus a Athanasiou 1986: 50; vlastní překlad; úpravy autor. 151 Aplikace metod a technik výzkumu při evaluaci programů výzkumu s ohledem na danou evaluační situaci. Expert běžně racionální analýzu od situace odděleného pozorovatele nepoužívá, jenom v  situacích, kdy je „zaskočen“ evaluační situací, s níž nemá zkušenosti. 1.4 Závěr Praktické dovednosti aplikace metod a  technik výzkumu v  evaluaci programu adekvátní evaluační situaci jsou vázány na evaluátorovu osobu skrze ryze osobní zkušenost. Povaha těchto dovedností znemožňuje jejich předání z osoby, která je má, na jinou osobu ústním nebo písemným sdělením. Dovednosti adekvátní aplikace metod a  technik výzkumu v evaluaci programu tudíž spadají do kategorie nesdělitelných znalostí (tacit knowledge, viz [Polanyi 1983]). Pokud evaluátor na vyšších úrovních osvojení adekvátní aplikace metod a  technik výzkumu v  různých evaluačních situacích využívá většinou svojí intuice založené na kumulovaných zkušenostech, pak je tato činnost spíše řemeslem. „Řemeslo, které nemůže být specifikováno do detailu, nemůže být přeneseno předpisem, protože pro něj žádný předpis neexistuje. Může být předáno dál jenom příkladem od mistra k učni.“ [Polanyi 1962: 53] Jestliže vědomosti lze nastudovat z  učebnice nebo příručky, pak dovednosti si lze osvojit jen dlouhodobým praktickým nácvikem, nejlépe za podpory někoho zkušenějšího. Například pro některé univerzitní studenty, evaluátory nováčky, představuje studium teorie evaluačního výzkumu počátek pomyslné cesty k  expertní úrovni výkonu evaluačního výzkumu. Tito studenti se tak ocitají v situaci podobné té, v níž se nacházejí studenti humánního nebo veterinárního lékařství či studenti právní vědy: další pokrok je možný jen dlouhodobou odbornou praxí po skončení univerzitního studia. Literatura Chen, H. 2005. Practical Program Evaluation: Assessing and Improving Planning, Implementation, and Effectiveness. Thousand Oaks, Calif.: Sage. Clarke, A. 1999. Evaluation Research. An Introduction to Principles, Methods and Practice. London: SAGE. Dreyfus, S. E., H. L. Dreyfus. 1980. A Five-Stage Model of The Mental Activities Involved in Directed Skill Acquisition. Berkeley: University of California. Evaluační výzkum16 Dreyfus, H., S. Dreyfus, T. Athanasiou. 1986. Mind over Machine: the Power of Human Intuition and Expertise in the Era of the Computer. New York: Free Press. Flyvbjerg, B. 2001. Making Social Science Matter: Why Social Inquiry Fails and How It Can Succeed Again. Cambridge: Cambridge University Press. Patton, M. Q. 1990. Qualitative Evaluation and Research Methods. SAGE: Newbury Park. Polanyi, M. 1983. The Tacit Dimension. Gloucester: Peter Smith. Polanyi, M. 1962. Personal Knowledge: towards a Post-critical Philosophy. Chicago: University of Chicago Press. Rossi, P., M. Lipsey, H. Freeman. 2004. Evaluation: a Systematic Approach. Thousand Oaks: Sage. Smutek, M. 2005. Evaluace sociálních programů. Hradec Králové: Gaudeamus. 172 Přístupy k analýze sociálních problémů z hlediska veřejné a sociální politiky 2 PŘÍSTUPY K ANALÝZE SOCIÁLNÍCH PROBLÉMŮ Z HLEDISKA VEŘEJNÉ A SOCIÁLNÍ POLITIKY Ondřej Hora V  této kapitole se zabýváme diskuzí a  definicí sociálních problémů jako předmětu lidského zájmu a základními přístupy k analýze sociálních problémů. Analýzu v tomto textu chápeme jako rozklad obsahu a  procesu výzkumu sociálních problémů na určité analytické prvky. Jako taková má analýza sociálních problémů tří základní významy: a) aplikační význam, v němž analýza pomáhá připravit podklady pro informovanější rozhodnutí b) výzkumně procesní význam, v  němž analýza umožňuje výzkumníkovi v  rozumné míře uchopit a  zjednodušit komplexní jevy c) didakticko metodický význam, díky němuž může výzkumník přiblížit postupy analýzy dalším výzkumníkům. Analýza sociálních problémů je současně často jednou z fází celé řady komplexnějších evaluačních postupů. 2.1 Definice sociálního problému Jednu ze základních perspektiv chápání sociálních problémů vymezil C. W. Mills [1959] v knize Sociologická imaginace, kde mj. rozlišil dvě, podle autora tohoto textu, základní podmínky analýzy sociálních problémů: studium širšího společenského kontextu a potřebu sociální problém definovat. Sociální problémy ovšem mohou být definovány různými aktéry. Ti, kdo sociální problém definují, mohou, ale nemusí být těmi, kterých se problém ve svých důsledcích bezprostředně týká (viz [Navrátil 1998], [Veselý 2009]). Veselý [2009] rozlišuje sociální problém a veřejně politický problém. Za veřejně politický přitom považuje pouze ten sociální problém, který je řešen v rámci politického vyjednávání. V  tomto textu na sociální problém nahlížíme převážně z  hlediska akademické perspektivy. Na základě literatury (např. [Blumer 1971], [Veselý 2009], [Carl 2011]) jsme identifikovali následující podmínky typické pro existenci sociálních problémů. Jako sociální problém označujeme situace, stavy či okolnosti, které: Evaluační výzkum18 1 Vezměme příklad jediného člověka, který přicestoval do země nakažen závažnou, snadno se šířící nemocí. Na tuto situaci se můžeme dívat jako na individuální problém této konkrétní osoby nebo jako na problém potřeby ochránit dosud zdravou populaci před následky rozšíření onoho závažného onemocnění. 2 Blumer [1971] uvádí, že rozpoznání sociálních problémů je vysoce výběrový proces, který je též předmětem (politického) soutěžení (zápolení) a  v  němž jen některé problémy jsou uznány jako sociální problémy. a) se bezprostředně týkají člověka či jeho vztahu k  dalším lidem (odlišení od ekonomických či ekologických problémů) b) přinášejí negativní důsledky konkrétním osobám, skupinám osob či společnosti jako celku (pro jejich existenci) anebo je nějak ohrožují. U sociálních problémů můžeme tedy rozlišovat tzv. individuální a celospolečenské důsledky.1 c) jsou větším počtem osob identifikovány (rozpoznávány) jako: 1) problematické, 2) nutné či potřebné řešit a 3) možné řešit2 . Řešení přitom zpravidla není snadné a někdy ani známé [viz Veselý 2009]. d) jsou z  důvodu jejich významu celospolečensky (významnými aktéry, kolektivně) řešeny nebo existuje alespoň zájem na jejich řešení. Jejich řešení se zaměřuje na změny sociálních institucí [Durant 1917]. Jen některé problémy získávají status a  význam sociálního problému [Navrátil 1998]. Mnozí autoři poukazují na dynamický charakter so­ciálních problémů (vznikají, trvají, zanikají). Z  tohoto důvodu může sociálním problémem být i  něco, co v  současnosti neexistuje, ale přitom je to potenciální hrozbou. Někteří autoři též upozorňují, že události či jevy označované jako sociální problémy nemusí přinášet všem účastníkům, kterých se týkají, bezprostřední negativní důsledky. Proto tito autoři častěji pracují s  pojmem sociální rizika (viz např. [Taylor-Gooby 2004], [Armingeon a Bonoli 2006]). 2.2 Různé vědecké přístupy k definici sociálního problému Nejprve se budeme stručně věnovat různým pojetím (přístupům k) porozumění sociálním problémům v akademických diskurzech uplatňovaných v sociálních vědách. Chápání různých pojetí sociálního problému je významné, neboť „představivost je schopnost (výzkumníka) přepnout se z  jedné perspektivy do druhé“ [Mills 1959]. Sociálnímu 192 Přístupy k analýze sociálních problémů z hlediska veřejné a sociální politiky problému ve společnosti nelze porozumět, aniž bychom určitým způsobem chápali, jaká tato společnost je. Lyotard [1984] upozorňuje, že společnost je v akademické prostředí chápána buď jako funkční celek (positivistické myšlení), anebo je chápána jako části v  konfliktu (kritické myšlení). Funkcionalismus (strukturální funkcionalismus), jehož základními představiteli jsou např. T. Parsons a R. K. Merton [1982] vnímá společnost jako celek, jehož jednotlivé části jsou propojeny a vzájemně se ovlivňují (přispívají k  fungování celku). Je možné rozlišovat manifestované (záměrné, rozpoznané, zjevné) a  latentní (nezáměrné, skryté) funkce. Na první pohled příjemné či potřebné věci mohou mít nezáměrné či skryté negativní důsledky a opačně věci zdánlivě nežádoucí mohou mít některé pozitivní důsledky. Funkcionální přístup definuje sociální problémy jako objektivní podmínky nebo uspořádání existující ve společnosti (jsou ukotveny v existujících sociálních strukturách). Sociální problémy jsou chápány jako odchylky od zavedených struktur (disfunkce), které zabraňují dosažení společenských cílů. „První a  základní složkou sociálního problému je významný rozpor mezi široce sdíleným sociálním standardem a  aktuálními podmínkami sociálního života.“ [Merton 1976: 47–48] Sociální problémy mohou být tedy také latentní či manifestované. Funkcionalistická analýza sociálního problému se zaměřuje především na obsahové vymezení (výčet či rozbor) těchto sociálních problémů. Jsou analyzovány příčiny a  především důsledky těchto problémů. Lyotard [1984] se domnívá, že řešení sociálních potřeb vychází z domněnky, že snížení nouze povede ke zlepšení výkonosti celého systému nebo odvrátí jeho destabilizaci [viz Lyotard 1984: 62–63]. Analýza sociálních problémů je chápána jako předpoklad řešení těchto problémů (tzv. reaktivní přístup). Odlišně od strukturálních funkcionalistů vnímají společnost představitelé teorie konfliktu (např. [Coser 1957], [Collins 1993]). Coser [1957] upozorňuje na odlišné osobní zájmy (vested interests) jednotlivých zájmových skupin a  na jejich rozdílnou roli při prosazování změny či zabraňování změně. Tvorba skupin s  obdobnými zájmy je předpokladem vytvoření nových modelů chování a  jejich prosazení. Konflikt v Coserově perspektivě tedy může být prospěšný v tom, že je předpokladem sociální transformace. Collins [1993] teorie konfliktu obohatil o  koncept emocionální, morální a  symbolické mobilizace Evaluační výzkum20 3 V  tomto kontextu si můžeme povšimnout např. toho, jaké pojmy jsou spojovány s  definicí sociálních problémů: „nežádoucí“, „nepříznivý“, „nezdravý“, „patologický“, „deviantní“, „utrpení“, „mizérie“, „bída“, „strádání“, „tenze“, „zhoršení“, „úpadek“. jako předpokladu pro prosazení skupinových zájmů a  poukázal na emoční náboj vznikající během konfliktů. Kultura skupiny během konfliktu je emočně nabitá, nikoliv odtržená nebo neutrální. Lidé ztrácí schopnost vidět věci v  širším kontextu. Jejich vnímání se stává vysoce selektivním. Při ideologické polarizaci každá ze stran vnímá na svých protivnících jen to nejhorší. Z tohoto důvodu se vysoce mobilizované konflikty stávají ritualizovanou výměnou krutostí. [ibid. 1993:293] Třetí odlišný přístup k  analýze sociálního světa nabízí symbolický interakcionalismus [Blumer 1971] a sociální konstruktivismus [Berger a  Luckmann 1971]. V  individuální rovině sociální problémy vznikají určitou interakcí jedinců s  prostředím nebo interakcí mezi jedinci navzájem. Sociální problém vzniká v procesu společenské a kolektivní definice sociálního problému [Blumer 1971]. „Sociální problém existuje především v  tom (z  hlediska toho), jak je definován a jaká je o něm společenská představa, namísto toho, aby byl objektivní podmínkou.“ [Blumer 1971: 300] Blumer [1971] tvrdil, že sociální problém pro společnost neexistuje, dokud tato společnost nerozpozná, že existuje. Studenti sociálních problémů by měli studovat proces, ve kterém společnost rozpoznává své sociální problémy. K porozumění sociální realitě významně přispěl též filosof Jean-Francois Lyotard [1984]. Lyotard (v návaznosti na Wittgensteina) zdůrazňuje význam jazyka, jeho ustálených pravidel (např. v institucích) a tzv. řečových her pro přenos informací.3 Vědění ve společnosti je zpravidla narativní povahy. Informace jsou přenášeny ve formě sdílených příběhů, které pomáhají vytvářet pravidla, upevňovat sociální vazby a tvořit kritéria kompetencí, podle nichž je možné posuzovat svět. Lyotard věřil, že postmoderní společnost je společnost, v  níž přestávají platit (dominovat) velké, v celé společnosti sdílené narativní příběhy. Každý jednotlivec je účastníkem určitých sociálních vztahů a vazeb, v rámci nichž sdílí informace. V rámci jednotlivých sítí nemusí být stejná pravidla řečových her a záměrem jednotlivců nemusí být vždy dosažení konsenzu (kterého je možné dosáhnout spíše v jednom čase a lokálně). 212 Přístupy k analýze sociálních problémů z hlediska veřejné a sociální politiky 4 „Uznání“, „rozpoznání“, „odsouhlasení“, „schválení“ či „potvrzení“ problému. J. F. Lyotard [1984] spojuje legitimitu s  procesem legalizace řešení sociálního problému. Legitimita též může být chápána jako kontrolní mechanismus vedoucí k tomu, aby byly společensky řešeny jen ty správné problémy. 5 Podle Schöna a Reina [1994 in Veselý 2009] veřejně politické kontroverze považujeme za spory, ve kterých se jednotlivé strany sporu drží protichůdných rámců (přesvědčení, vnímání a uvědomění). 2.3 Legitimita sociálních problémů a veřejná diskuze Pro sociální problémy je klíčovým prvkem legitimita4 . U  mnoha sociálních problémů se setkáváme s rozdílnými názory na příčiny, průběh a důsledky těchto problémů, ale především s různými názory na potřebnost a  způsob řešení sociálních problémů. Společnost vytváří arény veřejného mínění, kde značnou roli hrají média, rozhodnutí politiků, vliv veřejného mínění, veřejných organizací a církví [viz Blumer 1971]. V mnoha případech jsou definice sociálního problému i přístup k  jeho řešení historicky a  kulturně podmíněné [Veselý 2009, Carl 2011]. Významnou roli mohou hrát ideologie coby soubory hodnot a  přesvědčení sdílených jednotlivci, skupinami a  společnostmi, které ovlivňují jejich chování [viz George, Wilding 1994]. Pokud nepanuje ve společnosti shoda o  konkrétním sociálním problému, můžeme ho považovat za kontroverzní5 . V tomto ohledu je podstatné, odkud je odvozována legitimita jednotlivých sociálních problémů. Někteří autoři (např. [George 1883], [Lyotard 1984], [Bonoli 2006]) zdůrazňují, že legitimita sociálních problémů není odvozena jen od státu, ale od názorů a konání lidí žijících v dané společnosti. Politologové vědí, že problémy samy o  sobě netvoří politiky, ale vznik nového problému prožívaného velkými částmi voličů ve fungující demokracii, probudí zájem politických podnikatelů chtějících získat hlasy a vyústí v přenesení nového problému na politické kolbiště. [Bonoli 2006: 14] Vnímání legitimity problému je založeno na tom, jak spravedlivý, přiměřený a vhodný je proces řešení konkrétního problému či jakých výsledků bylo při řešení problému dosaženo [viz Maguire, Cartwright 2008]. Určité riziko ovšem představuje možnost, že veřejnost může být Evaluační výzkum22 o  problému málo informována nebo se může rozhodovat na základě nepravdivých či dokonce zmanipulovaných informací [Veselý 2009]. Pro sociálního vědce z  toho vyplývá zajímavá otázka: nakolik se daná konstrukce sociálního problému opírá o  skutečné sociální podmínky [Veselý 2009]. Mnozí autoři se zaměřovali na rozpor mezi vědou a obecnou (intuitivní, na zkušenosti založenou) představou o sociálním problému ([Blumer 1971], [Veselý 2009]). Věda si pro poznání sociálních problémů stanovuje svá vlastní pravidla (zakotvená v  tzv. metodologii vědy). Různí autoři spatřují možnou roli vědy při poznání sociálních problémů např. ve verifikaci (ověření), redukci komplexity či v  posílení přesvědčivosti. Praxe ovšem ukázala, že ne vždy věda přináší lepší výsledky než intuice [viz Veselý 2009]. V některých případech lze zachytit podstatu sociálního problému jen velmi obtížně (příklad práce na černo). 2.4 Vztah mezi výsledky vědy a využitím těchto výsledků Vědci v  mnoha případech reagují na objednávku ohledně výzkumu sociálních problémů především od politiků [Rossi, Lipsey, Freeman 2004]. Věda ovšem může též být aktérem v  tom ohledu, že může upozornit na potenciální problémy. Vědci stejně jako studenti veřejné politiky mohou zkoumat i  oblasti, které nejsou ve společnosti jednoznačně rozpoznány jako sociální problémy, pokud je sami považují za potenciálně závažné. Věda pouze vytváří poznatky, coby předpoklady pro efektivní veřejné rozhodování. Věda může, ale také nemusí, mít vliv na veřejnou debatu [viz Veselý 2009]. K využití výsledků by mělo dojít v důsledku procesu tzv. diseminace (součástí může být i popularizace vědy, snaha převést výsledky do příběhů). Vztah mezi politiky a vědci bývá často neujasněný (rizika, role moci, legitimita, očekávání ohledně nalezení řešení). Velmi diskutována jsou též „rizika politického procesu“ z hlediska diseminace. V  některých případech je od výzkumníků vyžadováno, aby výzkumy či odbornými stanovisky legitimizovali cíle a stanoviska představitelů jednotlivých politických stran [viz Veselý 2009]. Naopak sama publikace výsledků výzkumů může být zablokována, pokud nevyhovuje záměrům politiků [Lyotard 1984]. 232 Přístupy k analýze sociálních problémů z hlediska veřejné a sociální politiky 6 Zájemcům o tento proces doporučuji např. Dunnův přístup ke strukturaci sociálních problémů [viz Veselý 2009: 112–114]. 2.5 Analytická hlediska významná pro analýzu sociálních problémů Podle autora tohoto textu není možné prohlásit, že existuje jeden ideální přístup k  analýze sociálních problémů. Jak je naznačeno již výše v  textu, rozdílné přístupy k  analýze sociálního problému nejsou vedeny pouze odlišnými záměry jednotlivých výzkumníků, ale také jejich odlišnými perspektivami, hodnotami a  životními zkušenostmi. Významnou pomocí ve výzkumu je ovšem znalost jednotlivých teoretických přístupů, reflexe výzkumníka ohledně jeho vlastního metodologického postupu, stejně jako určitá tolerance k odlišnosti přístupů ostatních vědců. V  této části se zaměřujeme především na tvorbu základního analytického rámce. Preferujeme proto ta hlediska, která mohou být významná pro většinu výzkumníků bez ohledu na volbu konkrétního postupu analýzy sociálního problému. 2.5.1 Vymezení cíle Každou analýzu sociálního problému musí předcházet jednoznačné vymezení poznávacího cíle. Poznávací cíl by měl být formulován v návaznosti na aplikační cíle výzkumu (účel výzkumu) tak, aby byly získány poznatky, které jsou relevantní a které mohou být využitelné při řešení sociálního problému. Vymezení poznávacího cíle by mělo autora výzkumu vždy vést k prvotní definici klíčových pojmů a dimenzí jeho výzkumu. Jedná se o proces, v němž se mnohdy nejednoznačné koncepty stávají jasně vymezenými konstrukty6 . Jasná konstrukce sociálního problému je zde klíčová, neboť zaměření na rozdílné aspekty jednoho sociálního problému může vést k  návrhu zcela odlišných intervencí [Rossi, Lipsey, Freemann 2004]. Autor by měl problém vždy definovat tak, aby publikum (čtenáři) mohlo dobře porozumět jeho pojetí sociálního problému, případně aby bylo možné ověřit jeho výzkumné výsledky. Analýza sociálního problému vychází ze snahy o porozumění sociálnímu problému. Zde lze spatřovat dva základní přístupy v  návaznosti na to, zda se vědec domnívá, že problém je dostatečně znám, anebo se domnívá, že problém je třeba více poznat [viz Veselý 2009]. Evaluační výzkum24 7 Příkladem takového kontextu může být např. legislativní úprava pomoci v hmotné nouzi či sociálního bydlení. 8 V principu se jedná o otázku, nakolik jsou sociální problémy jevy nezávislé na pozorovateli [viz Veselý 2009]. 2.5.2 Vymezení perspektivy (makro-mezo-mikro) Metodologie vědy v uvažování o podstatě analýzy sociálního problému umožňuje v návaznosti na C. W. Millse [1959] rozlišit perspektivu malého rozsahu (mikro), tj. zpravidla lokální či komunitní, a perspektivu velkého rozsahu (makro), tj. zpravidla národní či nadnárodní. V praxi se též setkáváme s  přístupem mezo (středního rozsahu), který je na pomezí mikro a makro perspektivy, kdy sociální problém je zkoumán na území většího rozsahu (např. v některém z regionů). Z praktického hlediska jde jak o  prostorové a  časové vymezení (ohraničení) našeho výzkumu, tak také o volbu perspektivy nahlížení na sociální problém [viz Van Dijk 2001]. Při výzkumu sociálních problémů vždy musíme zvažovat, nakolik do jeho výzkumu zahrneme též identifikaci klíčového kontextu problému, bez jehož pochopení není možné problému dobře porozumět.7 2.5.3 Objektivita a subjektivita Další dimenzí významnou pro analýzu sociálních problémů je objektivita a subjektivita. Rozdíl mezi oběma pojmy je chápán dvěma poněkud odlišnými způsoby: a) Podle některých autorů objektivita znamená přistupovat k  problému nestranně bez osobních předsudků a  zkreslení, ať již vedených vlastními hodnotami, zkušenostmi či politickou orientací [Carl 2011]. K tomu by mělo sloužit odpoutání výzkumníka od sociálního problému. Někteří autoři ovšem upozorňují, že domnívat se, že se vědec může zcela odpoutat od svých hodnot, je poměrně naivní. b) V  druhé dimenzi je významné rozlišovat mezi povahou (podstatou) sociálního problému a  názory lidí na sociální problém8 . V  kvalitativním stejně jako v  kvantitativním výzkumu jsou lidé často informanty o povaze věcí. Pro výzkumníka proto může být významné sledovat problém z  více perspektiv těch, „kterých se 252 Přístupy k analýze sociálních problémů z hlediska veřejné a sociální politiky problém týká“ [Veselý 2009] a snažit se co nejvíce přiblížit tam, „kde se něco děje“. V některých případech může být řešením též tzv. výzkumná triangulace, tedy vhodná kombinace více výzkumných postupů či alespoň reflexe výsledků vlastního výzkumu ve srovnání se zjištěními jiných autorů. 2.5.4 Závažnost sociálního problému Výzkumník může zvažovat též závažnost sociálního problému. Jakkoliv je určení závažnosti problému ve více ohledech obtížné a problematické, výzkumníkovi tato úvaha může pomoci v rozhodnutí, zda se má problémem zabývat. Užitečnými hledisky pro posouzení významnosti sociálního problému mohou být: a) časová tíseň anebo problém priorit (např. tzv. problém tekoucího kohoutku) b) míra ohrožení sociálním problémem c) schopnost resilience, tedy schopnost jednotlivých aktérů, komunit či společnosti reagovat – řešit problém [viz Maguire, Cartwright 2008]. Do jaké míry můžeme očekávat, že se problém vyřeší sám bez vnějšího zásahu? 2.5.5 Rozsah sociálního problému Dalším klíčovým hlediskem analýzy sociálního problému je definice rozsahu sociálního problému. Jako rozsah sociálního problému zpravidla chápeme definici toho, kolika osob či skupin osob se konkrétní sociální problém týká. S  pojmem rozsah sociálního problému jsou spojovány též termíny distribuce sociálního problému, incidence a prevalence. Vždy tedy měříme rozsah sociálního problému v určitém čase na určitém místě. Při určování rozsahu sociálního problému můžeme pracovat též s pojmy „analýzy potřeb“ cílová populace (všichni, kdo splňují určité podmínky typické pro sociální problém) a  cílová skupina (ti, kdo jsou vhodní k zařazení do programu a mají o něj zájem). Pro kvalitní definici rozsahu cílové populace je důležité stanovení jednoznačných kritérií (např. věk nebo místo pobytu), která pomáhají určit, kdo bude do cílové populace započítán a kdo započítán nebude [viz Rossi, Lipsey, Freeman 2004]. Závažným problémem při určování rozsahu sociálního problému je riziko špatného usuzování o rozsahu. Evaluační výzkum26 9 Povahou sociálního problému zde máme na mysli výsledek podrobného popisu různých výskytů jevu, který nás zajímá, případně jeho příčin či následků s cílem jevu porozumět. Často k  němu dochází z  důvodu upřednostnění subjektivismu, anekdotismu a  také z  důvodu neadekvátního zobecňování pozorovaného na větší celky [viz Carl 2011]. Tabulka 2.1 Způsoby definice velikosti sociálního problému Rozsah udává, kolika jednotek se sociální problém týká Distribuce udává např. v jakých částech vymezeného území se problém nejčastěji vyskytuje Intenzita udává rozsah problému ve vztahu k referenční jednotce (např. k populaci žijící na sledovaném území) Incidence počet nových případů určitého jevu v daném čase na určitém území Prevalence počet existujících případů určitého jevu v daném čase na určitém území Riziková populace populace, u níž je pravděpodobné, že dojde k určitému jevu Cílová populace definuje skupinu, která je potenciálními klienty programu z hlediska jeho cílů Cílová skupina definuje skupinu, která naplňuje kritéria pro zařazení do programu a chce se programu zúčastnit Zdroj: Rossi, Lipsey, Freeman [2004], tabulka autor, upraveno. 2.5.6 Komplexnost sociálního problému Sociální problémy jsou často jevy komplexní povahy9 , a proto je složité jim dobře porozumět. U  sociálních problémů se zpravidla zajímáme kromě samotné povahy sociálních problémů též o jejich další důsledky. Jedním z důležitých aspektů může být skrytá podstata sociálního problému, která spočívá v tom, že známe pouze symptomy problému, ale neznáme jeho podstatu či jeho příčiny. Ve výzkumu sociálních problémů se proto můžeme zajímat o příčiny vzniku sociálních problémů, ale je třeba reflektovat, že ne ve všech případech je možné na základě rozpoznání příčin problému identifikovat vhodná řešení sociálních 272 Přístupy k analýze sociálních problémů z hlediska veřejné a sociální politiky problémů (např. pokud by příčinou sociálního problému byla vichřice nebo autonehoda, nelze již řešit v  konkrétních případech důsledky těchto konkrétních událostí nápravou příčin). 2.5.7 Analýza současného řešení problému Další důležitou dimenzí posuzování sociálních problémů je analýza současného stavu řešení těchto problémů. Je třeba si uvědomit, že většina událostí označovaných jako sociální problémy je v současnosti řešena nebo již byla řešena v minulosti, a to také i více než jedním opatřením současně. K  analýze stávajících opatření existují dva základní přístupy. První z nich se zaměřuje na to, jaká část sociálního problému (z  hlediska rozsahu a  závažnosti) zůstává nevyřešena poté, co jsme uplatnili intervence sociální politiky. Sociální problém je tedy vyjádřen jako rozdíl mezi současným stavem řešení určitého sociálního problému a ideálním stavem řešení tohoto problému (výsledný rozdíl je označen jako tzv. konfrontační napětí). Druhý přístup se zaměřuje na to, nakolik konkrétní intervence sociální politiky přispěly k řešení konkrétních sociálních problémů. Do této kategorie můžeme zařadit většinu klasických evaluačních studií, tak jak o  nich pojednávají následující kapitoly. Další přístup se zaměřuje na schopnost společnosti identifikovat zdroje a  adaptační kapacity, které mohou být využity k řešení problému [viz Maguire, Cartwright 2008]. 2.5.8 Statický nebo procedurální přístup Pro analýzu sociálních problémů je též významné rozlišení tzv. statického a  procedurálního přístupu. Veselý [2009] rozlišuje tyto dva přístupy v závislosti na tom, zda se autoři analýzy zaměřují na samotný proces vymezení problémů, či ne. Ovšem i v rámci přístupu, kde nesledujeme proces vymezení problému (ten je definován výzkumníkem) můžeme uplatnit rozlišení mezi analýzami, které se zaměřují na „výsledek“ problému v určitém časovém bodě, a analýzami, které se zaměřují na „vývoj“ problému. Klíčovou částí analýzy sociálních problémů se stala identifikace klíčových aktérů, která je součástí tzv. přístupu stakeholders [Rossi, Lipsey, Freeman 2004] – viz níže. Evaluační výzkum28 10 Klíčovou výhodou kvantitativních přístupů je možnost usuzovat na vztahy mezi jevy na základě souvislostí mezi kódovanými variantami jednotlivých jevů (obdobný postup je v  kvalitativním výzkumu značně obtížný). I  v  kvantitativním výzkumu je ovšem usuzování o příčinách a důsledcích jevů mnohdy značně komplikované mj. z důvodu a) tzv. nepravých souvislosti b) chyb měření c) omezení při vymezení kauzality. 2.6 Vybrané metody a postupy analýzy sociálních problémů Analýza sociálních problémů je typickým typem výzkumu pro fázi před zavedením programu. Typickou analýzu sociálních problémů v sociální politice mohou představovat např. tzv. „state of the art” reporty, které shrnují, jaký je současný stav vědění o sociálním problému z mnoha výzkumů v určité oblasti. V této části se zaměřujeme na jednotlivé metody sociálních věd využívané pro analýzu sociálních problémů. U každého z přístupů uvádíme příklady výzkumů, které dobře reprezentují konkrétní metodologický přístup k  analýze sociálních problémů. Některé výzkumné studie nepoužívají jednu konkrétní výzkumnou metodu, ale jednotlivé přístupy kombinují (např. klasická studie [Jahoda, Lazarsfeld, Zaisel 2002]). 2.6.1 Kvantitativní přístupy (survey, indikátorový přístup) Jako kvantitativní přístupy zde označujeme techniky analýzy, ve kterých pracujeme s  daty kódovanými do formy numerických či jiných symbolů. Kvantitativní přístupy jsou často nenahraditelné, zvláště při analýze rozsahu sociálního problému. Můžeme také zdůraznit potenciální přínos kvantitativních přístupů při analýze příčin, mechanismů a důsledků sociálních problémů.10 Typickým nástrojem kvantitativních přístupů je provedení dotazníkového šetření (survey) nebo i sběr pouze jednotlivých konkrétních údajů. Pro výzkumy sociálního problému můžeme také pracovat s různými dalšími numerickými údaji, které jsme sami nevytvořili (statistiky). V sociálních vědách se pro klíčové údaje, které více či méně reprezentují sledované sociální konstrukty, zažil termín sociální indikátory. Celá řada výzkumných studií využívala např. data o příjmech či o finančním hospodaření domácností (viz [Jahoda, Lazarsfeld, Zaisel 2002] či [Ginzberg 2004]). Při usuzování na sociální indikátory je důležité vyhnout se především riziku chybného úsudku o souvislostech mezi indikovanými jevy – tzv. „ecological fallacy“ (viz 292 Přístupy k analýze sociálních problémů z hlediska veřejné a sociální politiky 11 Analýzy potřeb v  některých případech pro základní vymezení využívají taxononapř. [Neuman 2007]). Příklady kvantitativních studií sociálních problémů: [Levitas et al. 2007] nebo [Rowlingson 2011]. 2.6.2 Analýza právně-institucionálních charakteristik Součástí analýzy sociálního problému může být též tzv. analýza institucionálních charakteristik systémů. Tato analýza zahrnuje především analýzu legislativních opatření včetně analýzy legislativní podoby opatření sociální politiky. Takovými analyzovanými opatřeními může být např. antidiskriminační zákon nebo podoba legislativní úpravy poskytování rodičovského příspěvku. Příklad analýzy sociálních charakteristik: [Clasen, Clegg 2011]. 2.6.3 Kvalitativní přístupy (interview) Rozhovory jsou jedním z nejlepších výzkumných nástrojů pro analýzu sociálních problémů na lokální úrovni. V tomto kontextu jsou rozhovory využívány k porozumění podstatě sociálních problémů. Máme na mysli postup, kdy má výzkumník vymezen sociální problém již před výzkumem a během výzkumu zjišťuje podrobné okolnosti či kontexty, v nichž sociální problém vzniká, vyskytuje se či zaniká. Tomuto typu výzkumu se na příkladu věnujeme na konci tohoto textu. Příklady kvalitativní studie sociálních problémů: [Jordan et al. 1992]. 2.6.4 Analýza potřeb Analýza potřeb je specifickým typem analýzy, která se provádí před zavedením programu, aby ověřila jeho potřebnost, nebo aby určila, jaké typy služeb by v rámci programu vedly k nejlepšímu uspokojení potřeb [Rossi, Lipsey a Freeman 2004]. Cílem může být také zjištění poznatků o  potenciálních klientech programu, které mohou vést k  lepšímu využití stávajících služeb. Programy se mohou zaměřovat jak na klienty služeb, tak na sociální pracovníky (např. vzdělávací programy). Základním termínem toho typu analýzy je slovo „potřeba“. Potřeba je podle Rossi, Lipsey, Freeman [2004] sociální konstrukce vyjednaná mezi aktéry odpovědnými za sociální program a těmi, kdo program využívají.11 Evaluační výzkum30 mii potřeb podle Bradshaw [1972], Bradshaw a  Finch [2001]: (a) pociťované potřeby definované jednotlivci, (b) vyjadřované potřeby, které se projevují nějakou akcí, (c) normativní potřeby definované experty, a (d) komparativní potřeby, které srovnávají potřeby s ostatními. 12 Analýza dostupnosti zahrnuje následující analytická hlediska: (a) kapacita – dostatečnost rozsahem služby, (míra pokrytí), (b) selektivita (kritéria přijetí), (c) prostorová dostupnost (dojezdnost), (d) časová dostupnost (otevírací hodiny zařízení) a  finanční dostupnost (viz např. [Kuchařová a Svobodová 2006]). 13 Viz např. pravděpodobné faktory ovlivňující volbu řešení situace dlouhodobé péče o seniory v Německu publikované v [Daguerre 2006]. Z  procesního hlediska analýza umožňuje identifikovat, kteří aktéři program podporují a  kteří jsou proti jeho zavedení či fungování (viz také níže). Analýza potřeb může využívat kvantitativní i  kvalitativní postupy analýzy. Analýza potřeb zahrnuje též např. popis charakteristik cílové populace, což má mj. zajistit, aby se do programu dostali ti správní klienti. Výzkum se zaměřuje na ty sociální podmínky, které aktéři považují za neuspokojivé, a na to, nakolik (případně i proč) jsou potřeby (ne)naplňovány v rámci existujících intervencí. Součástí analýzy může být analýza aktivit, kvality a dostupnosti12 současných intervencí. V neposlední řadě se analýza potřeb může zaměřovat na otázku, nakolik jsou jednotlivé intervence koordinovány [WHO 2000]. 2.6.5 Procesní přístupy k analýze sociálních problémů V procesním přístupu k sociálním problémům je pro výzkumníka významné, jak se sociální problémy vyvíjejí v čase. Analýzy se zaměřují na události, klíčová rozhodnutí a  dále na názory, postoje a  strategie aktérů. Síla procesní analýzy je především v možnosti odkrýt povahu sociálních problémů a mnohdy i skryté zájmy jednotlivých aktérů.13 Někteří autoři rozdělují průběh sociálních problémů do určitých fází (viz tabulka 2.2). Model Herberta Blumera [1971] implicitně předpokládá, že dochází k řešení problémů (v každé z fází ovšem jsou nebo mohou být některé problémy odmítnuty). Oproti tomu model Spector a Kitsuse [1987] předpokládá, že se sociální problém nepodaří vyřešit, respektive že může docházet k  poklesu v  řešení sociálních problémů a  že některé skupiny ve společnosti nemusí být spokojeny s  řešením problému. Plested, Edwards, Jumper-Thurman [2006] pracují s termí- 312 Přístupy k analýze sociálních problémů z hlediska veřejné a sociální politiky nem připravenost (readiness), který chápou jako stupeň, ve kterém je komunita připravena k činu. Tabulka 2.2 Fáze formulace sociálních problémů podle vybraných autorů Model řešení pro- blému Model přirozeného řešení Model připravenosti komunity Blumer [1971] Spector a Kitsuse [1987] Kelly et al. [2003], Plested, Edwards, Jumper-Thurman [2006] (1) vznik/objevení sociálního problému (1) transformace problému ze soukromého do veřejného (1) bez vědomí problému; problém je akceptován (2) legitimizace problému (2) legitimizace problému, akceptace problému veřejnou autoritou (2) odmítnutí problému; mohl by existovat, ale ne v naší lokalitě (3) mobilizace aktérů směrem k řešení problémů (3) fáze konfliktu, problematičnost současných řešení (3) nejasné vědomí problému; problém asi existuje, ale chybí motivace pro jeho řešení (4) formulace oficiálního plánu akcí (4) fáze odcizení nebo radikální změny, hledání vlastního řešení, tvorba vlastních institucí (4) předplánovací fáze; je rozpoznáno, že problém by se měl řešit, formují se první málo zřejmé snahy o řešení (5) implementace plánu akcí (5) přípravná fáze; začíná plánování, komunita poskytuje určitou podporu (6) zavedení řešení; je k dispozici dostatek informací, začínají aktivity (7) stabilizace; aktivity jsou podporovány autoritami, personál je vyškolen (8) potvrzení/rozšíření; aktivity jsou zavedeny, členové komunity jsou spokojeni (9) přijetí problému komunitou; existuje značná znalost o problému a jeho řešení Zdroje: Blumer [1971], Spector a Kitsuse [1987], Kelly et al. [2003], Plested, Edwards, Jumper-Thurman [2006], upraveno autorem. Evaluační výzkum32 Bonoli [2006] vysvětluje změny v sociální politice na základě a) závažnosti problému a  vlivu časování vývoje v  jednotlivých zemích, b)  přímé a  nepřímé politické moci a  mobilizace jednotlivých aktérů, c) institucionální setrvačnosti (např. komu vyhovuje a  nevyhovuje současný stav). Základem pro výzkum sociálních problémů je rozpoznání klíčových aktérů neboli stakeholderů (termín poprvé užil [Freeman 1984]). Podle Rossi, Lipsey a Freeman [2004] jsou významnými hledisky pro identifikaci klíčových skupin: a) kdo může využít výsledky, tj. zpravidla realizátoři programu, b) kdo může být výsledky ovlivněn, tj. zpravidla klienti programu. Hooper a  Longworth [2002] rozlišují tři skupiny aktérů: a) ti, kdo mají potřebné znalosti, b) ti, kdo mají moc ovlivnit výsledky programu, c) ti, kdo mají zájem účastnit se na programu. Na základě přechozích poznatků jsme definovali v tabulce 2.3 potenciální procesní analytická hlediska. Tabulka 2.3: Analytická hlediska pro procesní analýzu sociálních problémů Definice sociálního pro- blému - jak vznikají sociální problémy? - kdo sociální problém definuje? - jaká je historie sociálního problému a komunity [Maguire, Cartwright 2008]? - jak se definice sociálního problému odlišuje v jednotlivých fázích? Stakehol- deři - jak jednotliví stakeholdeři reagují? - kdo podporuje určité řešení problému? - kdo se snaží zabránit tomuto řešení? - kdo je pověřen řešením problému (má odpovědnost)? - jakou roli hrají média? - jaké názory na problém převažují? Spolu- práce a rivalita - kdo s kým spolupracuje při prosazení a řešení sociálního problému? - kdo vytváří koalici [viz Daguerre 2006]? Události - jaké události mají vliv na (způsob) řešení sociálního problému (viz např. situaci dovolání žen k ústavnímu soudu v Německu a její důsledky [Anderson, Meyer 2006]) 332 Přístupy k analýze sociálních problémů z hlediska veřejné a sociální politiky Legiti- mita - nakolik jsou v jednotlivých fázích sociální problémy akceptovány či legitimizovány - jakou roli v tom hraje jednání jednotlivých aktérů - kdo může ovlivnit podobu problému - nakolik mohou problém ovlivnit ti, jichž se bezprostředně týká - kdo další má zájem na řešení problému Řešení - jaká řešení jsou v jednotlivých fázích přijímána - jak se řešení v průběhu času mění - nakolik jsou jednotlivá řešení úspěšná (kritéria úspěšnosti) Zdroje - jaké jsou zdroje, odkud (od koho) pocházejí a jak jsou využívány - jak spolu jednotlivé skupiny aktérů bojují o využití zdrojů (viz např. [Huber, Stephens 2006]) 2.6.6 Analýzy textu a jazyka (diskurzivní analýza) Psané dokumenty mohou být významným zdrojem informací o  sociálních problémech. Různé podoby diskurzivní analýzy (analýza diskurzů) se zaměřují na způsob, jakým jsou sociální problémy definovány v  rámci psaných projevů, významných dokumentů nebo veřejných prohlášení. „Pokračujíce v  tradici, která odmítá možnost na hodnotách nezávislé vědy, argumentují, že věda a především vědecký diskurz, jsou nedílnou součástí sociální struktury, kterou jsou ovlivněny, a  vznikají v sociální interakci.“ [Van Dijk 2001: 352] Diskurzivní analýza se zaměřuje na psaný i  mluvený jazyk jako na základní předmět výzkumu. Jedna z  forem diskurzivní analýzy – kritická diskurzivní analýza (CDA) – se přímo zaměřuje na studium sociálních problémů v kontextu moci a kontroly (viz [Van Dijk 2001], [Jorgensen, Phillips 2002]). 2.6.7 Akční výzkum Specifickou součástí některých procesních přístupů je tzv. akční výzkum, ve kterém je vědec současně účastníkem změny či opačně účastník změny je zároveň vědcem. Jeho role pak spočívá v poskytování in- Evaluační výzkum34 formací, které napomáhají při realizaci projektu či dokonce v působení na ostatní účastníky projektu (viz např. [Coghlan, Brannick 2010]). 2.7 Příkladová analýza sociálního problému [Jordan et al. 1992] V této části se zaměříme na ilustraci toho, jakým způsobem lze kvalitně provést analýzu sociálního problému. Pro příkladovou analýzu sociálního problému jsme vybrali zdařilou studii Jordana a  jeho kolegů Trapped in Poverty? Labour-market Decisions in Low Income Households [Jordan et al. 1992]. Tato analýza byla vybrána pro svá kvalitní teoretická východiska, originální design, detailní popis metodologie a  vysokou kvalitu zpracování výzkumu. Užitečné jsou též poznámky autorů o  problémech, s  nimiž se autoři potýkali během výzkumného procesu. Všechny poznatky uvedené v  této kapitole čerpáme přímo z výše zmíněné knihy. 2.7.1 Cíle studie Autoři studie charakterizovali svůj výzkumný záměr následujícími větami: Kniha poskytuje detailní studii toho, jak se muži a ženy v domácnostech s dětmi s nízkými příjmy rozhodují, jakou práci dělat, za jakou mzdu, kolik hodin pracovat a s jakými vyhlídkami. Ukazuje, jak jsou rozhodnutí o příchodu na trh práce a rozhodnutí o odchodu z trhu práce navázána na jistotu zaměstnání, příjem, daňový systém, sociální dávky, rodinné závazky, způsoby hospodaření a další faktory. Také analyzuje vzájemný vztah rozhodnutí jednotlivých  partnerů a do jaké míry partneři sledují společnou strategii. Autoři uvádějí následující výzkumné otázky: [ibid.: 68] • Jak domácnosti rozhodují o množství placené a neplacené práce prováděné každým z partnerů? • Počítají domácnosti čistý zisk příjmu domácnosti (včetně daní, příspěvků na sociální pojištění, ztráty sociálních dávek a výdajů 352 Přístupy k analýze sociálních problémů z hlediska veřejné a sociální politiky 14 Autoři ukazují např. situace zpoždění či nevyplacení sociálních dávek či situace, kdy lidé nemohou rozhodovat o  povaze svého zaměstnání, např. kolik hodin budou pracovat. na cestování a péči o děti) dříve, než se rozhodnou, zda přijmout málo placené zaměstnání? • Uvědomují si respondenti past nezaměstnanosti či past chudoby, a pokud ano, jak se na základě toho rozhodují? • Jaké prvky trhu práce, daňového systému a  systému sociálních dávek a  jaké interakce mezi těmito prvky uvádějí respondenti jako zásadní pro jejich rozhodnutí? 2.7.2 Teoretické zakotvení studie Studie byla provedena třemi výzkumníky: ekonomem, sociologem a sociálním politikem. I proto autoři studie vnímali rozpor mezi několika základními teoretickými proudy. První proud reprezentuje ekonomický individualismus (reprezentovaný především teorií racionální volby a teorií her). Zde je rozhodování chápáno především jako otázka racionálního kalkulu (vyplatí se či nevyplatí za daných podmínek pracovat). Další teoretické proudy zdůrazňují etické, skupinové, komunitní a společenské faktory. Zde autoři ukazují, jak dělba rolí v rodině, sociální sítě, morální hlediska, pociťované povinnosti a  reciprocita ovlivňují chování respondentů. Pro vysvětlení uplatnění moci mezi oběma partnery jsou prezentovány také levicové a  feministické teorie. Třetí proud reprezentují teorie z oblasti sociální politiky, které se zaměřují na ekonomickou situaci chudých, strategie nezaměstnaných, pobírání sociálních dávek, vliv ideologie a na morální debatu o řešení situace chudých v různých ideových proudech [ibid.: 38 a dále]. Kniha se též dotýká tématu, jak je jednání aktérů omezeno strukturálními faktory.14 2.7.3 Volba metody a provedení studie Autoři upřednostnili kvalitativní výzkumnou strategii. Autoři studii označují jako explorační, vycházeli z  induktivní logiky a  jejich cílem byla tvorba hypotéz a teorie [ibid.: 54–55]. Autoři v metodologii stanovují následující podmínky pro generování teorie z dat [ibid.: 69]: Evaluační výzkum36 15 Kontextuální informace o podobě systému sociálních dávek v době provádění výzkumu jsou uvedeny v příloze č. 1. 1) Vnitřní ucelenost vysvětlení, které je doplněno jak o  běžné, tak i o extrémní případy. 2) Teorie musí vycházet z  poznatků různých oborů, jako je např. ekonomie nebo sociologie, a také musí poznatky doplňovat. 3) Teorie musí překročit rámec mikroroviny vysvětlení rozhodování jednotlivců a rodin tak, aby ukázala širší sociální vztahy a mohla přispět k politické debatě. 4) Teorie musí být schopná propojovat informace ze svého výzkumu s poznatky dalších výzkumů. 5) Teorie musí být podrobitelná falsifikaci, tj. musí rozlišovat nezbytné a  dostatečné podmínky, být schopná rozlišit odlišující se případy, poskytnout jakékoli dostupné kvantifikované výsledky a vždy zvážit alternativní vysvětlení sledovaných dat. Podle autorů bylo jedinou cestou, jak prozkoumat uvažování lidí o trhu práce, zeptat se jich na jejich příběh. Jejich úkolem bylo popsat, jak rozumí dostupným možnostem [ibid.: 55]. Cílem tedy nebylo zjistit objektivní stav (v případě rozporů hledat pravdu), ale prozkoumat, jak je chápou (rekonstruují) respondenti. Ve výzkumu byly využity rozhovory a  terénní poznámky o  průběhu výzkumu15 . Autoři reflektují, že studie neposkytuje „přesné“ informace běžné pro kvantitativní typ výzkumu (viz diskuze [ibid.: 67]) a  výsledky nelze zobecňovat mimo lokalitu [ibid: 80]. K určitému zkreslení výpovědí může docházet z důvodu snahy respondentů o  vylepšení sebeprezentace (viz [ibid.: 74] a diskuze níže). Ve fázi sběru dat byl výzkum proveden jedinou výzkumnicí (Helen Kay), a to během období šestnácti měsíců. Výzkum byl prováděn v  lokalitě nejvíce zanedbané (deprivované) čtvrti Exeteru, devadesátitisícového městečka na jihozápadě Anglie. Jedná se o  meziválečnou zástavbu zanedbaných polořadových domků. Lokalita byla vybrána na základě výsledků předchozích výzkumů, dostupných statistik a rozhovorů s  experty. Zkoumání respondentů z  jedné lokality má výhodu v tom, že respondenti jsou z jednoho prostředí a mají stejné podmínky (např. veřejná doprava, trh práce). 372 Přístupy k analýze sociálních problémů z hlediska veřejné a sociální politiky 16 Zjišťování příjmu je podle autorů spojeno se třemi základními problémy [ibid.: 55– 56]: a) zda brát v úvahu hlavní příjem domácnosti nebo příjem všech členů domácnosti (mají členové domácnosti vzájemně přehled o  svých příjmech), b) jak sledovat příjem v  domácnostech, kde dochází k  častým změnám příjmové situace, c) obava autorů, že zjišťování příjmu na začátku výzkumu povede pro svou citlivost k odmítnutí rozhovorů. 17 Stejně tak platí, že z obdobných studií nelze bez dalšího usuzovat na rozsah sledovaného sociálního problému mimo sledovanou lokalitu (poznámka autora tohoto textu). 18 Základní charakteristiky respondentů jsou popsány na [ibid.: 66]. Základní charakteristiky domácností jsou popsány v příloze č. 2. Cílovou skupinou výzkumu byly nízkopříjmové domácnosti. Autoři se rozhodli nedotazovat se domácností na jejich příjem16 , ale provést rozhovory s  respondenty ochotnými k  výzkumu v  uvedené lokalitě, kde většina domácností má nízké příjmy. Autoři studie uvádějí, že zkoumané domácnosti představují malou a  atypickou část britské populace. Autoři též upozorňují, že uvedené domácnosti nemusí být typickými představiteli této části populace. (Daný typ studie neusiluje o reprezentativnost.)17 Cílem výzkumu bylo provést výzkum ve čtyřiceti dvou domácnostech s  dětmi, přičemž v  každé měly být provedeny tři rozhovory. Autoři předpokládali, že pro analýzu budou moci uplatnit další hlediska srovnání mezi jednotlivými subkategoriemi [viz ibid.: 57]. Respondenti byli kontaktováni přes různé sociální instituce působící ve zkoumané oblasti a přes jejich pracovníky (komunitní centrum, mateřské centrum). Část respondentů byla získána tímto způsobem. Další část respondentů byla získána skrze kontakt přímo v  domácnostech respondentů (zaklepání na dveře). Celkem byly provedeny rozhovory s  třiceti šesti partnerskými dvojicemi s  dětmi.18 V  každé domácnosti výzkumnice prováděla více rozhovorů. Nejprve hovořila s  každým z  partnerů zvlášť a  poté, bylo-li to možné, s  oběma partnery dohromady. Pro srovnání provedla též rozhovory se sedmi samoživitelkami a samoživiteli. Provádění rozhovorů bylo velmi časově náročné. 2.7.4 Politické souvislosti, etické aspekty a obtížnost výzkumu Autoři se rozhodli pro výzkum na základě politické debaty o reformě sociálního systému [ibid.: 54]. Výzkum byl podle autorů studie obtížný v  tom ohledu, že všechny respondenty bylo možné v  době výzkumu označit za chudé; všichni měli zkušenost s pobíráním sociálních dávek Evaluační výzkum38 a ve třetině domácností nikdo nepracoval. Z toho vyplývala politická citlivost zkoumaného tématu. Autoři se v době publikování studie obávali politického dopadu publikování výsledků. Dalším obtížným momentem výzkumu bylo získat dostatečný počet respondentů, zajistit kvalitu výzkumu a také etickou dimenzi výzkumu. Během výzkumu výzkumník otevíral citlivá témata, narušoval intimní prostor domácností, mimoděk se dozvídal intimní informace a  byl svědkem partnerských konfliktů. Autoři studie uvádějí [ibid.: 61]: V této fázi bylo zjevné, že lidé své pracovní zkušenosti silně prožívají a  že otázky, které vyvstávaly během výzkumu, se stávaly extrémně citlivými, když se autoři pokusili uvést je do kontextu domácnosti. Dokonce i  u  relativně harmonických, spolupracujících párů se vyskytovaly určité tenze a tabuizované oblasti. V  některých případech se stávalo, že partneři vypovídali odlišně. Bylo obtížné uskutečnit druhý (s partnerem) a třetí (společný) rozhovor. Bylo obtížné uskutečnit individuální rozhovory bez přítomnosti partnera. Přítomnost partnera při individuálních rozhovorech někdy pravděpodobně narušovala validitu rozhovoru (vstupování partnera do rozhovoru, obava mluvit před partnerem). Základním požadavkem pro provádění výzkumu by vždy měl být informovaný souhlas respon- denta. 2.7.5 Zpracování výsledků Rozhovory byly nahrávány na magnetofon a  poté detailně přepsány. Ve fázi analýzy dat se výzkumu zúčastnili dva výzkumníci. Autoři plánovali analyzovat data tak, aby využili vlastní koncepty respondentů pro definování objevujících se témat. Ve druhé fázi výzkumu mělo následovat kognitivní mapování, které mělo přiřadit ke konceptům odpovídající procesy tak, aby bylo možné vytvořit teorii a tu diskutovat mezi jednotlivými výzkumníky [ibid.: 57]. Autoři usilovali o to, aby provedený typ analýzy byl přesvědčivý [ibid.: 68]. V  obdobném kontextu se často u  kvalitativního výzkumu píše o  potřebě autentičnosti a důvěryhodnosti. Autoři pracovali tím způsobem, že každý z nich vypracoval vlastní draft a následně diskutovali získané poznatky. U interpretace výsledků 392 Přístupy k analýze sociálních problémů z hlediska veřejné a sociální politiky nebylo vždy snadné dosáhnout konsenzu ohledně významů jednotlivých výpovědí z  hlediska rozdílných teoretických východisek autorů [viz ibid.: 69–70]. Nejprve využívali jakési mentální mapy jednotlivých rozhovorů, ale nebyli schopni se shodnout ohledně interpretací. Z toho důvodu využili autoři kódování (např. bydlení, daně, dávky, osoba samostatně výdělečně činná, hospodaření). Z  rozhovorů s  respondenty ovšem bylo jasné, že jednotliví respondenti interpretují stejná slova jinak a přikládají jim různé významy. Kromě rozdílného chápání jednotlivých slov se ve výpovědích projevily různé odkazy na sociální kontext (sociální vztahy) a  morální kritéria ospravedlnění rozhodování (odkazy na normy a požadavky kultury komunity a společnosti, ve které respondent žije). Studie je organizována následujícím způsobem: samostatné kapitoly jsou věnovány výpovědím mužů, výpovědím žen a společným výpovědím, informacím o bydlení a výpovědím samoživitelek a samoživitelů. Každá kapitola je strukturována kolem několika specifických témat. Výzkumný materiál je ve studii prezentován formou úryvků dialogu z  jednotlivých rozhovorů, popisy jednotlivých situací (zde dochází k  propojení informací z  rozhovoru partnera a  partnerky, případně společného rozhovoru). Informace získané z  rozhovorů jsou propojovány s teoriemi prezentovanými na začátku výzkumné studie. Závěrečná kapitola propojuje výsledky studie s teoretickými poznatky. 2.7.6 Komentář k provedení výzkumu Uvedená studie je cenná tím, že přestože přinesla zajímavé výsledky, autoři zde poukazují na celou řadu problematických míst výzkumu, která jsou v  obdobných studiích obvykle zamlčena: náročnost rozhovorů, obtížnost analýzy velkého množství dat, problémy ve shodě v  interpretaci výsledků mezi jednotlivými výzkumníky, změna výzkumníků v  průběhu výzkumu, obtížné materiální a  další podmínky pro výzkum, etické aspekty výzkumu a citlivost prezentovaných údajů. Z tohoto důvodu je uvedený výzkum jako celek cenným zdrojem poznatků o analýze sociálních problémů. Evaluační výzkum40 Literatura Anderson, K. M., T. Meyer. 2006. „New Social Risks and Pension Reform in Germany and Sweden.“ Pp. 171–191 in Armingeon, K., Bonoli, G. (eds) Industrial Welfare States: Adapting Post-war Social Policies to New Social Risks. New York: Routledge. Armingeon, K., G. Bonoli. (eds.) 2006. Industrial Welfare States: Adapting Post-war Social Policies to New Social Risks. New York: Routledge. Berger, P. L., T. Luckmann. 1971. The Social Construction of Reality: A Treatise in the Sociology of Knowledge. Harmondsworth, Middlesex: Penguin University Books. Blumer, H. 1971. „Social Problems as Collective Behavior. “ Social Problems 13 (3): 298–306. Bonoli, G. 2006. „New Social Risks and the Politics of Post-industrial Social Policies.“ Pp. 3–26 in Armingeon, K., Bonoli, G. (eds.) Industrial Welfare States: Adapting Post-war Social Policies to New Social Risks. New York: Routledge. Bradshaw, J. R. 1972. „The Concept of Social Need.“ New Society 496: 640–643. Bradshaw, J., N. Finch. 2001. Core Poverty. Paper for a Seminar at Centre for the Analysis of Social Exclusion LSE, London. York: University of York. Carl, J. D. 2011. Think Social Problems. Boston: Pearson Education. Clasen, J., D. Clegg. 2011. Regulating the Risk of Unemployment. Oxford: Oxford university press. Coghlan, D., T. Brannick. 2010. Doing Action Research in Your own Organization. London: Sage Publications. Collins, R. 1993. „What Does Conflict Theory Predict about America‘s Future? 1993 Presidential Address.“ Sociological Perspectives 36(4): 289–313. Coser, L. A. 1957. „Social Conflict and the Theory of Social Change.“ The British Journal of Sociology 8(3): 197–207. Daguerre, A. 2006. „Childcare policies in diverse European welfare states.“ Pp. 211–226 in Armingeon, K., G. Bonoli. (eds.) Industrial Welfare States: Adapting Post-war Social Policies to New Social Risks. New York: Routledge. Durant, W. 1917. Philosophy and the Social Problem. Norwood: Norwood Press. Freeman, R.E. 1984. Strategic Management: A Stakeholder Approach. Boston, MA: Pitman. George, H. 1884. Social Problems. Chicago: Belford, Clarke & Co. George, V., P. Wilding. 1994. Welfare and Ideology. Hemel Hempstead: Harvester Wheatsheaf. Ginzberg, E. 2004. The Unemployed. Piscataway, New Jersey: Transaction Publishers. Hooper, J., P. Longworth. 2002. Health Needs Assessment Workbook. London: Health Development Agency. Huber, E., J. D. Stephens. 2006. „Combating Old and New Social Risks.“ Pp. 143–168 in Armingeon, K., G. Bonoli. (eds.) (2006) Industrial Welfare States: Adapting Post-war Social Policies to New Social Risks. New York: Routledge. Jahoda, M., P. F. Lazarsfeld, H. Zaisel. 2002. Marienthal: the Sociography of an Unemployed Community. New Brunswick: Transaction Publishers. 412 Přístupy k analýze sociálních problémů z hlediska veřejné a sociální politiky Jorgensen M., L. J. Phillips. 2002. Discourse Analysis as Theory and Method. London, Thousand Oaks, New Delhi: SAGE Publications. Jordan, B., S. James, H. Kay, M. Redley. 1992. Trapped in Poverty? Labour Market Decisions in Low Income Households, London: Routledge. Kelly, K. J., B. A. Plested, R. W. Edwards, P. Jumper-Thurman, M. L. Comello, M. D. Slater. 2003. „The Community Readiness Model: A Complementary Approach to Social Marketing.” Marketing Theory 3(4): 411–425. Kuchařová, V., K. Svobodová. 2006. Síť zařízení denní péče o děti předškolního věku v ČR. Praha: VÚPSV. Lyotard, J. F. 1984. The Postmodern Condition: A Report on Knowledge. Minneapolis: University of Minnesota Press. Levitas, R., C. Pantazis, E. Fahmy, D. Gordon, E. Lloyd, D. Patsios. 2007. The Multi-dimensional Analysis of Social Exclusion, Bristol: Townsend Centre for the International Study of Poverty and Bristol Institute for Public Affairs, University of Bristol. Merton, R. K. 1982. Social Research and the Practicing Professions. Cambridge, Mass: Abt Books. Mills, C. W. 1959. The Sociological Imagination. New York: Oxford University Press. Maguire, B., S. Cartwright. 2008. Assessing a Community’s Capacity to Manage Change: A Resilience Approach to Social Assessment. Canberra: Bureau of Rural Sciences. Navrátil, P. 1998. „Sociální práce jako sociální konstrukce.“ Sociologický časopis 34 (1): 37–50. Neuman, W. L. 2007. Basics of Social Research. Boston, USA: Pearson Education. Plested, B. A., R. W. Edwards, P. Jumper-Thurman. 2006. Community Readiness: A Handbook for Successful Change. Fort Collins, CO: Tri-Ethnic Center for Prevention Research. Rossi, P. H., M. W. Lipsey, H. W. Freeman. 2004. Evaluation: A Systematic Approach. Thousand Oaks: Sage Publications. Rowlingson, K. 2011. Does Income Inequality Cause Health and Social Problems? York: Joseph Rowntree Foundation. Schön, D. A., M. Rein. 1994. Frame Reflection: Toward the Resolution of Intractable Policy Controversies. New York: Basic Books. Spector, M., J. I. Kitsuse. 1987. Constructing Social Problems. Hawthorne, NY: Aldine de Gruyter. Taylor-Gooby, P. (ed.) 2004. New Risks, New Welfare: the Transformation of the European Welfare State. New York: Oxford University Press. Van Dijk T. A. 2001. „Critical Discourse Analysis“ Pp. 352–371 in Tannen, D., D. Schiffrin, H. Hamilton. (eds) Handbook of Discourse Analysis. Oxford: Blackwell. Veselý, A. 2009. Vymezení a strukturace problému ve veřejné politice. Praha: Karolinum. WHO 2000. Workbook 3: Needs Assessment. Geneva: World Health Organisation, United Nations International Drug Control Programme, European Monitoring Center on Drugs and Drug Addiction. 433 Evaluace programu ve stadiu plánování 3 EVALUACE PROGRAMU VE STADIU PLÁNOVÁNÍ Martin Žižlavský 3.1 Úvod Tato kapitola ukazuje aplikace metod a  technik výzkumu sociálního světa při evaluaci programu ve stadiu plánování pomocí komentovaných ukázek skutečných evaluačních výzkumů. Členění určitého programu na stadia autor převzal od Chena [2005: 48]. Ve stadiu plánování se daný program „rodí“. Po stadiu plánování následuje stadium počáteční implementace. Podle Chena [ibid.] plán programu slouží jako základ pro organizaci a  implementaci programu v  budoucím období. Chen [ibid.] se domnívá, že řádný plán programu obsahuje zdůvodnění existence programu a plán implementace programu. Jinými slovy, řádný plán programu ve stadiu plánování obsahuje jak symbolickou část zdůvodňující význam zamýšleného programu odkazem na určitý sociální problém, tak implementační část pojednávající o  uskutečňování programu. Evaluace programu ve stadiu plánování pak pomáhá naplnit potřebu subjektů zainteresovaných na programu dozvědět se od evaluátora odborné „evaluační koncepty, strategie a činnosti, které mohou pomoci při navrhování a rozvinutí programového zdůvodnění a plánu programu.“ [Chen 2005: 50] Výběr ukázek evaluace programu ve stadiu plánování byl omezen malým množstvím publikovaných písemných zpráv na toto téma. Většina písemných evaluačních zpráv má totiž povahu soukromé věci náležející k  soukromému obchodnímu kontraktu mezi evaluátorem a  jeho zákazníkem. Konečně, účastníci evaluací si často nepořizovali písemné záznamy a  vše, co se dělo při evaluacích programů ve fázi plánování tak zůstává skryto před veřejností v paměti přímých účastníků evaluací. Výběr ukázek evaluace programu ve fázi plánování byl tudíž omezen na veřejně dostupné písemné zprávy o  evaluacích programových plánů. Autor této kapitoly vybral ty zprávy, které nejvíce naplňovaly kritérium transparentního popisu metodiky evaluačního výzkumu programu ve fázi plánování. Evaluační výzkum44 3.2 První ukázka: Plán rozvoje sociálních služeb v Moravskoslezském kraji Plán programu může informovat občany o  politikách, které plánují politikové územně správního celku, například kraje. To je případ Střednědobého plánu rozvoje sociálních služeb v  Moravskoslezském kraji na léta 2010–2014 (dále v textu také jen „komunitní plán“). Prvotní účel vybraného komunitního plánu samozřejmě spočívá v podpoře návrhu a  uskutečňování rozvoje sociálních služeb v  Moravskoslezském kraji zainteresovanými stranami. Tento komunitní plán je jedním z dílčích plánů, které se vážou k jednotlivým krokům procesu plánování rozvoje sociálních služeb v  Moravskoslezském kraji. Hodnocený komunitní plán se váže k druhé fázi plánování rozvoje sociálních služeb v Moravskoslezském kraji. První fáze, 2008 až 2009, se zaměřila na stabilizaci současného stavu poskytování sociálních služeb; druhá fáze, 2010 až 2014, se týkala vytváření systému rozvoje sociálních služeb v  kraji (návrh decentralizace, návrh nového systému odměňování); třetí fáze, 2015 až 2018, se bude soustřeďovat na rozvoj sociálních služeb a vytvoření strategie k jejich zajištění (vytvoření sítě poskytovatelů a také systému sledování a hodnocení plánu rozvoje sociálních služeb). (Podrobněji viz [Bareš 2011: 36].) 3.2.1 Cíl evaluace. Evaluační strategie Protože evaluace programu uspokojuje informační potřebu nejen evaluátora (či evaluátorů), ale také subjektů majících zájem na programu (angl. „stakeholders“), tak zpravidla nevymezuje cíle evaluace a  prostředky k  jejich dosažení sám evaluátor. Chen nazývá takový soubor evaluačních cílů a  prostředků evaluační strategií. „Evaluační strategie je obecný směr nebo orientace, kterým se ubírají evaluátoři a subjekty mající zájem na programu, aby naplnili daný účel evaluace.“ [Chen 2005: 51] Evaluátor může například poskytnout svoje znalosti a  dovednosti subjektům majícím zájem na programu formou expertízy. Evaluátor také vystupuje v  roli konzultanta nebo moderátora diskuse pracovní skupiny složené ze zástupců stran zainteresovaných na plánovaném programu. Podkladem pro konzultace je mimo jiné text plánu programu. Jedním z výstupů této evaluační strategie, napomáhající rozvoji programu, může být výzkumná zpráva nebo článek 453 Evaluace programu ve stadiu plánování v  odborném časopise. Veřejně přístupná výzkumná zpráva obsahuje důležitá sdělení jak pro jiné evaluátory, tak pro tvůrce podobných programů v  jiných územně správních celcích. A  to je případ výzkumné zprávy Pavla Bareše nazvané Cíle, priority a  opatření v  plánu rozvoje sociálních služeb Moravskoslezského kraje. Jeho výzkumná zpráva rozšířila informační základnu pro tvůrce komunitních plánů v  ostatních krajích České republiky. Bareš o  své evaluaci píše [2011: 26]: „Jejím cílem je zachytit, jakým způsobem byly formulovány a  v  dokumentu jsou prezentovány cíle, priority, opatření a aktivity, respektive v jakých ohledech lze zvolený přístup k jejich formulaci a prezentaci považovat za přínosný a jaké má zvolený přístup limity.“ 3.2.2 Metody a techniky výzkumu použité v evaluaci. Evaluační přístup Konkrétní prvky postupu v  rámci dané evaluační strategie ukazuje evaluační přístup. Chen [2005: 52] píše, že „evaluační přístup ustavuje systematický soubor určitých procedur a  východisek k  usměrnění navrhování a  vedení evaluace.“ Do procedur a  východisek spadají také určité metody a techniky výzkumu sociálního světa. Výchozí bod evaluačního výzkumu představují výzkumné otázky. Bareš [2011: 26] formuluje několik výzkumných otázek: „Je z hlediska těchto aspektů dokument navržen adekvátně a  je z  tohoto ohledu logicky strukturován? Umožňuje relevantní dokumentace dostatečně ,zrekonstruovat‘ použitý postup pro stanovení priorit a  je zvolený postup adekvátní?“ Z  uvedených výzkumných otázek vyplývá, že jednotku zkoumání představovaly určité vlastnosti komunitního plánu: logická struktura komunitního plánu, postup pro stanovení priorit v komunitním plánu a adekvátnost postupu pro stanovení priorit v komunitním plánu. Empirická data Bareš čerpal z dokumentu obsahujícího text s komunitním plánem Moravskoslezského kraje. Přiměřeně povaze dat v  této jednotce zjišťování (dokument s  komunitním plánem) Bareš přizpůsobil techniku šetření empirických dat a techniku analýzy a interpretace dat. Přesněji řečeno, použil obsahovou analýzu textu. Bareš se v obsahové analýze zaměřil na nalezení znaků textu komunitního plánu, které definoval pomocí Metodiky pro plánování sociálních služeb Ministerstva práce a sociálních věcí České republiky [viz Skříčková 2007]. Přestože Evaluační výzkum46 v obsahové analýze postupoval kvalitativně, nenacházelo se v ohnisku jeho výzkumného zájmu hledání původních významů v textu, ale identifikace předem vymezených znaků v  textu. Autoři označují takovou variantu obsahové analýzy sice různými, ale významově totožnými výrazy. Mayring [2000] píše o „aplikaci deduktivních významových kategorií“, Hsieh a Shannon [2005] se zmiňují o „řízené obsahové analýze“. Výstižněji a  podrobněji vysvětluje tuto variantu obsahové analýzy textu Krippendorff [2013] a nazývá ji aplikací analytických konstruktů v podobě standardů za účelem hodnocení textového obsahu. „Aplikace standardů pro identifikaci, hodnocení nebo audit zahrnuje dva kroky: (a) srovnání z textu odvozené proměnné s daným nebo předpokládaným standardem pro tuto proměnnou a (b) posouzení, co z  tohoto (srovnání, pozn. autora) plyne.“ [ibid.: 179] Bareš hledal obsahovou analýzou textu komunitního plánu pomocí aplikace standardů odpovědi na svoje výzkumné otázky. Výsledkem Barešovy obsahové analýzy byly logické vývody (závěry) plynoucí z  výsledku srovnání standardu s  textem plánu (viz obrázek 3.1). Barešovu analýzu rámoval kontext politiky budování krajských sítí sociálních služeb, metodicky usměrňovaný pracovníky Ministerstva práce a  sociálních věcí České republiky. Metodické usměrňování ze strany Ministerstva práce a  sociálních věcí České republiky a  rovněž metodika plánování sociálních služeb vypracovaná na popud stejného ministerstva se nesly v  nezávazném, doporučujícím duchu. Pracovní týmy v  jednotlivých krajích tudíž disponovaly značnou volností při vypracovávání krajských plánů sociálních služeb. Tato skutečnost dominovala kontextu Barešovy obsahové analýzy textu komunitního plánu Moravskoslezského kraje. Metodika pro plánování sociálních služeb [Skříčková 2007] poskytla Barešovi standardy plánu sociálních služeb, které dále rozpracoval do empiricky použitelného kódovacího schématu, nebo, dle jeho vlastních slov, do empiricky použitelného „kategorizačního klíče“. Podle tohoto kategorizačního klíče Bareš vyhledával a třídil části textu plánu sociálních služeb v Moravskoslezském kraji. 473 Evaluace programu ve stadiu plánování Obrázek 3.1 Proces obsahové analýzy textu Pramen: Krippendorff 2013: 83; vlastní překlad. Krajský plán rozvoje sociální služeb vybíral Bareš záměrně. Plán vybraný ze souboru všech krajských plánů musel splňovat následující kritéria: – skončení platnosti plánu v roce 2012 a později; – začátek platnosti plánu v roce 2010 nebo v roce 2011; – přičemž plán nesměl být aktualizací předchozího plánu. Těmto kritériím vyhověly tři komunitní plány. Následně Bareš vybral z těchto tří plánů jeden pomocí následujících kritérií: – určité charakteristiky prvního krajského komunitního plánu; – návaznost na minulé dokumenty týkající se sociálních služeb v kraji; – vývoj koncepce plánování rozvoje sociálních služeb v minulosti; – koncepce a strukturace aktuálního plánu s důrazem na priority. Pomyslným sítem posledně zmíněných kritérií prošel Střednědobý plán rozvoje sociálních služeb v Moravskoslezském kraji na roky 2010 až 2014. Evaluační výzkum48 3.2.3 Postup a výsledky evaluace Bareš si nejprve ujasnil význam slova „priorita“ [2011: 27], přičemž konstatoval, že „v  plánu MS (Moravskoslezského, pozn. autora) kraje je akcentováno především to, že se jedná o určitou tematickou oblast.“ Slovo „priorita“ používali autoři textu plánu Moravskoslezského kraje tak, že nebrali v potaz důraz na pořadí, na přednost či prvenství cílů. Bareš dospěl k závěru, že v plánu Moravskoslezského kraje má „priorita“ spíše význam geografický a věcný, označuje spíše určitou skupinu témat. Z  tohoto důvodu reformuloval původní výraz „priority“ na „prioritní oblasti“ a  dále původní výraz textu plánu Moravskoslezského kraje „vlastní priority“ na „akcentované obsahy a  preferované postupy“ [viz Bareš 2011: 29]. Další překážku pro obsahovou analýzu textu plánu Moravskoslezského kraje představovalo nesystematické používání výrazů „priorita“ a „vlastní priority“. Bareš na jejich identifikaci a kategorizaci použil níže zmíněný kategorizační klíč. Barešův kategorizační klíč obsahuje následující významové kategorie: 1. obsahové akcenty („co bude akcentováno“ – A), lze rozlišit dvě pod- kategorie: a. vyjádřené konkrétně či přímo (KA) b. vyjádřené obecně či nepřímo (OA); 2. preferované postupy („jaké postupy jsou preferovány při dosahování stanovených cílů a priorit“ – P), opět lze rozlišit dvě podkate- gorie: a. obsah a rozsah (P-O) b. podmínky a okolnosti (P-P). [Bareš 2011: 30] Přiřazení jednotlivých kategorií částem, „útržkům“, textu plánu Moravskoslezského kraje umožnilo Barešovi systematickou obsahovou analýzu textu. Ještě než k  ní Bareš přistoupil, tak si kvůli obsahové různorodosti prioritních oblastí v  analyzovaném textu plánu vyjasnil indikátory pro přímé obsahové akcenty a  nepřímé obsahové akcenty (viz tabulka 3.1). 493 Evaluace programu ve stadiu plánování Tabulka 3.1 Kritéria dělení obsahových akcentů na přímé a nepřímé v jednotlivých prioritních oblastech prioritní oblast / obecná kategorie konkrétnější specifikace / přímé obsahové akcenty obecnější rámec / nepřímé obsahové akcenty 1. prioritní oblast – procesy při plánování akcenty na určité konkrétní aspekty v oblasti sociálních služeb akcenty obecnější povahy 2. prioritní oblast – rozvoj služeb parametry sociálních služeb dle zákona o sociálních službách (druh či forma poskytování), deklarace potřebnosti obcí jiná charakteristika prioritních typů sociálních služeb (cílové skupiny, „alternativní a navázané služby“ apod.) 3. prioritní oblast – kvalita služeb akcenty na určité konkrétní aspekty, akcenty přímo se týkající poskytování sociálních služeb podle zákona o sociálních službách akcenty obecnější povahy, akcenty týkající se širšího zaměření politiky sociálních služeb („poskytovatelé sociálních služeb nenahrazují běžně dostupné veřejné služby“ apod.) 4. prioritní oblast – financování služeb konkrétní požadované předpoklady, jež musejí sociální služby naplňovat, mají-li být financovány z rozpočtu kraje obecnější charakteristiky týkající se širšího zaměření politiky sociálních služeb („vyjednání veřejného závazku ve smyslu vymezení služeb jako služby veřejného zájmu včetně nastavení spolufinancování“ apod.) Pramen: Bareš 2011: 31 Bareš nejprve prošel text plánu Moravskoslezského kraje za účelem rozpoznání pasáží podle kategorizačního klíče. Po rozpoznání shodnosti významu textové pasáže s významem určité kategorie z kategorizačního klíče Bareš tuto textovou pasáž označil kódem této kategorie. Pomocí kódů pak Bareš systematicky třídil pasáže roztroušené na různých místech textu plánu Moravskoslezského kraje podle určité významové kategorie. Tento postup Bareš aplikoval na každou prioritní oblast (Podpora procesu střednědobého plánování rozvoje sociálních služeb v Moravskoslezském kraji; Podpora rozvoje potřebných sociálních služeb; Podpora zvyšování kvality sociálních služeb; Podpora nastavení funkčního a  transparentního systému financování potřebných a kvalitních sociálních služeb). Že identifikace významových kategorií pro každou prioritní oblast nutně vedla mimo textové oddíly explicitně věnované určité prioritní oblasti, dokládá sám Bareš [2011: 43]: Evaluační výzkum50 Všechny čtyři uvedené prioritní oblasti sice napovídají, které oblasti budou v  rámci plánu MS kraje řešeny, žádná z  nich však nevypovídá nic o  konkrétních ani obecnějších akcentech či preferencích. Představu o  obsahových akcentech a  preferovaných postupech si lze vytvořit až studiem obsahu jednotlivých podkapitol, v nichž jsou tyto čtyři prioritní oblasti důkladněji rozebrány. Výsledky nalezení významových ekvivalencí a  přiřazení významových kategorií pro každou prioritní oblast Bareš prezentoval v přehledové tabulce, kterou opatřil komentářem. Tabulka 3.2 ukazuje přehledovou tabulku s  výsledkem kategorizace podle obsahových akcentů a  preferovaných postupů pro první prioritní oblast Podpora procesu střednědobého plánování rozvoje sociálních služeb v  Moravskoslezském kraji. Tabulka 3.2 Aplikace kategorizačního klíče v analýze textu první prioritní oblasti Číslo obec. princ. obecný princip klasifikace 1 Procesy plánování rozvoje sociálních služeb probíhají v souladu s Metodikami pro plánování sociálních služeb a Kritérii kvality plánování sociálních služeb. P-O/P-P 2 Zapojení obcí do procesu plánování je nezbytným předpokladem pro efektivní plánování rozvoje sociálních služeb na úrovni celého kraje. P-P 3 Kraj deklaruje podporu obcím na území MS kraje, které plánují rozvoj sociálních služeb. P-P 4A Obec zjišťuje potřeby poskytování sociálních služeb osobám nebo skupinám osob na svém území. KA 4B Tyto informace společně s možnostmi jejich uspokojování sděluje kraji. P-P 5A Zadavatelé identifikují potřeby KA 5B a navzájem spolupracují při síťování sociálních služeb. P-P 6 Pro posílení komplexnosti procesu střednědobého plánování rozvoje sociálních služeb na území kraje je žádoucí, aby obce v procesu plánování sociálních služeb vzájemně spolupracovaly a vytvářely tak vhodné prostředí pro síťování sociálních služeb. Spolupráce obcí je dobrovolná. P-P 513 Evaluace programu ve stadiu plánování 7 Struktura území, v němž probíhá proces plánování sociálních služeb, odpovídá území vymezenému působností úřadu obce s pověřeným obecním úřadem, nezvolí-li si obce jinou formu plánování (např. území obce, svazku obcí, mikroregion). P-O 8 Při realizaci procesu střednědobého plánování rozvoje sociálních služeb na všech úrovních je nezbytné zaměřovat se na kvalitu sociálních služeb. OA 9 V rámci střednědobého plánování rozvoje sociálních služeb na všech úrovních je nezbytné propojení potřebnosti, kvality a financování sociálních služeb. P-O 10 Pro posílení skladebnosti krajského plánu je vytvořena doporučená struktura obecních střednědobých plánů. P-O/P-P 11A Ve střednědobých plánech rozvoje sociálních služeb obcí je žádoucí ukotvit stávající a nové sociální služby, příp. i na ně navazující aktivity KA 11B včetně zajištění udržitelného způsobu financování. P-P Pramen: Bareš 2011: 45 Legenda: KA – akcenty na určité konkrétní aspekty v oblasti sociálních služeb; OA – akcenty obecnější povahy; P-O – obsah a rozsah preferovaných postupů; P-P – podmínky a okolnosti preferovaných postupů. Přístup ke stanovení priorit v  plánu Moravskoslezského kraje nevyústil ve stanovení pořadí důležitosti, píše Bareš, což dokládá významový posun výrazu „priorita“ v textu plánu Moravskoslezského kraje do významu, v němž se jakákoli priorita či pořadí ztratily. Pozitivním přínosem Bareš shledává rozlišení čtyřech prioritních oblastí, přesněji to, že se tyto oblasti tematicky nepřekrývají. Umístění prioritní oblasti „Podpora procesu střednědobého plánování rozvoje sociálních služeb v  Moravskoslezském kraji“ na první místo vyjmenovaných prioritních oblastí se Barešovi jeví účelným, neboť je procedurálně svázána s  ostatními prioritními oblastmi. Tato prioritní oblast totiž obsahuje metodiky pro plánování v ostatních prioritních oblastech. Negativum Bareš spatřoval v nepřehlednosti textu plánu Moravskoslezského kraje, čemuž byl podle něj na vině nestrukturovaný „beletristický“ styl. Bareš také hodnotil „zvolený přístup tematizace priorit, opatření a  aktivit“ v  textu plánu. Kromě pojmové volnosti, volného nakládání s termíny ukotvenými v oficiální (byť nezávazné) metodice [viz Skříčková 2007], zde našel negativum, a to nejasné vazby mezi prioritními oblastmi na jedné straně a  opatřeními a  aktivitami na straně druhé. Evaluační výzkum52 V  textu plánu není jasně zmíněn způsob stanovení opatření a  aktivit vzhledem k  tematizovaným prioritním oblastem. Není objasněn postup, metodika, jakou se dospělo k propojení prioritních oblastí s opatřeními. Obecně řečeno, nepřítomnost popisu postupu Bareš shledává nedostatkem plánu. Rovněž přístup k  formulaci prioritních oblastí byl poněkud neprůhledný. Proto Bareš nemohl zcela rekonstruovat postup stanovení priorit a rovněž nemohl řádně posoudit adekvátnost postupu stanovení priorit. Sdělení obsažená v  textu plánu Moravskoslezského kraje Barešovi dovolila posoudit adekvátnost postupu pouze rámcově vzhledem k  celému procesu plánování sociálních služeb v  Moravskoslezském kraji. Vzhledem k  příslušnosti hodnoceného plánu do druhé fáze procesu plánování sociálních služeb v Moravskoslezském kraji shledává Bareš postup stanovení priorit adekvátním. Přesto Bareš navrhuje systemizaci a  strukturaci obsahových akcentů a  preferovaných postupů pro zlepšení věcného propojení prioritních oblastí s  opatřeními a  aktivitami. To pak podle něj následně umožní sestavení pořadí obsahových akcentů a preferovaných postupů. 3.3 Druhá ukázka: Národní akční plány sociálního začleňování vybraných států Evropské Unie V druhé ukázce evaluace programu ve stadiu plánování hodnotí Miroslava Rákoczyová vybrané národní akční plány sociálního začleňování z období 2003 až 2005 (v případě národních akčních plánů sociálního začleňování Dánska, Německa a  Velké Británie) a  z  období 2004 až 2006 (v  případě národních akčních plánů sociálního začleňování České republiky a  Maďarska). Národní akční plány sociálního začleňování vypracovávaly členské státy Evropské unie v tzv. Lisabonském plánovacím období (2000 až 2010) pomocí otevřené metody koordinace. Otevřená metoda koordinace byla vytvořena a  vyzkoušena v  procesu sbližování politik zaměstnanosti jednotlivých členských států Evropské unie. Pak byla v  plánovacím desetiletí 2000 až 2010 rozšířena na další politiky, které jsou v  kompetenci vlád členských států Evropské unie, mimo jiné také na politiku sociálního začleňování. „Otevřená metoda koordinace vytváří rámec pro spolupráci členských států, jejichž národní politiky jsou takto směřovány k určitým společným cílům.“ [Europa 2014] 533 Evaluace programu ve stadiu plánování Konvergenční proces podporoval společné definování cílů politiky sociálního začleňování a  společné stanovování způsobů měření cílů politiky sociálního začleňování politickými zástupci jednotlivých členských států v Radě Evropské unie. Národní akční plán sociálního začleňování pak ukazoval, které ze společných cílů určitý členský stát sleduje, jaké jsou výchozí a cílové kvantity těchto cílů, měřené společně stanovenými způsoby měření, a  konečně, jakými prostředky (politikami) chtějí politikové a  státní úředníci daného státu dosáhnout stanovených cílů. Za dohledu Evropské komise jsou Národní akční plány sociálního začleňování jednotlivých členských států Evropské unie navzájem srovnávány jednak za účelem rozpoznání úrovně výkonu jednotlivých členských států při sledování společných cílů, jednak za účelem mezistátní výměny příkladů dobré praxe. Úředníci Komise Evropské unie pak v  pravidelných dvouletých intervalech zhodnotí proces srovnávání výkonů při sledování společných cílů a  výměnu příkladů dobré praxe v dokumentu „Společná zpráva“ (Joint Report). 3.3.1 Cíl evaluace. Evaluační strategie Rákoczyová vykonala evaluaci z pohledu experta stojícího mimo proces hodnocení v rámci otevřené metody koordinace. Popud k evaluaci národních akčních plánů sociálního začleňování tudíž nevzešel z  potřeb subjektů zainteresovaných na tvorbě národních akčních plánů sociálního začleňování, ale vzešel z  odborného zájmu expertky dlouhodobě se zabývající sociální politikou v České republice a v Evropské unii. Protože výsledky svého evaluačního výzkumu Rákoczyová publikovala v odborném časopise, plnila její studie pomocnou informační funkci pro tvůrce národního akčního plánu sociálního začleňování, a to zejména v České republice. Podobně jako výše Bareš, Rákoczyová při své evaluaci národních akčních plánů sociálního začleňování sledovala evaluační strategii napomáhající rozvoji programu. Poznávací cíl evaluace vybraných národních akčních plánů sociálního začleňování vystihují následují věty: „Cílem předkládané studie je srovnání národních akčních plánů sociálního začleňování České republiky a čtyř vybraných členských států Evropské unie. Zaměřujeme se především na opatření cílená na jednotlivé skupiny ohrožené sociálním vyloučením a na stanovené cíle.“ [Mareš, Rákoczyová, Sirovátka 2006: 28] Evaluační výzkum54 3.3.2 Metody a techniky výzkumu použité v evaluaci. Evaluační přístup Rákoczyová hledala odpověď na pomyslnou výzkumnou otázku (pomyslná je proto, že Rákoczyová v textu své výzkumné zprávy explicitně výzkumnou otázku neuvádí, je implicitní): jak jsou ve vybraných národních akčních plánech sociálního začleňování vymezeny jednak skupiny ohrožené sociálním vyloučením, jednak cíle a opatření sociálního začlenění těchto skupin? Ze zaměření výzkumu vyplynuly následující jednotky zkoumání: vymezení opatření cílená na jednotlivé skupiny ohrožené sociálním vyloučením; vymezení cílů. Údaje potřebné k nalezení odpovědi na výzkumnou otázku Rákoczyová vyhledala z jednotky zjišťování, kterou představovaly dokumenty s texty národních akčních plánů sociálního začleňování. Dokumenty s národními akčními plány sociálního začleňování Rákoczyová vybírala tak, aby zastupovaly co nejpestřejší podoby plánů ke srovnání s  plánem České republiky. Základní soubor, ze kterého Rákoczyová vybírala, představovaly národní akční plány sociálního začleňování států Evropské unie za roky 2003 až 2005 a za roky 2004 až 2006 pro státy, jež vstoupily do Evropské unie v roce 2004. Zmíněnou pestrost Rákoczyová nejprve zajistila pomocí výběrového kritéria „typ sociálního státu podle Esping-Andersena“. Podle tohoto kritéria Rákoczyová vybrala národní akční plán sociálního začleňování Velké Británie (typ liberálního sociálního státu), plán Dánska (typ sociálně-demokratického sociálního státu) a konečně plán Německa (typ korporativního sociálního státu). Poslední národní akční plán sociálního začleňování Rákoczyová vybrala pomocí dalšího výběrového kritéria: „postkomunistická země ze střední Evropy s podobnými demografickými a ekonomickými ukazateli“. Druhému výběrovému kritériu nejvíce vyhovoval plán Maďarska. Výběrový soubor pak tvořily národní akční plány Velké Británie, Dánska a  Německa na roky 2003 až 2005 a  národní akční plány Maďarska a České republiky na roky 2004 až 2006. Ačkoli se na první pohled může zdát, například podle názvu kapitoly s  textem evaluační zprávy Miroslavy Rákoczyové a  tvrzením v  úvodním oddíle, že jde o  mezinárodní komparaci, ve skutečnosti Rákoczyová použila interpretační poznávací metodu. Vedle obsahové analýzy textů národních akčních plánů sociálního začleňování představovala komparace jednu z použitých technik. Mezinárodní kompa- 553 Evaluace programu ve stadiu plánování race zde byla použita ne jako metoda, ale jako technika. Komparační metoda je jistou obměnou experimentální metody. Komparační metodou se v praxi zkoumání sociálního světa rozumí zkoumání několika málo případů. Tyto případy badatele zajímají kvůli jejich okolnostem (kontextu), přesněji kvůli historicky specifickým okolnostem. Případy jsou většinou geograficky a  historicky vymezené konfigurace událostí a struktur [viz Ragin 2004]. Výzkumník je studuje za účelem „porozumění nebo interpretace specifických historických jevů v malém počtu případů“ [Ragin 1987: 17] Komparační technika spočívá ve srovnávání podle kritéria za účelem stanovení odlišností a  podobností (např. srovnání naměřených hodnot, „větší než“, „menší než“). Jestliže v komparační metodě je určení podobností a  odlišností prostředkem, pak v  komparační technice je určení podobností a odlišností cílem [viz Říchová 1997]. Rákozcyová srovnala text národního akčního plánu sociálního začleňování České republiky s  texty vybraných národních akčních plánů sociálního začleňování za účelem identifikace jejich odlišností a podobností. Rákoczyová tedy použila komparační techniku. To, co podle Krippendorffa [2013: 93] badatel v  takovém případě srovnává, „nejsou rozdíly nebo shody mezi vlastnostmi textu, ale rozdíly mezi závěry vyvozenými z různých textů, které jsou funkcí přímo nepozorovaného předpokládaného kontextu.“ Jak ukazuje obrázek 3.2, analytik nejprve aplikuje v  obsahové analýze stejné standardy na všechny texty. Výsledkem je tolik odpovědí na určitou výzkumnou otázku, kolik je obsahově analyzovaných textů. Pak se srovnávají jednotlivé odpovědi komparační technikou. Rákoczyová nejprve analyzovala texty jednotlivých vybraných národních plánů sociálního začleňování aplikací standardu v  podobě Evropskou komisí určených druhů cílů a  následovně aplikací standardů „vymezení skupin ohrožených sociálním vyloučením“ a  „popis opatření na sociální začlenění vymezených skupin ohrožených sociálním vyloučením“, přičemž Rákoczyová analyzovala obsah textů jednotlivých národních akčních plánů sociálního začleňování v kontextu Lisabonské strategie Evropské unie a  otevřené metody koordinace. Poté Rákoczyová navzájem srovnala výsledky obsahových analýz textů jednotlivých národních plánů sociálního začleňování. Tímto srovnáním Rákozcyová identifikovala odlišnosti a podobnosti mezi národními plány sociálního začleňování. Evaluační výzkum56 Obrázek 3.2 Komparace podobných jevů vyvozených z různých textů Pramen: Krippendorff 2013: 94, vlastní překlad. 3.3.3 Postup a výsledky evaluace Určení skupin osob ohrožených sociálním vyloučením se ve vybraných plánech shodlo na příslušnících etnických menšin, přistěhovalcích, zdravotně postižených, bezdomovcích a dlouhodobě nezaměstnaných. Tato shoda mohla podle Rákoczyové ukazovat pomyslné společné „jádro“ sociálně vyloučených na území Evropské unie [viz Mareš, Rákoczyová, Sirovátka 2006: 52]. K  přehlednému zobrazení podobností a odlišností ve vymezeních skupin ohrožených sociálním vyloučením v  jednotlivých národních akčních plánech zaměstnanosti Rákoczyová použila tabulku (viz tabulka 3.3). Podobnosti a odlišnosti ve vymezení skupin ohrožených sociálním vyloučením ukazují symboly v  řádcích. Symbol „X“ označuje, že v národním akčním plánu sociálního začleňování byla daná skupina shledána ohroženou sociálním vyloučením. Symbol „(X)“ označuje, že v dané skupině se sociální ohrožení vztahuje pouze na její část (podskupinu). Prázdná buňka v tabulce označuje, že v národním akčním plánu nebyla daná skupina zařazena do kategorie skupin ohrožených sociálním vyloučením. 573 Evaluace programu ve stadiu plánování Tabulka 3.3 Skupiny ohrožené sociálním vyloučením vymezené v národních plánech Maďarsko Velká Británie Německo Dánsko Česká republika Romové/etnické minority X X X X Zdravotně postižení X X X X X Drogově závislí a alkoholici X X X X X (jen mladí drogově závislí) Psychicky nemocní a mentálně postižení X (X) (X) X X Bezdomovci X X X X X Přistěhovalci a uprchlíci X X X X X Nadměrně zadlužené domácnosti X X X (X) jen ve vztahu k určitým ohroženým skupinám, např. Romům nebo bezdo- movcům Početné domácnosti X X X (X) ohrožení chu- dobou Jobless domácnosti X X Dlouhodobě nezaměstnaní X X X X Nízkokvalifikovaní a nekva- lifikovaní X (X) X (X) Oběti domácího násilí X X X X (X) Senioři X X X X Děti X X X X X Osoby propuštěné z výkonu trestu X X Kočovníci X Těhotné dospívající dívky X Domácnosti samoživitelů X X X (X) jen ohrožení chudobou Jednočlenné domácnosti X (X) jen osamělé důchodkyně Prostitutky X Osoby opouštějící ústavní výchovu X Pramen: Mareš, Rákoczyová, Sirovátka 2006: 35 Evaluační výzkum58 Hlavní odlišnost spočívala podle Rákoczyové v  pojetí fenoménu sociální exkluze. V  této odlišnosti se zračily různé národní okolnosti (kontexty). Tvůrci národního akčního plánu sociálního začleňování Velké Británie uchopili fenomén sociálního vyloučení skrze chudobu. To se pak promítlo do povahy jednotlivých opatření a jejich struktury. V britském národním akčním plánu sociálního začleňování jsou zdůrazněny ekonomické pobídky k  námezdní práci. Oproti tomu tvůrci dánského národního akčního plánu sociálního začleňování akcentovali neekonomické dimenze sociálního vyloučení. Z  tohoto důvodu se podle Rákoczyové vztahovala opatření v dánském národním plánu sociálního začleňování na specifické potřeby jednotlivých ohrožených skupin, přičemž prvotním cílem těchto opatření nebylo začlenění do trhu práce. Ve vymezení skupin ohrožených sociálním vyloučením a  ve vymezení opatření k  jejich sociálnímu začlenění v  českém národním plánu sociálního začleňování se zračí nerozvinutost politiky sociálního začleňování a  jejího plánování, konstatovala Rákoczyová. Tak například autoři českého národního plánu sociálního začleňování většinou popisují výchozí stav sociálního vyloučení pro jednotlivé skupiny a opatření pro sociální začlenění navrhují jen pro některé skupiny ohrožené sociálním vyloučením. Kategorizaci cílů politik sociálního začleňování ve vybraných národních akčních plánech sociálního začleňování Rákoczyová přebírá ze zprávy Evropské komise o  stavu sbližování politik sociálního začleňování v  jednotlivých členských státech Evropské unie (tzv. „joint report“). Cíle spadají do následujících kategorií: „(a) přímé cíle, které se vztahují přímo k celkovému výsledku politiky sociální inkluze, tedy k redukci chudoby a sociálního vyloučení (b) nepřímé cíle, jejichž dosažení může přispět k  redukci chudoby a sociálního vyloučení (c) vstupní cíle, které mají charakter zvýšení policy effort.“ [Mareš, Rákoczyová, Sirovátka 2006: 29] Pouze dva z hodnocených národních akčních plánů sociálního začleňování uváděly všechny kategorie cílů, a to plán britský a plán maďarský. V českém národním plánu sociálního začleňování Rákoczyová nalezla jenom nepřímé a  vstupní cíle. Český plán patřil také k  těm plánům, v  nichž se nenacházely kvantifikované cíle. „Jediný kvan- 593 Evaluace programu ve stadiu plánování tifikovaný cíl je převzat z  Národního akčního plánu zaměstnanosti a má charakter vstupního cíle (jedná se o cíl zvýšit podíl dlouhodobě nezaměstnaných zařazených do některého programu APZ na 20 % do roku 2006).“ [Mareš, Rákoczyová, Sirovátka 2006: 29] Tato skutečnost vedla Rákoczyovou k závěru, že kvalitativní, deklaratorní povaha cílů v českém národním akčním plánu sociálního začleňování nevytvářela potřebné podmínky pro uplatnění řízení podle cílů v  české politice sociálního začleňování. 3.4 Závěr Bareš a  Rákoczyová evaluovali plány programů v  situaci, kdy nebyli přímými účastníky tvorby plánu a  nevykonali evaluaci na podnět subjektů zainteresovaných na plánovaném programu. Bareš a  Rákoczyová evaluovali plány programů na základě vlastních badatelských potřeb a  z  pozic odborníků na danou problematiku, stojících mimo sestavování hodnocených plánů. Protože jedinými jednotkami zjišťování (zdroji dat) byly texty plánů programů, příhodně se nabízela technika obsahové analýzy textů. Bareš a Rákoczyová hodnotili plány programů pomocí varianty obsahové analýzy textu, která spočívala v aplikaci jimi stanovených expertních standardů. Z obsahové analýzy textů plánů vzešly aplikací expertních standardů poznatky, které Barešovi a  Rákoczyové dovolily vyslovit doporučení k  dalšímu rozvoji plánů programů na vyšší kvalitativní úroveň. Co je však důležité, svoje evaluační výstupy v podobě zmíněných doporučení formulovali s  ohledem na okolnosti, ve kterých byl evaluovaný plán používán. Bareš sepsal svá doporučení na vylepšení Střednědobého plánu rozvoje sociálních služeb v Moravskoslezském kraji na léta 2010–2014 s ohledem na okolnosti dlouhodobě založeného procesu plánování sociálních služeb v Moravskoslezském kraji. Rákoczyová zase ve svých postřezích pro tvorbu národního akčního plánu sociálního začleňování České republiky brala v potaz jak historické dědictví institucionálního rámce politik sociálního začleňování v  České republice, tak podmínky otevřené metody koordinace politik sociálního začleňování jednotlivých států v rámci Evropské unie. Pokud by byla evaluační situace jiná než výše uvedené evaluační situace Bareše a  Rákoczyové, pak by evaluátor mohl aplikovat jiné Evaluační výzkum60 metody a techniky výzkumu sociálního světa, a to metody a techniky příhodnější dané evaluační situaci. Čistě hypotetický příklad: evaluátor je přizván subjekty zainteresovanými na určitém programu k práci na plánu tohoto programu. Evaluátor se osobně účastní pracovních schůzek k plánu programu se subjekty zainteresovanými na programu. Podobu evaluační strategie utvářejí kromě evaluátorových potřeb také potřeby subjektů zainteresovaných na programu. Evaluátor může v této situaci při evaluaci plánu programu aplikovat nejen obsahovou analýzu textu plánu programu, ale také nějakou techniku individuálního rozhovoru, skupinového rozhovoru či techniku zúčastněného, nestrukturovaného pozorování. Nelze tudíž zjednodušeně spojit evaluaci programu ve stadiu plánování s určitou metodou nebo technikou výzkumu a  stanovit všeobecně platné, na evaluační situaci nezávislé pravidlo jejich aplikace v  evaluačním výzkumu, například pravidlo, že evaluace programu ve stadiu plánování se vykonává pomocí obsahové analýzy textu. Takové „univerzální“ pravidlo by vedlo evaluátora k  aplikaci metod a  technik výzkumu neadekvátních evaluační situaci a  v  konečném důsledku k  povrchní a  neprofesionální evaluaci pro- gramu. Literatura Bareš, P. 2011. Cíle, priority a opatření v plánu rozvoje sociálních služeb Moravskoslezského kraje. VÚPSV: Praha. Chen, H. 2005. Practical Program Evaluation: Assessing and Improving Planning, Implementation, and Effectiveness. Thousand Oaks, Calif.: Sage. Europa. 2014. EUROPA. Summaries of EU Legislation. Glossary. http://europa.eu/ legislation_summaries/glossary/open_method_coordination_en.htm. Citováno 18. 2. 2014. Hsieh, H., S. E. Shannon. 2005. „Three Approaches to Qualitative Content Analysis.“ Qualitative Health Research. Volume 15, No. 9, pp. 1277–1288. Krippendorff, K. 2013. Content Analysis: an Introduction to Its Methodology. Los Angeles: SAGE. Mareš, P., M. Rákoczyová, T. Sirovátka. 2006. Sociální vyloučení a sociální začleňování v České republice jako veřejně politická agenda. CESES FSV UK: Praha. Mayring, P. 2000. „Qualitative Content Analysis.“ Forum: Qualitative Social Research. Volume 1, No. 2, Article 20. Ragin, C. C. 2004. Comparative Method. In Lewis-Beck, M., A. Bryman, T. Liao. (eds.) The Sage Encyclopedia of Social Science Research Methods. Thousand Oaks: Sage Publications, pp. 148–151. 613 Evaluace programu ve stadiu plánování Ragin, C. C. 1987. The Comparative Method: Moving beyond Qualitative and Quantitative Strategies. Berkeley: University of California Press. Říchová, B. 1997. „Komparativní metoda v politologii.“ Politická revue. Číslo 2, s. 3–34. Skříčková, Z. (ed.) 2007. Metodiky pro plánování sociálních služeb. MPSV ČR: Praha. 634 Procesní evaluace 19 Tato kapitola se zabývá hodnocením procesů existujících mimo program pouze ve vztahu k tomuto programu. Jinými (zde nezahrnutými) formami procesní evaluace jsou např. hodnocení implementace opatření na národní úrovni či hodnocení fungování spolupráce aktérů na lokální či národní úrovni (viz např. [Winkler, Klimplová, Žižlavský 2005]). Dále zde zpravidla nejsou zahrnuty postupy, které hodnotí finanční přínosy jednotlivých opatření (hodnocení efektivity) a  makroekonomické výsledky programů. 4 PROCESNÍ EVALUACE Ondřej Hora Motto: „Mnoho kroků je potřeba k tomu, aby se z konceptu stal plně fungující program, a je třeba mnoho úsilí, aby byl zachován původní záměr a design programu.“ [Rossi et al. 1999: 192] 4.1 Definice procesní evaluace Při hodnocení jednotlivých sociálních programů se zpravidla zajímáme o  výsledky, případně efekty těchto programů (tzv. evaluace vlivu – viz následující kapitola této knihy). Cílem tohoto typu evaluace je tedy především zhodnotit, nakolik program naplnil své programové cíle, respektive jakého dosáhl efektu. V  praxi se ale často setkáváme s  tím, že program nebyl realizován podle očekávání. K  získání informací o průběhu programu využíváme procesní evaluaci.19 Procesní evaluace (též může být označena jako evaluace implementace) se využívá v celé řadě oborů lidské činnosti: při hodnocení programů aktivní politiky zaměstnanosti, vzdělávací politiky, programů zdravotní péče, programů řešení zadlužení, soudnictví, programů pro propuštěné z výkonu trestu a dalších opatření. Procesní evaluace není definována jednotně, ale je souborem různých pojetí, přístupů a  po- stupů. Cílem procesní evaluace je často řešit problém tzv. „black box“ neboli problém černé skříňky [viz Rossi et al. 1999]. Tato pomyslná černá skříňka obsahuje všechny aktivity, které se udály během realizace programu a  které v  evaluaci vlivu často nejsou sledovány. Evaluační výzkum64 Chen [2005] k  tomu uvádí, že procesní evaluace poskytuje klíčové kontextuální informace o implementaci, bez nichž je obtížné interpretovat vztah mezi programem a jeho výsledkem. Ke zlepšení fungování programu dochází skrze změny provedené na základě porozumění tomu, jak program reálně funguje [WHO 2000]. Jedním ze základních cílů procesních evaluací je též identifikovat silné a slabé stránky (nedostatky) programu [Gelmon, Foucek, Waterbury 2005]. Podle Pattona [1997] je pro procesní evaluaci důležité, abychom určili a změřili přesně to, od čeho je v konkrétním programu očekáván efekt. Procesní evaluace často vychází ze srovnání konkrétního procesu implementace s  programovou teorií [Chen 2005]. To znamená, že výzkumník by měl znát programovou teorii, která popisuje, jakým způsobem v programu dosáhnout výsledku. Někteří autoři ovšem upozorňují, že ne vždy může být programová teorie při implementaci dodržena (zvláště pak u  velkých programů), neboť program je třeba přizpůsobit místním podmínkám a vývoji situace (viz např. [Chen 2005]). „Běžnější je určitý stupeň inkrementální implementace, ve které se program rozvíjí postupně a  přizpůsobivě v závislosti na nově se rozvíjejících situacích a předchozích zkušenostech.“ [Patton 1997: 201] Tento fakt někdy vyžaduje, aby se procesní evaluace přizpůsobila měnícím se podmínkám v  programu [Frechtling et al. 2010]. Chen [2005] uvádí, že míra změny v  programu by měla být v  souladu se „zralostí“ tohoto programu (změny lze spíše očekávat ve fázi zavádění programu). 4.1.1 Aplikační význam procesní evaluace Praktický (aplikační) význam procesní evaluace je podle jednotlivých autorů možné spatřovat například v následujících aplikacích: • v  ověření, zda byl program poskytnut cílové populaci [Rossi et al. 1999]; • v ověření, že program skutečně proběhl [Patton 1997] a peníze byly vhodně využity [WHO 2000]; • v ověření stálé kvality programu [Hughes, Black, Kennedy 2008]; • v ověření efektivního výkonu programu [Rossi et al. 1999]; • v ověření, zda program proběhl podle plánu [Rossi et al. 1999]; 654 Procesní evaluace • ve zjištění vztahu mezi provedením konkrétní části programu a výsledkem [Saunders, Evans, Joshi 2005]; • ve zjištění, proč program nedosáhl očekávaných výsledků; • v získání podkladů pro řešení problémů identifikovaných před evaluací [Chen 2005]; • v  možnosti provádět dílčí změny vedoucí ke zlepšení programu [Gelmon, Foucek, Waterbury 2005], [Frechtling et al. 2010] či při potřebě rozhodovat o  zachování, rozšíření či zrušení konkrétních programů [Rossi et al. 1999]; • v ověření funkčnosti, pokud se jedná o zkoušení nového typu programu (tvorbu tzv. pilotních programů) či o  přenos osvědčeného programu do nových podmínek [WHO 2000, Rossi et al. 1999]; • v možnosti zlepšit úsudek o udržitelnosti programu; • v možnosti posílit legitimitu hodnocených programů [Winkler 2005]. 4.2 Základní přístupy k problému procesní evaluace Dva základní přístupy k  procesní evaluaci v  sobě zahrnují její dva typické cíle: a) posoudit kvalitu implementace programu (Jak dobře je program implementován?) b) zjistit faktory, které ovlivňují implementaci programu (Jaké determinanty [faktory] ovlivnily průběh a výsledek programu?) Těmito otázkami se budeme nyní zabývat. 4.2.1 Posouzení kvality implementace programu U  tohoto přístupu jsou jednotlivé části programu hodnoceny na základě evaluačních kritérií, stanovených programovou teorií, evaluátorem nebo na základě vnějších standardů [Rossi et al. 1999]. Frechtling et al. [2010] rozlišují: a) implementační evaluaci, která se zabývá tím, zda projekt probíhá tak, jak bylo plánováno a b) evaluaci postupu, která sleduje, nakolik se program přibližuje k dosažení programových cílů. Kritéria pro posouzení dosažení uspokojivé úrovně jednotlivých částí programu jsou stanovena buď ještě před zahájením programu, Evaluační výzkum66 20 Pro příklad hodnotitelem předem stanovených kritérií hodnocení viz Horák [2009]. nebo jsou formulována dodatečně.20 Pokud jsou pro evaluaci stanoveny teoretické předpoklady, měly by být velmi dobře definovány, aby bylo možné je ověřit. Dosažený výkon (performance) v  jednotlivých částech programu či adekvátnost aktivit může být posuzována například z hledisek uvedených v tabulce 4.1. Tabulka 4.1 Hlediska dosaženého výkonu a adekvátnosti aktivit hledisko alternativní definice A dostupnost služeb míra pokrytí [Chen 2005] B kvalita aktivit a služeb síla intervence během jednoho sezení [Chen 2005] C kvantita aktivit a služeb intenzita intervence [Chen 2005] D dodržení požadovaného standardu výstupů E dodržení příslušných legislativních a metodických požadavků a standardů implementace [Horák 2009] přesnost doručení služeb [Chen 2005] F cena 4.2.1 Zjištění příčin dosaženého výsledku programu Evaluace může pomoci administrátorům a  tvůrcům identifikovat bariéry úspěšné implementace a  doručení programu, která mohou být vnímána jako oblasti pro zlepšení [Gelmon, Foucek, Waterbury 2005]. Přínos tohoto typu evaluace spočívá především v tom, že pomáhá odkrýt běžně neznámé příčiny implementačních selhání (např. konkrétní postoje a motivaci účastníků programu – viz např. [Horáková 2010]). Zároveň je možné identifikovat ty prvky programu, které nejvíce přispívají k výsledkům vzdělávacích programů [Horáková 2010]. Z toho vyplývá, že součástí některých procesních evaluací je sběr informací o výsledcích programu [Rossi et al. 1999]. Jedním z  typických problémů, které bývají odhaleny v  rámci procesní evaluace, jsou špatné plány a chybné předpoklady (viz [Rossi et 674 Procesní evaluace 21 Pro návod k  hodnocení cílů programu viz např. [Gelmon, Foucek a  Waterbury 2005]. al. 1999]). Ty mohou být součástí programové teorie nebo implementace konkrétního programu. Faktory, které ovlivňují průběh a výsledek programu, mohou působit jak uvnitř (nedostatek kvalifikovaných lektorů), tak vně programu (situace na trhu práce). Pokud se program nepodařilo realizovat způsobem, jak bylo plánováno z důvodů uvnitř programu, hovoříme o implementačních selháních či o  implementačních deficitech (viz [Rossi et al. 1999]). Příklady determinujících faktorů a  implementačních deficitů uvádíme v tabulce 4.2. Tabulka 4.2 Determinanty a implementační deficity Determinanty Implementační deficity vnější situace (např. ekonomická; vnější politické vlivy) nejasná programová teorie, příliš obecné či nerealizovatelné cíle programu21 profil účastníků programu nerealizace aktivit (intervence neproběhla) předchozí zkušenosti účastníků a realizátorů programu intervence nebyla dostatečná motivace (potenciálních) účastníků programu k účasti na programových aktivitách intervence nebyla dobře zvolena homogenita/heterogenita účastníků programu nevhodné načasování aktivit skupinová dynamika zpoždění aktivit chybějící materiální podmínky pro realizaci programu nespolupráce aktérů nedostatečná zralost programu problémy se zvládnutím aktivit nedokončení aktivit intervence se bez odůvodnění u jednotlivých účastníků nekontrolovaně velmi lišila Pramen: Konceptualizace autora, zdroje některých informací: Rossi et al. 1999, Chen 2005, Frechtling et al. 2010. Evaluační výzkum68 4.3 Průběh a klíčové kroky procesní evaluace Programová evaluace sleduje základní lineární model výzkumu, a  to: záměry programu, cíle programu, klíčové koncepty, klíčové indikátory, metody a  zdroje dat [Gelmon, Foucek, Waterbury 2005]. Autor evaluace by měl mít k  dispozici programovou teorii. Pokud programová teorie neexistuje v  písemné podobě, je vhodné ji vytvořit na základě setkání s klíčovými stakeholders programu [viz Chen 2005]. Rossi et al. [1999] a Frechtling et al. [2010] doporučují pro hodnocení vymezit zvlášť jednotlivé části programu (někdy nazývané komponenty). Pokud jsou realizátory stanoveny dílčí cíle pro jednotlivé části programu, je možné hodnotit dosažení těchto dílčích cílů [Hora, Suchanec 2012]. Jednotlivé kroky evaluačního postupu by měly být vzájemně provázány tak, aby bylo možné zkontrolovat jejich logickou návaznost (např. za pomoci evaluační matice – viz [Gelmon, Foucek, Waterbury 2005] a/nebo tzv. logického modelu – viz níže). 4.3.1 Stanovení dílčích výzkumných otázek Základním krokem procesní evaluace je stanovení dílčích výzkumných otázek. Následující otázky byly získány z  různých metodik procesní evaluace či realizovaných evaluačních studií anebo byly odvozeny z  provedených výsledků těchto studií. V  některých případech byly otázky pro potřeby tohoto textu mírně upraveny při současném zachování jejich základního významu. V  případě evaluace konkrétního programu jsou formulovány specifičtější otázky, které reagují na konkrétní podmínky programu [Rossi et al. 1999] – viz také příklad na konci této kapitoly. Frechtling et al. [2010] uvádějí, že evaluační otázky by měly být formulovány ve spolupráci se subjekty zainteresovanými na programu a  publikem, které bude danou evaluaci využívat. 694 Procesní evaluace Tabulka 4.3 Typické dílčí výzkumné otázky Předpro- gramová/ předevaluační fáze Jaké jsou záměry zadavatelů evaluace [Chen 2005]? Je k dispozici programová teorie [Chen 2005]? Nakolik přinese evaluace či její část informace, které nejsou nyní dostupné [Frechtling et al. 2010]? Kdo a jak může využít získané informace [Frechtling et al. 2010]? Vstup a přístup do programu Kdo je cílovou skupinou programu [Patton 1997]? Jak se účastníci dostali do programu [WHO 2000]? Jakým způsobem jsou lidé do programu vybíráni [Horáková 2010]? Byly zvoleny vhodné strategie výběru [Frechtling et al. 2010]? Jaký je (byl) stav účastníků ve věci, kvůli které by měli být podle programové teorie zapojeni do programu [WHO 2000, Chen 2005]? Na základě čeho se účastníci dostali do programu [WHO 2000]? Jak dostupný byl program pro osoby z cílové populace [Rossi et al. 1999]? Byla naplněna kapacita programu [Rossi et al. 1999]? Kolik zájemců (a jakých) se do programu nedostalo [Rossi et al. 1999]? Jaké jsou demografické charakteristiky účastníků programu [WHO 2000], kdo jsou účastníci programu [Chen 2005]? Byli do programu zapojeni ti, kdo do něj měli být podle programové teorie zapojeni [WHO 2000]? Je účast v programu dobrovolná [Rossi et al. 1999]? Aktivity Odpovídají stanovené cíle a aktivity programu problémům a specifikům cílové populace [Horáková 2010]? Z jakých části se program skládá [Patton 1997]? Jaké aktivity byly v programu realizovány [Grinnell 2001]? V jakém rozsahu byl program realizován [Rossi et al. 1999]? Má program všechny požadované části [Patton 1997]? Které aktivity jsou klíčové pro fungování programu [Chen 2005]? Jak dlouho program trval? Kolik hodin intervence [WHO 2000]? Jsou aktivity účastníkům poskytovány univerzálně nebo individuálně [Horák 2009]? Je program navázán na další opatření [Horáková 2010]? Kdo program nedokončil a proč [WHO 2000, Rossi et al. 1999]? Jaké jsou klíčové podpůrné funkce programu [Rossi et al. 1999]? Jsou jednotlivé prostředky a zdroje programu dostatečné [Rossi et al. 1999]? Jak je program monitorován [Grinnell 2001]? Evaluační výzkum70 22 Viz indikátory a dimenze spolupráce [WHO 2000: 18–19]. Realizátoři, aktéři Kdo realizoval jednotlivé aktivity [Hora a Suchanec 2012]? Mají pracovníci dostatečnou kvalifikaci [Patton 1997], [Rossi et al. 1999], [Grinnell 2001]? Je pracovníků dostatečný počet [Rossi et al. 1999]? Jaký vztah je mezi počtem pracovníků a počtem klientů [Patton 1997]? Jaká je pracovní zátěž realizátorů programu [Rossi et al. 1999]? Kdo je zapojen do tvorby programu [Patton 1997]? Jak se jednotliví aktéři zapojili do programu? (Jak obtížné bylo zapojit jednotlivé aktéry do programu?) Jak probíhala spolupráce aktérů [WHO 2000]?22 Jaké je řízení programu [Horák 2009]? Jaká je koordinace aktérů v programu [Rossi et al. 1999]? Procesy/ výsledky Probíhaly jednotlivé aktivity v souladu s programovou teorií [Colman et al. 2007]? Jaký je rozdíl mezi programovou teorií a realitou [Grinnell 2001]? Fungují požadované části dle očekávání [Patton 1997]? Přibližují se účastníci v jednotlivých fázích programu k naplnění cílů programu [Frechtling et al. 2010]? Naplňuje služba požadovaný/očekávaný standard [WHO 2000], jaká je kvalita poskytovaných služeb [Chen 2005]? Je rozsah programu (počet účastníků) dostatečný [Chen 2005]? Proč program dosáhl či nedosáhl požadovaných výsledků? Co (které části, případně které okolnosti) a jak v programu přispělo k dosažení programových výsledků [Chen 2005]? Jaké byly neočekávané (nezáměrné, vedlejší) výsledky programu [Chen 2005]? Jaké možnosti ke zlepšení identifikují účastníci programu [Egbert 2006]? 4.4 Proces evaluace programu Postup monitorování programu by měl být raději naplánován a zajištěn ještě před zahájením programu [Chen 2005], [Frechtling et al. 2010]. Plánování procesní evaluace zahrnuje následující otázky [WHO 2000], [Saunders, Evans, Joshi 2005], [Gelmon, Foucek, Waterbury 2005]: 714 Procesní evaluace 23 Gelmon, Foucek, Waterbury [2005] uvádějí následující příklady: manažer programu, ředitel organizace, realizátoři programu, hodnotitelé, účastníci programu, externí stake- holdeři. 24 V procesní evaluaci můžeme rozlišit dva základní přístupy: sebehodnocení (typické pro manažerské monitorování výkonu a  evaluaci formou akčního výzkumu – [Rossi et al. 1999] v některých případech doporučují nezávislé ověření) a nezávislou evaluaci (bývá upřednostňována právě z  důvodu větší důvěryhodnosti výsledků [Frechtling et al. 2010]). S evaluací jsou spojena některá související rizika: a) realizátoři programu se mohou cítit procesní evaluací ohroženi, b) data, která evaluátor získává nepřímo, mohou být spojena s obdobnými problémy jako při sekundární analýze dat, c) zadavatelé či realizátoři programu mohou mít tendenci bránit zveřejnění výsledků evaluace, pokud nejsou výsledky příznivé, e) jak role člena, tak role cizince může limitovat přístup k datům (viz [Shaw 1999]), f) chod programu může být uzpůsobován, aby byly naplněny konkrétní indikátory (viz [Rossi et al. 1999]). • Co má být evaluováno? • Kdo má být do evaluace zapojen?23 • Vlastnosti čeho či koho mají být zjišťovány [Rossi et al. 1999]? • Jaké jsou zdroje dat? • Bude docházet k  výběru výzkumného vzorku a  jakým způsobem [Frechtling et al. 2010]? • Kdy a kde mají být sbírána data? • Jaké evaluační metody a nástroje potřebujeme ke sběru dat? • Jak bude probíhat sběr dat? • Jak budou data uchovávána? • Jak budou data analyzována? • Jak budou data využita? • Jak jsou na sebe jednotlivé části evaluace časově navázány? • Kdo je zodpovědný za jednotlivé úkoly spojené s  evaluací? Při evaluaci by měla být zvážena obtížnost jednotlivých výzkumných postupů a  též nakolik jsou odpovědné osoby a  pověřené osoby informované a  kompetentní k  provedení jednotlivých kroků/úkolů evaluace. • Do jaké míry je hodnotitel nezávislý na hodnocení, které provádí [Rossi et al. 1999]?24 • Jak zajistit, aby hodnotitel hodnocením nenarušil program anebo chod organizace [Saunders, Evans, Joshi 2005], [Frechtling et al. 2010]? • Jako jsou náklady (časové, finanční) na evaluaci [Frechtling et al. 2010]? Evaluační výzkum72 25 Viz [ibid.: 28] pro příklad metodické pomůcky pro operacionalizaci kritérii. 4.4.1 Koncepty a jejich indikace v procesní evaluaci Teorie procesní evaluace programu neboli logický model programu rozlišuje v  jednom z  nejčastěji užívaných pojetí následující evaluační koncepty (prvky) [Hatry 1999], [Frechtling et al. 2010]: vstupy (inputs), aktivity (activities), výstupy (outputs), krátkodobé a  dlouhodobé výsledky (outcomes). - Vstupy zahrnují zdroje fungování programu [Frechtling et al. 2010]. - Aktivity jsou např. v programu poskytnuté služby, poskytnuté materiály nebo realizované akce [Frechtling et al. 2010]. - Termín výstup (output) je v  procesní evaluaci často využíván k  označení produktů či služeb vzniklých z  programových aktivit [Rossi et al. 1999], [Gelmon, Foucek, Waterbury 2005]: např. počet vytištěných brožur, počet účastníků vzdělávacího programu, kvalita poskytovaných služeb, počet odučených hodin. - Termín výsledek (outcome) se naopak vztahuje k výsledkům těchto aktivit [Rossi et al. 1999]: např. počet klientů, kteří si našli zaměstnání, zlepšené výsledky žáků ve škole. Výsledky programu nás informují, jak rozsáhlý je problém, který sledujeme před programem a po programu, případně též zda v rámci běhu (běhů) programu dochází ke zlepšení či zhoršení sledovaných charakteristik. Hlavní nevýhodou těchto výsledků je ovšem jejich obtížná interpretace bez dobré znalosti kontextuálních údajů (viz [Rossi et al. 1999] a  kapitola 5 níže). Uvedené koncepty pomáhají vytvořit logickou mapu toho, co a jak má být v  programu evaluováno. Je ovšem třeba hledat k  nim odpovídají indikátory, respektive indikace. Chen [2005] uvádí, že i když základem pro výběr indikací je konceptuální rámec programové teorie, nemělo by to být překážkou v hledání indikací důležitých věcí v teorii neuvedených. Zároveň je nutné brát v úvahu, že získání odpovědí na některé výzkumné otázky může být obtížné z hlediska operacionalizace a měřitelnosti indikací validním a  reliabilním způsobem [Frechtling et al. 2010].25 Manhood [1997] upozorňuje, že často potřebujeme širokou 734 Procesní evaluace škálu indikátorů, protože program má mnoho dimenzí, z nichž žádná by neměla být opomenuta. Často pak máme k  dispozici indikátory vstupů, výstupů a výsledků, ale zachycení vztahů mezi těmito indikátory může být obtížné. 4.4.2 Metody a techniky procesní evaluace Procesní evaluace může využívat jak kvantitativní, tak kvalitativní přístupy. Některé evaluace též využívají tzv. design smíšených metod (mixed-method design) [Frechtling et al. 2010]. Standardní metody sociálně vědního výzkumu, jako jsou rozhovory, dotazníková šetření či sekundární analýza dat, zde nejsou popisovány, ač jsou základními evaluačními postupy. Referujeme spíše k  postupům méně známým a specifickým pro procesní evaluaci. - Gelmon, Foucek a Waterbury [2005] nabízejí jako jeden z možných nástrojů procesní evaluace tzv. zprávu o důležitých událostech (critical incident report). V  této zprávě jsou od realizátorů, případně od účastníků programu, retrospektivně zjišťovány důležité události, které pozitivním či negativním způsobem ovlivnily průběh programu tím, že a) napomohly (urychlily) splnění cílů, b) představovaly překážky pro splnění cílů nebo c) pomohly překonat překážky splnění cílů. - Další výzkumnickou alternativou je pravidelné průběžné zapisování informací během průběhu programu deníkovou formou [ibid.]. V  některých případech (např. u  lékařů či sociálních pracovníků) jsou tyto zápisky prováděny za jiným účelem a  nezávisle na hodnocení. V  takovém případě je třeba ověřit, zda jsou vhodné pro evaluaci a dostupné z důvodu ochrany osobních údajů. - Další formou či obdobou procesní evaluace může být monitoring. Jako monitoring chápeme soustavné a pravidelné sledování toho, jak si program vede ve svých klíčových funkcích [Patton 1997], [Rossi et al. 1999], [Chen 2005]. Proces monitorování zahrnuje zpravidla dlouhodobé shromažďování určitých (převážně kvantitativních) údajů. Chen [2005] uvádí, že monitoring je zpravidla rozsahově jednodušší než ostatní formy procesní evaluace. Za účelem monitoringu jsou využívány elektronické informační systémy a  databáze, například tzv. Manažerský informační systém (MIS). MIS je primárně určen Evaluační výzkum74 26 Zhodnocení se může týkat též organizačních aspektů projektu: např. zda je projektová dokumentace vedena správným způsobem. pro manažery konkrétních programů, ale informace z něj je možné použít i pro nezávislou procesní evaluaci [Rossi et al. 1999]. - Významným zdrojem informací o  programu je hodnocení od participantů (např. hodnocení spokojenosti). Někteří autoři [Rossi et al. 1999], [Horák 2009] uvádějí, že hodnocení (spokojenosti) participantů může být pro evaluaci významné, neboť poskytuje jinou perspektivu hodnocení programu (např. k ověření toho, jaké aktivity byly skutečně realizovány či které aspekty programu byly pro účastníky obtížné, co by mělo změnit). Rossi et al. [1999], Shaw [1999] a Frechtling et al. [2010] ovšem upozorňují na případy, kdy hodnocení názorů a spokojenosti může být nepřesné (např. z důvodu, že účastníci mají nízké aspirace či že chtějí „chránit“ realizátory programu). - Jako vhodná metoda procesní evaluace bývá uváděno též pozorování. Pozorování ovšem může narušovat autentičnost výsledků, neboť subjekty výzkumu si uvědomují, že jsou pozorovány [Rossi et al. 1999]. Dalším obtížným úkolem při pozorování pro evaluaci může potřeba standardizovat pozorované výsledky [ibid.]. - Cenným zdrojem informací může být také benchmarking – např. srovnání s  předchozími výsledky stejného programu nebo s  výsledky jiných programů. Srovnání s  kontrolní skupinou využívané pro evaluaci vlivu není typickou součástí procesní evaluace. - Procesní evaluace může využít i  další techniky sociálně vědního výzkumu, jako je např. analýza sociálních sítí, focus group, různé formy auditů26 nebo testy znalostí [viz Frechtling et al. 2010]. 4.4.3 Rizika procesní evaluace Provádění procesní evaluace lze z více hledisek označit za jeden z nejobtížnějších výzkumných úkolů. Provádění procesní evaluace může být podle autorů spojeno s těmito riziky: • Podstatným rizikem pro procesní evaluaci je přílišná velikost programu nebo jeho značná heterogenita [viz Patton 1997]. • Evaluátoři se mohou setkávat s  projevy rezistence k  provádění procesní evaluace [Gelmon, Foucek, Waterbury 2005], [Chen 2005] anebo s rezistencí k publikaci výsledků. 754 Procesní evaluace • Nejsou dostupná potřebná data [Chen 2005]. • Aktéři programu se před evaluací či v  průběhu evaluace mění [Chen 2005]. • Cíle programu mají tendenci být formulovány pomocí toho, co lze snadno změřit, což ale nemusí představovat nejdůležitější aktivity programu [Manhood 1997]. • Jsou získány neužitečné poznatky nebo jsou nedůvěryhodné a  nesrozumitelné [Frechtling et al. 2010]. • Evaluátoři nezachytí podstatné změny, které nastaly v průběhu realizace programu [Frechtling et al. 2010]. • Experti (a tedy i evaluátoři) mohou mít tendenci podléhat stranickosti [viz Winkler 2005]. • Přílišná nákladnost evaluace. Náklady na evaluaci se mohou odlišovat podle cíle evaluace. Frechtling et al. [2010] doporučují věnovat deset procent nákladů projektu na evaluaci. Podle zkušeností autora textu mohou být náklady na evaluaci například v  případě malých pilotních projektů podstatně vyšší. Chen [2005] proto doporučuje vždy před provedením procesní evaluace zvážit, zda je daný program vhodným kandidátem pro procesní evaluaci. 4.4.4 Tvorba evaluační studie Součástí procesní evaluace je zpravidla tvorba evaluační studie. Tento proces je popsán v učebnicích metodologie a není třeba k němu referovat. Zde upozorníme toliko na specifika procesní evaluace. Zpráva o  procesní evaluaci by měla obsahovat dostatek informací o  evaluovaném programu, o metodách a o postupu evaluace. Evaluátor by měl své základní výzkumné výsledky opřít o  klíčová data či zjištění, tedy taková, která pomáhají odpovědět na výzkumné otázky a/nebo taková, která jsou průkazná, neočekávaná (nová), která si vzájemně odporují či která jsou zajímavá z hlediska dosažených výsledků programu [viz Frechtling et al. 2010]. 4.5 Příklad provedení procesní evaluace Jako příkladovou studii jsme zvolili evaluaci, kterou jsme prováděli v letech 2010 a 2011 jako součást mezinárodního programu Progress Evaluační výzkum76 27 Místní akční výzkumná skupina (Local action research group). „Social experimentation for active ageing“ VS/2010/0045 (viz [Hora, Suchanec, Soukup 2010], [Hora, Suchanec, Soukup 2011], [Hora, Suchanec 2012]). Cílem české části projektu bylo vyzkoušet program podpory drobného podnikání pro cílovou skupinu osob nad padesát let. Program měl tedy dvě základní roviny: realizaci projektu podnikání pro cílovou skupinu osob nad padesát let (tzv. pilotáž) a evaluaci tohoto pilotního projektu. Projekt zde komentuji z pozice jeho evaluátora, což je též důvod, proč byla vybrána právě tato evaluace (jako účastník mám dobrý přehled o realizaci projektu). V tomto textu nereferujeme k výsledkům evaluace, ale pouze ke způsobu realizace evaluace. Významným krokem procesní evaluace je určení klíčových aktérů (stakeholders). V našem případě byli klíčoví aktéři určeni v předprogramové fázi hlavním koordinátorem programu (hlavním tvůrcem programu). Pokud v  některém programu nejsou klíčoví aktéři určeni tvůrci programu, je na evaluátorech, aby určili klíčové aktéry, neboť jejich znalost je nutná pro vlastní evaluaci. Je třeba brát v  úvahu, že klíčoví aktéři se mohou v  průběhu programu měnit; je tedy potřeba identifikovat klíčové osoby a  instituce i  v  průběhu projektu a  přizvat je ke spolupráci na evaluaci (určit jejich roli při evaluaci). Projekt byl realizován ve spolupráci několika subjektů. Vybraní zástupci těchto subjektů a další účastníci (mj. jeden z podnikatelů, který se dříve účastnil obdobného programu) vytvořili tzv. skupinu LARG27 . LARG se pravidelně scházel v  horizontu jednoho či dvou měsíců. V rámci schůzek se aktéři podíleli na tvorbě projektu, vzájemně se informovali o průběhu projektu, řešili identifikované problémy, plánovali další postup realizace a evaluace programu. Schůzky LARG byly také přímo či nepřímo využívány k  evaluaci. Jednotliví účastníci skupiny měli též za úkol předávat informace ostatním účastníkům projektu a zajistit spolupráci institucí, které členové LARG reprezentovali. Před začátkem projektu byla zpracována tzv. základní studie (baseline study) [Hora, Suchanec, Soukup 2010]. Jedná se o určitou formu analýzy potřeb před realizací programu, jež přináší realizátorům programu informace využitelné při tvorbě programové teorie. Studie zahrnovala zhodnocení situace cílové populace na trhu práce, existujících opatření pro sledovanou cílovou populaci a rozdílu mezi současným stavem řešení a ideálně očekávaným stavem řešení (konfrontační napětí). 774 Procesní evaluace Při evaluaci projektu jsme vycházeli z programové teorie vytvořené hlavním koordinátorem programu. Programová teorie má pro evaluátora následující významy: pomáhá mu porozumět teorii modelu změny (jakým způsobem má být dosaženo výsledku), pomáhá mu rozpoznat, jaké výsledky je nutné zachytit a  také jaký je časový plán realizace projektu (to je významné pro vytvoření obsahového a časového plánu evaluace). Tabulka 4.4 Výtah z programové teorie programu celkové cíle projektu - zahájení a udržení samostatného podnikání - zvýšení lidského a sociálního kapitálu účastníků - zvýšení kvality jejich života cílová populace projektu Nezaměstnaní starší padesáti let v okrese České Budějovice, kterým zbývá alespoň 2,5 roku do odchodu do důchodu, mají čistý trestní rejstřík a jsou z města České Budějovice nebo jeho okolí teoretické vymezení jednotlivých etap projektu 1. etapa (A): zvýšení zájmu o podnikání 2. etapa (B): založení podnikání 3. etapa (C): udržení podnikání operační cíle pro jednotlivé etapy (A) zvýšit zájem o podnikání v cílové skupině (B) pomoci podnikání zahájit (C) pomoci podnikání udržet indikátory naplnění těchto operačních cílů A1: získat alespoň 40 zájemců o kurz„Základy podnikání“ A2: naplnění kapacity kurzů (2krát 10 osob) B1: podíl účastníků, kteří dostali dotaci (alespoň 50 procent) B2: podíl účastníků v OSVČ/zaměstnání vs. podíl neúčastníků s podobnými charakteristikami C1: podíl dotovaných (alespoň 70 procent, kteří po šesti měsících stále podnikají) C2: subjektivní pocit účastníků o perspektivnosti podnikání C3: subjektivní pocit zvýšení lidského kapitálu účastníků C4: subjektivní pocit zvýšení sociálního kapitálu účastníků C5: subjektivní pocit zvýšení kvality života účastníků aktivity A1: informační letáčky A2: informace od zprostředkovatele A3: informační schůzky pro nové zájemce A4: informačně-motivační schůzky A5: schůzky realizátorů se zájemci B1: vzdělávací blok k podnikání (individuální poradenství) B2: tvorba podnikatelského plánu B3: obhajoba podnikatelského plánu C1: finanční dotace C2: individuální poradenství C3: workshopy pro začínající podnikatele Evaluační výzkum78 Podle programové teorie (model změny) mělo u  cílové skupiny osob nad 50 let dojít k posílení zájmu o podnikání. U účastníků druhé fáze programu (vzdělávání) mělo dojít ke zvýšení jejich znalostí v  oblasti podnikání a  vytvoření podmínek, které ulehčují začátek podnikání (poradenství, finanční podpora). Ve třetí fázi měl program skrze pokračující podporu (další vzdělávání a poradenství) dosáhnout toho, že podnikání bude pokračovat. Na základě programové teorie jsme vytvořili plán evaluace. Evaluační plán vycházel z  fází definovaných v  programové teorii. Ne vždy ale evaluace probíhá v  reálném čase (informace jsou často získávány zpětně, zvláště jedná-li se o  dodatečné zhodnocení). Evaluační plán se v průběhu času mění v závislosti na vývoji situace (data klíčových setkání mohou být změněna, lidé mohou onemocnět atd.). Pro program byly stanoveny následující základní evaluační cíle: - zhodnocení míry naplnění cílů programu (dosažení očekávaných výsledků) a zjištění vedlejších a neočekávaných „efektů“; - zhodnotit, nakolik jednotlivé komponenty programu či jiné faktory (mimo program) přispěly k úspěšné či neúspěšné implementaci programu v jednotlivých fázích; - zhodnotit, nakolik je program podpory podnikání vhodnou formou intervence pro cílovou skupinu (na základě dosažení programových cílů, zhodnocení výsledků programu, srovnání úspěšnosti programu s  jinými formami intervence a  posouzení úspěšnosti programu účastníky programu a členy LARG). Jako evaluátoři jsme si kladli dílčí výzkumné otázky, které jsou uvedené v tabulce 4.5. Tabulka 4.5 Výzkumné otázky použité ve výzkumu První fáze Bylo dosaženo operačního cíle programu pro první fázi programu? Jaké aktivity či okolnosti mohly mít vliv na (ne)dosažení tohoto cíle? Jací účastníci se účastnili informačně-motivačních schůzek? Jací účastníci se rozhodli vstoupit do programu? Jaká byla motivace osob z cílové populace a zájemců ke vstupu do programu či k odmítnutí vstoupit do programu? 794 Procesní evaluace Druhá fáze Bylo dosaženo operačního cíle programu pro druhou fázi programu? Jaké aktivity či okolnosti mohly mít vliv na (ne)dosažení tohoto cíle? Jak probíhaly aktivity (vzdělávací blok, příprava podnikatelského plánu, obhajoba podnikatelského plánu)? Jak hodnotí realizátoři a účastníci programu jednotlivé aktivity? Jaké identifikují pozitivní a negativní aspekty realizace aktivit? Jaké jsou případné další přínosy realizovaných aktivit? V jakém oboru byly vypracovány podnikatelské plány? Zahájili účastníci přípravu na podnikání? Jaká byla motivace účastníků k zahájení podnikání? Třetí fáze Bylo dosaženo operačního cíle programu pro třetí fázi programu? Jaké aktivity či okolnosti mohly mít vliv na (ne)dosažení tohoto cíle? Jak probíhaly aktivity (finanční dotace, individuální poradenství, skupinové workshopy)? Jaké identifikují pozitivní a negativní aspekty realizace aktivit? Jaké jsou případné další přínosy realizovaných aktivit? Jaká byla motivace účastníků k podnikání ve třetí fázi? Jaká byla situace účastníků programu v rozhodném období z hlediska programových cílů? (ekonomická situace, životní situace - kvalita života, jak podnikají, vliv na lidský a sociální kapitál) Jaká byla ekonomická situace účastníků ve srovnání se skupinou neúčastníků programu? Jak celkově hodnotí program členové LARG? Jaké byly náklady na program ve srovnání s výsledky programu? Jaké byly náklady na program ve srovnání s jinými programy? 4.5.1 Použité metody a techniky evaluace v jednotlivých fázích evaluace Nyní popíšeme techniky výzkumu využité v  jednotlivých fázích výzkumu. Data pro evaluaci byla získávána průběžně po celou dobu tvorby a  realizace programu. Evaluátoři si z  každé aktivity, které se zúčastnili, psali terénní poznámky a ty následně využili pro evaluaci. Původním záměrem bylo více využít dotazníky, ale vzhledem k  malému počtu účastníků a nízké ochotě účastníků dotazníky vyplnit jsme se rozhodli upřednostnit rozhovory. Pro první fázi (zvýšit zájem o  podnikání v  cílové skupině) jsme využili: Evaluační výzkum80 28 Jako evaluátoři jsme nemohli zhodnotit znalosti účastníků v  oblasti podnikání. Proto jsme pracovali s bodovým hodnocením testů a se slovním komentářem lektora k tomuto hodnocení. 29 Skupinu neúčastníků programu tvořili účastníci informačních schůzek, kteří projevili zájem o program a zanechali na sebe kontakt, ale kteří se rozhodli do programu nevstoupit. Provedení klasického experimentu by v  tomto případě bylo příliš velkým narušením průběhu programu a mohlo by narušit jeho samotnou realizaci. - nezúčastněné pozorování informačně-motivačních schůzek; - dotazník ke zjištění informací o cílové populaci programu. Tento dotazník byl distribuován na informačně-motivačních schůzkách. Zjišťoval názory cílové populace na podnikání; - individuální rozhovor s  realizátorem, který zajišťoval rozhovory pro vyhodnocení jejich průběhu; - skupinové diskuze se členy LARG. Pro druhou fázi (pomoci podnikání zahájit) jsme využili: - nezúčastněné pozorování (evaluátoři se v  rozsahu jednoho či dvou dnů účastnili většiny programových aktivit, tedy výuky, obhajob podnikatelských plánů a workshopů); - rozhovory s  realizátory programu (komentář realizátorů k  průběhu programu, ke zhodnocení výstupních testů a  kvalitě zpracování podnikatelských plánů);28 - skupinové diskuze se členy LARG. Pro třetí fázi (pomoci podnikání udržet) jsme využili: - individuální rozhovory s  účastníky programu, kde jsme retrospektivně zjišťovali informace o  všech předchozích fázích programu a  o  situaci účastníků. V  případě odmítnutí rozhovoru účastníky programu jsme telefonicky získávali alespoň základní informaci o jejich situaci po programu; - skupinové diskuze se členy LARG. V rámci závěrečné fáze hodnocení jsme realizovali jedno setkání LARG (focus group), které bylo celé věnováno evaluaci a kde jednotliví aktéři hodnotili průběh a výsledky programu; - součástí této evaluace bylo i  srovnání výsledků účastníků programu z  hlediska ekonomického postavení po absolvování programu ve srovnání s kontrolní skupinou neúčastníků.29 Informace jsme získávali ze dvou základních zdrojů: z rozhovorů s  účastníky a  vybranými neúčastníky programu a  z  kvantitativních dat získaných z databáze úřadu práce. 814 Procesní evaluace 30 Uveďme příklad: do vzdělávacího programu nastoupilo devět účastníků z deseti plánovaných účastníků. Program dokončili čtyři účastníci. Takovou informaci lze dále interpretovat. Také je možné zjišťovat, z jakého důvodu účastníci program nedokončili. 31 V souladu s teorií stakeholders se využívají dvě základní hlediska: a) kdo je přímo zapojen do fungování programu, b) kdo má zásadní vliv na fungování programu či kdo je programem zásadně ovlivněn. 4.5.2 Komentář k provedení evaluace Základní informaci o  průběhu programu jsme získávali monitorováním výstupů (output) relevantních pro jednotlivé fáze programu. Evaluátor musí určit jednotlivé výstupy, které je třeba sledovat. Ty nemusí být dány jen programovou teorií.30 Otázky, jak probíhaly jednotlivé aktivity a účast evaluátorů na jednotlivých aktivitách, byly klíčové, neboť ukázaly mimo jiné účast či neúčast nezaměstnaných v  jednotlivých aktivitách. Pozorování bylo prospěšné také proto, že účastníci programu díky němu znali evaluátory a bylo snazší získat jejich důvěru při rozhovorech. V  případě této evaluace byla celá řada „efektů“ zjišťována pomo- cí  polostandardizovaných rozhovorů na úrovni slovní reakce účastníků programu. Fakt, že se jednalo o kvalitativně zaměřenou evaluaci, prohloubil validitu výzkumu a porozumění situaci z hlediska jednání aktérů v  konkrétních situacích (např. proč se účastníci rozhodli nepodnikat). Konkrétní evaluační podmínky ale mohou (též v  závislost na zadavateli evaluace) vyžadovat i více reliabilní výsledky. Ve výzkumu jsme se zaměřovali na motivaci k podnikání (viz dílčí výzkumné otázky). Výsledky ale ukázaly, že za rozhodnutím podnikat či nepodnikat stojí širší okruh faktorů rozhodování (např. posouzení vlastních schopností, podmínek existujících v  ekonomice nebo osobnost konkrétního nezaměstnaného). Pro procesní evaluaci je klíčová spolupráce jednotlivých aktérů při realizaci programu. Je důležité zapojit klíčové aktéry31 a  být s  nimi v  pravidelném kontaktu. V  průběhu evaluace se ukázalo, že cíle realizátorů programu a  evaluátorů mohou být ve vzájemném konfliktu ohledně způsobu realizace programu, postupu evaluace a role při evaluaci. Evaluace totiž může narušovat průběh programu. Evaluátor musí vždy osobně vykonat evaluaci anebo zajistit, aby evaluaci v daném čase a místě provedla kompetentní osoba. Evaluátor musí být včas informován o všech změnách v programu. Evaluační výzkum82 32 Tento fakt ale u procesní evaluace nepředstavuje takový problém jako např. u evaluace vlivu. 33 V našem případě byl postup práce a konečné výsledky projektu prezentovány při různých příležitostech asi desetkrát. Z toho vyplývá, že diseminace výsledků může být náročná a evaluátor s tím musí počítat. 34 Z tohoto důvodu je např. často nemožné důsledně prezentovat všechny teoretické a  metodologické aspekty studie. Někteří členové publika preferují číselné údaje, zatímco jiní považují číselné výsledky za nedostatečné [Frechtling et al. 2010]. Jako důležité se projevilo též časové hledisko evaluace. Projekt byl omezen poměrně krátkým časovým obdobím pro realizaci a evaluaci. To mělo za následek, že projekt (a také evaluace) mohl či nemohl být realizován i v méně vhodných obdobích roku jako jsou období letních prázdnin či vánočních svátků. Zároveň program nemohl být hodnocen s dostatečným časovým odstupem od ukončení programu.32 V neposlední řadě je třeba brát v úvahu, že procesní evaluace tohoto typu je časově náročná. Jednalo se o  malý program. V  takových případech jsme jako evaluátoři určitým způsobem omezeni z  hlediska využití kvantitativních postupů. Je třeba zdůraznit, že výsledky evaluace je nutné v tomto kontextu chápat jako jedinečné – mohou být zdrojem poznání pro realizátory obdobných programů, ale nelze je v žádném případě zobecňovat mimo uvedený program. Nedílnou součástí většiny procesních evaluací je diseminace výsledků. Diseminace probíhá formou předání výsledků výzkumu relevantním stakeholderům a formou prezentace výsledků před objednavateli výzkumu a  dalšími zájemci.33 Diseminace výsledků procesních evaluací může být pro evaluátory náročná, neboť evaluátor je často vystaven potřebě či požadavku publika prezentovat výsledky jazykem blízkým respondentům34 při současném malém obsahovém a časovém prostoru pro prezentaci. Součástí procesní evaluace by měla být formulace doporučení. Literatura Chen, H. 2005. Practical Program Evaluation: Assessing and Improving Planning, Implementation, and Effectiveness. Thousand Oaks: Sage. Colman, R. et al. 2007. The New York State Care Coordination Pilot Project: Process & Impact Evaluation Study Findings. New York: New York State Office of Children & Family Services. 834 Procesní evaluace Frechtling, J. et al. 2010. The 2010 User-Friendly Handbook for Project Evaluation. Rockville: Directorate for Education and Human Resources. Egbert, S. C. 2006. Child Abuse Prevention in Utah: A Process Evaluation. Salt Lake City: Social Research Institute. Gelmon, S. B., A. Foucek, A. Waterbury. 2005. Program Evaluation: Principles and Practices. Portland: Northwest Health Foundation. Grinnell, R. M. 2001. Social Work Research and Evaluation. Belmont, USA: Thomson Learning. Hatry, H. 1999. Performance Measurement: Getting Results. Washington, DC: Urban Institute Press. Hora, O., M. Suchanec, T. Soukup. 2010. Local Mapping/baseline Report THE CZECH REPUBLIC: Situation of Target Group and Activities in the Region of České Budějovice. Praha: VÚPSV. Hora, O., M. Suchanec, T. Soukup. 2011. THE CZECH REPUBLIC: Social Experimentation: Supporting People 50+ in Entrepreneurship. Praha, Brno: VÚPSV. Hora, O., M. Suchanec. 2012. „Podpora a rozvoj podnikání osob nad 50 let: Evaluační studie sociálního experimentu formou akčního výzkumu.“ Fórum sociální politiky 6(2): 2–8. Horák, P. 2009. „Implementace české aktivační politiky na lokální úrovni a princip individualizace.“ S. 148–179 in Sirovátka, T., J. Winkler, M. Žižlavský. (eds.) Nejistoty na trhu práce. Brno: Albert. Horáková, M. 2010. „Důvody a možnosti hodnocení výcvikových a vzdělávacích programů a jejich účinků pro nízkokvalifikované osoby: návrh komplexního hodnotícího přístupu.“ Forum sociální politiky 4(1): 8–16. Hughes R., C. Black, N. P. Kennedy. 2008. Public Health Nutrition Intervention Management: Process evaluation. Dublin: JobNut Project, Trinity College. Manhood, C. 1997. „Performance Measurement in the United Kingdom (1985– 1995). “ Pp. 134–144 in Chelimsky, E., W. R. Shadish. (eds.) Evaluation for the 21st Century. Thousand Oaks: Sage Publications. Patton, M. Q. 1997. Utilization-Focused Evaluation. The New Century Text. Thousand Oaks: Sage Publications. Rossi, P., H. Freeman, M. Lipsey. 1999. Evaluation: A Systematic Approach. Thousand Oaks: Sage Publications. Sanders, R., M. Evans, P. Joshi. 2005. „Developing a Process-Evaluation Plan for Assessing Health Promotion Program Implementation: A How-to Guide.“ Health Promotion Practice 6(2): 134–147. Shaw, I. 1999. Qualitative Evaluation. London: Sage Publications. Winkler, J. 2005. „Role expertízy při tvorbě sociálních programů.“ S. 59–65 in Winkler, J., L. Klimplová, M. Žižlavský. (eds.) Účelové programy na lokálních trzích práce. Brno: FSS. Winkler, J., L. Klimplová, M. Žižlavský. 2005. „Hodnocení programů z hlediska partnerství a adekvátního plánování.“ S. 208–217 in Winkler, J., L. Klimplová, M. Žižlavský. (eds.) Účelové programy na lokálních trzích práce. Brno: FSS. WHO 2000. Process Evaluation (Workbook 4). Geneva: World Health Organization. 855 Evaluace dopadu 5 EVALUACE DOPADU Miroslav Suchanec Evaluaci dopadu (impact evaluation) lze zasadit do širšího rámce evaluace sociálních programů. Sociálními programy se rozumí široká škála intervencí, jejichž cílem je zlepšení sociálních podmínek, které jsou vnímány klíčovými aktéry (tvůrci politik, občanskými iniciativami) jako více či méně problematické či nežádoucí [Rossi et al. 2003]. Takovou definici naplňují např. programy aktivní politiky zaměstnanosti (rekvalifikace atd.) jakožto nástroje „řešení“ nezaměstnanosti. Evaluace (tedy i evaluace dopadu jako její specifický druh) je potom doslova „ohodnocení“ programu použitím výzkumných metod a  technik. V  důsledku je tedy aplikovaným výzkumem, jehož cílem je oproti základnímu výzkumu přímo přispět ke zlepšení sociálních podmínek ve společnosti skrze ohodnocení „ne/fungování“ sociálního programu. Ačkoli pozitivní změna v  sociálních podmínkách má význam bez ohledu na zdroje této změny, evaluační literatura v tomto ohledu rozlišuje. Evaluace efektu se liší od hodnocení výsledků programu (tzv. outcome monitoring/evaluation) svou kauzální nadstavbou. Nejedná se o pouhé zjištění naplnění indikátorů programových cílů (též někdy nazývaných evaluačními kritérii) po uplynutí realizace programu (ať již se jedná o absolutně definovaná kritéria, jako například do půl roku od ukončení programu si polovina účastníků najde zaměstnání, nebo o relativně definovaná kritéria, která považují výsledky účastníků relativně k určitému předcházejícímu časovému období nebo jiné skupině osob, jako například urychlení odchodu nezaměstnaných z  registru, zvýšení míry pravděpodobnosti nalezení zaměstnání, lepší výsledky než jiný program atd.), nýbrž o snahu o úzké (pokud možno kauzální) propojení těchto výsledků s programem. Evaluace vlivu tak eliminuje souvislosti mezi programem a výsledkem na nekauzální bázi (tzv. matoucí efekty, které jsou způsobeny vlivem třetího faktoru). Terminologie v  evaluační literatuře však není tak jednotná, jak je zde uvedeno. Zaprvé, je důležité rozlišovat mezi výsledky (outcomes) Evaluační výzkum86 a výstupy (outputs). Výstupy představují finální (dokončené) produkty a  služby programu (např. počet účastníků rekvalifikace), nicméně samy o sobě neříkají nic o dosažených výsledcích programu, ačkoli se očekává, že k očekávaným výsledkům povedou. Výstupy jsou tedy činy, které implementující personál programu (např. lektoři) vykonal, nikoli změny, kterých bylo dosaženo vně programu (např. na jeho účastnících – nezaměstnaných) [Hatry 1999]. Výstupy jsou vnitřní součástí programu. Oproti tomu výsledky (outcomes) představují jevy a  události, popřípadě změny v sociálních podmínkách nebo chování participantů programu, které indikují posun směrem k  programovým cílům. Výsledky tedy nejsou to, co program vykonal, nýbrž důsledek této aktivity. Výsledky programu zahrnují i vedlejší efekty, ať již záměrné nebo nezáměrné, pozitivní nebo negativní. Z  hlediska hodnocení efektu je pro některé autory podstatné rozlišení mezi průběžnými (intermediate) a  koncovými (end / final) výsledky a  také mezi krátkodobými a  dlouhodobými výsledky, přičemž i  brzy se vyskytující výsledek může být koncový [Hatry 1999]. Od průběžných výsledků se očekává, že povedou ke koncovým výsledkům, ale samy o  sobě konečné nejsou. Příkladem může být počet účastníků dobrovolného programu, kteří jej dokončili. Takový indikátor tak umožňuje posoudit, jak úspěšný byl program nejen při motivaci nezaměstnaných ke vstupu do programu, ale i k jeho dokončení. Dokončení programu je nicméně pouze mezikrok ke koncovému výsledku, kterým je zlepšení podmínek absolventů programu na trhu práce (např. zvýšení lidského kapitálu, zvýšení zaměstnatelnosti, získání stabilního zaměstnání nebo zvýšení mzdy). Průběžné výsledky již z definice předcházejí koncovým cílům a jsou někdy z časových i metodologických důvodů pro evaluátory programu lépe hodnotitelné. Některé koncové výsledky se projeví až v  dlouhodobém horizontu a  mohou být i  více ovlivnitelné vnějšími faktory v  porovnání s  průběžnými výsledky. Na druhou stranu průběžné výsledky mohou, ale nemusí vést ke koncovým výsledkům. Jak již je uvedeno výše, efekty neboli impakty nejsou v  odborné literatuře chápány, nebo alespoň popisovány, identicky. Nejčastěji se v literatuře objevuje: (a) kauzální definice efektu založena na kontrafaktualitě (kontra-faktualita, tedy stav, který je v  rozporu se skutečností, neboť není možné, aby účastník v téže čase v programu byl a zároveň nebyl, proto 875 Evaluace dopadu lze kontrafaktualitu česky též přeložit jako stav „co by kdyby“), kdy efekt představuje rozdíl mezi situací účastníků po intervenci a  jejich hypotetické (kontrafaktuální) situace, kdyby bývali program neabsolvovali [Kluwe 2005], [Hujer 2004], [Heckman, Smith 1999]; (b) kauzální definice efektu založena na rozkladu korelace a posouzení míry její kauzální podstaty, kdy efekt představuje „rozsah v jakém program způsobil výsledky“ [Hatry 1999: 21]. Někteří autoři také hovoří o  impaktu jako o  společenských efektech, na rozdíl od efektů individuálních [Hatry 1999: 24]. Viertel [2004: 195] hovoří o evaluaci impaktu jako o vztahu mezi okamžitými a celkovými cíli programu. Rossi et al. [2003: 234] popisují evaluaci vlivu jako posouzení vlivu (impact assessment), jehož předmětem je zjistit, zda program způsobuje zamýšlený efekt. Evaluátoři posuzují efekt programu porovnáním informací o  výsledcích účastníků programu s  odhady jejich situace, kdyby se programu neúčastnili (toto je příklad kontrafaktuální definice impaktu). Problematika posouzení impaktu je identická s posouzením, zda je program příčinou nějakého efektu. Na jiném místě Rossi et al. [ibid.: 206] hovoří také o  úrovni výsledku (outcome level), změně výsledku (outcome change) a  čistém efektu programu. Úroveň výsledku je stav výsledku v  určitém časovém bodě (např. úroveň lidského kapitálu nezaměstnaného před programem). Změna výsledku je pak rozdíl mezi úrovněmi výsledku v různých časových bodech (např. rozdíl mezi úrovní lidského kapitálu nezaměstnaného před zahájením programu a po jeho ukončení). Efekt programu pak představuje tu část této změny výsledku, která může být přisouzena výhradně programu, na rozdíl od vlivu jiných faktorů. Shrňme tedy vymezení evaluace impaktu programu vůči jiným evaluačním procedurám. Zaprvé, evaluace impaktu se liší od hodnocení výsledků. Monitoring výsledků bere v úvahu pouze výsledky účastníků programu (např. jaká část účastníků programu nalezla zaměstnání), zatímco evaluace impaktu porovnává tyto výsledky s  hypotetickými výsledky participantů, kdyby se bývali programu nezúčastnili. Zadruhé, evaluace impaktu se liší od evaluace procesu (viz kapitola 4, výše). Evaluace procesu se zabývá fungováním (činností, provozem) programu a jejím cílem je poskytnout manažerům programu zpětnou vazbu, zda program funguje podle plánů a efektivně, co se týče vynaložených nákladů (inputs) na činnosti (activities) [Rossi et al. 2003], [Hatry 1999]. Evaluační výzkum88 5.1 Reprezentace kontrafaktuality Definovali jsme tedy impakt a  již víme, čím se evaluace impaktu zabývá. Impakty lze však dále dělit podle mnoha hledisek a v závislosti na tom, jakou volbu z  určitého hlediska zvolíme, následně volíme i příslušnou statistickou metodu analýzy dat. Pouze jedinou vlastnost mají všechny impakty společnou – abychom vůbec mohli impakt měřit jakožto změnu stavu, ke které má intervence přispět, je vždy nutné srovnání dvou veličin / proměnných (pokud tedy pouze změříme stav účastníků programu po jeho skončení bez jakéhokoli srovnání, pak se nejedná z  hlediska impakt analýzy o  relevantní výzkumný design – k  adekvátním designům se dostaneme později). První veličinou je stav experimentální skupiny (skupina, která absolvuje intervenci) po programu – například úroveň lidského kapitálu účastníků rekvalifikačního programu, jejich situace na trhu práce atd. Druhou veličinou je situace, kterou si zvolíme jako vhodnou reprezentaci kontrafaktuality – tedy hypotetické situace, v jaké by se ocitli účastníci intervence, pokud by se bývali intervence nezúčastnili. Takovou reprezentací kontrafaktuality může být například stav lidského kapitálu účastníků rekvalifikace, potažmo jejich situace na trhu práce před programem, nebo stav lidského kapitálu, případně situace na trhu práce po programu jiné skupiny lidí, tzv. kontrolní / srovnávací skupiny. (Pokud se na moment zaměříme na konkrétní techniku analýzy dat, tak z  uvedeného plyne, že základní měření impaktu lze provést základními statistickými nástroji, jako je srovnávání průměrů nebo proporcí – ke konkrétním nástrojům se však vrátíme později.) Pokud by naše zvolená reprezentace kontrafaktuality nebyla vhodnou reprezentací, tedy existovaly by opodstatněné důvody, proč by se reprezentace kontrafaktuality neměla shodovat s  potenciálním stavem účastníků programu po jeho skončení, pak by naměřený impakt mohl být tímto zkreslen (vychýlen) – naměřený impakt by neodpovídal reálnému impaktu. Takováto situace může například nastat, když jako reprezentaci kontrafaktuality zvolíme stav účastníků rekvalifikace před programem a  na lidský kapitál neúčastníků s podobnými vlastnostmi, jakými disponují účastníci rekvalifikace by v průběhu měsíční rekvalifikace jejich kolegů působily alternativní paralelní vlivy, které by úroveň lidského kapitálu zvyšovaly. Pokud by bylo pravděpodobné, že stejné vlivy by působily i na účastníky, kdyby se bývali rekvalifikace neúčastnili, pak by námi 895 Evaluace dopadu zvolená reprezentace kontrafaktuality nebyla v souladu s potenciálním stavem účastníků po programu a  impakt programu by byl nadhodnocen, neboť by „nepočítal“ s  potenciálním alternativním navýšením lidského kapitálu. Žádný kauzální odhad se tedy neobejde bez předpokladů, úkolem evaluátora je, aby tyto předpoklady byly co nejvíce platné. Abychom naměřili nezkreslený („opravdový“) impakt, je tedy důležité pokusit se o eliminaci „paralelních“ vlivů, které vstupují do hry a „tváří“ se jako efekt programu, ačkoliv jde o vlivy, které s programem nesouvisí. Tyto matoucí efekty představují tzv. hrozby interní validity, které lze eliminovat prostřednictvím vhodného výzkumného designu anebo dodatečně pomocí statistické kontroly. Tuto problematiku ještě rozebereme hlouběji. 5.2 Náhodnost výběru a povaha analyzovaného efektu Prvním místem, na kterém lze přístupy k impakt analýze začít dělit, je u sběru dat – konkrétně u způsobu výběru vzorku do experimentální a  kontrolní skupiny. Pokud totiž chceme výsledky z  výběrového souboru zobecnit (přenést) na populaci, z  níž byl vybrán, je nutné, aby výběrový soubor byl náhodný (pozor, nikoli nahodilý) – tedy aby byl vybrán prostřednictvím náhodného mechanismu (např. losování) ze všech členů populace. Pokud tedy máme možnost výběr vzorku ovlivnit, popřípadě víme, že námi vybraná datová matice pochází z náhodného výběru, pak si můžeme klást otázku, jaký je efekt programu na náhodně vybrané členy populace. Tato otázka je z  pohledu sociální politiky zajímavá například v situaci, kdy je zvažováno, že by byl program implementován na univerzální bázi a byl by například povinný. Pokud bude naplněna podmínka náhodného výběru, pak se nemusíme strachovat, že zjištěné efekty intervence by byly platné pouze u  naší experimentální skupiny nebo by maximálně byly přenositelné na osoby se stejnými charakteristikami, jako mají účastníci programu. Tomuto typu efektu se říká průměrný efekt participace (zkratka ATE) a jedná se o průměrný efekt participace programu pro každého člena populace, například nezaměstnaných. Pokud náhodný výběr nemáme, pak nejčastěji mluvíme o tzv. průměrném efektu programu na účastníky (zkratka AETT). Tento efekt představuje průměrný efekt programu na aktuální účastníky. Tento efekt je užitečné znát, uvažujeme-li o po- Evaluační výzkum90 kračování programu stejným způsobem jako funguje doposud a  zda by měl být program zachován pro podskupiny nezaměstnaných, pro kterou funguje v současnosti. Pokud je efekt programu identický pro všechny členy populace (což ale jen stěží lze předpokládat), pak nezáleží na výběru efektu, oba budou odhadovat stejné efekty. Je-li však efekt heterogenní v závislosti na různých vlastnostech nezaměstnaných, kdy má například program tendenci pomáhat relativně nejvíce osobám s vícenásobným znevýhodněním, a tyto osoby jsou do programu vybrány, pak efekt na účastníky programu (AETT) bude pozitivnější než efekt participace v  populaci (ATE). Kromě těchto efektů lze definovat také tzv. distribuční efekty [Khandker et al. 2010: 115]. Jedná se o  rozlišení efektů programů podle různých charakteristik participantů, podle toho, kde v distribuci různých proměnných se nacházejí. V případě nezaměstnaných může být například zajímavé, která ze skupin nezaměstnaných těží z programu relativně nejvíce. Pokud tedy v naší hypotetické situaci program relativně nejvíce pomáhá osobám s vícenásobným znevýhodněním, jejichž šance na trhu práce by bez programu byla v průměru mizivá, a kromě těchto osob jsou v programu ještě účastníci s pouze jedním znevýhodněním, pak distribuční efekt pro vícenásobné znevýhodněné je pozitivnější, než průměrný efekt na účastníky (AETT). Ten je pak pozitivnější než průměrný efekt participace (ATE), neboť v  programu nejsou zastoupeny skupiny populace, kterým program pomáhá relativně nejméně (kteří jsou na tom dobře i bez programu). Pokud shrneme všechny uvedené efekty, lze říci, že ATE je relevantní pouze při splnění podmínky náhodného výběru. Pokud jsou naše výsledky zobecnitelné na populaci, pak o  nich mluvíme jako o  externě validních výsledcích. 5.3 Interní validita Podmínkou možnosti generalizovat zdrojovou populaci je kromě náhodného vzorku i  nezkreslenost (jazykem ekonometrie nestrannost, nevychýlenost) výsledných odhadů efektů programu a z toho plynoucí interní validita [Campbell, Stanley 1966], neboť není příliš užitečné mít možnost zobecňovat interně neplatné (invalidní) výsledky. Interní validita se zabývá otázkou kauzality, tedy vztahem příčiny a následku 915 Evaluace dopadu mezi dvěma proměnnými – například programu APZ a  jeho výsledkem. Ptáme se, zda rozdíl v závislé proměnné (např. zaměstnatelnost mezi účastníky a  neúčastníky programu po jeho skončení) není dán jinými faktory, než právě programem, který má být naším kýženým hybatelem. Nebyli například účastníci rekvalifikace „šikovnější“ (vzdělanější, motivovanější atd.) než neúčastníci a  právě z  tohoto důvodu (a  nikoli z  důvodu programu) byli v  důsledku úspěšnější? Nebo v  případě alternativní kontrafaktuality v  podobě předprogramového měření (pretestu) účastníků, nevstoupil v  průběhu programu na trh nový „velký“ zaměstnavatel, díky kterému byli uchazeči nakonec tak úspěšní? Tyto a jiné „alternativní“ vysvětlení výsledku představují tzv. hrozby interní validity. Pro analýzu impaktu je tedy naplnění interní validity, na rozdíl od validity externí, klíčové. Je nezbytně nutné již v  situaci, kdy výzkumník považuje výsledky analýzy platné pouze ve zkoumaném vzorku a nemá ambice je generalizovat na zdrojovou populaci. Již Campbell a Stanley [1966] představili výčet hrozeb kauzality, které lze více či méně eliminovat vhodným výzkumným designem či posléze statistickou kontrolou. Stejně jako Trochim [2000] je budeme nazývat hrozby interní validity pro jednoskupinové designy, tedy pro výzkumné designy, které postrádají kontrolní skupinu. 1. Historie. V průběhu trvání programu není jeho účastník v izolaci, ale je vystaven působení mnoha faktorů, které ho směřují stejným směrem jako program. Historie tedy představuje hrozbu, kdy se v průběhu programu APZ vyskytne u participantů faktor, který ovlivní jejich výsledek po programu a výzkumník chybně vliv tohoto faktoru považuje za vliv programu. V případě APZ by se například mohlo jednat o skutečnost, že by uchazeč souběžně absolvoval i jiný program, který by zvýšil jeho šanci na nalezení zaměstnání, popřípadě by například získal práci přes svého známého. 2. Zrání. V  průběhu programu čas nestojí a  v  účastníkovi dochází k přirozeným procesům. Jedná se o situaci, kdy proces běhu času má vliv na výsledek. Participant se například může právě nacházet v období, kdy je již obvyklé, že si uchazeč najde práci, a tudíž by si ji našel i bez programu. Alternativně, uchazeč se postupem času může stávat zkušenějším v hledání práce. Evaluační výzkum92 3. Testování. Ověřování stavu indikace měřeného cíle pomocí testu má svá úskalí. Hrozba testování je aktuální tehdy, když pro zjištění situace účastníka před programem, například jeho schopností práce s  počítačem, je použit test, který následně ovlivňuje účastníkovy výsledky, když je po skončení programu testován, zda se jeho schopnosti zlepšily. V případě, že je test stejný, může se účastník test naučit, popřípadě ho první test může motivovat k tomu, aby v druhém testu dosáhl lepšího výsledku. V  obou případech by na změnu výsledku neměl vliv program, ale vnější faktor. 4. Instrumentace. S  procedurou testování je spojená i  další hrozba interní validity. Jedná se o  hrozbu, která je opět přítomna, užije-li výzkumník alespoň dvou testů měření participantových schopností, nejčastěji před zahájením programu a po jeho ukončení, a to v případě, kdy dojde ke změně měřicích nástrojů, popřípadě změně výzkumníka, posuzujícího situaci na základě rozhovoru, pozorování nebo jiné metody. V případě programu APZ se může jednat o situaci, kdy například dojde ke změně lektorů a hodnocení bude ovlivněno jejich subjektivními a vzájemně se lišícími metodami. 5. Regrese k průměru. Vybere-li výzkumník účastníky programu na základě jejich extrémního výsledku (například podprůměrného) v úvodním pretestu, je pravděpodobné, že při dalším měření (po programu) si polepší pouze na základě pravděpodobnostních zákonitostí; extrémní výsledky budou mít tendenci se stávat méně extrémními, nikoli však na základě programu. 6. Mortalita. Může se stát, že v  průběhu programu bude z  různých důvodů docházet k  systematickému úbytku participantů. V  situaci, kdy nezaměstnaní nejsou k účasti v programu dostatečně motivováni nebo jejich motivace poklesne, může dojít k tomu, že ti méně přesvědčení, odhodlaní či méně motivovaní program opustí. Pokud ale míra odhodlání ovlivňuje i výsledek na trhu práce, pak bude výsledek celé skupiny bez účastníků, kteří se rozhodli odejít, vychýlen směrem nahoru – bude pozitivnější, a to bez přičinění programu. 935 Evaluace dopadu 5.4 Jednoskupinové designy Jednoskupinové designy jsou typicky dva. Prvním je nejjednodušší design vůbec, kdy změříme účastníky programu po jeho skončení (X O), přičemž předpokládáme, že poprogramový stav je výsledkem programu. Tento výsledek můžeme přirovnat k určitému kritériu naplnění cíle programu. Tento design však neodpovídá naší úvodní definici impaktu, neboť postrádá referenční měření a ve svém důsledku se tak jedná pouze o zhodnocení výsledku. Design je také citlivý na všechny jednoskupinové hrozby interní validity. Druhým jednoskupinovým designem je pretest-posttest design (také známý jako pre-post srovnání, před-po estimátor, before-after estimátor [BAE]). Tento přístup porovnává výsledek účastníků před programem a  po programu, kdy jako kontrolní skupinu využívá samotné participanty před programem. Hlavním identifikačním předpokladem této metody je, že pozorovaný výsledek participantů před programem je stejný jako kontrafaktuální výsledek participantů po programu, kdyby ho byli bývali neabsolvovali. Stav participantů před programem tedy slouží jako aproximace jejich kontrafaktuálního stavu po programu. Průměrný efekt programu na účastníky je pak odhadnut jako rozdíl mezi stavem participantů po programu a před programem [Hujer et al. 2004: 144]. Platnost tohoto předpokladu závisí zejména na několika okolnostech. Zaprvé, anticipace (očekávání) programu nesmí ovlivnit výsledek budoucích participantů před programem. Tato hrozba je označována jako Ashenfelterův pokles [Hujer et al. 2004: 145], kdy aktivita v  hledání zaměstnání budoucích účastníků programu může kvůli anticipaci programu poklesnout a  efekt programu tak bude nadhodnocen o míru poklesu v předprogramové fázi (jedná se o  tzv. sociální hrozbu interní validity, kterou si představíme dále). Za druhé, platnost tohoto předpokladu je citlivá vůči jakýmkoli faktorům měnícím se v čase mezi pretestem a posttestem (hrozba historie) a všem ostatním jednoskupinovým hrozbám interní validity. Je-li například národní ekonomika před programem v  recesi a  v  průběhu programu se dostane do expanze, bude tento efekt chybně pokládán za efekt programu. Tento estimátor je s ohledem na náročnost měření výhodný, neboť nevyžaduje kontrolní skupinu, což se ovšem „vyruší“ tím, že vyžaduje longitudinální data v podobě dvou měření u skupiny účastníků (ačkoli jsou případy, kdy hodnota pretestu je jasná – např. Evaluační výzkum94 hodnota pretestu je = 1 / není = 0 zaměstnán v případě měření impaktu rekvalifikace na získání práce u  uchazečů o  zaměstnání je implicitně 0). V  závislosti na úrovni měření (kategorická vs. kardinální) závisle proměnné volíme pro tento design buď párové porovnání proporcí (ať již pomocí binomického testu nebo uměle pomocí „párového t-testu pro proporce“) nebo párové porovnání průměrů pomocí párového t-testu. Oproti předchozímu designu má tento výhodu, že již disponuje referenčním měřením, čímž naplňuje definici impaktu. 5.5 Víceskupinové designy Pokud opustíme designy s pouhou jednou skupinou, pak všechny tyto hrozby eliminujeme pouhou existencí kontrolní / srovnávací skupiny (tedy pouze prostřednictvím vhodného designu), ovšem pouze za předpokladu, že vytvořená kontrolní skupina je s experimentální srovnatelná. Jinými slovy, čím více budou rozdíly mezi skupinami vybalancovány (skupiny si budou z hlediska distribuce určité proměnné rovny, například stejné vzdělanostní složení obou skupin), tím lépe. Vybalancovat rozdíly mezi skupinami lze prostřednictvím náhodného výběru, náhodného rozdělení do experimentální a kontrolní skupiny (což není totéž jako náhodný výběr, což si vysvětlíme později) nebo dodatečně pomocí metody párování, popřípadě částečně statistickou kontrolou. Pokud tedy skupiny nejsou srovnatelné (jsou selektivní), je design citlivý na tzv. víceskupinové hrozby interní validity, což jsou jednak jednoskupinové hrozby, které se ovšem u skupin „nevykrátí“, neboť nejsou shodné u obou skupin, a nelze tedy u obou z nich očekávat stejný efekt hrozby, nýbrž míra hrozby je pro každou skupinu různá. Jsou to tedy hrozby působící spolu se selekcí. Například hrozba selekce-historie znamená, že obě skupiny měly svou vlastní historii, kupříkladu že nový zaměstnavatel, který vstoupil na trh práce, je specializovaný na výzkum a potřebuje pouze vysoce vzdělané uchazeče. Pokud je na tom tedy experimentální skupina co se týče vzdělání lépe než kontrolní, pak je hrozba v podobě nového zaměstnavatele přítomna pouze u experimentální skupiny. Kromě interakce s jednoskupinovými hrozbami však působí selekce samostatně ­– pokud jsou skupiny díky selekci rozdílné ve skutečnostech, které ovlivňují výsledek programu, pak všechny tyto rozdíly jsou hrozbou pro interní validitu. Například již 955 Evaluace dopadu výše zmíněný rozdíl v úrovni vzdělání může působit samostatně tím, že vzdělanější lidé mohou mít obecně lepší možnost uplatnění na trhu práce, tedy získají práci i bez programu a bez nového zaměstnavatele. Teď již k oné selekci podrobněji. 5.6 Efekty„selekce“ Problematika výběru účastníků programu je zásadní nejen s  ohledem na možnost zobecňování výsledků mimo zkoumaný vzorek, ale i  pro platnost výsledků uvnitř vzorku jako takovou. Selekce nastává v  situaci, kdy se skupina participantů a  kontrolní skupina navzájem odlišují v  charakteristikách, které ovlivňují výsledek po programu. K  této odlišnosti obou skupin dochází z  mnoha důvodů. Za prvé je to kvůli absenci randomizačního procesu, kdy nenáhodné přiřazení do skupin nezajišťuje vybalancování rozdílností mezi skupinami. Za druhé, v situaci, kdy výzkumník nemá kontrolu nad výběrem uchazečů do programu, v kterém je účast na dobrovolné bázi (tzv. samovýběr), kdy do programu mohou vstoupit uchazeči, kteří se domnívají, že z programu budou mít největší prospěch nebo uchazeči, kteří jsou nejvíce motivovaní. Třetí příčinou rozdílnosti experimentální a kontrolní skupiny může být existence určitých výběrových kritérií pro přijetí do programu, která souvisí s  úspěšností programu (např. výběr nejvíce znevýhodněných nezaměstnaných). Ve všech těchto případech je účast v programu determinována další proměnnou (např. motivací), která je zároveň korelována i  s  výsledkem programu. Odlišnost skupin pak způsobí odlišnost ve výsledku, kterou výzkumník může mít tendenci přisuzovat efektu programu. Eliminovat zkreslení z  důvodu odlišnosti skupin lze řešit vhodným designem, ex-post prostřednictvím vhodné specifikace modelu nebo vybalancováním rozdílů mezi skupinami za předpokladu velké velikosti zkoumaného vzorku, který toto vybalancování umožňuje. Efekty selekce lze rozlišovat podle toho, zda charakteristiky, které ovlivňují výběr do programu jsou nebo nejsou výzkumníkem pozorovány. Pokud jsou pozorovány (např. úroveň vzdělání), jedná se o  selekci na základě pozorovaných proměnných (selection on observables). V tomto případě se participanti a neparticipanti liší pouze na základě pozorovaných proměnných a  nezkresleného efektu programu Evaluační výzkum96 lze docílit relativně snadnou kontrolou efektů těchto proměnných jejich zahrnutím do modelu. Pokud charakteristiky nejsou pozorovány (např. úroveň motivace), jedná se o selekci na základě nepozorovaných proměnných (selection on unobservables), kterou lze řešit opět vhodným designem (viz DID estimátor nebo nespojitá regrese) nebo složitější specifikací modelu (dvoufázové modely, např. Heckmanův model, mimo obsah tohoto textu). Již dříve jsme zmínili, že existuje rozdíl mezi náhodným výběrem z populace (tzv. random sampling) a náhodným rozdělením účastníků do experimentální a  kontrolní skupiny (random assignment, randomization). Zde konečně nastal čas k  vysvětlení. Důvodem nutnosti odlišení je, že obě procedury s  sebou nesou odlišné implikace, co se validity výzkumu, týče. Náhodný výběr účastníků a  neúčastníků programu představuje způsob výběru těchto skupin z populace nezaměstnaných (např. na konkrétním úřadu práce) takovým způsobem, aby tito vybraní nezaměstnaní co nejlépe reprezentovali populaci nezaměstnaných na daném úřadu práce a  aby bylo možné výsledky vzorku zobecňovat na populaci. Náhodný výběr tedy souvisí s externí validitou, kdy chceme zjistit průměrný efekt participace (ATE). Na druhou stranu, náhodné rozdělení tohoto výběru na účastníky a neúčastníky slouží k vybalancování rozdílů mezi skupinami tak, aby rozdíl mezi skupinami po programu mohl být přisouzen výhradně efektu programu. Náhodné rozdělení tedy souvisí s  interní validitou, jinými slovy snažíme se eliminovat hrozby interní validity vybalancováním rozdílů mezi skupinami tak, aby případný rozdíl v  poprogramovém výsledku bylo možné přisoudit jedinému faktoru, který je v  obou skupinách odlišný, a  sice programu. Poté zjišťujeme průměrný efekt na účastníky (AETT). Tak jako náhodný výběr vytváří obraz populace v podobě vzorku, tak i náhodné rozdělení do skupin vytváří obraz experimentální skupiny v podobě skupiny kontrolní. Vztah mezi interní validitou a externí validitou je takový, že interní validita je předpokladem externí validity, neboť nemá smysl generalizovat interně invalidní výsledky. Externí validita nicméně není nutnou podmínkou interní validity. Jinými slovy, je možné dosáhnout platných nezkreslených efektů programu, aniž by byl program realizován na vzorku, který vzniknul náhodným výběrem z populace. Pokud tedy vzorek není náhodný, pak lze výsledky považovat za kauzálně validní, ale nelze je generalizovat vně zkoumaného vzorku; výsledky jsou tedy platné maximálně pro 975 Evaluace dopadu osoby se stejnými charakteristikami, které se vyskytovaly ve vzorku. Můžeme tedy mít jak výsledky s  interní a  externí validitou (ideální případ), výsledky s  jednou z  obou validit, nebo výsledky s  žádnou validitou. 5.7 Průřezový estimátor Prvním dvouskupinovým designem, který si představíme, je průřezový estimátor neboli také statické srovnání skupin, static-group comparison, cross-section estimátor (CSE) (s  různými pojmenováními se setkáváme proto, že analýza impaktu je multidisciplinární a  názvosloví se tedy v různých vědách a jazycích různí, třebaže jde o identickou záležitost). Základní myšlenkou průřezového estimátoru je porovnat stav participantů po programu s kontrolní skupinou neparticipantů ve stejném čase. Neparticipanti slouží jako aproximace (nejbližší náhražka) kontrafaktuality participantů. Přístup je založen na předpokladu, že výsledek neparticipantů je stejný jako kontrafaktuální výsledek participantů, kdyby se bývali programu neúčastnili. Efekt programu je pak odhadnut na základě rozdílu mezi situací participantů po programu a  neparticipantů ve stejném časovém bodě. Platnost předpokladu lze zvýšit jeho podmíněním na pozorovaných charakteristikách (statistickým „vybalancováním“, tedy dodatečnou statistickou kontrolou efektu programu prostřednictvím jedné nebo více nezávislých proměnných, které mohou mít vliv na výsledek programu). Jsou-li tyto charakteristiky rozděleny v obou skupinách různě, neboť skupiny nebyly vybalancovány randomizací, pak jejich statistickou kontrolou lze eliminovat systematické rozdíly ve výsledcích. Nicméně, platnost předpokladu i  tak závisí na nezávislosti participace na nepozorovaných faktorech (např. motivace), které by zvýšily kontrafaktualitu participantů. Jinými slovy, musí být platný předpoklad, že distribuce potenciálních výsledků u  jinak obdobných nezaměstnaných je nezávislá na výběru uchazečů do skupin [Hujer 2004:146]. Průřezový estimátor se používá v  neexperimentálních (průřezových) šetřeních (statistické šetření), kdy nemáme kontrolu nad manipulací s  nezávislou proměnnou (tedy intervencí) – nemáme kontrolu nad tím, komu a kdy přidělit intervenci, pouze přijímáme data taková, jaká jsou. Z  tohoto hlediska je administrativně nenáročný, díky exis- Evaluační výzkum98 tenci kontrolní skupiny eliminuje jednoskupinové hrozby interní validity a  implicitní eliminaci Ashenfelterova poklesu, neboť dochází k  měření jen v  jednom časovém bodě. Na druhou stranu disponuje všemi dvouskupinovými hrozbami interní validity, a to kvůli přítomnosti selekce, která nebyla eliminována randomizací. Co se týče statistické analýzy, tak lze použít t-test pro nezávislé výběry, nicméně kvůli velké pravděpodobnosti selekce je bezpečnější statisticky kontrolovat efekty matoucích proměnných, a  to buď prostřednictvím analýzy kovariance (dále jen ANCOVA), nebo metody nejmenších čtverců (dále jen OLS) regresní analýzy ve tvaru y = a + bx s libovolným počtem kontrolních proměnných x, kde y je predikovaná hodnota posttestu (poprogramového výsledku), první x v  pořadí je dummy proměnná 1 = experimentální skupina a 0 = kontrolní skupina a  koeficient beta u  této proměnné tedy představuje průměrný rozdíl v hodnotě posttestu mezi experimentální a kontrolní skupinou. Pokud zvolíme regresní model ve své základní podobě bez kontrolních proměnných, pak výsledek bude identický s  výsledkem t-testu. Pokud je závislá proměnná kategorické úrovně například ve tvaru „do jednoho měsíce po skončení programu si našel práci = 1 nebo nenašel = 0“, pak lze alternativně k t-testu použít rozdíly mezi proporcemi nebo podíly šancí (odds ratios) v kontingenční tabulce. Pokud chceme navíc kontrolovat efekty jiných proměnných jako v případě OLS regrese, pak použijeme binární logistickou regresi. V případě základní podoby binární regrese jsou efekty v podobě podílu šancí shodné s podíly šancí v kontingenční tabulce. Pokud se nám podaří eliminovat hrozby selekce, pak efekty, které jsme zmiňovali doposud představují průměrné efekty programu na jeho účastníky (AETT), popřípadě průměrné efekty participace (ATE), pokud by se jednalo o náhodně vybrané vzorky. Pokud bychom ale chtěli znát distribuční efekty, pak je třeba přidat do regresních modelů další kontrolní proměnnou a interakční člen. Pokud bychom například chtěli znát distribuční efekt programu pro muže a  ženy, je třeba formulovat například model OLS regrese do podoby y = a + b1 (x1 ) + b2 (x2 ) + b3 (x1 ∙ x2 ), kde x2 představuje pohlaví (1 = muž, 0 = žena) a x1 ∙ x2 interakční člen mezi programem a pohlavím, zachycující různost velikosti impaktu programu v závislosti na pohlaví. Velikost distribučního efektu programu pro muže představují koeficienty b1 + b3 , velikost distribučního efektu programu pro ženy koeficient b1 a koeficient b3 představuje relativní rozdíl efektu programu pro muže 995 Evaluace dopadu v  porovnání s  ženami. Ekvivalentně by se postupovalo v  případě binární logistické regrese. Průřezový estimátor lze vylepšit a  design nahradit větší kontrolou nad rozdělením intervence do skupin pomocí randomizace nebo dodatečným statistickým napárováním účastníků a neúčastníků tak, aby tvořili, co se charakteristik ovlivňujících účast v programu i jeho efekt týče, co nejpodobnější páry. 5.8 Experimentální design s posttestem První zmíněný design se nazývá experimentální design s  posttestem, nebo také posttest-only control group design. Design je ideální pro řešení jednoskupinových i  dvouskupinových hrozeb interní validity a navíc je jednodušší než pravý experiment, který vyžaduje navíc pretest experimentální i kontrolní skupiny. Náhodný proces rozdělení do skupin je užitečný z  hlediska elimininace hrozby selekce, na druhou stranu s sebou přináší riziko přítomnosti nových hrozeb – rizika randomizace a substituce. 1) Zkreslení z  důvodu randomizace (randomization bias) Jedná se o situaci, kdy nezaměstnaní s nízkou averzí vůči riziku, kteří by se jinak v režimu bez náhodného rozdělení o program ucházeli, si v randomizačním režimu rozmyslí uchazečství o program, neboť raději zvolí jistější alternativy. Osoby s nízkou averzí tak mohou být z  programu eliminovány a  skupiny participantů se budou v obou režimech lišit – jedná se o hrozbu randomizačního zkreslení [Heckman, Smith 1996: 49], [Heckman et al. 1999]. 2) Zkreslení z důvodu substituce (substitution bias) Jedná se o situaci, kdy neúspěšní uchazeči, kteří nebyli do programu vybráni, zvolí alternativní (náhradní) program. Výsledky kontrolní skupiny pak nebudou rovny výsledkům v  situaci bez programu, a  proto nemůže být kontrolní skupina užita jako vhodná aproximace kontrafaktuality participantů. Pokud se nám však podaří tyto hrozby eliminovat, popřípadě formulujeme adekvátní předpoklady pro jejich eliminaci, pak lze na tento design využít jednoduchý t-test pro nezávislé výběry a  komplexnější Evaluační výzkum100 statistickou kontrolu nepotřebujeme, neboť randomizace vykonala práci za nás. Pro dodatečnou kontrolu případných zbytkových rozdílů nevybalancovaných randomizačním procesem můžeme postavit regresní model s kontrolními proměnnými, nicméně jejich efekt by měl být marginální a  rozdíl mezi efektem programu zjištěným t-testem a regresí tudíž zanedbatelný. 5.9 Posttest design s napárovanou kontrolní skupinou V  pořadí druhým uvedeným vylepšením průřezového estimátoru je posttest design s napárovanou kontrolní skupinou. Základní myšlenkou tohoto přístupu je najít mezi neúčastníky takové nezaměstnané, kteří jsou co nejvíce podobní participantům ve všech relevantních pozorovaných předprogramových charakteristikách (např. věk, vzdělání, délka evidence atd.) [Hujer 2004: 147]. Efekt programu je pak definován jako rozdíl v poprogramovém výsledku mezi participanty a kontrolní skupinou za předpokladu, že skupiny jsou stejné na základě pozorovaných předprogramových charakteristik. Konstrukce kontrolní skupiny skrze párování je založena na předpokladu, že pro individua se stejnými relevantními charakteristikami ovlivňujícími jak výsledek programu, tak participaci v programu, bude distribuce jejich potenciálních výsledků stejná, bez ohledu na to, zda byli vybráni do programu, nebo ne [Heckman, Smith 1996: 68]. Na rozdíl od průřezového estimátoru bere tedy tato procedura v  potaz proměnné, které ovlivňují pravděpodobnost participace v  programu, a  to takovým způsobem, že tyto proměnné vstupují již do samotné konstrukce párů. Předpokladem je, že pro každého participanta existuje neparticipant se stejnými charakteristikami, aby mohli vytvořit pár. Pro každou kombinaci hodnot nezávislých proměnných je pak spočítán rozdíl mezi participanty a neparticipanty a efekt programu je odhadnut jako vážený průměr těchto rozdílů. Platnost tohoto předpokladu se snižuje s rostoucí dimenzialitou proměnných a s tím souvisejícím počtem kombinací hodnot (buněk). Pokud je počet proměnných a dimenzí takový, že přesné párování na základě příslušnosti k buňce není možné, je vhodné alternativně použít například tzv. „propensity skóre“, které shrnuje informaci z  pozorovaných proměnných do jednoho indexu, indikujícího pravděpodobnost participace v  programu na základě předprogramových pozorovatelných 1015 Evaluace dopadu charakteristik [Hujer 2004: 147]. Tento způsob konstrukce párů probíhá například tím způsobem, že na základě nezávislých proměnných prostřednictvím binární logistické regrese predikujeme pravděpodobnost účasti v  programu a  párujeme k  sobě účastníky a  neúčastníky se stejnou nebo nejbližší pravděpodobností (tzv. exaktní párování vs. párování nejbližšího souseda). Pro zjištění efektu programu pak se již neporovnávají všichni účastníci se všemi neúčastníky, ale pouze jejich podskupina, která byla napárována. Pro měření impaktu lze opět použít t-test a OLS, popřípadě logistickou regresi. Pokud bychom rozšířili měření o pretesty obou skupin, pak se jedná buďto o DID estimátor nebo pravý experiment, a to v závislosti na tom, zda skupiny byly vybrány samovýběrem (DID estimátor), nebo zda byl jejich výběr pod kontrolou prostřednictvím randomizace (pravý experiment). 5.10 DID estimátor DID estimátor (neboli difference in difference – tedy „rozdíl v  rozdílu“) vyžaduje stejně jako BAE longitudinální (konkrétně panelová) data a  může být vnímán jako jeho rozšíření. DID porovnává změny mezi předprogramovým a  poprogramovým stavem u  participantů se změnami ve stejném časovém období u  neparticipantů. Metoda je založena na dvou předpokladech. Za prvé, změna ve výsledku mezi předprogramovou a  poprogramovou fází je u  neparticipantů stejná jako kontrafaktuální změna u  participantů, kdyby se programu nezúčastnili. Druhým identifikačním předpokladem je neměnnost selekčních efektů v  čase. Jinými slovy, zkreslení daná nepozorovanými proměnnými zůstávají v čase stejná jak před, tak po programu, takže posouzením rozdílu se jejich efekt eliminuje. Výhodou DID estimátoru je citlivost vůči nepozorovaným zkreslením, nevýhodou naopak citlivost vůči Ashenfelterovu poklesu. Nejjednodušším způsobem statistické analýzy je spočítat novou proměnnou v  podobě rozdílu v  závislé proměnné mezi pretestem a  posttestem (tzv. gain scores neboli „přírůstky“) a  následně porovnat velikosti těchto „přírůstků“ mezi účastníky a neúčastníky pomocí t-testu pro nezávislé výběry. Následně je možné dodatečně eliminovat efekty jiných faktorů pomocí analýzy ANCOVA. Druhý způsob jak Evaluační výzkum102 udělat totéž je pomocí OLS regresního modelu y = a + b1 (x1 ) + b2 (x2 ) + + b3 (x1 ∙ x2 ), kde x1 představuje experimentální vs. kontrolní skupinu, x2 představuje čas 1 vs. 0 a b3 je pak DID estimátor (rozdíl v rozdílu mezi pretestem a  posttestem u  účastníků a  neúčastníků). Tento interakční efekt v OLS regresním modelu má stejnou velikost jako DID estimátor zjištěný pomocí t-testu, pokud nezahrneme další kontrolní proměnné. Za třetí je možné použít model OLS y = a + b1 (x1 ) + b2 (x2 ), kde rozdíl v hodnotě posttestu (y) mezi účastníky a neúčastníky programu (x2 ) je očištěn o  hodnotu pretestu (x1 ). Případné rozdíly mezi účastníky a neúčastníky v posttestu způsobené rozdílnostmi v pretestu jsou tak eliminovány. 5.11 Nespojitá regrese Posledním designem je nespojitá regrese. Nespojitá regrese (regression discontinuity) představuje zvláštní formu designu. Výběr do experimentální a  kontrolní skupiny v  tomto případě neprobíhá prostřednictvím náhodného mechanismu, jak je tomu v případě pravého experimentu, ale na základě nějaké kvantitativní proměnné. Výzkumník stanoví na této proměnné hranici (např. hranice potřebnosti) a lidé spadající pod hranici jsou přiděleni do experimentální skupiny, zatímco lidé spadající nad tuto hranici poslouží jako skupina kontrolní. Pokud je rozdělovací proměnná korelována s  poprogramovým výsledkem, pak je účast v  programu automaticky s  tímto výsledkem korelována také i v případě naprosté absence efektu programu. Tento mechanismus tedy nezaručuje podobnost skupin co se týče charakteristik majících vliv na poprogramový výsledek a  design se tak zdá býti předurčen k podlehnutí hrozbě selekce. Nicméně prostřednictvím zahrnutí efektu rozdělovací proměnné do modelu zajistíme nejen kontrolu efektu proměnné samotné, ale i  eliminaci všech ostatních relevantních zdrojů selekce a zajistíme tak nezkreslený efekt programu na poprogramový výsledek. Pokud existuje nějaká společná příčina participace a poprogramového výsledku kromě rozdělovací proměnné (např. úroveň motivace) a  tato společná příčina v  modelu absentuje, pak je její matoucí efekt eliminován skrze přítomnost rozdělovací proměnné. Vliv části této matoucí proměnné, která je korelována s  rozdělovací proměnnou, je absorbován (je obsažen) v  rozdělovací pro- 1035 Evaluace dopadu měnné. Druhá část matoucí proměnné (respektive její vliv), která není s rozdělovací proměnnou korelována, není korelována ani s intervencí, jelikož intervenční proměnná je toliko podmnožinou rozdělovací proměnné. V obou případech tak efekt programu na poprogramový výsledek zůstává nezkreslen [Mohr, 1992]. Identifikačním předpokladem tohoto designu je však přísné rozdělení do skupin pouze na základě rozdělovací proměnné (např. index potřebnosti) tak, že lidé se stejnou hodnotou potřebnosti budou patřit pouze do jedné ze skupin. Rozdělení do skupin na základě potřebnosti představuje transparentní a z hlediska cílů sociální politiky relevantní kritérium. Tento design je také citlivý na multikolinearitu a tuto skutečnost je třeba brát v potaz při hodnocení efektu programu. Nespojitou regresi lze namodelovat pomocí OLS modelu y = a  + + b1 x1 + b2 x2 + b3 (x1 − C) ∙ T, kde b2 představuje průměrný efekt programu (rozdíl mezi úrovňovými konstantami účastníků a neúčastníků) bez ohledu na hodnotu připisovací proměnné, a  b3 představuje míru změny velikosti efektu v  závislosti na hodnotě připisovací proměnné (rozdíl mezi sklony křivek účastníků a neúčastníků). Kromě „klasických hrozeb“ interní validity známe i  tzv. sociální hrozby interní validity [Trochim 2006], které se týkají především dvouskupinových designů. Tyto hrozby jsou způsobené sociálními interakcemi mezi zainteresovanými skupinami v  experimentu, ať již se jedná o účastníky a neúčastníky nebo o implementátory programu, a nemožností od sebe tyto zainteresované skupiny navzájem „izolovat“. Při evaluaci impaktu je zapotřebí mít je na paměti a pokusit se jim předejít; pokud má výzkumník možnost aktivně se účastnit realizace programu, nelze je však eliminovat pomocí designu ani statisticky ad hoc. 1. Hawthornský efekt. Tento efekt spočívá v  tom, že účastníci naváží s realizátory programu vztah a chovají se způsobem, který se domnívají, že je experimentátorem očekáván [Mohr 1992: 64]. Výsledky v poprogramové fázi tak nemusejí být způsobeny obsahem programu, nýbrž jeho psychologickým efektem. 2. Difuze / Imitace. Efekt difuze nastává tehdy, když srovnávací skupina neúčastníků se nějakým způsobem dozvídá informace týkající se obsahu programu od experimentální skupiny – dochází tak k  difuzi obsahu mezi skupinami. Srovnávací skupina může také na základě Evaluační výzkum104 Tabulka 5.1 Designy a jejich odolnost vůči ohrožením interní validity Design Zdroj ohrožení interní validity Histo- rie Zrání Testo- vání Instru- mentace Regrese k prů- měru Selek- ce Mor- talita Jednoskupinový pretest – posttest design (BAE)35 O X O − − − − ? + + Průřezový estimátor (CSE)36 X O X O + ? + + + − − Experimentální design s posttestem37 R X O R X O + + + + + + + DID estimátor38 O X O O X O + + + + ? + + Experimentální design s pretestem i posttestem39 R O X O R O X O + + + + + + + Nespojitá regrese A X O A X O + + + ? + + ? Posttest design s napárovanou kontrolní skupinou M X O M X O + + + + + + + Zdroj: Upraveno autorem z Campbell, Stanley 1966. Legenda: O = měření, X = intervence (experiment); R = náhodné rozdělení do skupin, A = rozdělení do skupin na základě připisovací proměnné; M = ad hoc vytvoření párů; + / − = hrozba je / není eliminována. 35 Též známý jako pre-post srovnání, před-po estimátor, before-after estimátor (BAE). 36 Též statické srovnání skupin, static-group comparison, cross-section estimátor (CSE). 37 Též post-test only control group design. 38 Též difference-in-difference, non-equivalent control group design, kvasiexperimentální design s neekvivalentními skupinami. 39 Též pretest-posttest control group design. 1055 Evaluace dopadu znalostí o  obsahu programu vytvořit vlastní svépomocnou skupinu a imitovat tak program experimentální skupiny. Může tak dojít k vyrovnání poprogramového rozdílu mezi skupinami skrze změnu výsledku u srovnávací skupiny a efekt programu tak může být obtížněji identifikován. 3. Rivalita. Toto zkreslení nastává v situaci, kdy skupina neúspěšných kandidátů do programu „závidí“ program účastníkům a může tak dojít k rivalitě mezi skupinami, kdy se srovnávací skupina snaží experimentální skupině vyrovnat. Měření srovnávací skupiny v  poprogramové fázi tak může být nadhodnoceno, čímž se rozdíl mezi skupinami smazává a efekt programu je těžko identifikovatelný. 4. Demoralizace. Tento efekt je opačný k předchozímu efektu. Namísto rivality je však skupina neúčastníků demotivována, což může mít za následek ochabnutí úsilí v  hledání práce. V  tomto případě by došlo k  ještě větší rozdílnosti mezi výsledky obou skupin než v  případě absence efektu. Došlo by tedy k  vychýlení efektu programu směrem nahoru. 5. Ashenfelterův pokles. Ashenfelterův pokles představuje situaci, kdy se těsně před participací v  programu situace budoucích participantů na trhu práce zhorší. Tato situace může nastat například v  případě, kdy budoucí účastník programu poleví v aktivitě hledání práce, neboť anticipuje, že brzy nastoupí do programu. V  důsledku se pravděpodobnost nalezení zaměstnání sníží. Pretestovaná situace na trhu práce je tak pro účastníka horší než skutečná situace při absenci poklesu. V závislosti na míře pozitivity efektu programu pak může výzkumník dojít k závěru, že je efekt programu větší, než ve skutečnosti je, popřípadě že efekt programu je pozitivní, i když ve skutečnosti není žádný. Tento problém je skutečným problémem pouze v situaci, kdy se jedná o  dočasný pokles, při němž dojde k  rehabilitaci situace v  průběhu programu. V případě permanentního poklesu by totiž pokles ovlivnil jak fázi předprogramovou, tak fázi poprogramovou a  nedošlo by ke zkreslení programového efektu [Hujer 2004: 145]. Evaluační výzkum106 5.12 Statistická významnost dopadu Jako přidruženou informaci k  velikosti programového impaktu dostáváme statistickou signifikanci naměřeného výsledku. Standardně má tato informace za cíl určit pravděpodobnost naměřené velikosti impaktu za předpokladu, že impakt (ATE) je ve skutečnosti nulový – eliminuje nám tedy efekt náhodné příčiny získaného impaktu jakožto jednoho z možných matoucích faktorů. Tato funkce je nicméně užitečná pouze při splnění podmínky náhodného výběru a náhodného rozdělení kontrolní a experimentální skupiny. V těchto případech totiž existuje vysoká pravděpodobnost, že právě náhoda je jediným možným rušivým elementem při měření impaktu, neboť všechny ostatní potenciální „rušiče“, jako například selekce, jsou eliminovány. Pokud nám ovšem chybí náhodný mechanismus výběru z  populace, pak i  rozdělení pravděpodobností výběrové distribuce je neznámé a  hodnota pravděpodobnosti získaná statistickým testem není interpretovatelná standardním způsobem. Jeho funkce je pouze informativní a  konstruktivní. Kromě náhody je totiž v  těchto situacích třeba brát v  potaz všechny ostatní rušiče. Pokud tedy naměříme „nenáhodný efekt“, jeho zdrojem může být kromě programu samotného i jakákoli hrozba validity. Pokud naopak naměříme efekt, jehož zdrojem může být s  velkou pravděpodobností náhoda, pak je možné, že ve skutečnosti efekt existuje, je však překryt některou z hrozeb validity. Signifikantní efekt je tedy v případě absence nenáhodného výběru zapotřebí vnímat kontextuálně. 5.13 Příklad z praxe Příkladem evaluace impaktu sociálního programu v českém prostředí může být evaluace impaktu aktivní politiky zaměstnanosti České republiky v  roce 2007 [Kulhavý, Sirovátka 2008]. Autoři sledují impakt různých aktivizačních politik (např. rekvalifikace, veřejně prospěšné práce atd.) pomocí srovnání rizik nezaměstnanosti vybraných účastníků každé politiky s vybranými neúčastníky v různých časových obdobích po ukončení programu (po třicetidenních úsecích). Kontrolní skupinu konstruují prostřednictvím párování, konkrétně metodou exaktního párování pomocí „propensity“ skóre a  následnou analýzu 1075 Evaluace dopadu impaktu provádějí již na takto „napárovaném“ vzorku. Pro analýzu impaktu používají jednotlivé modely logistické regrese, kdy porovnávají riziko nezaměstnanosti (1 = byl v evidenci vs. 0 = nebyl v evidenci po určitém časovém období od konce programu u  účastníků, respektive od referenčního bodu u neúčastníků) napárovaných účastníků a neúčastníků „očištěné“ od potenciálních matoucích efektů několika kontrolních proměnných (věk, zdravotní stav, vzdělání, délka nezaměstnanosti atd.). Pro každé časové období po programu (jeden měsíc, dva měsíce, tři měsíce až jeden rok) modelují logistickou regresi. Výsledkem je, že pro každé časové období zjišťují autoři různě velké impakty jednotlivých programů na zaměstnanost. Kupříkladu u  rekvalifikací je impakt nejvyšší do tří měsíců od konce programu (účastníci mají poloviční riziko nezaměstnanosti ve srovnání s neúčastníky), v dalším průběhu je rozdíl mezi účastníky a neúčastníky zanedbatelný a impakt je opět pozitivní až jeden rok po skončení programu [viz Kulhavý, Sirovátka 2008: 48]. Tyto impakty korespondují s AETT efektem a jedná se tedy o průměrný efekt programu na konkrétní strukturu účastníků. Z hlediska designu se jedná o post-test design s napárovanou kontrolní skupinou, který je realizovaný ve více časových bodech a  je stabilní vůči všem „klasickým“ hrozbám interní validity. Díky nenáhodnému rozdělení do skupin je odolný i vůči hrozbám spjatým experimentními designy. Možný efekt selekce na základě nepozorovaných proměnných je eliminován implicitním pretestem, kdy účastníci i neúčastníci jsou si před programem rovni co se týče hodnoty závisle proměnné – všichni jsou totiž nezaměstnaní. 5.14 Závěr V této kapitole jsme si představili nástroje statistické analýzy, kterými lze měřit dopad určitého sociálního programu. Z  přehlídky řady ohrožení interní validity lze vyvodit, že ačkoli některé designy jsou jednoznačně stabilnější než jiné, co se odolnosti vůči těmto hrozbám týče, tak neexistuje žádný univerzálně ideální design a je tedy zapotřebí vždy vnímat kontext, v kterém byl sociální program realizován. Může také nastat situace, že evaluátor nemá žádnou kontrolu nad realizací programu a výběr evaluačních designů a následně statistických metod tak může být omezený. To však nezamezuje evaluátorovi použít nej- Evaluační výzkum108 lepší možné nástroje za daných podmínek, neboť i jednoduchá evaluace s vědomím možných nedostatků a z nich plynoucích zkreslení, je lepší než evaluace žádná. Literatura Campbell, D. T., J. C. Stanley. 1966. Experimental and Quasi-experimental Designs for Research. Chicago. Hatry, H. P. 1999. Performance Measurement: Getting Results. The Urban Institute Press. Heckman, J. J., R. J. Lalonde, J. A. Smith. 1999. “The Economics and Econometrics of Active Labor Market Programs.” Handbook of Labor Economics, Volume 3, Ashenfelter, A. and D. Card, eds., Amsterdam: Elsevier Science. Heckman, James J./Jeffrey A. Smith. 1996. “Experimental and nonexperimental evaluation.” In: Schmid, G., O´Reilly, J., Schomann, K. International Handbook of Labor Market Policy and Evaluation. Cambridge: Cambridge University Press. Hujer, R., M. Caliendo, D. Radic. 2004. „Methods and Limitations of Evaluation and Impact Research.“ In: Descy, P., M. Tessaring. (eds.) The Foundations of Evaluation and Impact Research: Third Report on Vocational Training Research in Europe: Background Report. Luxembourg: Publications Office (Cedefop Reference Series, 58), 131–190. Khandker, S. R., G. B. Koolwal, H. A. Samad. 2010. Handbook on Impact Evaluation: Quantitative Methods and Practises. New York: The World Bank. Kluwe, J. 2005. Study of Effectiveness of ALMPs. Essen: RWI. Kulhavý, V., T. Sirovátka. 2008. Hodnocení efektivity programů APZ a doprovodných nástrojů a projektů politiky zaměstnanosti v roce 2007. Praha: VÚPSV. Mohr, L. B. 1992. Impact Analysis for Program Evaluation. Newbury Park: Sage. Rossi, P. H., H. E. Freeman, M. W. Lipsey. 2003. Evaluation: A Systematic Approach. Newbury Park: Sage Publications. Trochim, W. M. The Research Methods Knowledge Base. 2nd Edition. Internet WWW page, at URL: (version current as of October 20, 2006). Viertel, E., S. P. Nielsen, D. L. Parkes, S. Poulsen. 2004. “From Project to Policy Evaluation in Vocational Education and Training – Possible Concepts and Tools. Evidence from Countries in Transition.“ In: Descy, P., M. Tessaring. (eds.) The Foundations of Evaluation and Impact Research: Third Report on Vocational Training Research in Europe: Background Report. Luxembourg: Publications Office (Cedefop Reference Series, 58), 191–236. 109Závěr ZÁVĚR Martin Žižlavský Motto: „Veškerá zkušenost však ukazuje, že věda je příliš jemné řemeslo, než aby bylo možno naučit se mu z příručky či učebnice, byť sebesystematičtější. Skutečného pokroku tu lze dosáhnout jen dlouholetým výcvikem, trpělivou vlastní prací a postupným získáváním zkušeností.“ [Možný, Rabušic 1989: 3] Přestože tato kniha není ani příručkou ani učebnicí, po jejím přečtení čtenář už ví, že studium písemně zprostředkovaných vědomostí stačí k ovládnutí evaluačního výzkumu pouze na nováčkovské úrovni. Čtenář tuší, že ovládnutí aplikace metod a  technik výzkumu v  evaluaci programů na vyšších úrovních vyžaduje vědomosti nesdělitelné textem, vědomosti nabývané spíše vlastní zkušeností s různými evaluačními situacemi. Evaluační situace jsou rozrůzňovány v několika rovinách. Srozumitelně lze tyto roviny ukázat pomocí pomyslných otázek, jejichž odpovězení umožňuje započetí určitého evaluačního výzkumu. 1. Pro koho jsou informace určeny a kdo bude poznatky používat? 2. Jaký druh informací je potřeba? 3. Jak budou informace použity? Za jakým účelem bude evaluace vykonána? 4. Kdy jsou informace potřeba? 5. Jaké zdroje jsou dostupné k vykonání evaluace? 6. Jaké metody jsou vhodné s  ohledem na odpovědi na výše uvedené otázky? [Patton 1990: 12] Z počtu a věcné povahy otázek plyne mnoho možných variant evaluační situace, v níž evaluátor řeší úkol adekvátní aplikace metod a technik výzkumu, a  to výčet otázek neukazuje okolnosti, které se vynoří až při samotném evaluačním výzkumu. Aplikace metod a  technik adekvátní evaluační situaci pak není samozřejmá a  standardizovaná předpisem. Volba příhodné metody a  techniky je do jisté míry věcí Evaluační výzkum110 objektivního standardu a do jisté míry věcí umění, zkušené volby. Tato míra se liší například v jednotlivých programových stadiích. Evaluace dopadu (viz kapitola 5) využívá více méně standardizovaných postupů, které zároveň nastavují meze požadavkům ostatních subjektů zainteresovaných na hodnoceném programu, takže evaluátor čelí při aplikaci metod a  technik výzkumu relativně předvídatelné a  kontrolovatelné evaluační situaci. Evaluátor nemusí v  takové míře spoléhat na svoje situační zkušenosti a může se opřít o nesituační předpis, kdežto mnohost použitelných metod a technik jak standardizovaných, tak nestandardizovaných, a  jejich nesamozřejmá volba vystavují evaluátora při procesní evaluaci (viz kapitola 4) situaci, kdy adekvátní aplikaci metod a technik výzkumu řeší především pomocí svých situačních zkušeností a méně pomocí nesituačních předpisů. Evaluační výzkum je odborná lidská činnost. Odbornost se tu váže na vědomosti a  dovednosti. Vědomosti člověk nabývá studiem teorie a  dovednosti člověk nabývá tréninkem v  rozličných situacích. Skutečný evaluátor expert disponuje kromě znalostí různých teorií situačním citem pro aplikaci metod a  technik výzkumu v  rozmanitých evaluačních situacích. Ovšem k  expertní dovednosti evaluace programů vede dlouhá cesta, jejíhož konce dosáhne jen několik z těch, kteří se na ni vydali. A právě pro ty, kteří stojí na začátku cesty, napsali autoři tuto knihu. Pokud tato kniha napomůže čtenáři k postupnému osvojení aplikace metod a technik výzkumu příhodné dané evaluační situaci, potom splnila svůj účel. Literatura Možný, I., L. Rabušic. 1989. Úvod do metodologie vědy pro sociology. UJEP: Brno. Patton, M. Q. 1990. Qualitative Evaluation and Research Methods. SAGE: Newbury Park. 111Jmenný rejstřík Gelmon – 64, 65, 68–71, 74 George – 21 Ginzberg – 28 Hatry – 72, 86 ,87 Heckman – 87, 96, 99 Hooper – 32 Hora – 68–70, 76 Horák – 66, 69, 74 Horáková – 66, 69, Hsieh – 46 Huber – 13, 33 Hughes – 64 Hujer – 83, 87, 97, 100, 101, 105 Chen – 12, 43–45, 53, 64–70, 72–75 Jahoda – 28 Jordan – 29, 34, Jorgensen – 33 Joshi – 65, 70, 71 Jumper – Thurman – 30, 31 Kay – 36 Kelly – 31 Kennedy – 64 Khandker – 90 Kitsuse – 30, 31 Klimplová – 63 Kluwe – 87 Krippendorff – 46, 47, 55 Kuchařová – 30 Kulhavý – 106, 107 Lazarsfeld – 28 Levitas – 29 JMENNÝ REJSTŘÍK Anderson – 32 Armingeon – 18 Athanasiou – 13, 14 Bareš – 44–53, 59 Berger – 20 Black – 64 Blumer – 17, 18, 20–22, 30, 31 Bonoli – 18, 21, 32, Bradshaw – 30 Brannick – 34 Campbell – 90, 91, 104 Carl – 17, 21, 24, 26 Cartwright – 21, 25, 27, 32 Clarke – 11, 15 Clasen – 29 Clegg – 29 Coghlan – 34 Collins – 19 Colman – 70 Coser – 19 Daguerre – 30, 31 Dreyfus – 13 Durant – 18 Edwards – 30, 31 Egbert – 70 Evans – 65, 70, 71 Finch – 30 Flyvbjerg – 13 Foucek – 64, 65, 68, 71–73 Freeman – 11, 23–26 Frechtling – 64, 65, 68 Evaluační výzkum112 Lipsey – 11, 22, 23, 25–27, 29, 32 Longworth – 32 Luckmann – 20 Lyotard – 19–22 Maguire – 21, 25, 27, 32 Manhood – 72, 75 Mareš – 53, 56–59 Mayring – 46 Merton – 19 Meyer – 32 Mills – 17, 18, 24 Mohr – 103 Možný – 109 Navrátil – 17, 18 Neuman – 29 Patton – 64, 69, 70, 73, 74 Phillips – 33 Plested – 30, 31 Polanyi – 15 Rabušic – 109 Ragin – 55 Rákoczyová – 52–58 Rein – 21 Rossi – 85, 87 Rowlingson – 29 Říchová – 55 Shannon – 46 Shaw – 71, 74 Schön – 21 Sirovátka – 53, 56–59 Skříčková – 45, 46, 51 Smith – 87, 99, 100 Smutek – 11 Soukup – 76 Spector – 30, 31 Stanley – 90, 91, 104 Stephens – 33 Suchanec – 68, 70, 76 Svobodová – 30 Taylor – Gooby – 18 Trochim – 91, 103 Van Dijk – 24, 33 Veselý – 17, 18, 21–25, 27 Viertel – 87 Waterbury – 64, 65, 67, 68, 70–74 Wilding – 21 Winkler – 63, 65, 75 Zaisel – 28 Žižlavský – 63 Ondřej Hora, Miroslav Suchanec a Martin Žižlavský EVALUAČNÍ VÝZKUM Redakční práce Lucie Mořkovská Jazyková korektura Zuzana Kačerová Grafická úprava Kateřina Granátová V roce 2014 vydala Masarykova univerzita, Žerotínovo nám. 617/9, 601 77 Brno, www.muni.cz 1. vydání, 2014 www.spsp.fss.muni.cz www.muni.cz/fss/research/projects/17424 ISBN 978-80-210-6887-2 Publikace vychází v rámci projektu Internacionalizace, inovace, praxe: sociálně-vědní vzdělávání pro 21. století, CZ.1.07/2.2.00/28.0225. Autoři se v knize zabývají aplikací výzkumných metod a technik při evaluaci sociálních programů. Kladou důraz na situační rozměr této aplikace. Aplikace je ukázána při evaluacích různých programových stadií nebo aspektů programu: posouzení potřeb, program ve stadiu plánování, program v implementačním stadiu a měření dopadů programu. O AUTORECH: Ondřej Hora je odborným asistentem na Katedře sociální politiky a sociální práce Fakulty sociálních studií Masarykovy univerzity. Výzkumně se zabývá oblastí sociální politiky, a to především ve vztahu k sociálnímu vyloučení, chudobě a nezaměstnanosti. Je vyučujícím metodologických předmětů a předmětů tvorby diplomových prací pro bakalářské a magisterské studium.   Miroslav Suchanec působí na FSS MU jako vyučující statistiky a kvan­ti­tativního výzkumu a výzkumně se zabývá evaluací programů aktivní politiky zaměstnanosti. Jeho obecnými profesními zájmy jsou metodologie a statistika.   Martin Žižlavský je členem akademického sboru Fakulty sociálních studií Masarykovy univerzity. Jeho pedagogická činnost pokrývá oblasti ekonomiky sociálního státu a metod a technik výzkumu ve veřejné politice a sociální práci. Výzkumně se zabývá zejména ekonomickou a organizační stránkou sociálních programů.