Čermák, I., Štěpaníková, I. (1998). Kontrola validity dat v kvalitativním psychologickém výzkumu. Československá psychologie, 1, 50-62. Kontrola validity dat v kvalitativním psychologickém výzkumu[1] Ivo Čermák, Irena Štěpaníková Psychologický ústav AV ČR, Brno Abstract The authors describe a range of techniques used to control validity in qualitative research. They categorize the existing techniques to those pertaining to 1. gathering information on the investigated phenomenon, and to 2. analysis and interpretation of the collected material. The first category is further divided into procedures related to a) the nature of data, b) the role of a researcher, c) the selection of respondents, and d) an independent subcategory of triangulation. The second category comprises techniques pertaining to a) the reflexive and dialogical nature of qualitative research, b) the candor and critical attitude of a scientist, c) specific procedures for data evaluation and result formulation, and d) techniques concerning the integrity, coherence and distribution of the data sample. Attention is also paid to the factors that may endanger validity of qualitative research. Key words: qualitative research control of validity Klíčová slova: kvalitativní výzkum kontrola validity Úvod Některé způsoby kontroly validity v kvalitativním výzkumu již patří ke standardní metodologické výbavě v kvalitativních výzkumech. Tyto techniky si kladou za cíl zvýšit důvěryhodnost výzkumu tím, že omezují vliv určitých výzkum doprovázejících jevů, které by mohly ohrozit validitu zjištění. Důvěryhodnost výzkumu do značné míry závisí na kvalitě dat. V kontextu kvalitativního výzkumu by taková data měla být podrobná, úplná a informativní (viz bohatá a hustá data) a nasbíraná v podmínkách, které zvyšují jejich výpovědní sílu (viz silná data) a možnost generalizace (viz reprezentativnost). Zároveň by se již při sběru dat měla věnovat pozornost potencionálním zdrojům zkreslení, které mohou data znehodnotit. Data mohou být ovlivněna samotnou přítomností badatele nebo jeho prekoncepcemi, jednostranností pohledu, apod. Některé z technik, které mohou přispívat ke kvalitě dat, nalézají svou analogii i v klasickém kvantitativním výzkumném paradigmatu (např. kontrola reprezentativnosti, kontrola efektu výzkumníka), ale v kvalitativním výzkumu nabývají nového obsahu. Podobně i techniky používané ve fázi vyhodnocení a interpretace, kdy se výzkumník pokouší o odhalení smyslu dat, se někdy podobají technikám známým z kvantitativních studií, zatímco jindy naopak představují perspektivu, kterou kvantitativní výzkumy už díky své povaze a cílům téměř nikdy nevyužívají. Některé takové postupy, které si kladou za cíl předejít úskalím a možnostem zkreslení, vycházejí z požadavku reflexivity výzkumu, kritičnosti a nestrannosti badatele. V předcházejícím článku (Čermák, Štěpaníková, 1997) jsme věnovali pozornost teoretickým zdrojům kvalitativního pojetí validity. Nyní se zaměřujeme na konkrétní techniky, které se v kvalitativním výzkumu využívají ke zvýšení věrohodnosti dat. 1. Techniky týkající se shromažďování informací o zkoumaném jevu Pravděpodobně nejčastěji používanou technikou kontroly validity v kvalitativním výzkumu, kterou lze využít nejen při sběru dat, ale i při plánování výzkumu a jeho vyhodnocování, je triangulace. Pomáhá kontrolovat integritu dat i výsledků z nich vyvozených. Norman a Denzin (1970) tvrdí, že triangulací je možné překonat zkreslení, které hrozí při užití jediné metody, jediného pozorovatele a jediné teorie. Pojem triangulace je převzat z navigace, kde znamená určování přesné pozice objektu ze tří různých měření (Silverman, 1994). Triangulace se tedy opírá o použití několika druhů metod a několika různých zdrojů dat, o účast více tazatelů, kteří poskytují vlastní popis a interpretaci, či o interpretaci dat z různých teoretických perspektiv. Někdy zahrnuje všechny tyto postupy najednou (viz např. Denzin, 1989; Banister, Burman, Parker, Taylor & Tindall, 1994). Hlavním smyslem triangulace je tedy zhodnotit sociální či psychologický jev z mnoha úhlů pohledu. Schwandt (1997) uvádí jako příklad výzkum, jehož cílem je porozumět komunikaci mezi geriatrickými pacienty a ambulantními internisty. Triangulace v tomto výzkumu znamená porovnávání údajů z různých fází výzkumu, z různých komunikačních párů pacient - lékař a z různých časových cyklů setkání (anamnéza, testování, diagnóza, předepsání léčebného plánu, sledování průběhu atd.). Data získaná na základě zachycených rozhovorů mezi pacientem a lékařem mohou být srovnána s rozhovory vedenými s každým zvlášť. Autor upozorňuje, že data získaná z různých zdrojů nebo různými metodami musejí nezbytně konvergovat nebo být shrnuta tak, aby zkoumaný jev pravdivě zobrazila. Nelze však propadnout naivně optimistickému názoru, že shrnutí dat z různých zdrojů bude neproblematické a povede ke snadnému zachycení komplexnějšího obrazu. Rozdíly mezi různými druhy dat mohou být také důležité a přispět k porozumění zkoumanému jevu. Triangulace je tedy nejen nástrojem validizace zjištění, ale zároveň i zdrojem dalších údajů (Hammersley & Atkinson, 1983). Triangulace je technikou, kterou lze s úspěchem použít i v pozdějších fázích výzkumu. O tom svědčí Pattonovo (1980, 1990) rozlišení čtyř druhů triangulace: ˙ Triangulace metod představuje získávání údajů různými postupy. Je zvláště vhodná pro studie, které kombinují kvalitativní a kvantitativní data. ˙ Triangulace zdrojů je získávávání dat jedinou metodou, ale z různých zdrojů. Příkladem mohou být data z pozorování a rozhovoru nebo data z rozhovorů s týmiž osobami provedenými v různé době. Můžeme také srovnávat to, co lidé říkají na veřejnosti a co v soukromí nebo perspektivy různých lidí na tutéž věc. ˙ Triangulace analyzantů je pověření různých osob analýzou týchž kvalitativních dat. Variací týmového přístupu k analýze je postup nazvaný obhajoba - obžaloba (advocacy - adversary), kdy jedna část výzkumného týmu shromažďuje údaje, které hovoří pro úspěšnost výzkumného programu, zatímco druhá shromažďuje údaje, které naopak svědčí pro to, že program by měl být pozměněn či zastaven (Wolf, 1975). ˙ Triangulace teorií či perspektiv je užití různých teorií a pohledů v interpretaci dat. ˙ Janesicková (1994) k tomuto seznamu dodává ještě interdisciplinární triangulaci, která může prospět psychologickým výzkumům tím, že do nich včlení prvky jiných disciplín, jako je např. antropologie, sociologie, historie, vědy o umění, atd. Ostatní techniky kontroly validity shromažďovaného materiálu se mohou týkat povahy dat, role výzkumníka, nebo výběru respondentů. A. Techniky týkající se povahy dat Při sběru kvalitativních dat je nutno dbát na to, aby data splňovala nebo se alespoň přiblížila jistým kritérium. Patří k nim bohatost, hustota a síla. Bohatá data (rich data) jsou podrobná a úplná. Tak mohou nejen poskytnout podklad pro konstrukci teorií, ale zároveň je i testovat. U rozhovorů jsou takovými daty verbatim (doslovné) přepisy, u pozorování jsou to podrobné, popisné poznámky o konkrétních událostech a jevech (Maxwell, 1996). Hustý popis (thick description) je podle Geertze (1973, 1983, 1988) takový popis, který nejen podává zprávu o faktech, ale navíc informuje i o kontextu události, zachycuje pohnutky a význam, který událost či zkušenost obsahuje, a klade důraz na její procesuální stránku. Miles a Huberman (1994) rozlišují mezi "silnými" a "slabými" daty. Silná data jsou oproti slabším nasbírána později v průběhu výzkumu, nikoli při prvním kontaktu s respondentem. Jsou to data z první ruky. Vztahují se k chování, nikoliv k výrokům a jsou nasbíraná v neformálním prostředí, kde je respondent s badatelem sám a ne ve skupině jiných lidí. Mezi kriteria týkající se povahy dat lze zařadit také saturaci. Výzkumník identifikuje taková data, která se opakují častěji než jiné(rekurentní výroky, poznámky, postřehy, glosy atd.) a to jak na straně účastníka výzkumu tak i u sebe a členů výzkumného týmu. Otázkou zůstává, zda lze vyvinout nějakou speciální techniku, která výše zmíněným kritériím dostojí. Je zřejmé, že kvalitativně založený výzkumník bude preferovat určité techniky sběru dat, avšak důležitější než konkrétní technika je aspekt, který je při sběru dat akcentován. Uvedeným kritériím odpovídají data verbálně zakotvená, tj. nenumerická, jakkoli diskutabilní se to může z pozice kvantitativně orientovaného vědce jevit. Neboť právě verbální data mohou dosáhnout větší bohatosti než například data získaná dotazníkovým měřením. Z toho implicitně vyplývá, že bohatá data mají svůj zdroj ve flexibilitě různých zdrojů přirozeného jazyka na rozdíl od omezeného deskriptivního repertoáru, který nabízí měrné škály. V průběhu kvalitativního výzkumu se data při sběru nepodrobují restrikci z hlediska informací relevantních zkoumané otázce. Zdroje informací sloužící k deskripci zahrnují v kvalitativním výzkumu širokou škálu různých kontextů, které se v jeho průběhu mohou kdykoli vynořit. Nepřesnost, jak by tento přístup nazval kvantitativní výzkumník, je naopak považována za výhodu. Spíše než techniky ověřující, zda jsou data dostatečně hustá či bohatá, můžeme vymezit podmínky, za kterých lze kriteria naplnit. Kvalitativní výzkumník bude preferovat zdroje vyskytující se v přirozeném prostředí účastníka výzkumu a bude se snažit zachytit co nejvíce přirozených situací vyskytujících se i mimo vlastní výzkum. Výzkumník se bude snažit s informátorem[2] nastolit tak blízký vztah, aby se mohl zúčastnit toho, co zkoumá. Bude volit takové přístupy, které podporují emergenci nových souvislostí a nových idejí a odmítat přístupy podporující již existující hypotézy či teorie (antikonfirmativní přístup). V jeho repertoáru sběru dat budou spíše nestrukturované výzkumné strategie, hojně bude využíván idiografický přístup a důraz bude kladen na výzkum procesu a sociální konstrukce významu účastníkem výzkumu (viz Bryman, 1988, Miles Huberman, 1994). B. Techniky týkající se role výzkumníka Podobně jako kvalitativně orientovaní vědci, i kvantitativní badatelé často usilují o kontrolu efektu výzkumníka. Efekty výzkumníka zahrnují nejen vliv osoby provádějící výzkum na data, ale i vliv dat na výzkumníka. Prvnímu z těchto efektů lze předejít a)dlouhodobou přítomností badatele na místě výzkumu, která má umožnit jeho organické včlenění se do prostředí, b)užitím co nejméně rušivých metod výzkumu, c)pověřením některého z účastníků výzkumu monitorováním vlivu badatele a d)informovaností respondentů o záměrech badatele. Vliv dat na osobu provádějící výzkum, který se může projevit jejím nekritickým přijetím vysvětlení, které nabízejí respondenti, lze omezit zahrnutím respondentů nižšího statutu, disidentů, deviantů a lidí na okraji společnosti do výzkumného vzorku. Vhodné postupy v této souvislosti představují také triangulace, konzultace terénních poznámek s kolegou, který dokáže lépe odhalit možná zkreslení a sledování původních výzkumných otázek i v situacích, které jakoby přímo nabízely otázky jiné (Miles & Huberman, 1994). Je však třeba připomenout, že ne všichni kvalitativní metodologové souhlasí s tím, že je třeba usilovat o kontrolu efektů výzkumníka a souvisejících jevů, které mohou ohrozit validitu. Pomocí modu operandi, popsaného Scrivenem (1974), se takové jevy snažíme pojímat jako možné události a pak hledat odpověď na otázku, jestli skutečně nastaly a ovlivnily zkoumaný jev. Obtížnost tohoto přístupu tkví v nutnosti identifikovat všechny podobné jevy a generovat možná alternativní vysvětlení, která jsou ovšem vždy ovlivněna teoretickými předpoklady badatele a kontextem studie (Maxwell, 1996). C. Techniky týkající se výběru respondentů Úsilí o kontrolu reprezentativnosti hraje významnou roli i v tradičních kvantitativních výzkumech. Reprezentativnost dat a zjištění v kvalitativních studiích může díky povaze kvalitativního výzkumu ohrozit především zkreslení způsobené tím, že respondenti jsou převážně vzdělaní a informovaní lidé (elite bias) nebo generalizace z událostí či procesů, které nějak vynikají, např. svou dramatičností, ale nejsou reprezentativní. Takové typy zkreslení lze omezit tak, že záměrně vyhledáváme negativní nebo extrémní případy (outliers), zvýšíme počet účastníků výzkumu a vybíráme je náhodně z reprezentativních souborů (Miles & Huberman, 1994). 2. Techniky týkající se analýzy a interpretace shromážděného materiálu Při analýze a interpretaci dat v kvalitativním výzkumu usilujeme především o nalezení jejich smyslu.[3] Miles a Huberman (1994) tvrdí, že lidé jsou puzeni rychle nacházet smysl i v těch nejchaotičtějších událostech. Autoři vycházejí z předpokladu, že ve vlastních interpretacích dáváme přednost takovému pojetí světa, kde svět je konzistentní a předvídatelný. Kritickou otázkou pro vědce využívajícího kvalitativní postupy však zůstává, zda významy, které nachází v datech, jsou spolehlivé, opakovatelné a správné. Ke generování významu z dílčí konfigurace kvalitativních dat doporučují Miles a Huberman (1994) následující postupy: 1. Zachycení vzorců, témat, či "gestaltů". Velké množství dat je redukováno do menšího počtu analytických jednotek (témat, souborů nebo konstruktů) na základě podobnosti, odlišnosti nebo procesů v daném kontextu. Děje se tak během sběru dat, protože pozdější práce s daty je zpravidla orientována na jiné aspekty, její fokus je užší. Výzkumník si tak vytváří kognitivní mapu, integrovanější schéma pro porozumění lokálních jevů a událostí. Z dat se průběžně vytváří jakýsi příběh, což jde většinou velmi snadno. Pro výzkumníka je důležité nejenom aby nová data dokázal do "příběhu" vestavět, ale aby se neuzavřel alternativě, že "příběh" nebude potvrzen. 2. Vidění plausibility má nejdříve formu pocitu, že výzkumník dělá něco smysluplného. Potom na základě tohoto emergentního pocitu systematicky prochází vlastní poznámky a ověřuje jeho platnost. 3. Vytváření trsů (clustering) jako souvisejících kategorií. Většinou se provádí tak, že se dílčí výzkumné jednotky (události, jevy, procesy, místa, případy atd.) seskupí a pak konceptualizují. Takto vzniklé koncepty jsou uspořádány do trsu, kde se částečně překrývají. Vznikají tak induktivně zformované kategorie, které naznačují opakující se uspořádávání věcí, událostí, zapojených osob, procesů či prostředí. Příkladem může být clustering míst ve škole, jak to uvádí Miles a Huberman (1994): formálně vzdělávací (třída, tělocvična), neformálně vzdělávací (knihovna, klub), formální pracovní místo dospělých (zasedací místnost, kancelář), místo neformálního setkávání dospělých (jídelna dospělých, kuřácký salonek, odpočívárna), smíšená místa (kavárna, hřiště). Z uvedeného příkladu je patrné, že vytváření trsů je založeno na srovnávání a agregaci dat. Clustering může mít i dimenzi hierarchizace, které je patrná v procesu přechodu od předběžně vytvořených dílčích kategorií k obecnějším jednotkám. 4. Užití metafor představuje podobně jako předcházející procedury prostředek k integraci mezi rozličnými částmi materiálu. Metafora redukuje data tak, že zobecňujícím způsobem zachytí několik dílčích elementů do jednoduchého vyjádření. Například "obětní beránek" je metafora odkazující k několika skutečnostem: skupinovým normám, zacházení s narušovateli těchto norem, sociálním rituálům a sociálním racionalizacím (Miles, Huberman, 1994). Miles s Hubermanem (1994) dávají několik rad, jak zacházet s metaforou v kvalitativním výzkumu: 1. Stále si být vědom toho, že účastníci výzkumu (včetně výzkumníka) často užívají metafor, aniž to plně reflektují. Snažit se porozumět implicitnímu významu metafor a pokoušet se o její explicitní exploraci a testování. 2. Metafory, které propojují dílčí prvky zkoumaného tématu, začít vyhledávat až ve druhé třetině výzkumného procesu, neboť dřívější využívání metafor může být nebezpečné. Člověk se často totiž stává vězněm svých metafor mimo jiné proto, že metafora snadno vyvolává resonanci od druhých osob, které mají pocit, že výzkumník má hluboký vhled do jejich problémů (a tedy do předmětu svého zájmu). 3. Kognitivně si s metaforami pohrávat -- například, říci si "jak bych to vyjádřil jen dvěma slovy?". Taková technika pomáhá přesouvat pozornost z jedné oblasti na jinou, nebo třeba i z denotátu na konotaci. 4. Využívat metaforu ke stimulaci interakce mezi členy skupiny, což vede k novým pohledům, udržuje to kreativní atmosféru a decentralizuje kognitivní rutinu. 5. Vědět kdy přestat s hrou metafor a být si jasně vědom toho, že dvě věci, které metafora dovede obsáhnout, jsou vždy odlišné. 5. Výčet (counting) odpovídá na otázku, co zde je či existuje. Počet je kategorie, která je kvalitativním výzkumem často ignorována. Přesto se však bez ní ani kvalitativní výzkum neobjede. Když se nějaký jev nebo téma objeví několikrát, nebo se stále za určitých podmínek objevuje, pak jde také o počet. Někdy se za otázkou "jak mnoho" skrývá něco podstatného o kvalitě. Když tvrdíme, že něco je důležité, opakující se, pak srovnáváme, vážíme, hodnotíme. I kvalitativní výzkumník by měl připustit, že někdy je užitečné počítat a měl by se zamýšlet nad tím, kdy je dobré užít vědomě frekvence a kdy ne. 6.Užití kontrastu a srovnávání je klasickým způsobem jak testovat závěry. I když v kvalitativním výzkumu může být tato metoda pociťovaná jako nenáležitá, i zde má své místo. 7. Rozlišení proměnných se používá, je-li diferenciace nutná více než integrace. Výzkumník by měl připustit, že některé globálnější proměnné dovolují menší vhled či porozumění než proměnné dvě nebo tři. Miles a Huberman (1994) uvádějí například, že v první fázi jednoho výzkumu se ukázalo, že ke změnám ve škole jako organizace došlo díky výsledkům inovace. V dalších fázích výzkumu se ukázalo užitečnější rozlišit mezi organizačními změnami, které představovaly obvyklé postupy (plánování, využívání zdrojů, obsazování míst a podobně) a klimatem v organizaci (normy, interpersonální vztahy, sociální vazby, mocenské vztahy). Na druhé straně je třeba si být vědom toho, že extrémní diferenciace vede k atomizaci a špatnému mapování jevů a procesů. 8. Shrnutí dílčích prvků do obecné kategorie se překrývá s vytvářením trsů. Miles a Huberman (1994) je odlišují mírou intuice -- clustering je intuitivnější postup. Použije-li výzkumník techniku sumarizování dílčích prvků do obecnější kategorie, postupuje systematičtěji, pokouší umístit bezprostřední akty jednání, události, jednající do abstraktněji definované třídy jevů. Dílčí prvky se zpravidla kódují a pak se shrnují do obecnější kategorie. Kategorie může být předem definovaná nebo se může vynořit jako úvahy nad kódy a jejich vztahy, které výzkumníka napadnou v průběhu kódování a jsou zachyceny v podobě poznámek (memos), které mohou být jednovětné nebo i vícestránkové, psané nejprve pro vlastní potřebu výzkumníka, později předložené kolegům. Glaser (1978) užívá tuto techniku k sumaci specifického chování tvořícího například vyjednávání nebo dohadování se o ceně (hašteření, pření se, nabízení, urovnávání sporů či konejšení druhé strany apod.). 9. Faktorování je analogií kvantitativní techniky a jejím cílem je odhalit pozorováním nezachycenou, hypotetickou proměnnou. Například Havelock, Cox, Huberman a Levinson (1983, podle Miles Huberman, 1994) při výzkumu organizačních souvislostí mezi univerzitami a okolními školami v jednom středozápadním státě USA zjistili řadu společných charakteristik jako například málo kontaktů s agenturami na celostátní úrovni, malá výzkumná aktivita, mnoho aktivit přesahujících do místních škol, univerzitní učitelé byli aktivní v místních radách apod. Z těchto charakteristik vyvodili obecnější téma-faktor: důraz na lokální zájmy -- činorodost. 10. Vyznačení vztahů mezi proměnnými. Cílem je odhalit jaké vztahy existují mezi dvěma nebo více proměnnými. Na této úrovni jde o vztahy mezi koncepty či kategoriemi, nikoli nutně mezi dílčími jednotkami (konkrétní chování, konkrétní osoby). 11. Hledání vztahů mezi intervenujícími proměnnými. Pokud se vztah mezi dvěma nebo více proměnnými ukazuje v průběhu výzkumu jako slabý, je třeba uvažovat o vlivu intervenujících proměnných. Grafická síť s vyznačením vzájemných vztahů mezi proměnnými a předpokládaným vlivem vmezeřené proměnné může pomoci zorientovat se v datech získaných kvalitativním výzkumem. 12. Na základě výsledků dosažených pomocí předcházejících procedur se můžeme pokusit o utvoření logického řetězce důkazů. 13. Utváření konceptuální a teoretické koherence. Dílčí fakta získaná v průběhu výzkumu jsou postupně seskupována do abstraktnějších výkladových schémat. Z empirické roviny se výzkumník přesouvá do konceptuální úrovně a posléze k teoriím. Důležitou charakteristikou tohoto kroku je propojení dat z více než jedné studie, neboť účastník jednoho výzkumu je zpravidla schopen vidět pouze vzájemné vztahy týkající se konkrétního místa, času, události, lidí - na jiných místech se věci odehrávají jinak. Multipřípadový terénní výzkum, jak tuto podmínku nezbytnou pro konceptuální a teoretickou koherenci nazývají Miles a Huberman (1994), je užitečný proto, aby se co nejvíce minimalizoval konsensuální klam. Neboť vliv skupinového myšlení, vlastních sebeklamů podporovaných jevem známým jako "přání je otcem myšlenky", může totiž většinu zkoumaných osob dovést k souhlasu s výsledky, které nemusí zas tolik odpovídat realitě. Eisenhardtová (1989) pro vybudování teorie z kvalitativních dat navrhuje, aby se konfrontovala zjištění u různých případů (cross-case findings), aby se dbalo na jasnou formulaci konstruktů, pečlivě se prozkoumávalo jejich spojení se vlastními daty a aby se v literatuře vyhledávaly jak konstrukty, které jsou v konfliktu se zjištěními, tak ty, které výzkumníkovy nálezy podporují. Uvedený popis navrhovaných procedur, který autoři směřují spíše teoreticky a kontextově, napovídá, že existuje široká plejáda konkrétních technik, které poskytují návody na to, jak se pokud možno vyhnout chybám při interpretaci a posílit kvalitu závěrů vyvozených z kvalitativních dat. Je také zřejmé, že s mnohými principy budou souhlasit i psychometricky orientovaní výzkumníci. V následující části uvedeme ty techniky, které jsou specifické, dobře propracované a snadno použitelné. Tyto techniky se často vzájemně překrývají, doplňují a vyznačují celou řadou společných charakteristik. Proto je jejich kategorizace obtížná. Návrh, který předkládáme, lze považovat za tentativní. A. Techniky týkající se reflexivní a dialogické povahy výzkumu Validizace respondentem (member check, respondent validation) byla vyvinuta v sociologii. Někdy se označuje jako validizace čtenářem, neboť spolehlivost získaných dat se ověřuje diskusí o výzkumné zprávě, kterou si účastníci výzkumu přečetli. Čtenář může s autorem zprávy polemizovat, zpřesňovat významy, či souhlasit, avšak v tomto rámci je míra svévolné či "divoké" validizace velmi redukována. Jde o dosahování konsensu v dialogu. Tento typ výzkumu a validizace dat poprvé vyzkoušel Mulkey (1985) u skupiny vědců, kteří mluvili o své práci. Podstatou této techniky je zpětná vazba, kterou poskytují respondenti po předložení předběžných výsledků. Zkoumaným osobám jako účastníkům výzkumu v duchu tohoto pohledu nemá být upírána schopnost reflektovat to, co se na nich zkoumá. Výzkumník je proto může vyzvat, aby v dialogu společně analyzovali výsledky. Respondenti tak mohou pomoci hodnotit zjištění výzkumníka(Miles & Huberman, 1994) a poskytnout vědci materiál pro jejich doplnění a úpravu ve světle svých reakcí (Reason & Rowan, 1981). Tato technika však nemá jasný epistemický základ. Nelze totiž přesně říci, jak skutečně posiluje pravdivost zjištění. Pokud obsah textu není kompatibilní se sebeobrazem respondenta, nebo pokud text pro něj není zajímavý a srozumitelný, což je případ, který, jak upozorňuje Bloor (1978), může u textu psaného pro vědeckou obec lehce nastat, bývá použití validizace respondentem problematické (Abrams, 1984). Když respondenti neakceptují určitá zjištění, pak to může být proto, že neodpovídají skutečnosti, nebo proto, že se respondenti bojí, že by zjištění (případně jejich interpretace) na ně vrhla špatné světlo. Mohou se také domnívat, že zjištění jsou nevyvážená v tom smyslu, že zdůrazňují buď jen negativní nebo pozitivní aspekty zkoumaného jevu. Systematicky o příčinách nesouhlasu respondentů s předloženými zjištěními pojednává Guba a Lincolnová (1981). Řadí k nim nepochopení smyslu, domněnku, že badatel byl předpojatý a proto jsou výsledky zkreslené, konflikt předložených zjištění s hodnotami, sebepojetím, či zájmy respondenta, nebo rozdíly mezi jeho či její a badatelovou konstrukcí zkoumané reality. Schwandt (1997)je tudíž toho názoru, že spíše než o validizační proceduře bychom o validizaci respondentem měli uvažovat jako o kontrole výsledků z hlediska jejich integrity. Tentýž autor doporučuje použití validizace respondentem také proto, že je přesvědčen, že vliv výzkumníka musí být minimalizován a odpovědnost za zjištění by měla být přesunuta na respondenty. Avšak tento postup by měl právě naopak zvýraznit participativní a dialogický charakter výzkumné aktivity. Navíc se dotýká spíše její etické než epistemologické dimenze, neboť jej lze chápat jako čestné jednání výzkumníka s lidmi, do jejichž života vstoupil a jejichž čas si vyžádal. Proto badatel má stát i o to, aby vyjádřili souhlas s textem, který o nich chce napsat. Z tohoto důvodu můžeme validizaci respondentem chápat spíše jako další způsob generování dat a vhledu do zkoumaného jevu než jako proceduru validizace či vyvrácení zjištění (Fielding & Fielding, 1986). Zpětnou vazbu mohou poskytovat nejen respondenti, ale i jiní lidé obeznámení nebo i neobeznámení se studovaným jevem. Zpětná vazba pomáhá identifikovat vlastní zkreslení, logické a metodologické chyby i jiná možná ohrožení validity (Maxwell, 1996). Zvláštními případy zpětné vazby je kromě validizace respondentem také nezávislý audit. Jakýsi pseuodoaudit může provést výzkumník sám, když se na svůj výzkum dívá jako nezávislý hodnotitel a krok za krokem znovu projde všechny jeho fáze. Vyzve-li někoho, kdo se výzkumu nezúčastnil, aby systematicky zkontroloval všechno, co vedlo k závěrečné zprávě, pak můžeme mluvit o nezávislém auditu. Audit se vztahuje na prvotní poznámky týkající se výzkumných otázek, plán rozhovorů, magnetofonové nahrávky, přepisy, kódovaní a původní kategorizace, hrubé verze zprávy a konečnou zprávu o výzkumu, atd. Audit je tedy jakýmsi "stopováním", zkoumáním řetězce tvrzení či argumentů od začátku až ke konečné verzi zprávy na základě existujících dokumentů. Cílem je zjištění koherence celého výzkumu (Yin, 1989; Smith, 1996) a ověření věrohodnosti závěrečného popisu a jeho oprávněnosti. Auditor má odpovědět na otázku, zda je finální zpráva skutečně založena na získaných datech. Výzkumník není veden úsilím potvrdit, že jeho přístup ke zpracování dat je jediný možný či definitivní, nesnaží se ani o potlačení alternativního čtení, ani o dosažení konsensu. Je to pokus ověřit spolehlivost jednoho určitého textu. S reflexivní a dialogickou povahou výzkumu souvisí i Smithův (1996) požadavek na prezentaci průkazných dat. Podle tohoto autora by výzkumník měl uvést hrubá data tak, aby čtenář měl možnost na jejich základě podrobně zkoumat interpretace a tak se zúčastnit interpretativního dialogu. Při psaní závěrečné zprávy je proto třeba jasně odlišit interpretace od hrubých dat. B. Techniky týkající se povahy vzorku, především jeho integrity, koherence a rozložení Důležitějším znakem vzorku než reprezentativnost je podle názoru některých autorů jeho vnitřní konzistence a koherence (Miles & Huberman, 1994). To však neznamená, že by se neměla věnovat pozornost i kontradiktorním datům. Pokud se dvojznačná nebo mnohoznačná data objeví, pak by se k nim badatel měl smysluplným způsobem vyjádřit. Podobně je žádoucí pojednat také o alternativních zdrojích interpretace (textech). Jiné způsoby interpretace dat nebo i protichůdné interpretace mohou text velmi obohatit. Někteří autoři dokonce doporučují záměrné vyhledávání negativních případů a diskrepancí. Případy, které jsou neslučitelné s navrhovaným vysvětlením, poukazují na jeho možné nedostatky a v popperovském duchu jsou tedy pro vědce velmi cenné. Jde totiž o aktivní hledání důkazů, které by vyvrátily navrhovanou teorii. K revisi teorie může dát popud už jen jediný negativní případ (Miles & Huberman, 1994). Přesto je zřejmě důležité brát v úvahu i proporci negativních a pozitivních případů. Rozhodnutí, zda podržet nebo modifikovat původní vysvětlení, pak závisí na kritickém zkoumání dat, která zvolené vysvětlení potvrzují, i těch, která je vyvracejí (Maxwell, 1996). Miles a Huberman (1994)kromě vyhledávání negativních případů v této souvislosti doporučují kontrolovat význam outlierů a zaměřit se na extrémní případy a na překvapující zjištění. Soustředění pozornosti na osoby, jevy, procesy či události, které se liší od ostatních, považují autoři za vhodné i přes nedůvěru, kterou takové případy přirozeně vzbuzují. Nakonec se totiž může ukázat, že jsou prototypické. Autoři dokonce prohlašují, že takové případy jsou přátelé badatele (s. 269). Podobně i překvapující zjištění mohou vést k revisi nevyhovující interpretace nebo dokonce ke konstrukci zcela nové teorie. Při setkání s překvapujícím zjištěním je nejdříve reflektujeme ve vztahu k původní teorii, pak uvažujeme o možnostech její revize a nakonec hledáme důkazy, které by revidovanou teorii podpořily. C. Techniky týkající se nestrannosti a kritičnosti badatele V etnografii doporučuje Roger Sanjek (1990) teoretickou nestrannost (theoretical candor), ale toto doporučení a jeho zdůvodnění platí nesporně i pro jiné obory sociálních věd. Např. Bromley (1986) se v podobném duchu dovolává nestranné analogie (judicial analogy), jež má podpořit způsob, kterým výzkumník hodnotí případovou studii. Oborová perspektiva výzkumníka podle Sanjeka určuje, jak je problém pojmenován a jak je vybrán, determinuje objektivitu jeho uchopení a místo provedení výzkumu. Výzkumník si na základě uvedených prvků vytváří určité terénní teorie o lidech, místech a událostech, které určují podobu zjištění mnohem více než to, co slyší a co vidí. V závěrečné zprávě by proto měl explicitně uvést jak postupy zvolené pro dokumentaci, tak apriorní funkce dílčí teorie. Navíc by měl reflektovat roli postupů i teorie při tvorbě hypotéz, problémů a výsledných tvrzení, stejně jako jejich vliv na volbu zkoumaných jevů a na průběh interakce mezi zúčastněnými osobami. Z textu by mělo být patrné, jak se vyvíjelo zachycení významu vyvozeného z terénních zjištění na základě zvolené teorie. Také Miles a Huberman (1994) se domnívají, že badatel by neměl být spoután vlastními teoretickými východisky a prekoncepcemi, ale měl by vždy být otevřen uvažování o alternativních výkladech. Kontrola rivalizujících výkladů jevu představuje podle nich "zdravé cvičení sebedisciplíny" (s. 274). Doporučují formulovat několik možných vysvětlení a počítat s nimi až do okamžiku, kdy jedno z nich se díky existujícím důkazům začne jevit jako stále pravděpodobnější. Příliš brzké zavržení alternativních hypotéz může způsobit zkreslení, které se v psychometrii nazývá systematickou chybou měření. Nebezpečné však může být naopak i příliš pozdní zamítnutí alternativních hypotéz, protože oslabuje celkovou práci a ústí ve zbytečnou akumulaci materiálu. Podobně není vhodné zabývat se příliš velkým množstvím nepravděpodobných alternativních hypotéz. Nejvhodnější cestu vidí autoři v zaměření pozornosti na "druhé nejlepší" vysvětlení při finální analýze. S kontrolou rivalizujících výkladů souvisí úsilí o vyloučení nepravých vztahů. Tato technika je založena na hledání třetí intervenující proměnné, která může vstupovat do objeveného vztahu mezi původními proměnnými. Miles a Huberman (1994) navrhují konzultovat takovou možnost s informovaným ale nezapojeným kolegou, který nepravý vztah spíše odhalí. Výzkumník může být přesvědčen, že vidí vztah mezi proměnnou A a B, ale ve skutečnosti A i B se může vyskytovat díky X. Technika se podobá vyhledávání intervenujících proměnných, avšak v tomto případě jde o lepší porozumění jinak jen intuitivně pociťovanému vztahu. Kupříkladu Walis a Roberts (1956, podle Miles a Huberman ,1994) zjistili, že pacienti trpící obrnou přijíždějící do nemocnice z větší dálky umírali častěji, než pacienti přicházející z bližšího okolí. Třetí proměnnou mohla být závažnost záchvatu, kvůli kterému byly do nemocnice dopraveni. A zároveň je pravděpodobný předpoklad, že do nemocnice byly přivezeny pouze vážné případy. Takto je důkladněji vymezena úloha třetí proměnné -- závažnosti záchvatu, jejíž výskyt podmiňuje obě původní: převoz a úmrtnost. D. Konkrétní postupy při vyhodnocování dat a formulaci závěrů Existují samozřejmě i techniky, které nesouvisejí tolik s teoretickými a epistemologickými východisky výzkumu, ale týkají se konkrétních procedur, které je možné aplikovat na získaná data. Cílem je úsilí nalézt validní interpretace v kvalitativních studiích. Např. quasi-statistika je použití jednoduchých numerických výsledků, které lze lehce odvodit z dat. Umožňuje doložit kvantitativní předpoklady a výroky, jako např. to, že nějaký jev je v populaci řídký, četný, atd. (Becker, 1970). Explicitní porovnání lze užít ve výzkumech, které probíhají na několika místech (multisite studies), implicitní se pak hodí pro studie jediného případu, které mohou obsahovat srovnání s případy popsanými v literatuře, nebo i s dřívější zkušeností respondenta případně badatele (Maxwell, 1996). Testování typu "jestliže-pak" (if-then) je založeno na ověřování hypotéz, které vyjadřují očekávaný vztah mezi událostmi či jevy. Miles a Huberman (1994) doporučují tuto metodu v případě, že badatel se cítí zmaten nebo jako by na mrtvém bodě, nebo má-li pocit, že už není daleko od vysvětlení, ale nedokáže jej ještě jasně formulovat. Jestliže- pak je pracovním koněm kvalitativní analýzy (Miles Huberman, 1994). Jde o tvrzení týkající se očekávaných vztahů, je to způsob jak formalizovat propozice, v generování predikcí nám pomůže dát dohromady velké množství jestliže a jedno pak. Zaměřuje výzkumníkovu pozornost k neustálé prověřování, zda se pak opravdu stalo. Charakter konkrétní, dobře známé a hojně používané techniky má i replikace zjištění, která se již netýká vyhodnocování dat, ale spíše ověřování závěrů. Miles a Huberman (1994) navrhují, aby se badatel sám pokusil replikovat své výsledky s pomocí nových dat pocházejících od nových respondentů, nebo aby k replikaci použil jinou část původního souboru dat. Podle autorů je s replikací třeba počítat již při plánování studie, protože pokusy o replikaci v konečné fázi studie bývají ohroženy nedostatkem prostředků, času, atd. Zvláštní soubor kritérií a souvisejících postupů, která zahrnují nejen teoretická východiska badatele, ale i implikace reflexivity výzkumu, vytvořili Lincolnová a Guba (1989)pro hodnocení takového druhu kvalitativního výzkumu, který má svůj původ v konstruktivistické epistemologii,. Své požadavky na kvalitativní výzkum shrnují pod pojem kritérium autenticity. Autoři rozlišují následující subkritéria: 1. Nestrannost (fairness) jako schopnost zachytit respondentovy různé konstrukce světa a hodnoty v nich obsažené vyváženým způsobem (konstrukce světa jsou autory definovány jako různé způsoby, kterými jedinec dává smysl situacím, událostem, atd.). 2. Ontologická autenticita jako míra, ve které je respondent schopen rozšířit a obohatit vlastní konstrukce díky své participaci na výzkumu. 3. Edukativní autenticita jako míra, ve které se účastník výzkumu učí chápat a oceňovat konstrukce jiných osob. 4. Katalytická autenticita jako míra, ve které proces dotazovaní stimuluje a facilituje jednání. 5. Taktická autenticita jako míra, ve které je účastník výzkumu podnícen k jednání. 3. Faktory ohrožující validitu v kvalitativním výzkumu K jevům, které mohou ohrozit validitu v kvalitativním výzkumu, a s nimiž se snaží vyrovnat výše uvedené techniky, lze zařadit zkreslení způsobené badatelem (researcher bias), reaktivitu (Maxwell, 1996), zkreslení elitou a holistické zkreslení (Miles & Huberman, 1994). Silverman (1993)[4] hovoří o dalších úskalích kvalitativního výzkumu, která označuje jako turistiku a romantismus. ˙ Zkreslení způsobené badatelem je důsledkem selekce dat, která zapadají do jeho prekoncepcí, která jej nějak zvláště přitahují či se mu z nějakého důvodu zdají významná (Miles & Huberman, 1994). Maxwell (1996) upozorňuje na to, že eliminace tohoto zkreslení je prakticky nemožná, protože kvalitativní výzkum má reflexivní povahu. Identifikace možných zdrojů a efektů zkreslení je však integrální součástí kvalitního projektu. ˙ Reaktivita je vliv badatele na studované prostředí nebo osoby. I zde je úplná eliminace obtížná, ne-li nemožná, avšak důležitá je reflexe možného zkreslení pouhou přítomností badatele. ˙ Turistika souvisí s nenasytným vyhledávání odlišností, která je typická pro turisty pohybující se po cizokrajných zemích. Badatel, který uvízne v její pasti, může ve snaze o odhalení unikátních vlastností zkoumaného jevu přehlédnout jeho podobnosti a souvislosti s jinými jevy. ˙ Romantismus je úskalí číhající na badatele, který považuje zobrazení vnitřní zkušenosti za dostatečný cíl výzkumu (podobně, jako se zobrazení vnitřní zkušenosti považovalo za dostatečný umělecký cíl v období romantismu 19. století). Jednostranný důraz na autentickou vnitřní zkušenost může totiž vést k zanedbání sociálního pozadí jevů. Romantismus je zvláště lákavý při zkoumání některých skupin, jako např. žen, na nichž bylo spácháno násilí, homosexuálů, atd. (Silverman, 1993). ˙ Holistické zkreslení (holistic fallacy) hrozí při interpretaci událostí jako strukturovanějších a kongruentnějších než jsou ve skutečnosti. ˙ Zkreslení elitou (elite bias) může nastat, pokud badatel klade důraz na data získaná od dobře informovaných a výřečných respondentů, kteří mají často vysoký společenský status. Těchto chyb se nedopouštějí pouze kvalitativní výzkumníci. V hojné míře se vyskytují i v klasickém výzkumu, kde jsou však často skryty za maskou "objektivity" ověřených metod. Závěr[5] Validizační techniky, které jsme se v tomto textu pokusili přiblížit, jsou výzkumníky používány proto, aby se zvýšila důvěryhodnost zjištění získaných kvalitativním výzkumem. Cílem je posílit přesvědčení uživatelů, že výsledky výzkumů podávají pravdivdivý a autentický obraz zkoumané reality. Je zřejmé, že některé techniky jsou užívány i v kvantitativním výzkumu, což dává naději, že přibližování původně zcela neslučitelných výzkumných alternativ přinese v budoucnu bohaté plody. Otevřenou otázkou však zůstává, která ze zmíněných technik přináší lepší výsledky a která je méně spolehlivá. Lze se totiž oprávněně domnívat, že některé validizační techniky jsou svou komplexností a propracovaností lepší než jiné z hlediska předpokládaného dosažení takových cílů jako jsou objektivita, potvrditelnost, reliabilita, autenticita, transferabilita a praktická využitelnost, abychom vyjmenovali aspoň některé. Současný stav vývoje validizačních technik neumožňuje spolehlivě je hierarchizovat podle zmíněného kritéria. Lze snad jen uvést domněnku, že triangulace si může činit nároky na získání pozice nejspolehlivější validizační techniky v kvalitativním výzkumu. Toto tvrzení by však nemělo umenšit význam ostatních technik. Mnoho kvalitativních výzkumníků zaujímá ve vztahu k získaným datům postoj, že neexistuje nějaké základní faktum, které by určovalo povahu všech jevů, a proto je také obtížné formulovat rigorózní kritéria získávání dat a ověřování jejich věrohodnosti. Můžeme se pokusit alespoň o to, abychom všechno neudělali špatně (Wolcott, 1994). Literatura: Abrams, P. (1984). Evaluating soft findings: Some problems of measuring informal care. Research Policy and Planning, 2, 2, 1-8. Banister, P., Burman, E., Parker, I., Taylor, M. & Tindall, C. (1994). Qualitative methods in psychology. A research guide. Buckingham, Philadelphia: Open University Press. Bartram, D. (1990). Reliability and Validity. In: J.R. Beech, L.Harding (eds). Testing People. A Practical Guide to Psychometrics. Windsor: NFER-NELSON. Becker, H.S. (1970). Sociological work. Chicago: Aldine. Becker, H.S., Geer, B., Hughes, E.C. & Strauss, A.L. (1961). Boys in white: Student culture in medical school. Chicago: University of Chicago Press. Bloor, M. (1978). On analysis of observational data: A discussion of the worth and uses of inductive techniques and respondent validation. Sociology, 12, 3, 545-557. Bromley, D.B. (1986). The Case Study Method in Psychology and Related Disciplines. Chichester: Wiley. Čermák, I., Štěpaníková, I. (1997). Validita v kvalitativním psychologickém výzkumu. Československá psychologie, 41, 6, 510-519. Denzin, N.K. (1989). The research act, 3rd ed. New York: Prentice Hall. Denzin, N.K. & Lincoln, Y.S. (1994). Introduction: Entering the field of qualitative research. In N.K. Denzin & Y.S. Lincoln (Eds.), Handbook of Qualitative Research. (s. 1-17). Thousand Oaks, London, New Delhi: Sage. Eisenhardtová, K.M. (1989). Building theories form case study research . Academy of Management Review, 14, 4, 532-550. Fielding, N.G., Fielding, J.L. (1986). Linking data. Qualitative research methods series No 4, London: Sage. Geertz, C. (1973). The interpretation of cultures: Selected essays. New York: Basic Books. Geertz, C. (1983). Local knowledge: Further essays in interpretive anthropology. New York: Basic Books. Geertz, C. (1988). Works and lives: The anthropologist as author. Stanford, CA: Stanford University Press. Guba, E.G. Lincoln, Y.S. (1981). Fourth generation evaluation. Newbury Park, CA: Sage. Hammersley M. & Atkinson P. (1983). Ethnography: Principles in practice. London: Tavistock. Janesick, V.J. (1994). The dance of qualitative research design. Metaphor, methodology, and meaning. In N.K. Denzin & Y.S. Lincoln (Eds.), Handbook of Qualitative Research (s. 209-219). Thousand Oaks, London, New Delhi: Sage. Lincoln, Y. & Guba, E. (1989). Fourth generation evaluation. London: Sage. Maxwell, J.A. (1996). Qualitative research design. An interactive approach. Thousand Oaks, CA: Sage. Miles, M.B. & Huberman, M.A. (1994). Qualitative Data Analysis. 2nd edition. London: Sage. Mulkey, M. (1985). The Word and the World. London: Allen and Unwin. Patton, M.Q. (1990,1980). Qualitative evaluation methods,2nd ed. Newbury Park, CA: Sage. Reason, P. & Rowan, J. (1981). Human Inquiry: A sourcebook for new paradigm research. Chichester: John Wiley. Sanjek, R. (Ed.) (1990). Fieldnotes: The makings of anthropology. Ithaca, NY: Cornell University Press. Schwandt, T.A. (1997): Qualitative Inquiry. A Dictionary of Terms. Thousand Oaks, London, New Delhi: Sage. Scriven, M. (1974). Maximizing the power of causal investigations: The modus operandi method. In W.J. Popham (Ed.), Evaluation in education - current applications (s. 68-84). Berkley, CA: McCutchan. Silverman, D. (1993). Interpreting qualitative data: Methods for analysing talk, text and interaction. London: Sage. Smith, J.A. (1996). Evolving issues for qualitative psychology. In. J.T.E. Richardson (Ed.) Handbook of qualitative research methods for psychology and the Wolf, R.L. (1975). Trial by jury: A new evaluation method. Phi Delta Kappan, November. Wolcott, H.F. (1994): Transforming qualitative data. Description, analysis, and interpretation. Thousand Oaks, London, New Delhi: Sage. Yin, R. (1989). Case study research: Design and methods, 2nd ed. Thousand Oaks, California: Sage. SOUHRN Autoři v článku popisují různé techniky používané ke kontrole validity v kvalitativním výzkumu. Značné množství existujících postupů rozdělili na techniky týkající se 1.shromažďování informací o zkoumaném jevu a 2.analýzy a interpretace shromážděného materiálu. V rámci první kategorie identifikovali procedury týkající se a)povahy dat, b)role výzkumníka, c)výběru respondentů, a d)samostatnou subkategorii triangulace. Druhou kategorii tvoří techniky týkající se a)reflexivní a dialogické povahy kvalitativního výzkumu, b)nestrannosti a kritičnosti badatele, c)konkrétních postupů při vyhodnocování dat a formulací závěrů a d)techniky odkazující k integritě, koherenci a rozložení zkoumaného souboru dat. Pozornost věnovali také faktorům, které mohou ohrozit validitu v kvalitativním výzkumu. ------------------------------- [1] Tato studie byla podpořena grantem č. A8025602 GA AV ČR [2] V kvalitativním výzkumu je výzkumník účastníkem výzkumu, proto se mnozí autoři vyhýbají rozlišení výzkumníka od zkoumané osoby. Místo toho označují výzkumníka i zkoumanou osobu jako účastníky výzkumu, zkoumaná osoba je někdy informátorem nebo dotazovanou osobou (informant). Ve zprávách o kvalitativním výzkumu se výzkumník presentuje ich formou, jinak je z kontextu patrné o kterého účastníka jde. V článku nedodržujeme v tomto smyslu striktně žádný úzus. [3] V kvalitativním výzkumu jde vždy o význam pro někoho, tedy o smysl (konotaci). [4] Silverman (1993) upozorňuje také na chyby typické pro kvantitativní výzkum. Řadí k nim: 1. scientismus, tedy názor, že věda je oddělená a nadřazená zdravému rozumu (common sense) 2. víru v pokrok v průběhu historie. [5] Pro srovnání uvádíme stručnou poznámku o pojetí validity v psychometricky založeném výzkumu. Validita je kupodivu podle stoupenců tohoto přístupu problematicky definována i v psychometrii. Validita psychologického testu byla většinou chápána jako ověřování toho, co je to za proměnnou, kterou test měří. Nověji je psychometrická validita vztahována k vhodnosti a oprávněnosti tvrzení o skórech získaných testem a oprávněnosti, kterou máme pro vyvozování závěrů z takových skórů ve vztahu k jiným naměřeným proměnným (např.Bartram, 1990). Různé druhy validity představují zároveň různé způsoby jejího dosahování: domnělá (face validity), souběžná, prediktivní, konstruktová, obsahová, kriteriální, syntetická validita a jiné.