Kapitola 3. Obsahová analýza Obsahová analýza je ze zde probíraných přístupů v sociálních vědách nej-starší a nejrozšířenějsí. Je popsána v radě dostupných příruček a učebnic [Franzosi 2008; Krippendorff 2004; Neuendorf 2002; Weber 1990] a její standardní výklad by byl nošením dříví do lesa. V této kapitole se proto budeme zabývat jen základními předpoklady obsahové analýzy a specifickými aplikacemi rozlišující čtenářskou a strojovou perspektivu analýzy textů, zejména kvalitativní obsahovou analýzou založenou na postupu zakotvené teorie {Grounded Theory) na jedné strane a korpusovými přístupy na straně druhé. Budu se držet hlavně postupů, s nimiž mám vlastní zkušenosti, které považuji za inovativm a které jsou v současnosti použitelné v sociologickém výzkumu. Samozřejmě to neznamená, že neexistují jiné zajímavé a slibné aplikace obsahové analýzy. Klasická Berelsonova definice zní, že obsahová analýza je „výzkumná technika k objektivnímu, systematickému a kvantitativnímu popisu zjevného obsahu komunikace" [Bereíson 1952:18j. I když v současnosti se mnoho výzkumů k této definici v její úplnosti nehlásí, stále platí, že obsahová analýza by měla být objektivní, systematická a vztahovat se k obsahu komunikace nezávisle na její formě. Ponechme nyní stranou problematický požadavek objektivity a věnujme se pojmu obsahu, í když v rámci definice není nejexpo-novančjším konceptem a jako by se rozuměl samo sebou; z hlediska dnešní aplikace je jeho smysl zcela klíčový. Berelsonovská představa, že lidská komunikace je jednání, během něhož je pomocí komunikačního média (hlas, obraz, písmo apod.) přenášeno určité sdělení (obsah komunikace), které lze podrobit objektivnímu zkoumání, je totiž dnes neobhajitelná. Jak je patrné z. předchozí kapitoly, sdělení nelze jednoduše oddělit nejen od komunikačního média, ale ani od účastníků komunikace. Z toho důvodu by bylo vhodnější mluvit o analýze komunikace bez toho, že by se analýza soustředila na její obsah. To je na druhou stranu až příliš široký pojem, který zahrnuje velkou a hlavně velmi různorodou část lidských aktivit. Sperber s Wilsonovou, vycházející z pojmu relevance, na základě analogie s pojmem pohybu dokonce pochybují, jestli je možné vytvořit teorii komunikace, která by podle 57 F jednotného princípu vysvětlovala tak odlišné komunikační jevy, jako je okázalé nadýchnutí se čerstvého vzduchu a právni text [Sperber, Wilsort 1995: 1-4], Proto se setrvává u původního termínu obsahová analýza jako zavedené nálepky; někteří autoři, aby se vyhnuli problému s obsahem, používají termín textová analýza, zejména tam, kde je analyzovaným prostředkem komunikace text [Popping 2000; Roberts 1997], Pouhé vymazání pojmu obsahu z názvu nebo definice ovšem nestačí k tomu, abychom se s problémem obsahu komunikace vypořádali. Jak v každodenním, tak v odborném živote totiž intuitivně předpokládáme, že komunikace může mít nějaký obsah. Například když se ptáme, co píší v novinách nebo o čem je kniha, kterou právě někdo čte; nebo když se díváme na stránku nějaké knihy nazvanou „Obsah", abychom zjistili, jestli je pro nás zajímavá; nebo když hodnotíme nějaký text jako bezobsažný, ve kterém se „nic neříká". Obsah je tedy něco, s čím běžně počítáme a jsme schopni ho identifikovat, resp. identifikovat jeho absenci. Je však také možné, že nás tato laická intuice klame a že představa obsahu je formou komunikačního fetišismu, tzn. mylné víry, že jádrem úspěšné komunikace je nějaký obsah (význam, myšlenka, představa, tvrzení apod.), který si komunikující předávají. V následující části se budeme otázkou obsahu komunikace zabývat podrobněji se zvláštním zřetelem na komunikaci textovou. 3.1 Co je obsah textu? Existence obsahů knih a delších textů obecně, tzn. předpokládaná možnost, že text může být užitečně doplněn paratextem označeným „Obsah", který explicitně stanovuje, co je „uvnitř" textu, nás nutí nenechat problém obsahu textu stranou jako nedůležitý. Dokládá totiž, že něco jako obsah textu prakticky existuje, jinak by tento druh paratextu pozbýval smyslu. Současně však nesmíme jednoduše zaměňovat paratextuální „obsah" s hypotetickým vlastním obsahem textu, protože - jak jsem ukázal v úvodní kapitole - role čtenáře je při interpretací textových dat klíčová. Otázku „Co je obsah textu?" nevyřešíme jen pouhým přemýšlením o textech; je třeba si pomoci obecnější teorií komunikace a následně ji upravit na konkrétní případ textu. V první kapitole jsem se zabýval rozdílem mezi kódovým a inferenčním modelem komunikace [Sperber, Wilson 1995: 2].5 5 Terminologie je zde neustálená; srovnej [Craig 1999]; Jirák a Kopplová rozlisují přenosový 3 konstitutivní model komunikace (Jirák, Kopplová 2009: 26 a nás!.], které zhruba odpovídají tomu, co je zde označováno jako kódový a inferenřní model. pro připomenutí, kódový model předpokládá, že lidská komunikace probíhá lak. že jedna osoba převede svou myšlenku do kódu a vytvoří tak sdělení '(„Kolik je hodin?"), které je prostřednictvím nějakého média (zvuku, obrazu) ^přeneseno k jiné osobě, jež sdělení dekóduje a zjistí sdělovanou myšlenku. Komunikace souhrnně probíhá takto: myšlenka A - převod do kódu - přenos médiem - převod z kódu - myšlenka A. Kódový model nelze považovat za "univerzální model lidské komunikace, protože velká část komunikace takto iňeprobíhá a je mnohem komplexnější („Kolik je hodin?" - „Tak ty mě nenecháš spát?!"); na druhou stranu vysvětluje důležitý rys komunikace, a to využití kódu a média. Druhý - inferenční - model komunikace předpokládá, že explicitní část komunikace probíhá podle kódového modelu, ale zároveň existuje stejně tak důležitá implicitní část komunikace (tj. to, co není přímo řečeno, ale z řečeného to v dané situaci vyplývá), která kódem určená není a závisí na usuzování (inferenci) komunikujících (viz výše uvedený příklad). Celkově tak můžeme komunikaci chápat jako jedncní s komunikačním záměrem, kterým v dané situaci vybíráme (činíme zjevné) určité kódující i nekódující prvky prostredí (slova, zvuky, obrazy, pohyby apod.), o kterých předpokládáme, že z nich náš komunikační partner buď bude schopen odvodit to, co mu chceme sdělit (myšlenku, představu, pocit, výzvu apod.), nebo naopak, že s jejich prostřednictvím zjistíme, co chce sdělit komunikační partner nám [srovnej Luhmann 2006: 159 a násl,]. Lidská komunikace je často multimodální, tzn. jsou při ní využívány různé způsoby komunikace a nikoli jen jazyk [Rress 2010]. Sperber s Wilsonovou [1995: 25] uvádějí hezký příklad multímodálnosti komunikace, kdy na Petrovu otázku Jak se dnes cítíš?" odpovídá Marie beze slov vytažením krabičky aspirinu z kabelky, jak je v této situaci zajištěno, že odpovědi bude možné správně porozumět? Pokud vezmeme v úvahu jen ostenzivní komunikaci, tzn. když jedna osoba dává svým chováním druhé osobě očividně najevo, že ji chce o něčem informovat, tak podle Sperbera a Wilsonové platí princip relevance. Ten formulují takto: každý akt ostenzivní komunikace současně komunikuje předpoklad své vlastní optimální relevance [ibíd.: 158]. Jinak řečeno, komunikující své sdělení podává v takové podobě, o které očekává, že bude pro příjemce komunikace dostatečným stimulem, aby se významem sdělení zabýval, tj. shledal ho v dané situaci relevantním. V uvedeném příkladu Marie vytažením krabičky aspirinu předpokládá, že Petr pochopí relevanci tohoto gesta pro danou komunikaci a začne ho interpretovat jako odpověď na svou otázku. 59 Jak nám výše uvedené úvahy pomohou odpovědět na otázku o existenci a povaze obsahu textu, který předpokládá obsahová analýza? Následovne: 1. Protože každý text je součástí komunikačního jednání, je na jedné straně fixovaným výběrem prvků prostředí (zejména znaků), který učinil komunikující aktér se záměrem komunikovat určité sdělení, a na druhé straně předmětem usuzování jiného komunikujícího aktéra (čtenáře, např. analytika) se záměrem zjistit komunikované sdělení („Komunikace je koordinovaná selektivita." [Luhmann 2006: 176]). Obsah komunikace je proto vždy efektem (účinkem) individuální projekce určitého sdělení činěná souborem voleb (znaků). Asi jako když ve výtahu zmáčkneme tlačítko se znakem „3", abychom tím informovali stroj o našem požadavku vyjet do třetího poschodí. Obsah se proto nachází mimo komunikaci, není předmětem komunikace, ale je komunikací generován. Vytváření textu, stejně jako čtení textu tak obsah generuje, resp. generuje jeho absenci. 2, Text je vytvářen i čten s ohledem na jeho manifestní i implicitní (ko-notovanou) složku [Eco 2010]. Manifestní složka je předmětem kódování a dekódování, implicitní složka je předmětem usuzování (Proč je napsáno zrovna tohle a ne něco jiného? Co se tím chce říci?). Obsah textu je proto účinkem obou těchto složek. Navíc, i když samotný text je nemateriálni a nesituovaný, vyskytuje se vždy v materiálním a situačním kontextu (a zpravidla je doprovázen určitým kotextem). Proto i obsah je kontextem, v němž je text produkován nebo konzumován, spoluurčo-ván, zejména jeho implicitní složka. Obsah textu, který je nadepsán Můj tajný deník (kotext) a nalezneme ho v truhle po babičce (kontext), bude čtením vytvářen v tomto kotextuálním a kontextuálním rámci. Z toho vidíme, že obsah textu je komplexním účinkem psaní, resp. čtení textu nějakým aktérem. Doposud jsme se pohybovali v oblasti teorie lidské komunikace a nedbali jsme sociologické relevance pojmu obsah textu. Je ze socíálněvědního pohledu důležité, je-li obsah textu inherentní vlastností textu nebo jeho účinkem? Vždyť důležité snad je, zda obsah textu (komunikace) existuje a je přístupný analýze, nikoli jeho původ. Ba ne, uvědomění si původu obsahu, jeho pragmatický (činnostní) původ, je pro sociálněvědní analýzu klíčový, protože znamená: kolik je různých zacházení s textem, tolik je různých obsahů textu. Obsahová analýza je vhodný název nikoli z toho důvodu, že by dokázala od-baíit „objektivní" obsah textu, ale že dokáže systematicky vytvářet obsah textu (zejména z jeho manifestní složky, ale nikoli výhradně). Krippendorf navrhuje definici, která tyto podmínky splňuje, ale navíc zdůrazňuje důležitost kontextu užití textů. „Obsahová analýza je výzkumná technika pro vytváření "I rcplikovateiných a validních úsudků (inferences) z textů (nebo jiných smys-luplných věcí) na kontexty jejich užití" (Krippendorff 2004: 18]. Všimněme si, že Krippendorfova definice obsahové analýzy přenáší ex--.: planans (to, co chceme analýzou vysvětlit) z textů na jejich užití. Reflektuje ■ f. tím pragmatický obrat v teorii komunikace, který přenesl pozornost od studia domnělých vnitřních charakteristik komunikace k vnějším způsobům používání komunikace - teorii mluvních aktů (speech act). Nebudu zde tuto problematiku hlouběji rozebírat a odkážu čtenáře na první kapitolu, kde se ; o tom píše. Přenos důrazu na užití textů (co se texty „dělá") otázku obsahu i prakticky nemění. Protože nic jiného než interpretace se s texty dělat nedá [Wilson 2012]; pokud z novin udělám vlaštovku a hodím jí z okna. nepoužívám text, ale novinový papír. Jakmile si noviny začnu číst, již generují jejich : obsah a na otázku „Co v nich píšou?" jsem připraven odpovědět. Když píši -í „Slibuji...", výběrem slova slibuji se snažím komunikovat svůj závazek, protože v tom slově je, jak předpokládám, můj závazek pro daného komunikačního partnera obsažen. Dovolím si proto upravit Krippendorfovou definici tak, aby byla jasnější: Obsahová analýza je výzkumná technika pro vytváření replikovatelných a validních úsudků z textů (nebo jiných smysluplných věcí) na kontexty vytváření jejich obsahů. Pro ještě větší jasnost definice bychom ještě mohli nahradit termín kontexty slovem okolnosti. Lze totiž říci, že vytváření obsahů má určitý kontext, ale protože tento pojem je zatížen mnoha diskuzemi o jeho významu, jednodušší ho bude nahradit termínem okolnosti, který nevyžaduje takovou interpretaci. Okolnosti vytváření obsahů mohou být fyzické i symbolické. 3.2 Kódování Jestliže jsme si na základě rozboru pojmu obsahu textu definovali obsahovou analýzu jako metodu analýzy textů, jejíž pomocí můžeme vztahovat texty k okolnostem vytváření jejich obsahů, nyní přistupme k otázce, jakým způsobem analyzovat texty, abychom odhalili možnosti vytváření jejich obsahů. Vlastně se tím dostáváme k základní otázce textové analýzy tj. otázce významu. Nebude nás však zajímat to, jak je v textu význam obsažen, protože touto otázkou jsme se zabývali v předchozí části, ale to, jak transformovat analyzovaný text, jehož účinkem jsou nějaké obsahy, do analytického textu, který reprezentuje (re-konstruuje) obsahy analyzovaného textu. Jednoduše řečeno, jak textově postihnout obsahy, které analyzovaný text nebo texty í vytvářejí? 60 ľ Nástrojem, který se k této transformaci v obsahové analýze používá, je ■ kódování. Jeho klíčová role je uznávána v kvalitativních verzích obsahové analýzy [Seidel, Kelle 1995], méně už v kvantitativních přístupech. Příznačná : je Krippendorfova kvazisyrionyrnizace kódování se zaznamenáváním [kapitola Recording/Coding v Krippendorf 2004], sugerující, že kódování je v obsahové analýze jen jakési dokumentování, jehož interpretační aspeKTjt vzhledem analyzovanému textu minimální anebo přísně kontrolovaný, jde přece o to, .^azí^a^&í^zené obsahy v pojmech jazyka dat (,data lan-guage") [ibid. 12"|. „Zaznamenávání (recording)probíhá, když pozorovatelé? čtenáři nebo analytici interpretují to, co vidí, čtou nebo nacházejí, a následně vyjadřují své zkušenosti ve formalizovaných pojmech analýzy, kódováni (co-ding) je termín, který obsahoví analytici používají, když proces zaznamenávání probíhá v souladu s na pozorovateli nezávislými (obseryer-independent) pravidly" [ibid. 126]. Celý problém zaznamenávání-kódování se pak přenáší na otázku kvality (lidských) kodérů, tzn. jak je vycvičit, aby kódovali validně a reliabilně. Termín „kódování" implikuje nějaký sémiotický systém kódů, do kterého zkoumaný text překládáme. V kvantitativní obsahové analýze to může platit tehdy, když máme systém kódů ve formě vzájemně propojených škál (přítomnost - absence; přítomnost: pozitivní - neutrální - negativní; přítomnost pozitivní: minulá - současná - budoucí; atd.), ale většinou jde o pouhou transformaci dat pro účely statistického zpracování přiřazováním předem definovaných kódů k určitým úsekům textu bez předpokladu koherentního systému kódů. Kódování v obsahové analýze si proto nesmíme spojovat s kódovacím modelem komunikace, protože je mnohem jednodušší. V principu existují dvě funkce kódů [Seidel, Kelle 1995], Faktická funkce, kdy kód označuje nějakou skutečnost v textu jednoznačným způsobem; ukazuje, že něco je případem něčeho obecnějšího. Například studujeme-li líčení vzdělávací dráhy v biografických rozhovorech a hledáme všechny případy, kdy bylo vzdělání ovlivněno nestandardními procedurami (politický tlak, protekce...), kód s faktickou funkcí zastupuje to místo v textu, kde se tyto důvody uvádějí. Například v orálně-historickém rozhovoru nalezneme tuto pasáž: A tak si popovídali a ředitel řiká tomu mistrovi mému a co ty honíš? A on fiká, ale mám žáka, který se sem přihlásil na přijímací zkoušky a tak by mě zajímalo, jak dopadl. A on řiká, tudle to jsou určitě přihlášky, tak je probereme. Tak probrali sloupec přijatých přihlášek, kde jsem nebyl, tak řiká, no tak to je neprijatej. Tak probrali štos nepřijatých přihlášek, samozřejmě mě tam našel, vytáhl nepřijatou, přehodil do sloupce přijatých, asi to ještě neměli, sekretářka ještě neměla seznamy a já byl přijat na průmyslovou školu. (ID093). ■■ Uvedený úsek lze označit kódem „nestandardní procedury" a dále lze už pŕa-; covat se samostatným kódem - kód reprezentuje jev v textu. Kódy s primárně faktickou funkcí lze dále třídit a shlukovat do kategorii, například ■ aktéři muži nebo ženy, druh školy, pomoc při přijetí nebo naopak bránění ;: v přijetí apod. Druhým typem funkce kódu je referenční funkce. Kód v tomto případě označuje určitou část textu relevantní vzhledem ke zkoumanému jevu nebo : přinejmenším hypoteticky relevantní. Například ve výše uvedeném úryvku : vypravěč mluví o průmyslové škole a jakou roli v přijetí na ni hrály zná-: mosti. V případě, že bychom zkoumali vzdělávací dráhy vypravěčů, tento r úsek vyprávění bychom označili hned několika kódy s referenční funkcí, na-: příklad průmyslová škola, nestandardní přijetí, známosti, ředitel, mistr, pro-. tekce, přiznání, úspěch. Referenční funkce znamená, že kód daný úryvek /nezastupuje, pouze na něj odkazuje, asi jako číslo v telefonním seznamu odkazuje na danou osobu, a chceme-li zjistit, kdo je zač, musíme jí zatelefonovat. Proto u kódů s primárně referenční funkcí musíme pracovat stále s původním úryvkem, nikoli kódem, který na něj odkazuje. V kvantitativně orientované (hypoteticko-deduktivní) obsahové analýze je cílem dosáhnout maximální faktické funkce kódování tak, abychom mohli operovat s kódy bez obavy, že nemáme jasně definovaný sémantický vztah mezi kódem a textem, který zastupuje. Kódy si teoreticky ponechávají svou referenční funkci, nicméně prakticky už nikdo nekontroluje, jestli jednotlivé instance kódovaných úryvků odpovídají přirazenému kódu. Daleko častěji se ověřuje reliabilita kódování, tzn. zda různí kodéři kódují stejně, jak podotýkají Seidel s Kellem, faktické kódování předpokládá jasný konceptuálni rámec, ve kterém se kódy pohybují [Seidel, Kelle 1995: 54], Kód „nestandardní procedura" musí mít jednoznačnou definici, v tomto případě komplementární, tj. vymezení, co jsou standardní procedury přijetí na školu. Pro výzkum by bylo pohromou, kdyby někteří kodéři považovali politická kritéria přijetí za standardní a jiní za nestandardní. Při kvalitativní obsahové analýze je kladem důraz na referenční funkci kódů, a to především z toho důvodu, že kódy vznikají ad hoc „za pochodu" a tudíž výzkumník nemůže garantovat jejich kvalitu. Kódy zde představují heuristickou pomůcku ke konstruování kategorií. Z logických důvodů zde mnohem více hrozí záměna „slabších" referenčních kódů za „silnější" faktické. Seidel s Kellem [Seidel, Kelle 1995] uvádějí dvě rizika plynoucí z této záměny, která připadají v úvahu zejména tam, kde je ke kódování využíván počítačový software. První riziko je zvěčnění kódu, tím i ztráta opory v datech; to, co jsme si provizorně označili za (hypoteticky) relevantní vhledem k určité kategorii nebo jevu, začneme považovat za případ toho jevu, aniž by- 62 chom tento vztah zpřesnili. Ve výše uvedeném případě bychom za nežádoucí zvěčnění mohli považovat to, kdybychom 5 kódem „známosti" začali pracovat jako s fakticky kódujícím namísto pouhé referenční funkce. Vždyť jak můžeme s určitostí tvrdit, že přijetí bylo ovlivněno známostmi? Vždyť žádnou definici „známostí" nemáme v dané chvíli k dispozici. Pokud bychom chtěli funkčně kódovat kódem „známosti", nejdříve bychom ho museli definovat ve vztahu k podobným jevům, například vztahům nadřízeností a podřízenosti apod. Následně bychom museli všechna data takto nově definovaným kódem překódovat. Tento postup je legitimní, ale dosti náročný. Druhým rizikem záměny referenční funkce kódu za faktickou je ztráta kontextu. V případě referenčního kódování označujeme oblasti textu za relevantní vzhledem : ke kontextu aktivovanému naším čtením, který bývá značně rozsáhlý. V některých případech je hypotetická relevance vytvořena jen pozicí výpovědi v řadě jiných výpovědí (Proč zrovna zde mluví o přijetí na školu?). Pokud kód, například úspěch, f aktualizujeme a tím dekontextualizujeme, ztrácíme tak podstatnou část jeho relevance. V důsledku toho nebudeme schopni dospět k validní interpretaci kódu a ke konstrukci smysluplných, na datech založených kategorií. Referenční kódování samo o sobě není schopno generovat obsah (kromě specifických případů, o nichž bude řeč níže); je jako rejstřík v knize, který nás může informovat, o čem všem se v ní píše, ale už z něj nezjistíme, o čem kniha je - jaké je její téma a její zápletka nebo důvod jejího napsání. Proto referenční kódování musí vyústit v konstrukci kategorií nebo, jak bylo zmíněno výše, ve vytvoření systematického a koherentního kódovacího rámce s faktickou funkcí, kterým se text znovu kóduje. Běžně se ovšem přistupuje k tvorbě kategorií, při které jsou referenční kódy používány jako pomůcka. Nejpropracovanějším způsobem tvorby kategorií z referenčních kódů je postup zakotvené teorie, jemuž se budeme věnovat v další části této kapitoly. Shrnu-li dosavadní úvahy o obsahu a kódování v obsahové analýze, ukazuje se, že před výzkumníkem stojí následující výzvy: 1. analýza by měla vytvořit takový obsah textu, který odpovídá jak textu, tak okolnostem, v nichž byl text vytvořen anebo v nichž je obvykle čten; 2. analýza by měla postupovat prostřednictvím kódování, které v různé, míře kombinuje referenční a faktickou funkci; referenční funkce indexuje text, zatímco faktická vytváří jeho obsah. Podle odpovědí na tyto výzvy můžeme definovat různé přístupy k obsahové analýze: Tabulka 2 Přístupy k obsahové analýze převažující funkce kódování předmět vysvětlení faktická referenční okolností tvorby textu deskriptivní přístup (exphrační/ hermeneutický konfirmační) přístup okolnosti čtení textu sémiotkký přístup Rozdělení přístupů podle toho, jestli se zaměřují na vysvětleni okolností f tvorby textu, nebo čtení textu, není obvyklé, ale podle mého názoru je opod-i ' statněné. Při využití faktického kódování se plně neukazuje, protože tento i typ kódování není schopen odlišit proces konstruování textu od jeho čtení !(vypravěčem líčené přijetí na školu je kódováno jako nestandardní procedura bez ohledu na to, jestli je jako taková konstruována vypravěčem nebo čtenářem). Když však využijeme referenční funkci kódování, musíme se vždy ptát, zda nás zajímá způsob, jakým byl obsah textu vytvářen mluvčím, nebo způsob, jak obsahu textu rozumí čtenář. V prvním případě jsem označil přístup za hermeneutický, protože se snaží vyložit text z pozice jeho autora, tzn. jaký obsah chtěl autor textem vytvořit. Když je analýza zaměřena na čtení textu, pak referenční kódování vede k sémiotickému přístupu, tzn. jak čtenář ko-, operuje s textem, aby vytvořil jeho obsah. ■~ Následující část kapitoly je rozdělena na přístupy předpokládající lid- ského čtenáře a na ty, které si vystačí se čtenářem strojovým. 3.3 Lidský čtenář Lidské čtení textu je komplexní sémiotická aktivita. Jak obrazne tvrdí Eco [2010], „text přenechává interpretační iniciativu na čtenáři, třebaže si obvykle přeje být interpretován s co největší jednoznačností. Chce, aby mu někdo pomáhal fungovat" [Eco 2010: 68], Čtenář interpretuje text v několika úrovních současně, od základní lexematické úrovně (jaká slova jsou v textu obsažena) přes úroveň encyklopedickou (co tato slova znamenají v kontextu kultury, jíž je čtenář členem) až po úroveň konstrukce možných světů, tzn. hypotetických konfigurací aktérů, objektů a situací, ve kterých interpretovaný obsah textu dává smysl (napr. když čteme o teroristickém Í4 útoku v Severním Irsku, abychom textu porozuměli, představujeme si možnou organizaci aktérů, objektů i situací, za kterých se útok odehrál; jsme ochotni připustit, že policie zasáhla střelbou z pušek, ale těžko bychom přijali, že útočníky zahnala luky a šípy; v takové případě bychom hledali jinou interpretaci celého textu, napr. jako aprílové vydání novin). Když čte text stroj, k interpretaci textu nedochází, stroj pouze redukuje komplexitu textu podle určitého, předem zadaného algoritmu. Například při sledování spoluvýskytů klíčových slov převádí stroj text na numerickou matici četností spoluvýskytů klíčových slov, z níž může výzkumník obsah textu vytvářet. Pokud budou stroje disponovat kulturními znalostmi (encyklopedickou kompetencí), bude rovněž možné, aby text interpretovaly i na úrovni encyklopedické; například bude-li text obsahovat výraz „tak jsme se kapku pohádali", bude stroj schopen nejen rozpoznat, že slovo kapka nese v textu význam „trochu" a pohádali znamená „verbálně komunikovali vzájemné neshody", ale zároveň dokáže hledat v nejblížším okolí i příčinu nebo důsledek hádky (rozdílné názory na výchovu dětí). K. využívání encyklopedických znalostí (databázového zpracování již existujících textů) již dochází při strojovém generování obsahů textů, například při automatickém detekování nevyžádané elektronické pošty. Sémiotická komplexita procesu čtení není to, co v principu lidské a strojové čtení odlisuje. Podle mého názoru je podstatný rozdíl v tom, že lidský čtenář vztahuje čtením aktualizované významy a konstruovaný obsah textu k vlastní identitě a to ovlivňuje následné čtení i interpretaci textu. Pokud MNE text nezaujme, čtu ho dál jen povrchne; pokud (dojdu k závěru, že) MNE uráží, přestanu ho číst; pokud (zjistím, že) MI lichotí, čtu text s potěšením třeba i opakovaně. Lidé čtou text, protože ho chtějí číst jako součást svého života a očekávají, že text jim osobně něco přinese (zábavu, poučení, emoce apod.). Proto může malá část textu, která rezonuje s identitou čtenáře, ovlivnit čtení a interpretaci celého textu. Strojové čtení tuto vlastnost nemá, protože stroj nečte text pro sebe, ale pro lidského operátora. Stroj se sice čtením může proměňovat (získávat nové informace do databáze a přehodnocovat již uložené informace) podobně jako člověk, ale nevztahuje text ke své identitě jako klíčovému aspektu interpretace textu. To je jeho silnou i slabou stránkou při využití strojového čtení pro analýzu textu v sociálních vědách. Pro bližší seznámení s obsahovou analýzou jsem vybral tři přístupy - dva lidské (obsahovou analýzu v rámci zakotvené teorie a analýzu sémiotickou) a jeden strojový (sledování spoluvýskytů klíčových slov). 66 3.3.1 Přístup zakotvené teorie Grounded Theory (zakotvená teorie) je současně metodou výzkumu i výsledkem výzkumu; sestává ze souboru pravidel, jak vést induktivně založený výzkum, jehož cílem je vytvoření teorie, nikoli pouze empirické generalizace nebo tvrzení o přijetí či odmítnutí teorie stávající. Zakotvená teorie jako metoda se zaměřuje zejména na analytickou část výzkumu, to znamená na analytickou a interpretační práci s daty, ale významným způsobem ovlivňuje i přípravu výzkumu a sběr dat. Hlavním pilířem metody a vodítkem pro výzkumníky je neustálé vzájemné srovnávání (dat, terénu, interpretací, konceptů) a interaktivita (výzkumníka s terénem, s jinými lidmi, koncepty, s jinými výzkumníky). Metodologii zakotvené teorie vytvořili v 60. letech minulého století dva sociologové, Barney Glaser a Anselm Strauss. Oba už předtím spolupracovali na výzkumech sociální organizace umírání v nemocnici, což je pro výzkum velmi náročné téma a má přesah i do praxe - jak lépe zorganizovat péči o pacienty v terminálním stádiu nemoci. To je i v současnosti velmi diskutovaná otázka. Pro takový náročný výzkum potřebovali vyvinout metodologii, která by odpovídala povaze kvalitativního výzkumu, tzn. aby byla současně systematická, rigorózní a flexibilní. Svou představu takovéto metodologie ztělesnili v knize Discoyeiy of Grounded Theory [Glaser, Strauss 2006/1967]. Grounded Theory měla kvalitativní výzkum vymanit z tehdejší podřadné pozice, kterou měl vzhledem k výzkumu kvantitativně orientovanému. Její autoři k tomu měli všechny předpoklady. Glaser studoval na Kolumbijské univerzitě, kde v té době působil například P. F. Lazarsfeld a kde se zaměřovali na rozvoj sofistikovaných kvantitativních metod. Ze studia si odnesl přesvědčení, že dobrá sociologická metodologie musí být dobře promyšlená, jasně formulovaná a systematicky zpracovaná. Zejména ho trápila otázka, jak testovat pracovní hypotézy vzniklé z kódování. A. Strauss studoval na Chicagské univerzitě, která byla vždy baštou kvalitativního terénního výzkumu (ostatně ne nadarmo se v dějinách sociologie učí o chicagské škole sociologického výzkumu). Strauss byl ovlivněn zejména pragmatismem a symbolickým mterakcionismem, ze kterého si vzal zaměření na výzkum v terénu, nutnost pevného empirického ukotvení každé teorie, důraz na proměnlivost sociálního dění a důležitost symbolického rozměru lidského jednání. Když jejich kniha Díseoveíy of Grounded Theory vyšla, umožnila kvalitativně orientovaným výzkumníkům vést výzkum takovým způsobem, že nemohli být obviňováni z nevedeckosti, nesystematičnosti a jejich závěry nebylo možné odmítnout mávnutím ruky z důvodu, že pocházejí z metodologicky nezvládnutého výzkumu. Ironicky se časem stala jakousi legitimizační 67 záštitou pro celou radu výzkumů, které postupy zakotvené teorie nepoužívaly, ale jejich autori se domnívali, že jim tato metoda dodá punc vědeckosti [srov. Becker 1993], Později došlo k rozdělení zakotvené teorie do dvou verzí, jedné zastávané Glaserem a druhé Straussem. Hlavní rozdíl mezi nimi spočíval v důrazu, který kladl Glaser na induktivní přístup [Heath, Cowley 2004; Walker, Myrick 2006]. Výzkumník by měl přicházet do terénu bez předem nastudovaných vědomostí, věnovat se sbírání všech dostupných dat a ty pak podrobně - řádek po řádku - analyzovat s vědomím základních sociálních procesů. Cílem je vytvoření konceptů, které povstanou z analýzy dat, a jejich vztahy pak umožní zkonstruovat zakotvenou teorií [Glaser 1978, 1998, 2001]. Strauss spolu s Corbinovou se spíše přikláněli k méně ortodoxní verzi, kdy výzkumník má vstupovat do terénu a posléze i analyzovat data se znalostí prostředí a již existující odborné literatury o tématu, které chce studovat [Corbin, Strauss 1990; Strauss, Corbin 1997; Strauss, Corbinová 1999]. Navzdory odlišnostem základní princip zakotvené teorie, tzn. vyvíjení teorie z dat a její těsná vazba na empirická data, zůstává stále platný. 3.3.1.1 Kódování Kódování je jedním ze dvou klíčových analytických kroků v rámci budování zakotvené teorie. Druhým klíčovým analytickým krokem je vytváření kategorií a vztahů mezi nimi. Připomeňme si, jak probíhá analýza textů v běžné kvalitativní obsahové analýze. Výzkumník je postaven před množství přirozeně strukturovaných dat (dokumenty, přepisy rozhovorů, zápisy pozorování apod.). Cílem analýzy, aby to byla opravdu analýza a nikoli jen popis, je transformace přirozeně strukturovaných dat do interpretace jevu v odborném kontextu. Například jsme svědky pokřikování fotbalových fanoušků pražské Sparty na utkání s ostravským Baníkem:,Vy ste špína naší ligy -vy ste přece polský Židi!" Rozumíme tomu, chápeme, že cílem je zesměšnění, a to že je činěno pomocí slov špína, polský i Židi. Dále nad tím nepřemýšlíme, jen si řekneme, že to dokazuje otevřenou xenofóbii a rasismus fanoušků, a někteří z nás si pomyslí, že by se s tím (xenofóbií a rasismem) mělo něco dělat. Pokud ovšem chceme chování fanoušků analyzovat, nestaří pokřiku porozumět v jeho přirozeném kontextu a k tomu přidat hodnotící soud. Analytik musí nejprve znesamozřejmit samozřejmý jev pokřikování na stadionu a vysvětlit ho z odborného pohledu v kontextu sociálněvědních poznatků a teorií. Jinými slovy, musí poskytnout jiné vysvětlení, než že pokřik má zesměšnit druhý klub a činí to pro danou situaci hanlivými výroky, a toto vysvětlení musí odborně argumentovat v kontextu dosavadního disciplinárního vědění (např. o sociálním konfliktu). |j V obsahové analýze je nástrojem k transformaci přirozeně se vyskytují- ' cích dat do odborného kontextu právě kódování. Pomocí kódování, resp. jeho i prostřednictvím, hledáme v textech typy, příběhy, témata, vztahy, základní ! kategorie atd. Kódování není nikdy cílem samo o sobě, ale je prostředkem k vytvoření kategorií či teorie určitého jevu. V postupu budování zakotvené teorie rozvinutém Straussem ::a Corbinovou existují tři hlavní typy kódování: otevřené, axiální a selektivní : [Strauss, Corbinová 1999; pro srovnání s Glaserovým přístupem viz Kelle 20051. Hranice mezi typy kódování jsou však při samotném výzkumu nezřeli telne, protože v průběhu analýzy kódujeme tak trochu všemi způsoby najednou; jsme stále otevřeni novým kódům, pokud by nám přišly vhodné, stále '• přemýšlíme, jak bychom kódy mezi sebou pospojovali do kategorií, a současně máme na mysli nějakou klíčovou kategorii, ke které se celá naše interpretace vztahuje. 3.3.1.1a Otevřené kódování š Otevřené kódování je v postupu zakotvené teorie nejčastěji tím analytickým I krokem, kterým začínáme. Máme před sebou nasbíraná první data a vý-| zkumnou otázku, jež nás při sběru dat vedla. Otevřené kódování znamená, f i že označujeme ty kusy dat, například části textu, o nichž se domníváme, že 1 by mohly být pro zkoumaný jev nějakým způsobem relevantní. Vezměme •1 si výše uvedený pokřik:„Vy ste špína naší ligy - vy ste přece polský Židi!" < Označit můžeme jednotlivá slova: vy - adresát pokřiku, spina - hanlivé ozna-! čení adresáta, naší ligy - skupinová identita, přece - rétorická pomůcka, poí-í ; ský - etnické označení adresáta, Židi - „rasové" označení adresáta. Všechna slova jsou zde relevantní, i když slovesa jsme samostatně nekódovali, protože f: jejich funkce je zde gramatická. Označit můžeme také celou větu jako zesměšňující a ponižující pokřik. Prvním krokem je tedy označení relevantních f úseků textu kódy (pojmy), které reprezentují významy. Umění otevřeného .- kódování spočívá ve schopnosti zachytit co nejvíce konkrétních informací co ; nejmenším počtem kódů. Všimněte si, že z deseti slov jsme získali šest růz-I ných kódů. Když bychom takto kódovali biografický rozhovor, který má tisíce slov, dostali bychom stovky, ne-li tisíce kódů. A co pak při analýze deseti biografických rozhovorů? Proto se musíme vyvarovat obou krajností: mít kódy příliš konkrétní, které výstižně reprezentují jevy, ale které se v datech prakticky neopakují a mezi kterými se jen těžko hledají obecnější vztahy, nebo mít " kódy příliš obecné, které jevy reprezentují jen volně, ale zase se z nich dobře vytvářejí kategorie. V našem případě by příliš konkrétní kód pro slovo spina ■ bylo „označení adresáta jako špína" a naopak příliš obecný by byl kód „označení adresáta", který by nediferencované sdružoval slova špína, polský, Židi. 69 Poté, co si data okódujeme, začneme z kódů vytvářet kategorie. Kategorie se vytvářejí seskupováním kódů. V našem případě bychom vytvořili kategorii „označení adresáta", která by mohla mít p od kategorie hanlivé, pochvalné a neutrální. Dále bychom mohli vytvořit kategorii „skupinová identita", která by byla totožná se stejně nazvaným kódem. Smyslem vytváření kategorií je jednak snížení počtu kódů do zvládnutelného počtu, jednak vytvoření takové analytické úrovně, na níž bychom mohli sledovat dimenze pojmů a určit/navrhnout teoretické vztahy mezi nimi. Co jsou to dimenze kategorií? Například označení adresáta může mít dimenze pozitivní až negativní, ale může mít též dimenze stigmatizující - ne-stigmatizující (6uzeranri/debilové), přímé - nepřímé {debilové - Pražáci), etnické, rasové, genderové, zdravotní atd. Vztahy mezi kategoriemi a jejich dimenzemi je potřeba definovat. Například skupinová identita a označení adresáta. V našem výroku je skupinová identita kategorií zahrnující kategorii označení adresáta. Pokřik řadí adresáta, tj. tým Baníku a jeho fanoušky, do „naší ligy", ale v jejím rámci mu dává nízký status, který byl vyjeven („přece"; buď: vždyť to z vás na první pohled čiší, nebo: navzdory tomu, že tak na první pohled nevypadáte). V jiném pokřiku by adresát mohl být považován za nepřítele, někoho cizího, dvě identity by stály proti sobě, místo aby byly v hierarchickém vztahu. Strauss s Corbinovou nabízejí několik technik, jak konstruovat kvalitní kódy a kategorie. Nejprve upozorňují, že překážkou může být naše předpo-rozumění zkoumaným jevům, které způsobí jakousi analytickou slepotu, neschopnost rozpoznat v datech relevantní informace. Když fanoušci společně skandují „Smrt rozhodčímu!", jak takový pokřik kódovat? Jako výhrůžku? Jako rituální pokřik, jehož význam je ve vyjádření nesouhlasu s rozhodováním zápasu? Běžný člověk totiž chápe výhrůžku smrtí jako velmi vážnou, prakticky nejvážnější. Ale jsou situace, v nichž se až tak vážně nebere, například když někdo zapomene něco pro druhého udělat, ten mu odpoví: „Já té zabijú!". Proto, abychom se stali analyticky citlivější, můžeme zkusit hledat protiklady, abychom zjistili, na jaké škále se pohybujeme. Co se týče pokřiků, existují pokřiky, že někdo „je bůh", „je král" apod. jejích nerealističnost nám umožňuje vzít v úvahu i to, že výhrůžka smrtí na stadionu při utkání je chápana jinak, než když by takto pokřikovali fanoušci na rozhodčího před jeho domem. Jinou technikou získání analytické citlivosti je porovnávání dvou nebo více jevil Například můžeme srovnat pokřikováni u různých druhů sportů, u různých skupin, válečné pokřiky atd. Toto srovnání může ukázat, co je na pokřiku fanoušků obecné a co specifické. 70 3.3.1 'S Axiální kódování l máme dostatek kategorií, můžeme začít s axiálním kódováním. Jestliže Mirkem otevřeného kódování je rozložit přirozenou strukturu dat na sou-boľ lategorií, které tento smysl zachycují, ale nejsou už přímo spojeny s kon-kic'ními daty, cílem axiálního kódování je složit kategorie tak, aby vytvořily •>) nikturu odborného vysvětlení jevu. Můžeme to přirovnat ke zkoumání nějakého přístroje, například mobilního telefonu. Otevřené kódování je jako rozebírání (je otevřené a zároveň otevírací), kdy jednotlivé součástky rozdělujeme do kategorií podle různých kritérií. Axiální kódování je naproti tomu ak^vita syntetická, kdy se snažíme porozumět vztahům mezi kategoriemi. Protože svět se neodehrává náhodně (i když někteří filozofové tvrdí opak) a ani sociální dění není libovolné, navrhují Strauss s Corbinovou obecný model pro hledání vztahů mezi kategoriemi, který odpovídá sociálnímu dění. Tento model nazývají paradigmatický model (paradigm model) neboli vzorový model. Model vypadá takto [Strauss, Corbinová 1999: 72]: Tabulka 3 Paradigmatický mode! v zakotvené teorii kontext příčinné podmínky jev strategické jednáni a interakce následky intervenující podmínky Účelem modelu není analýzu sešněrovat, ale nabídnout obecný model pro systematické vysvětlení sociálního dění, který umožňuje kategorie a jevy vzájemně mezi sebou vztahovat složitými způsoby. Abych axiální typ kódování vysvětlil, použiji opět stejný příklad pokřiku fotbalových fanoušků. Bez paradigmatického modelu bychom mohli poskládat kategorie do vzájemných vztahů (např. označení ke skupinové identitě), ale vše by bylo statické. Víme totiž, že sociální dění je neustálý proces, který vnímáme jako proud zkušeností. Model nám pomáhá tuto procesuálnost dění zachytit tím, že nás nutí hledat ty aspekty jevu, které jsou před ním, po něm a po „stranách". Zde nabídnutá ilustrace bude ovšem jen špatnou simulací opravdového axiálního kódování, protože nemáme k dispozici potřebná data. Zkoumáme pokřiky fanoušků. Naším jevem je pokřikování fanoušků Sparty Praha na hráče a fanoušky Baníku Ostrava. Nuže, hledejme příčinné podmínky - co vede fanoušky k tomu, aby na stadionu pokřikovali, že ti druzí jsou špína ligy. V rozhovorech s fanoušky bychom zjistili, co si myslí o fanoušcích jiných týmů, co si myslí o ligových hráčích, proč chodí fandit, jaké jsou druhy fanoušků a ke kterým se řadí. Z toho bychom mohli pomocí otevřeného kódování získat poznatky o identitách jiných aktérů a mohli by- 71 chom srovnávat s tím, co se křičí. Zda je příčinou zrovna takového pokřiku přesvědčení, že hráči a fanoušci Baníku jsou špína ligy, nebo jestli je cílem snížit sebevědomí protivníka a zvýšit vlastní sebevědomí. Pak bychom hledali, proč zrovna ponižování souvisí se zvyšováním sebevědomí, a to bychom museli nahlédnout i do odborné literatury. To nás může vést zpátky do terénu zjistit, jak pokřiky fanoušci připravují, jestli je nacvičuji či zda existuje jejich stabilní repertoár apod. Kontext pokřikování je evidentní, je jím sportovní utkání, ale musíme z dat zjistit, jak fanoušci utkání kategorizují, jako jaký typ události ho chápou. Někteří fanoušci za hlavní bod utkání nepovažují samotný souboj hráčů na hřišti, ale bitku s fanoušky druhého týmu. Sportovní utkání je pro ně záminkou pro kolektivní rvačku. V tomto kontextu je pokřik podobný pokřikování bojovníků před bitvou, které jim má dodat odvahu zesměšněním nepřítele a morální posílení poškozením jeho tváře [srov. Goffman 1967: 5-46]. Ale jsou možné i jiné kontexty. Na hřišti nelze křičet cokoli. Například když by někdo zakřičel, že „Zítra je neděle!" nebo „Baník jsou strojvůdci!", asi by se z toho pokřik nestal, intervenující podmínkou je například fanouškovský diskurz. Jen některá slova mohou sloužit jako ponižující označení [Bargiela-Chiappini 2003; Brown, Levinson 1987]. Dalšími intervenujícími podmínkami jsou etnické a rasové stereotypy, které pokřik používá. Kdyby takto pokřikovali v Německu nebo Holandsku, málokdo by tomu rozuměl, protože si nespojí Ostravu s blízkostí Polska a Polsko s naším sousedem. I to, že pokřik nelze vymyslet libovolně, že aktéři mají k jeho tvorbě určité vymezené podmínky, je třeba při interpretaci vzít v úvahu. Důležitým prvkem v modelu je strategické jednání a interakce. Teoreticky zakotvená teorie vychází z pragmatismu a ze symbolického interakcionismu, které tvrdí, že významy se vytvářejí až v interakcích jedinců, kteří do nich vstupují s určitými záměry [Corbin, Strauss 1990]. Je proto nanejvýš důležité při interpretaci dat vzít v úvahu interakční kontext, v němž se jev vyskytuje, včetně příčinných a intervenujících podmínek a kontextu. V našem případě musíme zjišťovat, za jakým účelem jedni fanoušci pokřikují na druhé rasistické a xenofobní urážky. Jak na to ti druzí reagují? Není to hra na přebíjenou, kdo toho druhého více poníží a tím i naštve? Jsou pokřiky svého druhu konverzací? Na druhé straně některé prvky pokřiku mohou být nezáměrné. Primárním cílem možná není urážet Poláky a asi ani Židy. Tato označení jsou použita pro jejich nízký symbolický status vůči „naší líze" a v rámci fanouškovské subkultury. Konečně posledním prvkem modelu, který bychom při axiálním kódování měli brát v úvahu, jsou následky, jaké jev má. Následky opět musíme hledat v sebraných datech a nikoli o nich spekulovat, jak to zde Mním já. Následky jevu můžeme rozdělit na zamýšlené a nezamýšlené ze strany účastníků jednání. Zamýšleným následkem pokřiku muže být posílení identity ; a sebevědomí fanoušků, kteří křičí. Nezamýšlené následky může pokřikování i mít na ty fanoušky v obecenstvu, kteří s obsahem pokřiku nesouhlasí a nao-hou intervenovat u managementu klubu, aby takovým pokřikům zabránil. To je ve zkratce paradigmatický model. Práce s modelem znamená systematické vytváření otázek a hledání odpovědí v datech. Například hledáme nezamýšlené důsledky jednání jednoho aktéra, které mohou vytvářet kontext i pro jednání jiného aktéra. Při tomto úsilí nepracujeme jen na úrovni kate-- gorií, ale sestupujeme i na úroveň kódů a primárních dat. Zjišťujeme, jestli jsme nezapomněli kódovat něco, co se ukázalo pro pochopení pokřiku jako formy bojovné konverzace důležité. K tomu nám dobře poslouží software pro • analýzu kvalitativních dat, jako například Atlas.ti [Konopásek 1997, 2005, , 2008, 2011], NVTVO [Bringer, Johnston, Brackenridge 2006] nebo Qualrus. i V množství papírů může analytik ztratit hlavu, ale pokud má vše v počítači, je orientace ve velkém množství dat jednodušší. ; Ještě než přistoupíme k selektivnímu kódování, chtěl bych zdůraznit, 1 že ke kódování nelze přistupovat mechanicky. Paradigmatický model slouží jako pomůcka pro systematické porovnávání a uspořádávaní kategorií, ale ? není povinným stadiem výzkumu nebo nějakou garancí, že něco objevíme. Když vzpomenu příklad s mobilním telefonem, podobně jako na domácí rozebírání telefonů není žádný přesný návod, na kódování také ne. Ale pokud : dodržujeme určitá pravidla (např. že do telefonu nemlátíme kladivem), časem se to naučíme, podobně jako kódování. Paradigmatický model je něco ; jako obecný model telefonu, tzn. říká nám, že když jsme ho rozebrali, měli bychom mezi díly najít nějakou anténku, nějakou baterii, SIM kartu, nějaké í čudlíky, kterými se spouští apod. Podobně každý sociální jev má nějaké příčiny a následky, kontexty a interakce. Axiální kódování je uspořádávání ka- | tegorií do vztahu jak vůči sobě navzájem, tak i k celku. • 3.3.1.1c Selektivní (výběrové) kódováni Třetím typem kódování je selektivní kódování. Je to práce s kategoriemi, jejímž cílem je vybudovat zakotvenou teorii nějakého jevu. Je to závěrečná integrace kategorií do jednoho celku. Opět, jako v případě předcházejících typů kódování, nejde o závazný postup nebo o kuchařku; k dispozici jsou určitá pravidla, pokud se jimi řídíme, můžeme kódování úspěšně provádět. Prvním krokem je vytvoření příběhu, resp. nalezení pointy, která určitou kategorii zvýznamní a učiní z ní kategorii centrální. Pointu příběhu nejsnadněji nalezneme tak, že vyprávíme někomu jinému, na co jsme přišli. 73 Abychom udrželi posluchačovu pozornost, přirozeně nás to svádí zvýraznit určitý aspekt jevu. Není ovšem výjimkou, že při snaze vyprávět zjištěni někomu jinému zjistíme, že jsme vlastně nic zvláštního neobjevili, že žádnou pointu nejsme schopni vymyslet. Nebo se nakonec posluchač zeptá: „No a? A to má být objev?" V takovém případě je třeba se znovu vrátit ke kategoriím, případně kódům, a hledat mezi nimi dosud nezjištěné vztahy, které by nás k pointě navedly. Je ale potřeba říci, že jev sám žádnou pointu nemá, tu tam vkládáme až my jako analytici a interpreti. Někdy se ale stane, že potenciálních point je více; v tom případě je nutné si zvolit jen jednu. Proto se tento typ kódování nazývá výběrovým. Vezměme si náš fanouškovský příklad. Zkoumáme pokřiky fanoušků a zjistíme o nich mnoho informací typu kdo, kdy, kde, jak a proč. Stojíme teď před otázkou, co se stane naším objevem. Můžeme zkusit tvrdit, že centrální kategorií je interakční povaha skandování, jakési paralelní utkání k utkání hráčů. Že existují určitá nepsaná pravidla skandování. Čím agresivnější a tvrdší je utkání sportovní, tím agresivnější je i skandování fanoušků. Můžeme zkusit vybrat centrální kategorii, která by souvisela s nějakou již existující teorií, například teorií konfliktu, Pak bychom mohli tvrdit, že jde o formu nerealistického konfliktu, který se jako konflikt tváří, ale ve skutečnosti jde o posílení skupinové solidarity. Ať už bychom vybrali první, nebo druhou interpretací, museli bychom podle ní uspořádat ostatní kategorie a podřídit je logice této interpretace. Někdy se stane, že centrální kategorie je celkově dobře podpořená, ale někde existují slabá místa. Tehdy musíme zpátky ke kódům a ke kategoriím nebo dokonce přímo k datům a pokusit se buď smysl centrální kategorie upravit, nebo najít v datech potřebnou podporu. V této fázi výzkumu je důležité, abychom měli načteno dostatek literatury, která nám poskytne zdroje pro hledání centrální kategorie. Může lo být buď přímo, jako v případě nerealistického konfliktu, který byl původně konceptualizován Georgem Simmelem a později ho rozpracoval Lewis i'osrr [Coser 1956], nebo nepřímo, jako v případě interakční povahy skandov. i. V praxi se často setkáváme s otázkou, kdy můžeme přistoupit k selektivnímu kódování. Je evidentní, že i jeden rozhovor s fanouškem můžeme kódovat, vytvořit kategorie, paradigmatický model a začít s budováním teorie. Nicméně byla by to jen slabě zakotvená teorie, protože by byla s empirickou realitou propojená jen jedním rozhovorem. Opačný problém může nastat, když máme nasbíráno velké množství dat a vytvořenou řadu kategorií, ale chybí nám odvaha začít stavět teorii. Pro rozhodování o tom, kdy lze začít s teorií, existuje pomůcka, která se nazývá teoretická saturace. Teoretická saturace nastává v okamžiku, kdy už další nová data nepřinášejí významné nové poznatky ani neobohacují existující kategorie, jejich dimenze a vzájemné vztahy [Glaser, Strauss 2006: 62]. V tomto okamžiku je vhodné přejít k hledání centrální kategorie, pokud jsme na ni už dříve nepřišli. Samotné vytvoření zakotvené teorie poté spočívá v argumentovaných výrocích o vztazích mezi kategoriemi, které jsou v souladu s dominantní rolí centrální kategorie. Teorii pak můžeme formulovat narativně, ve formě příběhu, nebo systematicky, podle nějakého modelu (např. rozpracovat a přizpůsobit paradigmatický model). 3.3,1.2 Shrnutí kódování v zakotveni teorii : Kódování postupem zakotvené teorie je variantou obsahové analýzy prováděné od začátku do konce lidským čtenářem. Je charakterizováno snahou o maximální indukčnost, tzn. kódy a posléze kategorie by měly být v co nej-:vyšší míře odvozeny z analyzovaných textů. To neznamená, že by byl analytik osvobozen od všech forem předporozumění, hermeneutický kruh [Gadamer 2004: 265 a nás!.] zde platí. Nejprve operuje s referenčním kódováním, které umožní vytvoření kategorií a následně i paradigmatického modelu. Kategorie, s nimiž pracuje axiální a selektivní kódování, jsou tak i nadále ukotvené v kódech s referenční funkcí. Z tohoto důvodu je v tomto typu obsahové analýzy často používáno „in vivo" kódování, kdy k označení kódu nebo kategorie použijeme přímou citaci analyzovaného textu. Silnou stránkou tohoto typu obsahové analýzy je právě induktivní po-: stup, který slibuje o data opřenou konstrukci teoreticky nepředpokládaných vztahů; odhaluje obsah, jenž nejvíce odpovídá tomu, který generují účastníci sociálního dění zacházející s texty (vytvářejí je, distribuují i je čtou). Jinými slovy, postupem zakotvené teorie můžeme dosáhnout značného průniku relevancí aktérů i analytiků ve vztahu k obsahu analyzovaných textů. Nevýhodou tohoto postupu je obtížnost. Nezkušený analytik velmi často dojde buď k banálním zjištěním, kdy pouze tematizuje obsahy běžně temati-zované laickými čtenáři textů, nebo naopak k sofistikovaným, nicméně spekulativním výsledkům, které jsou významově adekvátní, ale těžko dokazatelné. Udržet se na interpretační úrovni blízké aktérům a současně dojít k odborně relevantním zjištěním je nesnadné a vyžaduje zkušenost a hermeneutické nadáni. 3.3.2 Sémioticky orientovaná obsahová analýza V úvodu této kapitoly jsem zdůraznil, že čtení je sémiotická aktivita. Samozřejmě to platí i pro vytváření textů. V rámci obsahové analýzy se proto 75 můžeme zaměřit na studium textů jako výsledků sémiotické aktivity jejich autora nebo na obsahy textů, které jsou generovány čtenáři. Jinou možností je zaměřit se na analýzu tvorby textů nebo čtení textů jako na aktivity generující významy a obsahy textů. Vezměme známý příklad - gymnaziální otázku - co chtěl básník říci verši: My přijdem blíž, my přijdem blíž, my světů dožijeme, my bijem o mříž, ducha lvi, a my ji rozbijeme! Obvyklá „správná odpověd" je ta, že Neruda tím chtěl vyjádřit jednak vůli překonat malost poměrů a jednak víru v lidský pokrok; tato odpověď je vlastně výsledek obsahové analýzy básně. Analýzou skutečného studentského čtení dané básně bychom pravděpodobně zjistili, že jednotliví čtenáři vytvářejí obsah básně různě, nicméně vlastním čtení vytvořený obsah, resp. jeho frag-mentámost či absenci, nepovažují (z ryze pragmatických důvodů) za legitimní obsah, který by mohl být prezentován jako „správná odpověď' na výše uvedenou otázku. Školní lavice nejsou jediné místo, kde se vyžaduje, aby vytvářený obsah textu odpovídal především očekávání ostatních; v mnoha různých situacích vytváříme čtením takové obsahy, které jsou v dané situaci legitimní. A právě zkoumáním toho, jak se během čtení textů vytvářejí obsahy se zabývá sémioticky orientovaná analýza [pro klasické texty viz Eco 2010; Hall 2005/1973]. V následující části představím jednu konkrétní aplikaci takové analýzy, při níž se zjišťovalo, jak příslušníci tří generací kooperují s úryvky narativních textů a vytvářejí jejich obsahy; jedná se o výzkum, který jsem prováděl s Marií Dlouhou a dalšími studenty [Hájek, Dlouhá 2011, 2014]. Výzkum čtenářské kooperace s úryvky biografických vyprávění Ve výzkumu jsme se zaměřili na dosud jen málo prozkoumaný způsob, jakým jsou biografická vyprávění pamětníků, která můžeme chápat jako určité dokumenty kolektivní paměti, přijímány členy komunity paměti. Přijetí nějakého dokumentu jako dokumentu paměti, tzn. jako (legitimní) součásti kolektivní paměti, je komplexní proces a probíhá v několika úrovních, rozlišitelných pouze analyticky. První úrovní je situace, v níž se člověk s dokumentem setkává, například muzeum, dokumentární pořad v televizi, hraný film v kině, kniha, billboard apod. Tuto úroveň charakterizuje očekávání, že dotyčný se „naladí' na určitý žánr či sociální kontext, který situace implikuje. Příjemce se může rozhodnout, že daný žánr nepřijme, že jej bude popírat nebo k němu přistoupí subverzivně (např. ironicky). Příkladem může být ne-; ochota nebo právě ochota jít do Muzea totality nebo začít číst knihu Paměti ...... mi/iciondře. Druhou úrovní je lokální kontext, ve kterém je dokument prezentován a který orientuje potenciálního příjemce směrem do určité minulosti, například předmluva k vyprávěním pamětníků, komentár k muzejnímu exponátu, datum na fotografii apod. Příjemce dokumentu paměti zde musí opět aktivně participovat v tom smyslu, že přijímá (nebo nepřijímá) určitá pravidla hry například v historickém románu kombinaci historických a fiktivních momentů, v komentáři k muzejnímu exponátu důvěru k faktičnosti sdělovaných informací nebo u biografického vyprávění předpoklad autenticity sdělení (na rozdíl od fiktivních autobiografií) [Hall 2005/1973], Třetí úrovní předpokládané kooperace při recepci dokumentu jako dokumentu paměti je jeho obsah, například text básně, obsah filmu, podoba budovy, znění písně. Aby si dokument udržel status dokumentu paměti, je zapotřebí, aby recipient pochopil jeho obsah ve vztahu k sdílené minulosti určitého společenství paměti. Například ve filmu uvedeném jako historický film musí porozumět, v čem je film historický tzn. události v něm zpodobňované musí úspěšně přiřadit k vlastním představám o dané době. Případný nesoulad může vést k odmítnutí dokumentu jako dokumentu paměti (např. ve prospěch „propagandistického dokumentu"). Při aktuální interakci s dokumentem působí všechny tři úrovně současně, tzn. v určité situaci je specifickým způsobem prezentován objekt zvláštní povahy, například v knihovně je kniha biografických rozhovorů s pamětníky socialismu obsahující i průvodní studii. Ne nutně však všechny úrovně působí ^ ■ stejným směrem; táž kniha tvořící součást uměleckého objektu vytvořeného z množství knih různého stáří, který se nachází v předsálí knihovny nebude značnou částí návštěvníků knihovny považována za „dokument paměti", tzn. za legitimní součásti jejich „kolektivní paměti", i když v jiném kontextu (na polici označené „Životopisy") by nepochybně za dokument paměti považována být mohla a byla. Z uvedených tří analyticky pojímaných úrovní procesu recepce dokumentů paměti jsme se v našem výzkumu soustředili na úroveň třetí, na to, jak je posuzován obsah určitého dokumentu jako potenciálního dokumentu paměti. Jinými slovy, chtěli jsme zjistit, jak členové komunity paměti intera- !gují s předkládaným textovým dokumentem tak, aby ho mohli začlenit do intersubjektivně sdílené reprezentace minulosti a dát mu tak status dokumentu paměti. Domnívám se totiž, že kolektivní paměť nesestává pouze z intersubjektivně sdíleného souboru reprezentací minulosti, aleje současně specifickou schopností jednat, kompetencí s dokumenty paměti zacházet. To, co činí z člověka člena určité komunity paměti, není výlučně jeho znalost sdí- 76 lené minulosti, ale - a možná přednostně - umení náležitě konfrontoval sebe a ve společnosti existující dokumenty se vztahem k minulosti. Prakticky vzato, člověk je nucen aktivovat „kolektivní paměť" vždy, když se setká s nějakým dokumentem, pro který je nárokován statut dokumentu paměti. 3.3.2.1 Interpretační kooperace ve vyprávění Vzhledem k narativnímu charakteru textů použitých ve výzkumu (jeho účastníkům jsme předložili úryvky z přepisů autobiografických vyprávěni pamětníků socialismu) jsme při analýze metodologicky vycházeli ze dvou zdrojů: z Ricoeurovy teorie vyprávění, zejména z jeho konceptu trojí mimésis rozpracovaného v prvním díle Času a vypravení [Ricoeur 2000: 88-134; srov Hamar 2008: 28-40], a z Ecovy analýzy čtenářské kooperace v narativních textech [Eco 2010]. Ricoeur charakterizuje každé vyprávění jako proces trojí mimésis [viz kap. 5.4.2]. Tato konceptualizace vyprávění je ze sociologického hlediska přínosná, protože do vyprávění integruje jak interpretaci světa vypravěčem, která vyprávění předchází, tak následnou interpretaci vyprávění čtenářem. V našem výzkumu jsme respondentům nabídli úryvek autobiografického vyprávění jako dokument paměti a ten byl jimi jako takový přijat pokud v něm našli sdílený svět (socialistické) minulosti, na který vyprávění odkazovalo, a současně ho dokázali vnímat jako aktérskou biografickou výpověď, které je možné porozumět s ohledem na nynější situaci. Při analýze čtenářské aktivity respondentů, tj. při vytváření obsahu textu, jsme použili sémiotický přístup, jak ho rozpracoval U. Eco v knize zabývající se čtenářskou kooperací v narativních textech [Eco 2010], tzn. tím, co by Ricoeur označil jako třetí mimésis. Eco ve své práci vychází z Peirceova pragmatismu, v němž „odhalit objekt [...] znamená odhalit modus operandi, čili vyprodukovat jej (nebo vyprodukovat jeho praktické použití)" [Eco 2010: 59; kurzíva původní]. Na tomto základě pak staví svou teorii interpretační kooperace v narativních textech, jejichž porozumění čtenářem je úkol veskrze praktický, spočívající v aktualizaci jejich obsahu. Proto jsme se v našem výzkumu zaměřili na způsoby, jakými čtenáři s úryvky biografických narativů kooperují při jejich interpretaci. Poněvadž jednou z klíčových čtenářských strategií porozumění vyprávění je konstrukce hypotézy narátora [Bortolussi, Dixon 2003: 60-96; Eco 2010: 79; Mullins, Dixon 2007], zajímalo nás, jak budou recipienti biografických příběhů konstruovat identitu vypravěčů a jak bude identita domnělých vypravěčů spojena s interpretací textu. Druhou věcí, kterou jsme sledovali a pro kterou Ecova sémiotika poskytuje analytické nástroje, byla skutečnost, že čtenářská interpretace textu (aktualizace jeho obsahu) se nezakládá jen na skutečnostech v textu fakticky přítomných (nezávisle na intencích autora), ale současně vypovídá i o samot- ném světě čtenáře [Eco 2010: 82; Ricoeur 2000: 113]. Touto cestou jsme byli 'schopni postihnout způsoby, jakými se realizují specifické kompetence příjemce dokumentů paměti vedoucí k jejich přijetí a performované integraci ■do kolektivní pamětí. 5.3.2.2 Experiment Provést výzkum formou experimentu jsme se rozhodli vzhledem k položeným výzkumným otázkám i ke způsobu analýzy. Jelikož jsme se snažili prozkoumat v podstatě obyčejné čtení, tj. samozřejmě vnímanou a rutinní interakci - předpokládanou kooperaci - s dokumenty paměti, nabízelo se navázat na etnometodologickou tradici zviditelnění taken-for-granted řádu prostřednictvím jeho narušení [Bonková 2002; Garfinkel 1967: 35; McHoul 1982]. Logika experimentu se odvíjela od předpokladu, že člen komunity paměti (v tomto případě české společnosti) při setkání s domnělým dokumentem paměti dokument jako takový buď odmítne, nebo přijme. Pokud ho přijme (což jsme vzhledem k situaci předpokládali), bude se ho snažit zapracovat do kontextu legitimního obrazu minulosti. Abychom tento proces zviditelnili, předložili jsme účastníkům experimentu zvláštní dokumenty - krátké fragmenty autobiografických vyprávění pamětníků socialismu - které od čtenářů vyžadovaly značnou kooperaci (dle našeho soudu až na hranici únosnosti), aby mohly být integrovány do všeobecně přijímaného (nebo přijatelného) historického kontextu. Konkrétním úkolem respondentů-čtenářů pak bylo na základě četby přiřadit vypravěčům politickou identitu (podrobnosti uvádím níže). Následně byly s respondenty provedeny rozhovory o důvodech jejich volby. Provedený experiment sice nebyl narušující v garfmkelovském pojetí, protože radikálním způsobem neporušoval tichá očekávání (background expectation) účastníků a nevyvolával v nich nejistotu, zmatek či dokonce zlobu vůči experimentátorům [Garfinkel 1967: 37-49]. Respondenti věděli, že se účastní experimentu a byli připraveni na nekaždodenní, nerutinní činnosti. Narušení běžného řádu spočívalo v převrácení okolností při setkání s dokumenty paměti; v přirozených situacích je znám autor či zdroj dokumentu, zatímco je nejasná autenticita dokumentu, která je následně vůči autorovi či zdroji poměřována (zda mluví/píše pravdu, „jak to bylo", či nikoli). V našem experimentu jsme respondenty naopak postavili před deklarovane autentické dokumenty s nejasným autorstvím (disident, komunistický funkcionář nebo obyčejný člověk?). Druhé převrácení přirozeného pořádku spočívalo v předložení neobvykle krátkých úryvků; respondenti, zvyklí rozumět výpovědím na základě kontextů, ve kterých se vyskytují, tzn. opírat se o indexikální charakter přirozeně se vyskytujících výrazů [Garfinkel 1967: 4-7], tak byli nu- 78 79 ceni naopak potřebný kontext dotvářet, aby se úryvky staly srozumitelnými vzhledem k domnělé identitě vypravěče. Celkem se experimentu zúčastnilo čtrnáct osob. Účastníci pocházeli ze čtyř rodin a v jejich rámci.reprezentovali tri generace - prarodiče, rodiče a děti. Nej starší generace prožila většinu svého života v období socialismu, střední generace si socialismus pamatuje ze svého mládí, případně středního věku, a nejmladší generace, dnešní dvacetiletí, znají socialismus jen zprostředkovaně. Nejmladší generaci tvořili studenti (jeden muž a tři ženy) magisterského stupně studia sociologie na Fakultě sociálních věd Karlovy univerzity, střední generaci jejich rodiče (jeden muž a čtyři ženy) a nejstarší jejich prarodiče (dva muži a tři ženy; v jednom případě byl příbuzenský vztah nepřímý). Z hlediska sociální homogenity lze považovat náš vzorek nejvíce homogenní v generaci studentů a nejméně v generaci prarodičů. Stojí za zmínku, že žádný ze starších respondentů nebyl v době socialismu významně politicky angažován, ať už pro nebo proti režimu. Relativně malý počet respondentů (14) nepovažujeme za slabinu výzkumného designu vzhledem k tomu, že jsme pro analýzu získali téměř 300 konverzací o jednotlivých úryvcích, tj. 100 pro každou generaci, a v rámci generace 30 konverzací pro každou ze tří identitních kategorií vypravěčů. Celkem jsme měli k dispozici 120 normostran přepisů. Při analýze rozhovorů jsme vzali v potaz i to, že nejmladší generaci zastupovali studenti sociologie; z analýzy nám však nevyplynulo, že by jejich odborné znalosti a zkušenosti hrály při kooperaci s úryvky signifikantní roli. Technicky proběhl experiment následovně. Každému účastníkovi jsme předložili list s 21 krátkými úryvky vyprávění vybraných ze sbírek přepisů biografických rozhovorů vytvořených v rámci dvou projektů řešených v Centru orální historie (COH) Ústavu pro soudobé dějiny (ÚSD) AV ČR. Konkrétně šlo o sbírku rozhovorů Politické elity a disent v období tzv. normařizace. Životopisná interviews., ve které byli narátoři buď bývalí vysocí komunističtí funkcionáři, nebo příslušníci disentu, a sbírku Průzkum české společnosti v období tzv. normalizace. Biografická vyprdvenř příslušníků dělnických profesí a inteligence., ve které vyprávějí, jak už z názvu vyplývá, příslušníci dělnických profesí a inteligence. Charakteristiky studovaných sbírek rozhovorů jsou dostupné na webových stránkách COH ÚSD AV ČR6; značný počet rozhovorů byl publikován v editované podobě knižně [Vaněk, Urbášek 2005; Vaněk 2009]. Vybrané úryvky sestávaly z 35 až 45 slov dlouhých úseků textu obsahujících zájmeno nás. Důvodem záměrné přítomnosti zájmena nás byla potřeba asociovat předkládané texty s nějakým aspektem kolektivní identity 6 http://www.coh.usd.cas.cz/csAatalog-a-sbirky-ro2hovoru | vypravěče - komunistického funkcionáře, disidenta nebo tzv. obyčejného člověka. Naším cílem tudíž bylo vybrat takové fragmenty vyprávění, v nichž by byla patrná identitní práce vypravěčů [Becher 2008; Snow, Anderson 1987]. Předpokládali jsme, že v takových úryvcích bude narace obsahovat určitou diskurzní konstrukci skupiny, k níž se vypravěč řadí a která umožní respondentům snáze odhadnout jeho politickou identitu [Galasinski 2010], Úryvky byly náhodně vybrány z korpusu rozhovorů prostřednictvím sady náhodných čísel, vždy osm z každé skupiny vypravěčů. Z celkově vybraných 24 úryvků jsme dva vyřadili, protože se vztahovaly ke druhé světové válce a nikoli k období socialismu, a v jednom případě jsme úryvek vyřadili z toho důvodu, že text byl celkově obtížně srozumitelný. lak jsem již uvedl, účastníkům experimentu byl předložen list s 21 úryvky. Respondenty jsme vyrvali, aby označili, do jaké ze tří výše uvedených politicky definovaných skupin osob by zařadili narátora, který vyslovil daný úryvek v rámci svého životního vyprávění. Respondentům přitom nebylo známo rovnoměrné zastoupení narátorů pro každou skupinu (ne-: chtěli jsme, aby jejich určování ovlivňovala určitá kalkulace a chtěli jsme omezit vzájemné srovnávání jednotlivých úryvků) ani nebyli nuceni se k některé z identit přiklonit. Naopak, umožnili jsme jim v případě pociťované nemožnosti určení neoznačovat identitu žádnou, resp. označit identit několik. Kromě samotného označování domnělých vypravěčů jsme respondenty současně požádali o podtržení slov či oblastí textu, které je vedly ke zvolení na-rátorovy identity. Poté, co respondenti určili identity vypravěčů a podtrhli informativní slova a slovní spojení, jsme s nimi provedli rozhovor, ve kterém jsme je požádali o vysvětleni důvodů svých voleb, tzn. proč zvolili danou identitu a proč podtrhli ta která slova. Rozhovor}' vedl vždy student se svým příbuzným (rodičem, prarodičem), resp. kolegou/gyní bez přítomnosti cizích osob; ve dvou případech jsem vedl rozhovor se studenty já, příslušník střední generace. Rozhovory jsme nahrávali a jejich přepisy následně podro- I bili analýze. 3.3.2.3 Metoda analýzy Technicky se analýza opírala o konceptuálni nástroje vytvořené U. Ecem [Eco 2010]. Eco stratifikuje textovou kooperaci čtenáře s narativem do několika úrovní [Eco 2010; 85-105]. První kooperace se odehrává na úrovni slovníku, tzn. řetězce slovních výrazů neboli lexematického povrchu textu [Eco 2010: 91]. Čtenář kooperuje s textem tím, že na slova tvořící text aplikuje systém pravidel (kódů), který mu umožňuje text převést do první úrovně obsahu. Čte-li v textu „tak jsme se kapku pohádali", je schopen rozpoznat, že slovo kapka nese v textu význam „trochu" a pobádali znamená „verbálně 81 f komunikovali vzájemné neshody." Na rozdíl od tohoto příkladu slovní výrazy čínský budoár nebo sofistikované systémy nemusejí být všem čtenářům na této základní úrovni jednoznačně srozumitelné a jejich význam se bu-. dou snažit odhadnout z kontextu. V našem výzkumu nás tato úroveň slovních výrazů (slovníku) zajímala především v souvislosti se slovy a slovními spojeními, která čtenáři označili podtržením jako klíčová pro identifikaci vypravěče. Přirozeně, námi sledovaný „podtrhaný" slovník tvoří jen výseč ze slovníku, který čtenářům umožnil pochopit význam textů. Jednalo se ponejvíce o slova, jež měla z pohledu čtenářů vztah k minulosti, resp. k tomu, co z minulosti mělo potenciální význam pro určení identity vypravěče. Pro názornost můžeme uvést několik slovních výrazů, na něž čtenáři upozorňovali: vězení, nás tajemníky, co študujeme, protěžovaný atd. Od úrovně slovníku jsme: očekávali, že nás přivede k odpovědi na dvě otázky: jaký má slovně výrazová složka vyprávění podíl na přijetí dokumentu čtenářem jako dokumentu paměti a do jaké míry je tato slovně výrazová složka vyprávění sdílená napříč generacemi i jednotlivými respondenty? Úroveň slovníku umožní čtenáři udělat „první pokus o amalgam" [Eco 2010: 96], tzn. první mlhavou představu o tom, o co se v přečteném textu jedná. Druhou úroveň kooperace čtenář realizuje na úrovni encyklopedie. Eco hovoří o encyklopedii, nebo přesněji o encyklopedické kompetenci, jako o schopnosti čtenáře rozumět slovům v textu vzhledem ke kulturní tradici, k níž se základní slovník textu vztahuje [Eco 2010: 96]. Například objeví--li se v textu výraz byli jsme ye vězení, čtenářova encyklopedická kompetence mu poskytne nutné vědění k tomu, aby mohl dále pokračovat ve čtení (co je to vězení pro účely čteného textu, např. nemožnost být s rodinou) a současně v konstrukci toho, o čem daný text pojednává. V sociologickém myšlení je konceptu encyklopedie blízký Schútzův pojem „balíku příručního vědění" (stock of knowledge at hand), nicméně Schütz svůj pojem chápe obecněji, jako interpretační schéma pro současné i minulé zkušenosti každodenního života [Schütz 1970; 74]. Eco encyklopedii pojímá úzce jako schopnost propojit jazyk s kulturou, podobně jako knižní encyklopedie propojuje heslo s jeho kulturním významem. V našem výzkumu jsme zkoumali úroveň čtenářské encyklopedie z toho důvodu, že odkazuje k něčemu, co bývá intuitivně spojováno s kolektivní pamětí, tj. s určitou zásobou vědění o minulosti. Zjišťovali jsme, jaké obsahy aktualizují u čtenářů slova základního slovníku označená v první úrovni kooperace s textem. V rámci prováděné analýzy jsme se ještě pokusili o zkoumání třetí - nej-komplexnější - úrovně čtenářské kooperace, kterou je konstrukce „možných světů". V sémiotice a literární vědě je pojem možného světa velmi diskutovaný, viz [Doležel 2003; Eco 2010], a není mojí ambicí zde do této dis- kuze vstupovat. Termín jsme přejali a zacházeli s ním v jednom důležitém ohledu odlišně od běžného užití - vypravěči autobiografií si na rozdíl od autorů fiktivních příběhů nemohou sestavovat svět svého životního příběhu libovolně, protože by se mohli dostat do konfliktu se čtenářem (posluchačem), jenž by mohl namítnout, že „takhle to přece vůbec nebylo!" Analogicky čtenáři biografií nemohou nekriticky přijímat text a na jeho základě libo-:volně konstruovat hypotézy struktur možných světů, protože si uvědomují, že referentem je minulost skutečná, ne fikce (jako v případě historických románů nebo retrofilmů). Nicméně i přesto považuji pojem možného světa za vhodný k analýze interpretační kooperace v biografických textech, a to zejména z toho důvodu, že umožňuje zachytit čtenářovu (nikoli vypravěčovu) cestu k významu, který pro něj úryvek vyprávění nabývá. V autobiografickém vyprávění čtenář na základě čteného textu a své encyklopedie činí propozice o tom, jak se bude děj vyvíjet, anticipuje následné stavy, které se mu po přečtení dalšího textu buď potvrdí, nebo ne [Eco 2010: 139], Naši čtenáři se však museli potýkat s tím, že text jim poskytoval pouze omezený materiál pro vytvoření hypotézy o tom, co se děje, a svým rozsahem už jim zpravidla neumožnil tuto hypotézu ani dílčím způsobem ověřit. Respondenti-čtenáři tak za pomoci své encyklopedie konstruovali situační kontext či kontexty, v nichž by předložený úryvek pro ně nabýval smysl. Tyto kontexty lze chápat sémioticky ve vztahu k textu jako možné světy, tj. situace považované respondenty za reálně možné. Současně musíme připustit, že v některých případech si byli respondenti natolik jisti kontextem a svou interpretací úryvku, že je vztahovali jen k určitému subjektivně reálnému historickému světu, který znali z vlastní nebo zprostředkované zkušenosti. To v naší analýze znamenalo limitní případ možného světa. A právě interpretační pohyb čtenáře mezi „možným" a „skutečným" světem byla hlavní kooperační aktivita, kterou jsme sledovali. 3.3.2.4 Kooperace na úrovni slovníku V Ecově pojetí čtenářská kooperace na úrovni slovníku představuje především čtenářské, zpravidla rutinní a neuvědomované rozpoznání elementárních sémantických vlastností výrazů, například že výraz žena znamená lidskou bytost ženského pohlaví [Eco 2010: 96]. V našem případě se však většinou nejednalo o takto bazálni úroveň kooperace, ale o sledování, která slova či slovní spojení čtenáři-respondenti považovali za významná pro určení identity mluvčího jako komunistického funkcionáře, disidenta nebo obyčejného člověka. Konkrétně jsme pozorovali, jak se mezi generacemi respondentů liší zvýrazněná slova a slovní spojení a zejména zdůvodnění jejich role a významu při konstrukci hypotézy celkového významu úryvku za úče- 82 33 lem nalezení identity vypravěče. Vycházeli jsme nejen ze slov podtržených při čtení, ale především z následných rozhovorů-komentářů, v nichž respondenti význam podtržených slov rozváděli. Z hlediska generační struktury respondentů musím překvapivě konsta tovat, že rozdíly mezi generacemi nejsou výrazné. Jediná znatelná odlišnos-se týká nejmladší generace, která se častěji zaměřovala na hledání historicky relevantních významů jednotlivých slov než na skupinově specifické výrazivo nebo potenciální vysvětlující kontexty (viz dále). Přestože tedy čtenáři prožili v období socialismu různou dobu a jejich osobní zkušenosti jsou různé, na úrovni jednotlivých slov a slovních spojení není jejich kooperace s úryvlsv významně odlišná. Popišme si proto nalezené sdílené charakteristiky čtenářské spolupráce s úryvky narativů. I když hlavním úkolem respondentů bylo rozpoznání identity vypravěče, nejednalo se rozhodně o jedinou činnost v rámci čtenářské ko operace, kterou účastníci prováděli. Identifikaci provázela nebo předcházel.1, snaha zakomponovat a dát určitý význam i událostem a postavám, jež byly v úryvku explicitně nebo implicitně přítomny, tedy snaha navrhnout hypotézu původního širšího kontextu výpovědi, ze které byl úryvek za účelem experimentu vytržen. Hledání souvislostí mezi obsahem textu a představová ným kontextem nebylo náhodné, protože všechny prvky byly vytvářeny či zpětně upravovány tak, aby byly konzistentní s hypotetickou identitou vypravěče, kterého ať už provizorně, nebo definitivně označili za autora úryvku. Čtenáři považovali za nutné, aby úryvek byl v souladu s navrhovaným šiř-: ším kontextem biografického narativů postaveným na základě jejich interpretačních voleb. Obraz tak implikoval jistou celistvost, avšak ne vždy byli respondenti schopni přesně označit, která slova je vedla ke konkrétnímu interpretačnímu rozhodnutí o tom, jakou ze tří kategorií vypravěč reprezentuje. Například jeden respondent označil vypravěče za obyčejného člověka a současně podtrhl slovo protěžovaný7: t[azatel]: Proč protěžovaný vede k obyčejnému člověku? Že byly ty kuchařky protěžovaný... r[espondent]: Nó, nó, nó. To spíš odkazuje na to, že by to byla komunistka. t: Hmm. r: Ale prostě já jsem to podtrhnul... Automaticky asi. (úryvek 1, student B; slova převzatá z úryvku jsou zde a v dalších přepsané základním písmem) 7 V přepisech zůstává zachován charakter mluvené řeči, tzn. hovorové formy slov; zde např. protĚžovaný místo spisovného protBovaný. 84 Většinou ale respondenti bez obtíží dokládali vazbu mezi podtrženými slovy a identitou vypravěče, jak ukazuje následující příklad: ft: No, tady to druhý... škola jim to nedovolila, poslali nás ostříhat, vždycky přišel ředitel... t: Takže tys podtrhla vždycky přišel ředitel? 'r: Jo. A říkal ty, ty, ty běžte se ostříhat... no, protože to si přesně pamatuju. [smích] T.Jo. r: Takže to byli ale taky obyčejný lidi. < (úryvek 2, rodič A) ; Stojí však za povšimnutí, že vazba mezi jednotlivými slovy a smyslem výroku :zde není bezprostřední. Výraz „poslali nás ostříhat" odkazuje k určité situaci a teprve ta situace odkazuje k identitě mluvčího. O primární roli slovníku můžeme mluvit jen tehdy, kdy k identitě mluvčího, a tím i k pochopení textu, vedou už sama jednotlivá slova jako v následujících dvou případech: : r; No, tohle si myslím, že byli - vůbec nechápu smysl. t: [smích] r: [...] vůbec jo, ale jako když mluví o zámečnících, elektrikářích, posunovačích, takže to byl asi... asi normální, obyčejnej člověk. (úryvek 7, student A) r: No tady jsem dal taky komunistu, protože slovo barák je pro ně taky typický, tohle [KV - pozn. aut.] bude určitě krajskej výbor. (úryvek 9, rodič Cb) Ukazuje se, že i když už i na úrovni slovníku jsou čtenáři schopni dosahovat interpretačně úspěšné semiózy orientované na identitu vypravěče a někde dokonce výhradně jen na této úrovni (viz úryvek 7, student A), zpravidla se hledání identity mluvčího a významu výroku opíralo o větší celky než jednotlivá slova nebo slovní spojení. Druhé zjištění se týká toho, jak se čtenáři vyrovnávali se samým úkolem, který v rámci experimentu řešili, tj. jakým způsobem určit identitu jednotlivých narátorů. Respondenti v tomto případě postupovali různými způsoby, které se objevovaly nezávisle na tom, o jakého šlo respondenta a o jaký úryvek se jednalo. Variabilita způsobů textových heuristik nás vedla ke zjištění, že nelze říci, že by existoval sdílený či předepsaný způsob, kterým by si čtenář utvářel představu o tom, do které kategorie si vyprá- 85 vějícího zařadit; jde zde o určitou individuální kompetenci. Jedním ze způsobů, kterými čtenáři konstruovali podobu vypravěče, bylo postupné vytvá-: ření významů na základě určitých slov či jednoduchých slovních spojení. Například v jednom z úryvků vedlo k identifikaci vypravěče jako korními-; stického funkcionáře slovní spojení nds jako tajemníky. V jiném úryvku vý-; razy 99% společnosti a nds volilo směrovaly čtenáře k tomu, že interpretovali situaci jako běžný výsledek komunistických voleb, a proto mluvčího identifikovali jako komunistického funkcionáře, jak dokládá následující úryvek z rozhovoru: R: Tak 99 % společnosti, k tomu mě vedlo, že vlastně 99 % bylo pro komunistickou stranu, to znamená, že to spojujú. Které nás volilo, to znamená 99 % obyvatelstva volilo teda komunistickou stranu a tim, že je tam to slovo nás, tak je jakoby toho komunistu, toho mluvčího, že nás podporuje. (úryvek 8, student D) Jiným způsobem hledání významu výpovědi orientované na odhalení mluv-: čího bylo něco, co bychom mohli označit jako skupinový styl mluvy, který byl podle respondentů charakteristický pro určité skupiny obyvatel v minulosti. Identifikaci komunistického funkcionáře či disidenta podle zvláštních výrazů, resp. stylu, dokládají následující úryvky z rozhovorů: T: No, tady, velice sofistikovaný systém, je to jak bolševická mluva, no. R: Hm. T: Gorbačov zřejmě lecčemus nepřeje, z toho taky čiší bolševik, že jo, R: Hm. T: No, tak proto jsem dal komunistu. (úryvek 6, rodič Cb} r: No komunista určitě ne. Protože ten by prostě nebyl v týdobězavřenej. No... vlastně jenom proto, že tam není ten důvod... naznačenej. Ale fikám, možná teda, když ted nad tim uvažujú, že to spíš byl ten disident. Z důvodu toho, že je tam ta kultivovaná mluva... v tý větě. A že obyčejnej vězeň vlastně... mladej... by byl patrně... nějakej dělník. Takže by mluvil jiným způsobem. (úryvek 10, rodif B) V mnoha případech úroveň slovníku (výrazu) nebyla pro určení identity vypravěče podstatná nebo se alespoň neobjevovala ve vysvětleních identitní volby, kterou respondenti prováděli. Vysvětlení se opíralo o komplexnější úrovně semiózy tzn. o encyklopedii a možné světy. Příkladem může být ná- 86 sledující vyjádření respondentky, které se vztahuje ke stejnému výroku jako i v předchozím případě: r: Tady bych řekla, že je to nijaký obyčejný člověk, který, který se neorientoval v té 'době, který prostě nevěděl, o jaké rozhodnutí jde, šlo zřejmě o nějaké rozhodnutí, ve kterém vězeňský systém byl mírně vylepšen, oslaben nebo ehm. Snažili se hlavně rnladé vězně už proti sobě nepopuzovat. ■ (úryvek 10, prarodič Da) Na úrovni slovníku bych ještě rád poukázal na dvojí kooperační strategii, která vedla čtenáře-respondenty ke konstrukci identity vypravěče. Jednou strategií bylo vytváření celkového smyslu úryvku z vyskytujících se slov a slovních spojení, k jeho zařazení do širšího historického kontextu a vytvoření si představy o povaze situace, o níž text vypovídá. Jednalo se zejména o slova, jež se vztahovala k situaci, v níž se úryvek odehrával, buď místně (v kuchyni, tábor Mariánská, ŮV KSČ) nebo časově (16, ledna 1989, y 55., 56. roce), nebo z hlediska identity vypravěče (nás tajemníky, kuchařky). Smysl výroku pak byl odhadován na základě těchto indicií. Druhým způsobem čtenářského uchopování významu fragmentů výpovědí bylo více či méně reflektované spojování slov nebo slovních spojení s určitými identitami vypravěčů nezávisle na místě, době či historické identitě. Například slovní spojení nějací soudruzi bylo chápáno jako způsob vyjadřování toho, kdo se se „soudruhy" neidentifikuje; význam slova (ve smyslu slovníkového hesla) byl až druhotný, primární roli hrála konotace neurčitého osobního zájmena ve spojení se stranickou příslušností. Dalším příkladem tohoto druhu kooperace může být čtení výrazu študujeme, který byl v tomto gramatickém tvaru vykládán jako součást výraziva obyčejných lidí, nebo „rozhodně [to] není ně-jakej komunistickej funkcionář, fcterej by používal ustálenou frazeológii, ustálené výrazivo, jo?" (úryvek 13, prarodič Db). Tyto strategie tedy ukazují na různé metody přiřazování identit na základě výrazových charakteristik mluvčích, které se uplatňují pravděpodobně nejen při recepci dokumentů paměti, ale i při recepci jiných dokumentů či v interakcích tváří v tvář, 3.3.2.5 Kooperace na úrovni encyklopedie Druhá úroveň narativní kooperace s textem je vázána na encyklopedickou kompetenci čtenářů. V našem výzkumu byla encyklopedická kompetence chápána především jako vědomosti, které čtenář aktivuje za účelem porozumění textu v průběhu čtení a které jsou spojeny s minulostí společnosti, jíž se text týká. Základním předpokladem, jakousi vstupní hypotézou, bylo, že mezi generacemi se bude tato kompetence lišit, že v textu přítomné vý- 87 razy budou aktualizovat jiné či jinak rozsáhlé soubory vědomostí podle generační příslušnosti čtenářú-respondentů. Předpokladem tedy byla jistá podmíněnost encyklopedické kompetence vlastní zkušeností čtenáře, tedy to, zda v době socialismu žil část svého života či zda jeho podobu zná pouze zprostředkovaně (z mediálních sdělení, rodiny, literatury, známých apod.). Tento předpoklad se však nepotvrdil, alespoň ne tak, jak jsme očekávali. Encyklopedické vědomosti o minulosti, které se čtením textů aktivovaly a na které respondenti při vysvětlování svých voleb odkazovali, obsahovaly zpravidla jen sdílené stereotypní podoby disidentů, obyčejných lidí, komunistických funkcionářů a života za socialismu, jak se pokusím v interpretaci ukázat, není to z důvodu, že by všichni respondenti věděli o socialismu „to samé" nebo „stejně", ale proto, že pro přijetí dokumentu jako dokumentu paměti a určení identity vypravěče nebylo potřeba aktualizovat rozsáhlou encyklopedii; povětšinou dostačovaly běžné rejstříky znalostí, pravděpodobně často aktualizované jinými dokumenty v každodenním životě respondentů. Na druhou stranu navzdory tomu, že charakteristiky hlavních skupin aktérů byly sdílené stereotypně napříč generacemi, respondenti ve své interpretaci pro ně vytvářeli rozmanité kontexty, což ve svém důsledku vedlo k neshodám při konečném určování identity vypravěčů. V tomto smyslu jsou názorným příkladem interpretace následujícího úryvku: úryvek21: „Což mě dneska spíš baví, tak aby proběhlo takhle. To byl takovej souběh událostí, kdy jsme nikdo z nás netoužili po tom, aby se něco semlelo. já k tomu disentu, když už jsem se k tomu tak nějak dvakrát dotknul, já jsem to víceméně bra! jako okrajovou záležitost." (komunistický funkcionář) Respondenti indentifikovali vypravěče jako zástupce všech tří identit a ve všech případech dokázali uvedený výrok podpořit odkazem na encyklopedické vědění o dané identitě či době. Příklad, kdy byl narátor určený jako disident: r: A teď tady je teda souběh událostí, pro mě klíčový slovo, a ještě bych teda tady možná podtrhla netoužili po tom, aby se něco semlelo. A tady jsem na vahách, protože... Souběh událostí použije někdo, kdo už, kdo vůbec o těch věcech přemejšií. T: Mhm. r: A kdo teda možná v těch věcech tak, jak se udály, viděl souběh víc událostí než jenom jednu věc. To znamená, to trošku ukazuje na někoho jako informovanějšího. t: Mhm. i t ; r: No, ale... je tu netoužili po tom, netoužili, nikdo z nás netoužil po tom, aby se t - něco semlelo. Takže já bych to tipovala na nějakého disidenta a mohl teda mlu-í vit o něčem, kdy to ještě třeba nebylo připravený a kdy ještě to načasování, [...] ■ prostě mělo bejt jiný, takže třeba nechtěli, aby nějaká, aby už v tu dobu bylo něco vyprovokovanýho. (úryvek 21, rodič Q Narátor určený jako obyčejný člověk: r; No, to si taky myslím, že to byl takovej normální člověk, kterýmu nešlo o nějaký změny, aby se bůhvíco stalo a o tom disentu zas tak moc nepřemýšlel. To zas nebylo tak rozšířený mezi lidma, že někdo je v disentu a že někdo něco vymýšlí a že "f~ někdo by chtěl něco změnit, nebo tak. ■ (úryvek 21, prarodič C) Narátor určený jako komunistický funkcionář: r: No todle řikal nějakej papaláš... komunistickej. Disent považoval za okrajovou "záležitost. No. Voní to podcenili. Pro ně to jako... t: Hmm... Takže voni to podcenili. r: Já si myslim, že voni to trošku podcenili. No. (úryvek 21, prarodič 8) Extrahujeme-li z komentářů explicitní encyklopedické vědění, na jehož základě respondenti zdůvodňují své volby, dostaneme následující informace: disidenti byli o politické situaci informovanější než obyčejní lidé a nehrnuli se po hlavě do konfrontace s režimem; obyčejní lidé příliš o politice nepřemýšleli ani se politicky neangažovali, ať už na straně režimu nebo protirežimně; komunističtí funkcionáři (mylně) považovali disent za nedůležitou politickou sílu. Lze říci, že encyklopedické kompetence jednotlivých respondentů nejsou v rozporu navzdory tomu, že vedou k odlišnému určení mluvčího. Odvážil bych se i tvrdit, že všechny výše uvedené znalosti by mohly být součástí jedné a téže encyklopedie a odlišné určení vypravěčů má původ v odlišných rejstřících, které text diferencovaně aktivuje. Z generačního hlediska stojí za zmínku jeden rozdíl v encyklopedické kompetenci, který se vytvořil mezi generací studentů a respondenty z generací, jež socialismus zažily. Znalosti aktérů ve studentských encyklopediích se podobaly typickým charakteristikám postav obývajících minulost (disident, komunista), zatímco znalosti starších generací odkazovaly převážně na konkrétní či generalizovanou minulou zkušenost. Takto vysvětluje své určeni jedna studentka: R: A v posledním... příspěvku ten mluvčí zmiňuje disent, ale já jsem se nakonec přiklonila k tomu, že to je spíš obyčejný člověk než aktivní disident, jako člověk, který vyjadřuje odpor k režimu. (úryvek 21, student A) Další student uvádí: R: A poslední... teda... disident... Tak tam mi jako přišlo, že je to disident, který se k tomu dostal tak nějak jako slepý k houslím. Že se stýkal s těmi lidmi. 5 disidenty. A nějak tak... netoužil po tom, aby se něco semlelo. A tak jako mluví o všech, jako by netoužili... po tom aby se něco semielo. (úryvek 21, student B) Konečně třetí příklad studentského typologizování: r: Tak to jsem teda moc nevěděla, přišlo mi to takový jako, že jsem nevěděla, ale tak... Tak pak mi to přišlo disidentský z hlediska toho, že to chování je takový non-konFormnía kdy, kdy jakoby se nechce podřídit tomu, co mu jako nějaká instituce nebo organizace říká, tak tomu, že se vzpírali vlasit nosy, nosit vlasy, takovým způ- ■ sobem jako všichni ostatní, no, to mi tak jako přišlo, že by to mohlo souviset s tou povahou toho disidenta, no. {úryvek 2, student D) Studenti, zdá se, popisují spíše možný svět historických aktérů, než aby se snažili přiblížit k tomu, co se odehrálo. Ale jejich „typologický" přístup neznamená, že by se častěji mýlili v odhadování identity vypravěčů a toho, o co v úryvku běží. Zatímco encyklopedická kompetence pamětníků umožňuje nalézání a čtenářské aktualizování mnoha kontextů výkladu úryvku a tím vnáší do určování identity vypravěče neurčitost, encyklopedická kompetence studentů založená na typech aktérů a situací umožňuje navrhovat jednoduchá a zdánlivě povrchní řešení, jež nicméně často „fungují". Všechny generace tak disponují ve vztahu k textu rozdílným věděním o komunistech či disidentech, jak do rozsahu, tak do povahy ale při kooperaci s krátkým biografickým textem jsou - jak již bylo uvedeno výše - schopni využít vždy jen jeho relativně malou část. Možná je to způsobeno i „historickým" charakterem encyklopedické kompetence pamětníků, tzn. jsou schopni nalézat možné kontexty a vysvětlení z pohledu popisované doby, zatímco studenti aplikují spíše taková vysvětlení, která cirkulují v současném diskurzu (uměleckém, dokumentárním, odborném) o socialistické minulosti. 3.3.2.6 Konstrukce moíných světů Třetí, nejkomplexnější interpretační, či chcete-li čtenářskou kooperační úrovní, je konstrukce možných světů. V Ecově pojetí se možné světy vážou na čtenářskou anticipaci toho, co se v textu bude dít, jsou to propoziční postoje vůči běhu událostí, předvídané stavy jevů a věcí [Eco 2010: 139], V kontextu našeho výzkumu jsme uvažovali možný svět jako čtenářskou konstrukci, která prostřednictvím vědění aktualizovaného textem (encyklopedie) nabízí možnosti toho, co se mohlo, ale nemuselo odehrát, resp. co se odehrát nemohlo. Možným světem se zde tedy nerozumí svět rekonstruovaný na základě vlastní přímé zkušenosti, na základě individuální paměti a vzpomínek na minulost, ale je s jejich pomocí a pomocí dalšího vědění ndwrjem věrohodných možností dění. Zjednodušeně řečeno, jednalo se o ty úryvkem aktualizované oblasti minulosti, kde čtenář nemohl daný úryvek vykládat výhradně podle vlastní zkušenosti či pozitivní vědomosti, ale pracoval i s interpretacemi, které byl ochoten ještě v daném kontextu připustit, tj. které se mu jevily jako možné. Hned z prvních analýz bylo patrné, že charakter možných světů, jež respondenti v rozhovorech konstruovali, podléhal v zásadním ohledu experimentálnímu zadání, tj. tomu, aby čtenáři během čtení v úryvcích pátrali po identitních značkách, které by je mohly vést k určení vypravěčovy identity. To stimulovalo a zároveň i limitovalo vytvářené možné světy. Jejich nejčas-tější struktury se proto vztahovaly k vlastnostem připisovaným jednotlivým kategoriím mluvčích či situací, v nichž se mohli nacházet. Příkladem návrhu možného světa socialismu, ve kterém se vylučuje status kuchařky a komunistické funkcionárky, je následující komentář: r: Tak vzhledem k tomu, že bylo řečeno, že pokud se jedná o komunistu, tak to byl... ehm... člověk ve vysoké pozici v komunistické straně, tak se dá předpokládat, že kuchařka asi nebyla ve vysoké pozici a... ehm... vyvolává to prostě dojem běž-něho člověka za minulého režimu. Když o sobě mluví jako o tom, že byly jsme dvě kuchařky a mluví o vedoucí (úryvek 1, student A) Pro srovnání můžu uvést komentář příslušníka generace rodičů, ve kterém k identifikaci vypravěče postačuje jeho encyklopedická kompetence: 90 R: No, identifikovala jsem to jako na bežného člena partaje a identifikujú to z toho důvodu, že je tam to slovo že byly protěžovaný a že měla o nějaké peníze na hodinu víc, protože taková praxe byla, že pokud byl někdo v partají, tak měl nějaký ■ ■ hody i ten běžný člověk, oproti nestraníkovi, měl. (úryvek 1, rodič Ca) Srovnání nám ukazuje i jeden z rozdílů v recepci dokumentů, který se obje vil mezi generací studentů a generací jejich rodičů a prarodičů, a sice to, že studenti logicky odvozovali identity mluvčích z jim zprostředkovaně známé typologie postav a situací (disidenti byli proti režimu a měli se špatně, byli zavíraní; komunističtí funkcionáři podporovali režim a měli se dobře, byl: mocní). Studenti častěji konstruovali možné světy, zatímco obě generace pamětníků se spoléhaly na své vlastní vědomosti (a nevědomosti) o minulosti i a možné světy navrhovaly méně. Dalším dokladem, že pamětníci měli men;: tendenci konstruovat možné světy, může být i to, že když student ve výše uvedeném komentáři činí předpoklad, že kuchařka se neslučuje s komunistickým funkcionářstvím, tak pamětníci naopak činit předpoklady nechtějí: ' Jsou ío kuchařky, takže nepředpokládám, že je to bolševickej funkcionář' (rodič Cb) nebo „nepredpofc/ddám, že nijaká kuchařka byla v nějaké vyšít funkci nebo něco takovýbo" (rodič D). Negativní forma odpovídá využití encyklopedie k vyloučení určitých možností jako nerealistických. Rozvinutých konstrukcí možných světů se v komentářích nevyskytuje mnoho. Relativně nejvíce je jich v komentářích k úryvku 17: „...abych začal uvažovat o vstupu do komunistické strany No a tak samozřejmě, že to bylo otázka jako diskuzí, jednak u nás doma a jednak jako s ro-: dici. No a oni říkali, tak jako dávali sebe za příklad, že prostě, pokud se takto nestane, tak, že prostě ohrozím vlastně." (disident) Z úryvku je zřejmá situace (diskuze o vstupu do KSČ), ale jen těžko lze odhadnout politickou příslušnost vypravěče. Pravděpodobně proto si výrok vyžádal relativně velkou kooperační aktivitu, která se nezastavila u encyklopedie, ale vedla až ke konstrukcí možných světů, ze kterých bylo následně možné odvodit status vypravěče. R: Protože se tady mluví o ohrožení v případě, že do té strany nevstoupí.... takže jako by... mé to vede k tomu, že ti rodiče... teda asi nebyli komunisté tělem i duší, že by vyloženě prostě s tou ideologií natolik souhlasili, že by chtěli vstoupit do strany, ale spíš protože to dělali z nějakých, já nevím, praktických důvodů. T: Mhm. 92 :r: Ze svojí bezpečnosti. A to, že ten člověk... vlastně... taky o tom nemluví nějak 'přesvědčeně, že chce o tom diskutovat, že chce prostě probrat pro a proti proč do té strany vstoupit anebo nevstoupit. Tak proto... si myslím, že to byl obyčejný člověk. (úryvek 17, student C) r: Tady to je výrok obyčejnýho člověka, kterej tady uvažuje (důraz) o vstupu do komunistické strany, diskutuje o tom s rodiči. To je člověk, kterej tam nakonec třeba ■vstoupí, ale tak nějak jako... eště ke všemu říká, že když tam nevstoupí, tak se • ohrozí, čili jako je vidět že, žádný velký nadšení pro tu ideologii nemá, že to prostě když, v případě, že to udělá, tak že to udělá z existenčních důvodů, je to ta běžná situace obyčejnýho člověka, kterej prostě nakonec tam pak vstoupil do tý strany ale ■ tak, no. Ale asi se pak nikam nedral k nějakejm vysokejm Funkcím, že jo. Protože prostě jenom chtěl mít pokoj. : (oryvek 17, rodič D) r: Abych začal uvažovat o vstupu do komunistické strany, čili to je mladý člověk z rodiny, jeho rodiče jsou bud sami, sami komunisté anebo lidé, kteří si uvědomují, že by v tom komunistickém režimu by měl podstatně usnadněn, více usnadněnu kariéru, kdyby byl členem komunistické strany. T: Hm. r: Čili on ještě není členem komunistické strany, proto to není komunistický funkcionář], disident to rozhodně není, poněvač o tom uvažuje, takže je to naprosto jasné. Očko [obyčejný člověk]. (úryvek 17, prarodič Db) Povšimněme si, že interpretační kooperace hladce probíhá nezávisle na tom, je-li skutečný vypravěč v souladu se čtenářskou identifikací. V případě úryvku 17 žádný ze čtrnácti respondentů neurčil vypravěče správně jako disidenta, protože všichni zjevně považovali za velmi nepravděpodobné, že by byl svými rodiči přemlouván ke vstupu do komunistické strany a že by váhal. Nicméně i taková interpretace je možná: rodiče nestraníci (z donucení kvůli svému „buržoazního původu") pragmaticky radí synovi vstoupit do KSČ; jemu se ale nechce, protože s komunistickou politikou nesouhlasí (i vzhledem k osudu svých rodičů), a později ho tento nesouhlas dovede až do řad aktivních odpůrců režimu - disentu. Existují i další verze možných světů, které by vedly k disidentskému statusu vypravěče, například se stal komunistou v 60. letech minulého století, po roce 1968 byl vyloučen a v 80. letech podepsal Chartu a začal se politicky angažovat. Nicméně jak plyne z komentářů, respondenti je považovali za relativně nepravděpodobné. Dostáváme se tak opět k zjištění, že při recepci dokumentu paměti se aktualizují jen některé z responden- 93 tůrn dostupných encyklopedických kompetencí a jsou konstruovány jen nej pravděpodobnější, nejsnazší či nej přijatelnější možné světy. V důsledku toho se do velké míry znevýznamňuje rozdíl mezi respondenty s rozsáhlými ency klopedickými znalostmi založenými na vlastni zkušenosti a těmi, kteří takovými znalosti nedisponují a kooperaci provádějí na základě relativně omeze-: ných zprostředkovaných vědomostních zdrojů (studenti). 3.3.2.7 Shrnutísémioticky orientované obsahové analýzy Sociologicky vzdělanému čtenáři sémiotický přístup jistě připomíná přístupy fenomenologické sociologie a etnometodologie. Například konstrukce hypotézy významu úryvku z jednotlivých slov a slovních spojení je podobná „do-; kumentární metodě interpretace" [Garfinkel 1967: 39-40 a 76-103]. Čtenáři se snažili zkonstruovat smysl úryvku tím, že jej nebo jeho části stavěli do pozice dokumentu (stopy) určitého smysluplného vzorce jednání či myšlení, který byl implikován odhadovanou identitou mluvčího. Když v úryvku nalezli slovo nebo slovní spojení, které nešlo napoprvé považovat za dokumentující navržený vzorec jednání vážící se k dané identitě, snažili se ho reintepretovat tak, aby smysl úryvku zůstal zachován, popř. hledali možnosti, jak identitu: vypravěče této nové situaci přizpůsobit. V obecné rovině bychom dokonce mohli prohlásit, že analýza čtenářské semiózy je jakousi etnometodologií čtení, protože jde o výzkum racionálních vlastností indexikálních výrazů obsažených v textu a jiných praktických činností, kterými čtenář dosahuje po-: rozumění tomu, co text znamená (srovnej Garfinkel ovu definici etnometodologie [Garfinkel 1967: 11]); podobný přístup lze nalézt i v [Livingston 1995; McHoul 1982]. Sémiotický přístup je v souladu s etnometodologickým také v reflexivitě, tj. v tom, že metody (autorské) produkce významu v textu považuje za identické s těmi, které umožňují jeho porozumění (čtenářem). Pro analýzu čtenářské encyklopedické kompetence při identifikaci vypravěčů se zase nabízí Schůtzův koncept typizací a příručního balíku vědění vzniklého sedimentací jednotlivcových dřívějších zkušeností. Podobně jako jednotlivé encyklopedické kompetence jsou čtenářskou kooperací s textem aktivovány, tak i celek vědění každého člověka je „spící" a teprve při jednání se určitá část aktivuje podle principu relevance [Cox 1978: 90]. Sémiotická obsahová analýza splňuje nároky definice obsahové analýzy, tj. na základě zkoumání textů přináší inference o okolnostech užití textů. Technika sledování kooperace s texty sice zkoumá texty jen nepřímo, sledováním způsobů, jak jejich čtenáři vypovídají, že jim rozumějí. I tak přináší hodnotná zjištění o vytváření obsahů textů v souvislosti s okolnostmi jejk li užití. 3.4 Strojový čtenář - computer assisted text analysis (CATA) Když se výzkumník rozhodne analyzovat nějaký text nebo soubor textů za ■účelem generování jejich obsahu, narazí vždy na zásadní otázku, která se týká kódování, tzn. způsobu, jakým převést „pomíjivé, nestrukturované nebo neurčité, nicméně jinak zcela smysluplné fenomény do pojmů jazyka dat, ve kterém mohou být analyzovány pomocí náležitých technik" [Krippendorf 2004: 125]. Nej běžnější postupy kódování textu se zakládají na manuálním přisouzení určité oblasti textu určitému kódu lidským kodérem, například výrok „s dcerou jsme se neustále hádaly" by mohl být podle předem určených instrukcí kódován jako „konflikt v rodině". Tento postup má svou silnou stránku: kodér je vyškolený člověk, je schopen pochopit význam analyzovaného textu a více či méně validně i reliabilně přiřazovat kategorie; neboli je schopen se vypořádat s přirozenými jazykovými fenomény polysémie (více-značnosti) a konotace, je schopen odvodit, že v textu „mám dceru ráda, ale občas se spolu dostaneme do křížku", výraz „dostat se do křížku" znamená mít spor, a tudíž úsek správně přiřadí kódu „konflikt v rodině". Na druhou stranu manuální kódování má i slabé stránky. První souvisí s tím, co bylo uvedeno už v úvodu k této knize - množství textu k analýze. Manuálně lze kódovat několik biografických rozhovorů do cca dvou desítek kategorií, ale už ne všechny články obsahující slovo nespravedlnost v českých celostátních denících v posledním desetiletí, kterých je přes deset tisíc. Jen samotné přečtení by zabralo týdny. (í když by bylo teoreticky možné zaměstnat desítky vyškolených kodérů, nevyhneme se problému s reliabilitou takového kódování; „intercoder reliability" je ovšem problém, do kterého se zde nemůžeme pouštět a čtenáře proto odkazuji na [Krippendorf 2004, kap. 11].) Druhý problém spočívá v samotném kódovacím klíči. Klasická obsahová analýza počítá s předem vytvořeným kódovacím klíčem. Například ve výzkumu mediální reprezentace nespravedlnosti můžeme kódovat podle principů nespravedlnosti vytvořených v nějakém předchozím kvalitativně orientovaném výzkumu na dané téma. Co však v případě, že nechceme aplikovat na našich datech nějaký již vytvořený kódovací klíč, ať už z důvodu, že máme pochyby o jeho použitelnosti na naše data nebo nás zajímá induktivně orientovaný explorační přístup, například o čem se v článcích o nespravedlnosti nejčastěji píše, v jaké souvislosti se koncept objevuje? V takovém případě je manuální kódování problematické právě z téhož důvodu, který z něj činí silný nástroj pro teoreticky zakotvené kategorie - pro neodstranitelný sklon kodérů interpretovat text vždy v kontextu. Výrok „vyrostl jsem v pocitu, že je nespravedlivé, když člověk, který má víc odvahy než ostatní, stojí na okraji" může být v publikovaném rozhovoru se známým politikem kódován jedním kodérem do oblasti 94 95 nespravedlnost-politika, jiný do nespravedlnost-socializace/výehova, jiným třeba do oblasti nespravedlnost-pocity/emoce. Různost zvolených kontext: či oblastí významu ovšem není chybou kodérů, nýbrž vlastností lidského čtení a interpretace textu. Čtenář s textem kooperuje a jeho význam svýr i čtením spoluvytváří. I když jen málokdy se čtení textů kodéry diametrálně liší, zhusta se můžeme setkat s tím, že si kodéři nedokážou vybrat z možných verzí dominantní kontext a v důsledku toho nevědí, jakým kódem nebo kategorií mají daný text kódovat. V případě exploračního výzkumu to je zásadní překážka neboť kodérům nelze poskytnout obecný návod, jak v situaci kontextové nejistoty postupovat. Z obou výše uvedených problémů - neschopnosti lidských kodérů zpra covat veliké množství textů a rozhodnout o kontextu v případě exploračního přístupu - vedlo výzkumníky v textové analýze k hledání automatického zpii sobu induktivně orientovaného kódování. Zadání bylo jednoduché: a) jak kódovat velké množství textu, který je k dispozici v elektronické podobě a b) jak zaručit kvalitu kódování, aby zachycovalo relevantní atributy textu efektivně a spolehlivě. Odpověď na první úlohu je jednoduchá - kódovat musí stroj. Odpověď na drahou otázku závisí na tom, co považujeme za relevantní atri buty textu. 3.4.1 Frekvenční analýza textů Jestliže nás jako relevantní atribut určitého textu zajímá jeho téma (o čei ■ text je), zjištěná nejfrekventovanější plnovýznamová slova se zpravidla k tématu vážou. Již tradičně bývá frekvence výskytu určitého prvku v daném pro středí - nejen v textové analýze - považována za indikátor dominantní povahy tohoto prostředí (mnoho stromů značí les, mnoho vojáků armádu neb;> bitvu). Kupříkladu nejčastější významová slova této kapitoly [3.4] jsou test!. slovo, spoluYýskyt, fcorpus, graf, která bezesporu její téma indikují. Metoda analýzy textů založená výhradně na samostatně posuzovaných frekvencích jednotlivých slov však poskytuje pouze velmi přibližná zjištění a hodí se jen na určité druhy textů, zejména odborných, které jsou tematicky vyhraněné. Pio analýzu neodborných textů, například biografických rozhovorů nebo mediálních sdělení, není vhodná, protože tyto texty se frekventovanými slovy příliš neliší. Také při výzkumu novinových článků bychom sice dokázali tenw ticky odlišit články o ekonomice od článků o sportu, ale to k sociologk !■;■■ zajímavým zjištěním nepostačuje. V současnosti navíc již existují sofisti! vané metody, jak téma textu nebo jeho shrnutí z frekvencí slov, jejich vzájemných vztahů a klasifikací, odhadnout; pro přehled viz [Berry, Kogan 2010; 96 Dale, Moisl, Somers 2002; Song, Wu 2008]. Z odborného pohledu však nejde o techniky analýzy, které by měly přinést nějaké nové vědění nebo odhalit nějaké netriviální struktury jako spíše o metody zpracována textových dat za účelem automatického získání informací v textu již obsažených. Toto jejich zaměření je zřejmé z jejich anglických názvů natural language processing nebo information retrieval. Nicméně mohou sloužit jako pomocné techniky při sociologickém výzkumu vycházejícím z velkého množství textových dat. Jako příklad můžeme uvést analýzu proměn témat v on-line diskuzních skupinách nebo sledování objevujících se témat ve weblozích. Pokud chceme jít dál než je zjištění tématu v nějakém textu nebo souboru textů, tzn. chceme-li se pustit do objevování nového, potom se pro nás stane relevantním atributem textu spíše jeho struktura nebo struktury (vzorce) než téma. Posunuje nás to z oblasti, kterou bychom označili jako čtenářskou, do oblasti ne-čtenářské: zjištění tématu textu dokáže člověk-čtenář, zatímco zjištění vnitřní struktury rozsáhlého souboru textuje čtenářem jen těžko postižitelné. Tradiční obsahová analýza si sice činí ambice odhalit „fenomény, které nejsou přímo pozorovatelné," ale spoléhá v naprosté většině případů buď na kodéry-čtenáře, kteří čtením odhalují a kódují mikro- či makro-té-mata, případně jejich hodnocení (negativní, pozitivní, neutrální), nebo na ex-ante vytvořené kategorizační slovníky a tezaury které čtenářské chápání předpokládají [Carley 1993], To znamená, že stojí bud na čtenářských, nebo ;teoretických předpokladech. Induktivně orientovaná počítačová textová analýza (computer assisted text analysis, CATA) čtenářskou dovednost nepotřebuje, přesněji nepotřebuje ji v analytické fázi výzkumu. Předpokládá minimální znalost textů, které vstupují do analýzy, a snaží se explorativním způsobem zjistit jejich strukturní charakteristiky nebo vzorce, které se v nich objevují. Za základní jednotku textu je považováno slovo a strukturou textu se rozumí soubor vztahů mezi slovy, resp. vztahy mezi různými strukturami a vzorci slov. Jednu z takto orientovaných metod textové analýzy představím v následujícím oddíle. 3.4.2 Metoda sledování spoluvýskytů slov - příklad analýzy biografických vyprávění Jako ilustrace CATA by mohl posloužit výzkum mediální komunikace aktivistických skupin, který budu popisovat v kapitole 4.5; v jeho rámci jsem se spolu se spolupracovníky snažil popsat a prozkoumat aktivistický diskurz. V této části jsem se ale rozhodl předvést sledování spoluvýskytů slov jako specifické techniky obsahové analýzy na výzkumu přepisů biografických vy- 97 pravení. Cílem je prostřednictvím analýzy vyprávění jako textů získat infor mace o okolnostech jejich vzniku. Konkrétně se výzkumná otázka týká rozlišování soukromého a veřejného, tedy zda a případně jak rozlišují pamětníci ve svých životopisných vyprávěních sféru soukromého a veřejného života a zda se u různých sociálních skupin vypravěčů tyto sféry liší. Často totiž můžeme slyšet, že státní socialismus prakticky vytěsnil autentickou veřejnou sféru a že jediný možný prostor pro smysluplnou seberealizaci člověka, zvláště v posledních dvaceti letech socialismu, se nacházel v soukromí, v rodině, a u nás se projevoval zejména chatařením, kutilstvím a nej různějšími koníčky. Nejprve se věnujme samotné pojmové dichotomii veřejného a soukromého. V souvislosti s pádem státního socialismu ve střední a východní Evropě se otázka rozlišení veřejného a soukromého objevuje zejména v ekonomickém kontextu, tzn. ve vztahu k masivní privatizaci do té doby státem vlastněného majetku [např. Mertlík 1997; Mlčoch 1998], Samotné označení „privatizace" jasně vymezuje orientaci tohoto procesu, kdy majetek přechází z rukou státu do rukou soukromých, ať už fyzických nebo právnických osob. Druhá oblast odborného diskurzu, ve které má dichotomie veřejné/sou kromé privilegované postavení, je oblast genderu, přesněji genderově podmí něných změn ve společnosti po roce 1989. Interpretace těchto změn vycházejí z představy že státní socialismus dal vznik specifickému genderovému řádu [Vodochodský 2007; Havelková 1993; Wagnerová 1995]. Klíčová pro tento řád byla skutečnost, že ženy byly v důsledku tlaku na jejich všeobecnou zaměstnanost vtlačeny do veřejného prostoru, zatímco zrušení soukromého podnikání a nomenklaturní systém obsazování řídicích pozic uzavřel mnoha politicky neangažovaným mužům možnost profesní kariérni seberealizace. Po roce 1989, k překvapení feministek ze zemí se silným feministickým hnu ■ tím, neprojevovaly ženy v postkomunistických zemích na rozdíl od mužů tak masivně ambice po veřejné kariéře, naopak, mnohé pozitivně oceňovaly možnost (nikoli nutnost) opustit nudné či špatně placené zaměstnání a věnoví i se více rodinnému životu v širokém smyslu slova [Fodor 2002; Havelková 1994; Heinen 1997], Třetí oblastí, kde se polarita veřejného a soukromého diskurzně objevuje, i když ne v plně explicitní podobě, je oblast politická. Jedná se o případ často diskutované „nepolitické politiky" nebo „antipolitické politiky" [např. Havelka 1998; Otáhal 1998], pod kterou se dnes rozumí především odpor vůči demokracii spočívající výhradně na soutěži politických stran a důraz na nezastupitelnou roli tzv. občanské společnosti. V období státního socialismu však termín označoval především Havlovu představu dělání politiky v posttotalitním systému skrze „život v pravdě" prostřednictvím „mravní rekonstituce společnosti," tzn. politiku vycházející z privátního světa 98 jednotlivce [Havel 1990: 129], Jelikož veřejná politika byla v reálném sociali-• srnu zbavena jakéhokoliv smyslu kromě reprodukce moci, bylo podle Havla t dalších třeba hledat útočiště v morálním zázemí člověka jako jednotlivce. Cílem tohoto stručného a nutně zjednodušujícího představení tří oblastí užit! pojmové dichotomie soukromého a veřejného bylo ukázat, že hledat ně-■: jaký společný univerzální základ či výklad by bylo marné. Soukromé může "znamenat podle kontextu například formu vlastnictví, formu skupinového : bytí nebo prostor existenciální základny smyslu lidského bytí. Kromě mnohoznačnosti je rozlišení soukromého a veřejného podle an-s tropoložky Susan Gal (a nejen podle ní) ve své podstatě ideologické; jde o pří-; pad „jazykové ideologie," jak to nazývá [Gal 2005], podobně jako dichotomie práce/domácnosti, racionality/emocí, mužského/ženského apod., a za jejím použitím je třeba hledat zájmy a mocenské vztahy. Některé oblasti sociálního 'života jsou prohlašovány za veskrze soukromé, protože není žádoucí, aby vstupovaly do tržních vztahů (např. rodinná péče, výchova), zatímco jiné ob-: lasti jsou deklarovány jako veřejné a tržnímu prostředí vystaveny být mohou , (placená asistence u potřebných, vzdělání). Konkrétní podoba rozlišování tak ; odráží konkrétní zájmy sociálních skupin. Další charakteristikou pojmové opozice veřejného a soukromého, kromě již zmíněné obsahové vágnosti a ideologické zakotvenosti, je to, že jde o „fraktální rozlišení," tzn. jednotlivé : části opozice lze opět díchotomicky rozdělovat podle stejného klíče [ibid.]. jestliže domov je soukromý prostor, tak v jeho rámci máme též veřejné a soukromé oblasti (např. obývací pokoj či kuchyně versus ložnice). A rámci ložnice jsou šuplíky nočního stolku soukromější než jeho vrchní deska. Podobně ■ lží fraktálně rozhrnovat na veřejné a soukromé politiku, prácí, veřejné prostory apod. Například v zaměstnání existují oblasti soukromí zaměstnanců (osobní skříňka, vlastní kancelář) a oblasti veřejné (místnost pro setkání s klienty) a o proporci těchto oblast! se mohou vést spory (sledování elektronické pošty zaměstnavatelem, zaznamenávání telefonických hovorů). Stojíme nyní před otázkou, jak přistoupit k výzkumu soukromého a veřejného prostřednictvím biografických textů. Jak jsem se pokusil ukázat, nelze předpokládat, že jsou skutečnosti, které by byly ze své podstaty soukromé nebo veřejné; platí opak: soukromé a veřejné je a) předmětem a výsledkem vyjednávání a mocenských tlaků a b) závislé na perspektivě a kon-j: lextu. Z toho důvodu je nutným metodologickým předpokladem výzkumu relační a komparativní přístup, který bude brát soukromé a veřejné jako důsledek určitých vztahů a interakcí. Pro svůj výzkum soukromého a veřejného před rokem 1989 jsem vybral orálně historická biografická vyprávění pamětníků. Biografické rozho-voi y zde mají tu přednost, že zachycují veřejné a soukromé skrze subjektivní 99 zkušenost. Na druhou stranu jistým omezením je to, že nejsou historickými daty v pravém slova smyslu, protože se jedná o současná vyprávění, minulé životy prezentované z dnešní pozice a pro aktuální účely, takže jsou patrne zejména ty skutečnosti, které kontrastují vůči dnešku. S vědomím těchto omezení jsem se pokusil zjistit, jak se v rozhovorech objevuje rozlišení soukromého a veřejného, přičemž jsem využil toho, že vy pravěce lze rozdělit podle pohlaví a podle profese (na muže a ženy a příslušníky dělnických profesí a tzv. inteligence). Předpokládal jsem, že vzájemné porovnávání těchto skupin může odhalit sdílené a variabilní aspekty studované dichotomie. 3.4.2.1 Vytvoření korpusů Přepsané rozhovory pro analýzu jsem získal ze sbírky Biografie příslušníků dělnických profesí a inteligence, která byla vytvořena v Centru orální historie Ústavu pro soudobé dějiny AV ČR a se kterou jsem pracoval již v předchozím výzkumu, jedná se o soubor cca sta biografických rozhovorů s lidmi rozmanitých profesí, mužů i žen, z různých částí republiky z měst i venkova. Hned na začátku jsem se rozhodl, že budu vycházet z rozdělení vypravěčů, které poskytuje sbírka, tzn. na muže a ženy a na příslušníky dělnických profesí a příslušníky tzv. inteligence, což jsou lidé s vysokoškolským vzděláním pracující v odborných a manažerských funkcích. Tím vznikly čtyři skupiny, jež jsem označil jako: muži-dělnící, ženy-dělnice, muži-inteligence a ženy-inteligence. Korpusy rozhovorů pro jednotlivé skupiny jsem vytvořil sloučením všech rozhovorů stejné kategorie vypravěčů do jednoho velkého souboru. Výsledkem byly čtyři velké soubory. Poté jsem z nich poloautomaticky odstranil otázky tazatelů, které by mohly ovlivnit výsledky systematickou chybou. Při práci s mediálními texty je nutné zase odstranit (nejlépe poloautomaticky pomocí vytvořeného skriptu nebo makra v textovém editoru) průvodní informace k článkům (jméno autora, popis autora, popis fotografie, název rubriky či sekce apod.) nebo opakující se záhlaví a zápatí stránek. Takto vytvořené a očištěné korpusy jsou připraveny pro analýzu. 3.4.2.2 Frekvenční slovníky Vytvoření frekvenčního slovníku je prvním krokem analýzy. Programů, které jsou schopny spočítat frekvenci slov v textovém souboru, existuje celá řada, např, Atlas.ti, TextStat, AntConc. Pro každý korpus postupujeme stejně. Nejprve spočítáme frekvence jednotlivých slov, která seřadíme od nejčetněj-ších po nejméně četná. Protože nás ve vyprávění zajímají významové oblasti, vybereme do slovníku jen plnovýznamová slova nejčetnější, zpravidla podstatná jména. Jde nám totiž o to, abychom v následujících krocích mohli pra- covat jen se samotnými slovy, bez ohledu na bezprostřední kontext, v němž se v textu vyskytla, Při sestavování slovníků stojíme před dvěma otázkami: jaká slova a hlavně kolik slov do analýzy zahrnout. Mezi nejčastější slova v obou korpusech se řadí také slova označující čas nebo trvání (dneska, tenkrát, tehdy, rok, nikdy, pořád), která by teoreticky mohla indikovat ve vyprávění časové :■ struktury, nicméně mimo svůj konkrétní kontext výskytu jsou jen těžko in-terpretovatelná. Tehdy může znamenat v roce 1948 stejně jako v roce 1989. * Podobnejšou na tom častá slovesa dělat, jít, myslet, která sice mají vlastní význam, ale pro analýzu, jež se ve vyprávěních snaží odhalit životní sféry, nejsou dostatečně jednoznačná. Co se týče množství slov zahrnutých do ana- ; lytického slovníku, jsme omezeni na jedné straně zobrazovací schopností 'výsledných grafů, které jsou čitelné zhruba do padesáti až šedesáti zobrazených slov, a jednak velikostí korpusu, přičemž platí, že čím větší korpus, tím ' více slov má smysl do slovníku zařadit. U malých korpusů hrozí, že relativně málo frekventovaná slova zahrnutá do analýzy budou v grafu tvořit přirozené outliers stojící mimo ostatní struktury, a tudíž nebude možné je smysluplně interpretovat. Protože v našem případě jsou korpusy biografických vyprávění použitých dostatečné veliké (přes půl milionu slov každý), vybral jsem padesát nejčastějších slov, výhradně podstatných jmen. Technicky je procedura výběru slov do slovníku složitější než jen vypsání padesáti nejčastějších. Vzhledem k tomu, že čeština má ohebná slova, je prakticky potřeba vybrat nikoli nejčastější jednotlivé formy slova, ale slovní základy nebolí lemmata. Nejlépe by se pracovalo s plně lemmatizovanými korpusy, ve kterých bychom vybrali lemma, například škola, a automaticky by se do slovníku zařadily i všechny gramatické tvary tohoto slova {škola, školy, školou, školami atd.). V nelematizovaných textových korpusech postupujeme tak, že nejprve vybereme cca trojnásobné množství nejčastějších slov, tato převedeme na slovní základy (např. bahič, sestrapod.) a poté zjistíme výskyty všech slov odvozených od těchto slovních základů. V některých případech ale takto postupovat nemůžeme, protože slovní základ je společný různým slovům. Když zůstaneme u členů rodiny, kořen mám slov máma, mámou atd. je totožný s první osobou singuláru slovesa mít a tudíž bychom sčítali frekvence dvou různých slov, V takovém případě musíme postupovat odlišně. Použijeme k tomu program COOA [Hájek, Hájek 2009], který jsem pro účely analýzy spoluvýskytů vytvořil a který je volně ke stažení. Tento program umožňuje počítat frekvence jak slovních kořenů, tak i několika forem téhož slova v případech, kde slovní kořen využít nelze. V případě slova máma kumulujeme četnosti jednotlivých pádů jednotného a množného čísla, ale i sy-nonymních výrazů mafia, mamča, mamka, mamina apod. 101 Pri tvorbe slovníku se musíme vypořádat ještě s jednou obtíží, a to jsoi. slova nesoucí více významů. Snad největší potíže činí slovo stát, které je ve lice časté a znamená a) politickou instituci, b) vzpřímený postoj, c) cení („stát tolik a tolik") nebo d) dosažení určitého stavu či pozice („stát se prezidentem"). Podobně víceznačnými slovy j sou slova například strana (politická, strana sporu, „na druhou stranu", „pokračování na další straně"), společnost (firma, skupina, národ, organizace), svoboda (hodnota, vlastní jméno) nebo demokracie (politické uspořádání, část názvu politické strany). Jediným způ sobem, jak se s významovou mnohoznačností (polysémií) vypořádat, je manuálně pozměnit slova tak, aby byl každý význam rozlišitelný, resp. aby byl rozlišitelný význam, který chceme zařadit do slovníku, od významů, které sledovat nechceme. V případě biografických vyprávění jsem všechna slova stát. kdy se nejednalo o politickou instituci, ručně změnil na _stát, slova strana, kde se nejednalo o politickou stranu na ^strana a spoíečnosr jako firmu na ^společnost, K tomu, abychom zjistili, v jakých různých kontextech a tudíž i významech se dané slovo v korpusu vyskytuje, použijeme prakticky ve všech programech pro textovou analýzu dostupnou funkci KWIC, znamenající key-word in context, s jejíž pomocí se nám zobrazí seznam výskytů hledaného slova a jeho variant v kotextu okolních slov tak, jak se v korpusu vyskytuje. Tabulka 4 Prohlížení kotextu slova stát pomocí funkce KWIC ip, že dělníci predstíraj, že pracuji a stát předstírá, že je za to piati. A to byl vtip jako no a ten, kdo neměl známosti, tak musel stát frontu. Ne. To byl takovej průměr To bych řekl, kne „stát je nejhorsí hospodář", no ale stát jsem já jako ministr, protože je reprezentujú, ta ebo je pak nějak obnovili, takže každej stát socialistickej, nebo každá ta prostě společnost rj e zas otázka stylu práce, protože každý stát asi si kontroluje své nepřátele nebo pochybovače se týká umění nebo zločinnosti. Když se stát otevře tomu světu okolnímu, tak už je součástí té rajdaj někde v Paříži a stará se vo to stát, to jde z našich kapes, že jo. Jo a to je to, co enalo to jít si stoupnout do té fronty, stát se bojovníkem frontovým a prostě si vystát tu kní vis šesti hrnečků a že jsem tedy okradl stát atd. Takže hledalo se leccos a nevim. No a najedn potom tvořit a zpívat, tak vlastně ten stát nebo ten režim rozbourával daleko víc než kdokoli i hodně vysokej plat. Takže mě! jsem se stát docentem, ale nějak jsem pověsil tu kariéru, ja j takový epizody i takový se můžou teda stát. Ale to nevím, jak toto budete psát. To. (smích) Tak můžeme zkontrolovat, že pozměněné slovo _strana znamená vždy politickou stranu, nebo óratr znamená příbuzného a nikoli člena nějaké organizace (skauti, strana lidová, některá církev). Tato kontrola by měla být co nejdůkladnější, aby se předešlo vzniku artefaktuálních výsledků zpětně jen těžko odhalitelných. tabulka 5 Kontrola poloautomatických úprav mnohoznačného slova strana (_strana = politická strana: -strana = ostatní významy) uze volebních ale méía by být průběžná „strana by si měla vždy zachovat akceschopnost. V informa k volebním kampaním neexistuje jako by „strana hledala jen politicky a odborně připravené osobno lál. Na politické scéně chybí levicová „strana která by jim dala víru ve spravedlnost pořádek a t že je nám jedno že nám bude vládnout „strana která dokazuje jak jsou jí cizí zájmy obyčejných u jí cizí zájmy obyčejných zaměstnanců „strana která je na druhé -straně barikády. Pokud se nic tuace nejvážněji svědčí o tom že by se „strana mohla dostat na sestupnou dráhu což se jako první b odborářům běhat mráz po zádech. Tato „strana má po posledních vyhraných volbách v Senátu Paria žití jen nahodilé. Na druhé -straně má „strana málo odborníků pro komunální sféru. STYL straníck a řešení netradičních problémů. Tím že „strana nemá dlouhodobou strategii a neracionaiizovaía sv úlohu aparátu za vefmi důležitou žádná „strana nemůže bez jeho kvalitního složení existovat. Něk volebního systému kdy je volena určitá „strana není ani on osobně zvolen, je dosazen „stranoy. P - .......- Posledním krokem při vytváření analytického slovníku je doplnění jednotlivých slov o synonyma vyskytující se v korpusu, například táta a otec nebo firma, společnost a podnik. Výsledný slovník vypadá takto: Tabulka é Ukázka prvních šesti položek slovníku pro vyhledávání spoluvýskytů slov v přepisech biografických vyprávění. Hvězdička je zástupný znak a označuje jakékoliv další znaky. 1. auto, autě, auty, autu, aut, autům, autem, autech, auta. auť*. vůz, vozu, vozem 2. ba bič* 3. bratr, bratra, bratrem, bratrovi, bratrův, bratři, bratrů, bratřím, bratry, bratrech, brach* 4. brig* 5. byt, bytů, bytě, byty, bytu, bytům, bytem, bytech, bytov* 6. člověk* í31Illli: i- ■■■ 3.4.2,3 Sledování spoluvýskytů slov Jak bylo uvedeno výše, technikou, jak zviditelnit struktury textu v korpusu, je sledování spoluvýskytů vybraných slov. Obecný princip je popsán Ido Daganem [Dagan 2000]. V originálním pojetí je sledování spoluvýskytů slov, tj. kolokací, lingvistickým nástrojem ke zjištění jejich významu a dalších charakteristik [Čermák, Šulc 2006; Firth 1957]. Cílem většiny nelingvi-stických kolokačních studií je ze vzájemné četnosti spoluvýskytů slov odvodit jejich vzdálenost sémantickou [Bernard, Ryan 1998; Mohammad, Hirst 2005; Mohr 1998]. Spoluvýskyty lze ovšem sledovat i z jiných důvodů než je zjištění jejich významu. Stačí, když Firthovu distribuční hypotézu („you shall know a word by the company it keeps" [Firth 1957: 179], viz též kap. 2.5.3) obrátíme: zajímá nás, jak jsou určitým mluvčím nebo skupinou mluvčích sdružována slova, jejichž význam v textu alespoň přibližně známe. Lze to for- 102 103 mijlovat i negativně, tak, že zkoumáme, která slova lidé společně nikdy nebi téměř nikdy nepoužívají. Přitom nám, jako sociálním vědcům, nejde o poznání jazyka a vztahů slov v jeho rámci, ale jak je jazyk používán sociálními aktéry, jaké sociální skutečnosti lze skrze určité promluvy (text)') ozřejmit. Od teoretických úvah se přesuňme k technické rovině metody. Máme-li připraven analytický slovník 20-50 nejfrekventovanějších slov (tj. záznamových jednotek, recording units), je na řadě rozhodnout, v jakých kontextových jednotkách (context units) budeme spoluvýskyty sledovat. Podobně jako při vytvoření slovníku i zde provádíme analytické volby podle povahy dat a výzkumných otázek. Technicky vzato, můžeme volit mezi kontextovými jednotkami přirozenými nebo umělými [pro přehled viz Krippendorf 2004: kap. 5]. Přirozenou kontextovou jednotkou je věta, odstavec či celý článek/ rozhovor, jednotkou umělou je námi definovaný úsek textu, například stanovený počet slov, vět, odstavců nebo oblast mezi specifickými znaky či slov. (např. osobními zájmeny). Obecně platí, že v krátkých kontextových jednotkách (např. deset slov, věta) se více zvýrazní obecně jazykové (gramatici: é a stylistické) jevy, například sousloví, spojení subjektu s aktivitou a pod., zatímco v jednotkách globálních (např. odstavce či články) převažují tematické aspekty textu v korpusu [Dagan 2000: 463-464]. Zajímají-li nás slovní spo- : jení a těsné vazby slov (tzv. kolokace), pak je vhodné sledovat spoluvýskyty slov v krátkých kontextových jednotkách, zjišťujeme-li sémantická pole, jsou vhodnější středně dlouhé až dlouhé kontextové jednotky (od věty po několik vět). Často je ale naše volba omezena povahou textů, jimiž disponujeme.; V případě analýzy webových stránek nebo biografických rozhovorů nelze jako kontextové jednotky použít odstavce, protože nejsou vždy zjistitelné. Analyticky nejoblíbenější kontextovou jednotkou je věta definovaná zpravidla jako úsek textu nacházející se mezi dvěma tečkami, resp. několik po sobě jdoucích vět - z toho důvodu, že věta či souvětí většinou vyjadřují určitou myšlenku. Několik po sobě jdoucích vět se často vztahuje k jednomu tématu, i když na tento vztah záleží na typu textu. Pro analýzu biografických vyprávění jsem jako kontextovou jednotku zkusil nejprve jednu, tři, pět a deset vět, abych zjistil, jaká délka kontextové jednotky je pro zachycení variability korpusů nejvhodnější. Nakonec jsem analýzu spoluvýskytů provedl na kontextové jednotce pěti vět. Pro výpočet spoluvýskytů slov z analytického slovníku jsem použil již zmíněný program COOA. Program spočítá párové četnosti dvojic slov obsažených ve slovníku (přičemž se všemi slovy v řádku nakládá jako s variantami téhož slova) v rámci kontextových jednotek a výsledné četnosti normalizuje zvoleným koeficientem podobnosti. Podle mých zkušeností i experimentálních studií je nejrobustnější Jaccardův koeficient podobnosti (S) [Chung, Lee 104 2001], Počítá se podle rovnice S (x, y) = a / (a+b+c), kde x,y jsou proměnné (slova ze slovníku), a je počet společných výskytů x a y v korpusu, b je počet samostatných výskytů x v korpusu a c je počet samostatných vyskytuj v korpusu; Jaccardův koeficient je považován za vhodnou míru asociace párově se vyskytujících objektů. Výstupem programu je jednak přehled frekvencí jednotlivých slov (položek) slovníku v korpusu, dále frekvence slov v kontextových jednotkách a hlavně matice normalizovaných vzdáleností mezi slovy. Volitelně si můžeme pro kontrolu vypsat všechny kontextové jednotky s vyhledávanými slovy. 3.4.2.4 VizualizQce spoluvýskytů Získaná matice vzdáleností slov v korpusu je sice přímo interpretovatelná a jednoduše můžeme zjistit, která slova jsou si v korpusu blízko, tzn. vyskytují se relativně často spolu v kontextových jednotkách, a která slova naopak mají spoluvýskytů minimum, ale cílem metody je získat celkový obraz vzdáleností slov. Toho je možné dosáhnout různými klasifikačními nebo škálo-vacími technikami, které vycházejí z distančních matic, z nichž nejběžnější jsou shluková analýza (cluster analysis) a mnohorozměrné škálování (mul-tidimensional scaling, MDS). Shlukovou analýzu je vhodné použít tehdy, když chceme odhalit oddělené skupiny slov vyskytujících se v textu blízko sebe, například při zjišťování množství diskrétních témat textu (monotematické vyprávění vs. polytematické), a následně můžeme testovat diskrétnost shluků analýzou variance. Obecně řečeno, shluková analýza se hodí tehdy, pokud chceme nalézt lokální minima distancí, dvojice, trojice blízkých slov, které mají ostatní slova jako své satelity [Aldenderfer, Blashfield 1984; Everitt et al. 2011]. Naproti tomu technika mnohorozměrného škálování je procedurou, která zjišťuje globální minimum distancí celého souboru slov, tzn. je optimalizovanou projekcí n-rozměmého prostoru matice vzdáleností (či podobností) do prostoru s nižší dimenzionalitou [Cox, Cox 2010; Hebák et al. 2005: 145; Shepard 1980]. její použití je na místě tam, kde klademe větší důraz na interpretaci celkové struktury textu než na interpretaci jednotlivých vztahů mezi slovy jako v případě shlukování. To bylo i cílem výzkumu, na kterém ilustruji popisovanou metodu. Výsledkem MDS je „mapa" bodů (slov), v níž jsou si bližší ty, které jsou si bližší rovněž v korpusu (jak již bylo uvedeno, blízkostí v textu se zde rozumí frekvence spoluvýskytů v úseku pěti po sobě jdoucích vět). Poněvadž vzdálenosti mezi slovy v textu (spoluvýskyty) nemají metrický charakter, nabízí se jen nemetrická varianta MDS, která ordinalizuje vzájemné vzdálenosti mezi slovy. Z hlediska počtu zobrazených dimenzí se přidržuji, jak je doporučováno [Cox, Cox 2010: 88], dvourozměrného zobrazení, které sice mívá relativně vysokou hodnotu stresu (vzdálenosti mezi prvky v zobrazené dvourozměrné konfiguraci jen částečně odpovídají vzdálenostem v původní n-rozměrné konfiguraci), ale na rozdíl od zobrazení třírozměrného poskytuje snadnější interpretaci zobrazené konfigurace. 3.4.2.5 Interpretace získaných grafů Mnohorozměrné škálování je technika především vizualizační, tzn. její funkcí je poskytnout grafické zobrazení jako podklad k interpretaci strukturálních charakteristik dat. Zobrazení má podobu grafu znázorňujícího body na ploše a připomíná proto mapu. To svádí k intuitivnímu čtení, které se zaměřuje nn vzájemnou blízkost či vzdálenost jednotlivých slov tvořících shluky. Správna interpretace, zvláště při vyšších hodnotách stresu, však spočívá ve sledováni celkových strukturních charakteristik, jakými jsou polarita, rozptýlenost/se-vřenost, oddělenost/spojítost, jádro/okraj. V předchozích výzkumech se nám ukázaly jako relevantní dominantní rysy polarita [Hájek et al. 2006a; Hájek, Kabele 2010] a jádro/okraj [Hájek, Bayer 2007]. Kromě celostního čtení konfigurace je třeba při interpretaci grafu vzí: v úvahu následující skutečnosti: a) jednotlivé dimenze nemají substantívni smysl a graf lze proto libovolně otáčet a převracet; velmi četná slova, která prostupují rozsáhlé oblasti textu (např. slova lidé a člověk), jsou zobrazena blíže středu grafu, de facto vymezují střed konfigurace, a jejich vzájemné pozice jsou velmi stabilní; zatímco slova relativně méně častá a frekvenčně nesvázaná s jinými slovy se nacházejí na okrajích grafu a jejich pozice se při změně parametrů zobrazení může změnit. Krajním případem by bylo takové slovo, které by bylo přítomno v každé kontextové jednotce a které by v grafu logicky muselo mít pozici zcela uprostřed, protože jeho vzdálenost k ostatním slovům (tj. spoluvýskyt) by byla dána jen jejich relativní frekvencí v textu. V důsledku tohoto trendu se někdy při interpretaci využívá rozdělení konfigurace na výseče mající společný střed, poněvadž vzdálenost slov od středu vytvořeného nej frekventovanějšími slovy vypovídá zejména o jejich relativní frekvenci v korpusu, nikoli o jejich specifické distribuci (viz Obr. 2). b) Interpretace je pochopitelně ovlivněna významem jednotlivých slov, nicméně v grafu nelze nahradit slova tečkami nebo čísly za účelem dosažení objektivnější interpretace nezávislé na našem jazykovém porozumění. I tak by bylo sice možné odhalit izolované shluky, ale nikoli například polaritu pole, kdy na jedné straně grafu se nacházejí slova vážící se například k politickému diskurzu a na druhé straně ke slovům odkazujícím na každodenní život. Proto, i když musíme vzít při interpretaci v úvahu význam sledovaných slov, nepojímáme vzdálenost prvků v textovém prostoru jako primárně sémantickou, ale jako vzdálenost diskurzní. c) Konečně je třeba uvést, že věcná interpretace konfigurací slov v korpusu zobrazených prostřednictvím MDS nemá žádnou „technickou" oporu nezávislou na studovaném problému [Shepard 1980]. V tomto smyslu nemůže být ani „objektivní" a závisí na schopnosti výzkumníka vynalézt smysluplné vysvětlení získané konfigurace slov. Velkou výhodu mají v tomto směru srovnávací analýzy několika korpusů, poněvadž se při interpretaci můžeme opírat o diskuzi jejich specifických i sdílených rysů. Vraťme se k mému ilustrativnímu příkladu biografických rozhovorů. Na základě vytvořených frekvenčních slovníků jsem pro každý korpus vybral padesát nejfrekventovanějších slov (včetně jejich forem a vyskytujících se synonym) a z nich sestavil analytické slovníky. S využitím programu COOA jsem spočítal vzájemnou vzdálenost mezi slovy v kontextové jednotce pěti vět a matici spoluvýskytů normalizoval Jaccardoyýrn koeficientem podobnosti. Matici jsem použil jako vstupní data pro nemetrické mnohorozměrné škálování v programu SPSS. Pro výpočet dvojrozměrné konfigurace jsem aplikoval proceduru PROXSCAL pracující s maticí podobností. Ostatní parametry byly standardní, tak, jak je modul nabízí; počet iterací byl 1000 náhodných startů a proceduru jsem několikrát (obvykle 5-10 x) opakoval za účelem získání konfigurace s nejnižším stresem. Výsledný graf pro korpus biografických rozhovorů žen dělnic je na obrázku 1, graf mužů příslušníků inteligence je na obrázku 2. Jak interpretovat graf spoluvýskytů vybraných frekventovaných plnovýznamových slov ve vyprávěních žen dělnic (Obr. 1)? Nejdříve zkusíme najít střed grafu, který by měl být v okolí nejfrekventovanějších slov. To jsou v tomto případě slova dítě (1087 *), škola (734 «) a prdce (716 *). Pozice těchto slov je opravdu ve středu grafu, tzn. konfigurace není excentrická. Dále nás zajímá hustota slov, zda lze identifikovat oblasti nahuštění, které by mohly indikovat nějakou diskurzní strukturu, například výrazné téma, které by bylo pro tyto vypravěčky charakteristické. Z grafu je patrné, že nej-větší hustota je v jeho středu, který tvoří jakési jádro a okolo něj je prstenec ostatních slov, jež jsou více či méně rovnoměrně rozptýlena. Tato struktura je vyznačena elipsami. „Naslepo", bez znalosti slov, které tuto diskurzní strukturu tvoří, bychom ji mohli interpretovat tak, že vyprávění žen-dělnic má určitou osu procházející napříč jednotlivými vyprávěními a tvořenou 10-15 vysoce frekventovanými slovy. Na tuto osu jsou navěšena témata, která jsou vzhledem k prázdnému prostoru oddělujícímu jádro od prstence slov kolem něj diskurzně kvalitativně odlišná, tzn. ve vyprávěních hrají sekundární roli. 106 107 obrázek 1 Graf spoluvýskytů slov v biografických interview dělnic. Barevně jsou odlišena slova označující sociální role. obrázek 2 Graf spoluvýskytů slov v biografických interview příslušníků inteligence (muži). Barevně jsou odlišena slova označující sociální roíe. doktor Osoby: & rodina obecné kategorie m ostatní ~ vojn koruna n™ocníc stroj • syn firm byt důchod peníze A dce m kluk doma a ho!k dite babic vedoucí B diln , schuz i prače a dum mama sestra i * skol a i • otet rodíc ' clovek bratry ředitel ♦ rodin ksc \ vesnic nemeck * * valk » vyboi dovolen strana ded kamarád komunist „problém , Podíváme-li se na konkrétní slova zastoupená v grafu, můžeme ověřovat, zda má navržená struktura i sémantickou logiku, jestli je v ní zachycená distribuce slov interpretovatelná vzhledem k jejich významu. V jádru se nacházejí slova dítě, škola, dům, otec, máma, rodiče, rodina, práce, peníze, doma, život..., která se vážou na základní biografické aspekty lidského života: dětství, rodiče, školu, rodinu, zaměstnání. To je ona diskurzní osa, která zřetelně prochází většinou vyprávění a dominuje jim. Ostatní slova na periferii grafu se vztahují k různým životním sférám nebo situacím, které ve vyprávěních -z globálního hlediska - hrají spíše vedlejší roli. Na obrázku 2 je znázorněn graf rozmístění slov podle jejich spoluvýskytů v korpusu biografických vyprávění mužů příslušníků inteligence. Tento graf jsem vybral z toho důvodu, že naslepo, bez znalosti zobrazených slov, ho prakticky nelze interpretovat. Na rozdíl od předchozího případu jsou zde body „rozházené" po ploše bez rozeznatelné struktury. Interpretaci opět 108 voj n Osoby: é. rodina ♦ obecné kategorie , ^ soukromí a ostatní gymnazi • učitel * . kluk mest rocK katedr studí student kamarád * mama .dum * atK. doma fakult skol ■ zlvot ™&m Škola profesor ■ problém činnost • ' aut0 * strana » orgamza ^ » prace mcvnost nemeck * výbor a ''lit:A ♦,* ♦, , * * vedoucí p0,ltKk lide clovek ředitel » koleg ■ firm západ svet -n3' • 9 * politika + práce * sef a ustav komunist a polk režim sVstem začínáme od nejfrekventovanějších slov v korpusu, která jsou: řídě'(2604 *), škola (2238 *) a člověk (1523 «). Dvojice slov lidé a človek jsou ve středu grafu, což vypovídá o jejich málo specifickém používání v životopisných rozhovorech, zatímco škola je mimo střed grafu a vymezuje tak jedno z velkých témat rozhovorů, kterým je vypravěčovo vzdělávání. Tato sféra je v grafu označena jako „škola". Ovšem diskurzní sféra školy na levé straně plynule přechází ve slova, která se mohou vyskytovat jak při líčení zaměstnání vypravěče, tak při líčeni politické situace. Z toho můžeme usuzovat, že pracovní uplatnění mužů příslušníků inteligence je v jejich vyprávěních úzce provázáno s politickými faktory a politickým životem společnosti i jednotlivců, kdy na jedné straně (vlevo) se mluví o vlastní participaci (pasivní či aktivní) na politickém životě zejména v pracovní sféře a na druhé straně (dole) o celospolečenském politickém uspořádání (režim, wstém). Dalším významným strukturním rysem vyprávění, který je zřetelný z grafu, je polarita mezi diskurzní sférou pracovně-politickou a sférou rodinnou, která je na protilehlé straně grafu 109 a vytváří jen úzkou výseč. Tento rys výrazně odlišuje tuto skupinu vypravěčů od skupiny předchozí, kde slova vztahující se k základním biografickým ep: zodám domova, dětství, vzdělání, rodiny a zaměstnání tvořila osu vyprávěr i. V biografických vyprávěních mužů příslušníků inteligence taková osa pil tomna není a vyprávění přecházejí od školního vzdělávání k práci ovlivňované politickými okolnostmi a sféra domova a rodiny zaujímá jen relativně malé místo, které s politikou a zaměstnáním úzce nesouvisí. Co z této interpretace grafů spoluvýskytů nejčastějších významovýc'i slov vyplývá pro výzkumnou otázku - zda a případně jak rozlišují pamětní i ve svých životopisných vyprávěních sféru soukromého a veřejného živol-i a zda se u různých sociálních skupin vypravěčů tyto sféry liší? Pochopitelr č-zde prezentovaná analýza byla ryze ilustrativní a na jejím základě můžeme činit jen hypotetické závěry. Hlavním zjištěním je, že ve vyprávěních není veřejné a soukromé - ať již je definujeme jakkoliv - diskurzně výrazným polarizujícím prvkem. Diskurzní sféry veřejněpolitického a privátně-rodinného jsou v diskurzu propojeny prostřednictvím líčení školního vzdělávání a pracovního uplatnění. Zvláště slova vztahující se k zaměstnání (Mna, vědom >. pracovní, provoz, řediteí a pod.) se jak u dělnic, tak u mužů příslušníků inteligence nachází v blízkosti slov vztahujících se ke komunistické straně a jejím organizačním jednotkám a členům. Poukazuje to na skutečnost, že často zmiňovaný útěk do privátního světa v 80. letech minulého století nevytvořil, výraznou oblast soukromí, která by dala v pamětnických vyprávěních vznik rozeznatelné diskurzní sféře postavené na roveň líčení vzdělávání nebo zaměstnání, ve kterých se privátní a politické mísí. Pro bližší zjištění povahy dichotomie soukromého a veřejného bychom museli analyzovat jednotlivé životní sféry a v jejich rámci sledovat distinktivní znaky této dichotomie. 3.4.3 Shrnutí metody sledování spoluvýskytů slov Mám-li rekapitulovat hlavní výhody a omezení představené metody, její silnou stránkou je schopnost zpracovat velké množství textu bez nutnosti zapojení lidských kodérů a přitom zachytit relevantní aspekty dat, tj. přirozeně se vyskytující diskurzní struktury. Její hlavní slabinou je silná závislost na frekvenčním rozměru dat, tzn. jevy a struktury, které se neprojevují frekvenčně zřetelnými rysy, nejsou touto metodou zachytitelné. Tato slabina ovšem není tak významná, jak by se mohlo na první pohled zdát. V úvodní pasáži jsem diskutoval častý problém textových analýz spojený s kódovacími strategiemi. Lidští kodéri jsou prostřednictvím svého porozumění textu schopni zachytit mnohem více relevantních aspektů textu, zvláště ve vztahu k jeho významo- vému a strategickému použití. Na druhou stranu mají opodstatněný sklon nalézat více možných způsobů čtení textu a tím „komplikovat" rychlé kódování většího množství textu. Metoda sledování spoluvýskytů slov čte text tak, že zviditelňuje frekventované struktury spojené s použitým lexikem (slovy). Ovšem vzhledem k tomu, že pracuje s velkým množstvím textů zpravidla podobného charakteru, relevantní struktury by měly být přítomné ve velké část textů a tak i kvantitativně postižitelné. Ve zde uvedeném ilustrativním příkladu ukázala rozdílná distribuce spoluvýskytů frekventovaných slov na přítomnost diskurzní osy v biograficky orientovaných rozhovorech žen dělnic, která zahrnovala hlavní životní etapy, zatímco v případě mužů příslušníků inteligence takováto struktura přítomna nebyla a rozhovory se vyznačovaly spíše biograficky relevantními, ale přeci jen více tematickými diskurzními oblastmi. Z tohoto hlediska by se metoda neměla používat na textová data, která jsou buď příliš heterogenní, že nelze předpokládat opakující se diskurzní struktury (pokud však nechceme analyzovat právě důsledky této heterogenity, jako např. v [Hájek et al. 2006a], nebo na data sestávající z několika málo souvislých textů, kde opakující se lexikálně postižitelné diskurzní struktury nebudou kvantitativně výrazné (např. porovnání dvou biografií). 3.5 Souhrn obsahové analýzy V rámci této kapitoly jsem se věnoval jen několika možnostem, které obsahová analýza jako technika zkoumání textů nabízí. Připomenu-li definici z počátku kapitoly - obsahová analýza je výzkumná technika pro vytváření replikovatelných a validních úsudků z textů na okolnosti vytvářeni jejich obsahů - důležité bylo upozornit na povahu obsahu, který je obsahovou analýzou zkoumán. Obsahová analýza je totiž také určitá forma „čtení" a proto obsah textu spoluvytváří, nikoli jen odhaluje. Klíčovou procedurou obsahové analýzy je kódování. Lidské čtení může poskytnout základ pro adekvátní odborné kódování, protože člověk čtenému textu rozumí v jeho kotextu i kontextu, čte kooperativně. To ovšem může být i slabina, protože - jak jsem ukázal v příkladu analýzy čtení úryvků vyprávění - čtení produkuje množství významů. Z toho plyne metodologický problém jak naučit kodéry číst neznámý text stejně. Kvalitativní obsahová analýza využívající postupu zakotvené teorie se snaží tento problém vyřešit prostřednictvím několika úrovní kódování, zejména kombinací otevřeného a axiálního kódování. První kódování ukazuje na všechny možnosti čtení v daném kontextu, které analytika napadnou; druhý typ kódování hledá mezi záplavou možností ty nejvýznamnější vztahy, jež by měly dávat dohromady 110 m smysluplný celek (obsah). Obsahová analýza formou lidského čtení je velmi časové i kvalifikačně náročná a hodí se tehdy, máme-li k dispozici jen omezené množství textů. Pro velké textové korpusy je možné lidského čtenáře vycvičit tak, že bude číst operativně, tzn. víceméně jako stroj. Nicméně i tak je kódování a koordinace kodérů velice náročná a reliabilita zjištění není zaručena. Proto jsem ukázal techniku, která je strojovým čtením, nicméně která generuje lidsky srozumitelný obsah analyzovaných textů. Výsledkem techniky sledování spo-luvýskytů slov jsou grafické konfigurace vzájemných vzdáleností klíčových slov v textu, jež lze interpretovat jako netriviální reprezentaci obsahu textu. Slova v grafickém zobrazení vymezují - i když jen nedokonale - určitá té-, mata nebo diskurzní struktury. Tím je generován obsah textů a skrze něj lze činit úsudky o okolnostech jejich vzniku. Na příkladu dichotomie soukromého a veřejného jsem se pokusil ukázat, jak vypravěči ve svých životních vyprávěních soukromé od veřejného výrazně rozdělovali, resp. nerozdělovali. 112