MASARYKOVA UNIVERZITA Filozofická fakulta Ústav českého jazyka Magisterská diplomová práce 2009 ZUZANA KOLÁŘOVÁ MASARYKOVA UNIVERZITA Filozofická fakulta Ústav českého jazyka Český jazyk a literatura Zuzana Kolářová Možnosti a meze automatické derivace (počítačové zpracování deverbativ na –ce a na –ec) Magisterská diplomová práce Vedoucí práce: PhDr. Klára Osolsobě, Dr. 2009 Prohlašuji, že jsem magisterskou diplomovou práci vypracovala samostatně s využitím uvedených pramenů a literatury. ……………………….………….. Zuzana Kolářová Na tomto místě bych ráda poděkovala paní PhDr. Kláře Osolsobě, Ph.D., za pomoc a užitečné rady při tvorbě této magisterské diplomové práce. OBSAH: 1. ÚVOD.. 6 2. POČÍTAČOVÉ ZPRACOVÁNÍ JAZYKA.. 8 2.1 MATEMATICKÁ (POČÍTAČOVÁ) LINGVISTIKA.. 8 2.1.1 LABORATOŘ ZPRACOVÁNÍ PŘIROZENÉHO JAZYKA.. 9 2.1.1.1 Ajka. 11 2.1.1.2 Derivační rozhraní Deriv. 11 2.1.1.3 DEB II 12 2.2 KORPUSOVÁ LINGVISTIKA.. 13 2.2.1 ČESKÝ NÁRODNÍ KORPUS. 13 2.2.1.1 Struktura ČNK.. 14 3. TEORETICKÁ VÝCHODISKA.. 15 3.1 CHARAKTERISTIKA JEVU V LITERATUŘE.. 16 3.1.1 DEVERBATIVA VYJADŘUJÍCÍ AGENS (NOMINA AGENTIS) 17 3.1.1.1 Deverbativa vyjadřující agens na –ce. 17 3.1.1.2 Deverbativa vyjadřující agens na –ec. 18 3.1.2 DEVERBATIVA VYJADŘUJÍCÍ PATIENS (NOMINA PATIENTIS) 19 4. DERIVACE DEVERBATIV ZAKONČENÝCH NA –CE.. 20 4.1 ANALÝZA MATERIÁLU.. 20 4.1.1 NÁSTROJ DERIV.. 20 4.1.1.1 Připojování sufixu –ce ke slovesným základům bez infinitivní kmenotvorné přípony 23 4.1.1.2 Připojování sufixu –ce k dějovému jménu. 25 4.1.1.3 Připojování sufixu –ce k přítomnému kmenu. 27 4.1.1.4 Alternace v kořeni 28 4.1.1.5 Alternace v prefixu. 34 4.1.1.6 Dvojí alternace. 38 4.1.2 KORPUSY ČNK.. 41 4.1.2.1 Konstrukce dotazu v korpusu. 41 4.1.2.2 Srovnání dat z korpusů s nástrojem Deriv. 43 4.1.2.3 Význam získaných dat 44 4.2 ZPRACOVÁNÍ INFORMACÍ. 45 4.2.1 TABULKA ČINITELSKÝCH JMEN ZAKONČENÝCH NA –CE.. 46 4.2.2 PRAVIDLA DERIVACE, VYTVOŘENÍ DERIVAČNÍCH VZORŮ.. 51 4.2.3 DERIVACE OD VÍCE ZÁKLADŮ.. 55 4.3 FORMÁLNÍ PRAVIDLA DERIVACE DEVERBATIV NA –CE.. 57 5. DERIVACE DEVERBATIV ZAKONČENÝCH NA –EC.. 62 5.1 ANALÝZA MATERIÁLU.. 63 5.1.1 NÁSTROJ DERIV.. 63 5.1.1.1 Postup práce. 63 5.1.1.1.1 Vyřazení desubstantiv. 64 5.1.1.1.2 Vyřazení deadjektiv. 65 5.1.1.1.3 Další vyřazování 66 5.1.1.2 Deverbativa na –ec vyjadřující agens. 67 5.1.1.2.1 Připojování sufixu –ec ke slovesným základům bez infinitivní kmenotvorné přípony 67 5.1.1.2.2 Další tvoření činitelských jmen na –ec. 74 5.1.1.2.3 Alternace v kořeni 79 5.1.1.2.3.1 Samohláskové alternace. 79 5.1.1.2.3.2 Souhláskové alternace. 81 5.1.1.3 Deverbativa vyjadřující patiens. 83 5.1.1.3.1 Derivace deverbativ vyjadřujících patiens. 83 5.1.1.3.1.1 Derivace z přídavných jmen na –vý. 84 5.1.1.3.1.2 Derivace z přídavných jmen od příčestí l-ových, na –lý. 86 5.1.1.3.1.3 Derivace z přídavných jmen od příčestí trpných: 88 5.1.2 KORPUSY ČNK.. 92 5.1.2.1 Konstrukce dotazu v korpusu. 92 5.1.2.2 Srovnání dat z korpusů s nástrojem Deriv. 93 5.1.2.3 Význam získaných dat 94 5.2 ZPRACOVÁNÍ INFORMACÍ. 96 5.2.1 PRAVIDLA DERIVACE, VYTVOŘENÍ DERIVAČNÍCH VZORŮ.. 96 5.2.1.1 Pravidla derivace, derivační vzory pro deverbativa vyjadřující agens. 97 5.2.1.2 Pravidla derivace, derivační vzory pro deverbativa vyjadřující patiens. 99 5.3 FORMÁLNÍ PRAVIDLA DERIVACE DEVERBATIV NA –EC.. 101 5.3.1 FORMÁLNÍ PRAVIDLA DERIVACE DEVERBATIV VYJADŘUJÍCÍCH AGENS 101 5.3.2 FORMÁLNÍ PRAVIDLA DERIVACE DEVERBATIV VYJADŘUJÍCÍCH PATIENS 104 6. ZÁVĚR.. 106 SEZNAM POUŽITÉ LITERATURY.. 108 ELEKTRONICKÉ ZDROJE.. 113 1. ÚVOD Předmětem této práce bude počítačové zpracování deverbativ (především činitelských jmen) zakončených na –ce a na –ec. Inspirací pro tuto práci byl článek K. Osolsobě „Formální pravidla derivace deverbativ na –č,“ jehož cílem bylo ověřit, jak lze využít nástroje Deriv a jazykových korpusů k přesnější formulaci pravidel derivace jednoho slovotvorného typu (deverbativ na –č, především jmen činitelských)[1]. První dvě kapitoly (po tomto ÚVODU), tedy kapitoly 2 a 3 jsou teoretické. Ve druhé kapitole, která má název POČÍTAČOVÉ ZPRACOVÁNÍ PŘIROZENÉHO JAZYKA, představíme počítačové nástroje a aplikace, které pomáhají při lingvistických výzkumech, zejména ty, které využijeme při této práci (webové rozhraní Deriv, obecný prohlížeč elektronických slovníků DebDict, korpusy ČNK). Stručně se zde zmíníme i o oborech, které se zabývají počítačovým zpracováním přirozeného jazyka, o matematické (počítačové) lingvistice a o korpusové lingvistice. V kapitole 3 (TEORETICKÁ VÝCHODISKA) stručně představíme situaci české slovotvorby v 21. století a charakterizujeme, jak jsou deverbativa vyjadřující agens (na –ce a na –ec) a deverbativa vyjadřující patiens (na –ec) popsány (resp. nepopsány) v odborné literatuře. Nejdůležitějším oddílem této práce bude praktická část, tedy kapitoly 4 a 5, ve kterých za pomoci webového rozhraní Deriv a korpusového manažeru Bonito budeme analyzovat deverbativa (substantiva rodu mužského životného) na –ce (4. kapitola DERIVACE DEVERBATIV NA –CE) a deverbativa na –ec (5. kapitola DERIVACE DEVERBATIV NA –EC). Výsledkem této analýzy bude zpracování informací, kde shrneme pravidla derivace a vytvoříme jednotlivé derivační vzory; zástupcem derivačního vzoru bude ve většině případů nejfrekventovanější slovo z dané skupiny, které zjistíme pomocí frekvenční distribuce v korpusu. Následně budeme formulovat formální pravidla pro derivaci tohoto typu deverbativ. V případě sufixu –ce se zaměříme na popis alternací kořenových samohlásek a souhlásek a alternace samohlásek v prefixech a zmíníme způsoby, kdy se tato deverbativa mohou derivovat i od dějových jmen (popř. od více základů). V případě sufixu –ec se zaměříme na formální popis pravidel eliminace derivátů, které nepatří k danému slovotvornému typu a také budeme sledovat, jaký je rozdíl v derivaci deverbativ vyjadřujících agens oproti deverbativům, která vyjadřují patiens. Cílem práce tedy bude podat přehled základních zákonitostí derivace deverbativ zakončených na –ce a na –ec a za pomoci webového rozhraní Deriv a dat z korpusů ČNK formulovat soubor formálních pravidel pro jejich derivaci. Výsledky práce pak shrneme v kapitole 6 (ZÁVĚR). 2. POČÍTAČOVÉ ZPRACOVÁNÍ JAZYKA V této kapitole se budeme zabývat počítačovým zpracováním jazyka. Zejména představíme nástroje a aplikace, které mohou pomoci a také pomáhají při lingvistických výzkumech. Než se však dostaneme k jednotlivým nástrojům a aplikacím, které jsme využívali v praktické části naší práce, stručně se zmíníme o oborech, které se počítačovým zpracováním jazyka zabývají. Při tomto teoretickém popisu využijeme hlavně články z publikace Vybrané kapitoly z dějin české jazykovědné bohemistiky, jedná se o článek K. Osolsobě: „Matematická lingvistika“[2] a o článek F. Čermáka: „Korpusová lingvistika“[3]. 2.1 MATEMATICKÁ (POČÍTAČOVÁ) LINGVISTIKA Matematická lingvistika vznikla ve druhé polovině 20. století jako vědní obor na pomezí lingvistiky, matematiky, umělé inteligence (AI)[4] a informatiky. Snaží se o exaktní popis přirozeného jazyka opřený o matematické metody. Členění matematické lingvistiky: Ø komputační (počítačová) lingvistika – zabývá se zkoumáním a zpracováním přirozeného jazyka prostřednictvím počítačů a metod informatiky; Ø formální lingvitika – zabývá se formálním popisem gramatik a jazyků; Ø kvantitativní (statistická) lingvistika – využívá statistické stochastické a pravděpodobnostní metody aplikované na přirozený jazyk (využití pro anotace jazykových korpusů). V současnosti se prosazuje termín počítačové zpracování přirozeného jazyka (NLP)[5], který zahrnuje to, co je uvedeno pod komputační lingvistikou. O tzv. language engineering, jež pokrývá algoritmické techniky v popisu přirozeného jazyka a softwarové nástroje vznikající jejich implementací, se mluví samostatně. Hlavním úkolem matematické lingvistiky je budování nástrojů pro automatické odstraňování víceznačných interpretací jednotek přirozeného jazyka (automatická disambiguace = zjednoznačnění homonymních jazykových jednotek na všech úrovních jazyka). V souvislosti s matematickou lingvistikou (počítačovým zpracováním přirozeného jazyka) dochází i k rozvoji lingvistiky korpusové: „Symbióza korpusové lingvistiky s počítačovou má i jasné metodologické důsledky: lingvista dnes může dělat věci, které byly dříve nepředstavitelné ať už pro svou časovou náročnost a pracnost (viz např. relativně jednoduchý úkol setřídit manuálně třeba 250 tisíc slovníkových hesel) nebo skutečnou složitost (např. nalezení všech výskytů předložky na spolu se substantivem v akuzativu v textech o rozsahu 100 mil. slovních tvarů – spojení jako na stůl, na týden).“[6] Do středu zájmu se tak dostávají aplikace NLP zaměřené na automatickou anotaci (značkování) korpusů (viz kapitola 2.2 KORPUSOVÁ LINGVISTIKA). 2.1.1 LABORATOŘ ZPRACOVÁNÍ PŘIROZENÉHO JAZYKA[7] Laboratoř zpracování přirozeného jazyka (dále jen laboratoř NLP) na Fakultě informatiky Masarykovy univerzity (dále jen FI MU) se zaměřuje na získávání výsledků v oblastech informačních technologií a jazykovědy. Na FI MU vzniká řada programů a aplikací, které lingvistům pomáhají pracovat s jazykovým materiálem. Tyto nástroje jsou vhodné pro jazykovědný výzkum v mnoha oblastech: morfologická a syntaktická analýza, konstrukce gramatik, korpusová lingvistika, reprezentace významů, sémantické sítě a generování ontologií, sémantický web a vizuální lexikony, tvorba rozličných slovníků a softwarových nástrojů pro jejich editaci, vývoj lexikografické stanice nebo strojový překlad. Aktivity laboratoře NLP můžeme rozdělit do následujících kategorií: Ä korpusy – v laboratoři NLP byla vytvořena kompletní sada nástrojů pro tvorbu a správu korpusů Corpus Builder; Ä slovníky – jedním z projektů je vývoj platformy DEB (příkladem klientské aplikace je prohlížeč slovníků DEBDict[8], ve kterém je kromě digitalizovaných slovníků k dispozici také několik encyklopedií, onomastický a frazeologický slovník; Ä morfologie – v laboratoři NLP byl vytvořen obecný morfologický analyzátor pro češtinu ajka[9] pokrývající slovní zásobu s více než 6 milióny slovních tvarů; Ä syntaktická analýza – v rámci projektů laboratoře NLP se vyvíjí syntaktický analyzátor synt, pro výukové účely existuje jednoduchý analyzátor Zuzana s podporou zobrazení několika druhů derivačních stromů; Ä sémantika – jedním z dlouhodobých projektů laboratoře NLP je využití transparentní intenzionální logiky (TIL) jako jazyka pro sémantickou reprezentaci znalostí a transformačního jazyka v procesu automatického překladu, v oblasti reprezentace významů a znalostí je zmiňována významná spoluúčast členů laboratoře v evropských projektech EuroWordNet a Balkanet, které byly zaměřeny na budování vícejazyčné sémantické sítě typu WordNet. Výsledky projektů jsou hojně publikovány na konferencích, laboratoř NLP také spolupracuje s tuzemskými i zahraničními pracovišti podobného zaměření. 2.1.1.1 Ajka[10] Automatický morfologický analyzátor AJKA (Sedláček[11]) je programový nástroj vyvinutý v Centru NLP na FI MU, který umožňuje automaticky rozpoznávat a generovat české tvary (cca 6 mil.). Pracuje s lexikální databází získanou z elektronické verze SSJČ, se slovníkem kmenů čítajícím zhruba 400 000 jednotek a asi 1600 ohýbacích paradigmat. Slovník kmenů zároveň slouží jako výchozí soubor dat pro zkoumání derivačních vztahů v češtině. Analyzátor AJKA je založen na algoritmickém popisu české formální morfologie (Osolsobě[12]) a na reprezentaci strojového slovníku češtiny pomocí datové struktury trie (Sedláček[13]). Pozn. „Morfologická analýza je základním prostředkem zkoumání přirozeného jazyka a zabývá se rozlišováním a generováním správných gramatických tvarů slovních výrazů, které vzniknou skloňováním a časováním. Výsledkem je sada značek, které popisují gramatické kategorie daného tvaru, zejména pak základní tvar (lemma) a slovní vzor. Automatické rozlišení tvaru slova ve volném textu lze využít při vývoji gramatického korektoru, jako pomůcka při značkování korpusů nebo při poloautomatickém vytváření slovníků. Největší problém v této oblasti je morfologická desambiguace (zjednoznačňování gramatické značky) – tedy jak automaticky rozlišit, zda slovo "jedu" označuje sloveso nebo podstatné jméno.“[14] 2.1.1.2 Derivační rozhraní Deriv Deriv (http://deb.fi.muni.cz/deriv) je nástroj vyvinutý na FI MU, který umožňuje na základě lingvisticky stanovené hypotézy jednoduchým způsobem vyhledávat ve strojovém slovníku automatického morfologického analyzátoru AJKA. Nástroj Deriv pracuje podle formálně zadaných pravidel a vytváří tak seznamy slov, se kterými lze dále pracovat. Toto derivační webové rozhraní umožňuje nalézat kombinace substantiv s jejich odpovídajícími sufixy a sloves s příslušnými afixy, čehož využijeme v praktické části naší práce ke zjišťování informací o dvojicích sloveso a potencionální odvozené substantivum. V praktické části také ukážeme jakým způsobem je možné s nástrojem Deriv pracovat (viz kapitola 4.1.1 a 5.1.1). Při zadávání jednotlivých příkazů lze používat regulární výrazy, což oceníme např. při vyhledávání alternujících dvojic (viz např. kapitola 5.2.1.4 Alternace v kořeni). Do jednotlivých kolonek webového rozhraní se zadávají také značky, které signalizují, jaké slovo nebo jaký slovní tvar chceme vyhledávat. V praktické části vždy vysvětlujeme, jaký význam mají použité značky, přesto pro úplnost uvádíme odkaz, kde se nachází kompletní přehled jednotlivých symbolů: . 2.1.1.3 DEB II DEB II (http://nlp.fi.muni.cz/projekty/deb2/index-cs.php) je platforma pro vývoj slovníkových systému (editor a prohlížeč elektronických slovníků). Je založen na architektuře klient-server, což umožňuje existenci několika nezávislých klientů, které je možné spustit v internetovém prohlížeči Mozilla Firefox. Jedním z nich je DebDict[15], který souží jako obecný prohlížeč elektronických slovníků zapsaných v jazyce XML. DebDict v současnosti poskytuje přístup k těmto slovníkům: Ÿ Slovník spisovné češtiny, Ÿ Slovník spisovného jazyka českého, Ÿ Příruční slovník jazyka českého, Ÿ slovník cizích slov, Ÿ slovník synonym, Ÿ Slovník české frazeologie a idiomatiky, Ÿ encyklopedii Diderot. Tento obecný prohlížeč elektronických slovníků tak usnadňuje práci při lingvistických výzkumech. 2.2 KORPUSOVÁ LINGVISTIKA Korpusová lingvistika, která zaznamenala prudký rozvoj v 90. letech 20. století v souvislosti s matematickou (počítačovou) lingvistikou a příchodem počítačů a informačních technologií (viz výše), je odvětví lingvistiky, které se zabývá tvorbou korpusů a zkoumáním jazyka na základě dat, která jsou v těchto korpusech obsažená. Jazykový korpus (rozsáhlý soubor textů přirozeného jazyka, vytvářený a využívaný pomocí počítače a korpusového manažeru) je výborným pomocníkem pro nejrůznější jazykové výzkumy. 2.2.1 ČESKÝ NÁRODNÍ KORPUS Český národní korpus (dále jen ČNK[16]) je akademický projekt zaměřený na budování rozsáhlého počítačového korpusu. Od roku 1994 na něm pracuje Ústav Českého národního korpusu na Filozofické fakultě Univerzity Karlovy v Praze (dále jen ÚČNK) pod vedením Františka Čermáka. 2.2.1.1 Struktura ČNK ČNK se skládá z několika částí, cílem je budování a vytěžování korpusů českého jazyka v jeho různých podobách (mluvená, psaná, nářeční) a stádiích (synchronní, diachronní). Korpusy, které používáme v praktické části této patří mezi synchronní korpusy psaného jazyka: n SYN2000[17] – obsahuje 100 milionů textových slov, je lemmatizován[18] a morfologicky označkován[19], je to korpus žánrově vyvážený (převažují texty z let 1989 – 1999); n SYN2005[20] – obsahuje také 100 milionů textových slov, opět je lemmatizován, morfologicky označkován, je žánrově vyvážený, ale převažují texty z let 2000 – 2004; n SYN2006PUB[21] – obsahuje 300 milionů textových slov, je to korpus publicistických textů z let 1989 – 2004 a opět je lemmatizován a morfologicky označkován. Pozn. Při značkování korpusu SYN2005 byly použity tzv. guessery (= automatické programy zaměřené na „uhadování“ informace u slov, kterým automatický analyzátor nepřiřadí ani jednu interpretaci[22]), proto často dochází k chybnému přidělení značky. Na webových stránkách (http://www.korpus.cz/korpus/korpus.html), které jsou součástí ČNK, nalezneme další důležité informace týkající se korpusů a korpusové lingvistiky (např. druhy korpusů, způsob anotace v korpusu, značkování v korpusu, možnosti využití korpusu atd.). 3. TEORETICKÁ VÝCHODISKA V 21. století dochází v české slovotvorbě k odklonu od Dokulilovy onomaziologické teorie. Nové studie z této oblasti (např. P. Karlík[23]) se zakládají na různých přístupech, shodují se však v odklonu od pojetí slova jako výsledku onomaziologického procesu. Situaci v české slovotvorbě v 21. století popisuje M. Ziková v článku „Slovotvorba. Počátek 21. století“: „Alternativu k onomaziologickému pohledu na vnitřní strukturu slova nabízejí analýzy pohybující se v teoretickém rámci valenční a generativní syntaxe. V centru jejich pozornosti nestojí slovo, které je výsledkem pojmenovacího (onomaziologického) procesu, jako u Dokulila a jeho následovníků, ale slovo, které je výsledkem derivace, gramatického procesu, jenž determinuje jeho syntaktické chování.“[24] K. Pala v monografii Počítačové zpracování přirozeného jazyka uvádí, že „tvoření slov se v české lingvistice vždy věnovala a stále věnuje značná pozornost“. Podle jeho slov jsou „dobře popsány slovotvorné vztahy, zejména vztah fundace, chybí však konfrontace teoretického popisu s konkrétními českými jazykovými daty“[25]. V pozdějších studiích (Pala & kol.) klade důraz zejména na vztah mezi flexí a derivací v češtině[26]. Nejnovější studie jsou věnovány formálním vztahům české morfologie a slovotvorby (viz např. abstrakt příspěvku z konference Čeština ve formální gramatice[27]) a sémantické klasifikaci slovotvorných typů; tyto sémantické vztahy jsou v rámci derivace zachyceny formálními pravidly, při jejich definovaní se vychází jednak z klasických popisů české slovotvorby (Dokulil[28]), jednak ze sémantických klasifikací používaných např. v projektu VERBALEX[29]: n „klasická“ mutace = změna sémantické role: např. V>S[ag] (učit – učitel); V>S[pat ](trestat – trestanec); V>S[instr ](ukazovat – ukazovátko) atd.; n „klasická“ modifikace = sémantická specifikace – nemění se slovní druh: např. S[m]>S[f ](student – studentka); S>S[dem ](dům – domek – domeček) atd.; n „klasická“ transpozice = změna slovního druhu: V>S[verb ](učit – učení); A[verb]>S[ ](učený – učenost); S>S[pos ](otec – otcův) atd. V této práci půjde o následující změny sémantické role: V>S[ag ]a[ ]V>S[pat]. 3.1 CHARAKTERISTIKA JEVU V LITERATUŘE Tato práce je zaměřená především prakticky (snaží se o formální popis deverbativ zakončených na –ce a na –ec) – přesto nemůžeme vynechat charakteristiku těchto slovotvorných typů, kterou uvádějí nejdůležitější mluvnice[30], a to: ► Daneš, Fr., Dokulil, M., Kuchař, J. & kol. Tvoření slov v češtině 2. Odvozování podstatných jmen. Praha : Academia, 1967. (dále jen TS2); ► Šmilauer, V. Novočeské tvoření slov. Praha : Státní pedagogické nakladatelství, 1971. (dále jen Šmilauer); ► Dokulil, M. & kol. Mluvnice češtiny 1. Praha : Academia, 1986. (dále jen MČ1); ► Čechová, M. & kol. Čeština – řeč a jazyk. Praha : Institut sociálních vztahů, 1996. (dále jen ČŘJ); ► Karlík, P., Nekula, M., Rusínová, Z. & kol. Příruční mluvnice češtiny. Praha : Lidové noviny, 2003. (dále jen PMČ). Pozn. Protože je předmětem práce pouze odvozování, budeme se deverbativům tvořeným skládáním věnovat jen okrajově. 3.1.1 DEVERBATIVA VYJADŘUJÍCÍ AGENS (NOMINA AGENTIS) Pokud se zaměříme na činitelská jména, nacházíme ve výše zmiňovaných mluvnicích tyto základní informace: Ü činitelská jména pojmenovávají osoby na základě činnosti, kterou vykonávají; zřídka pojmenovávají zvířata a ojediněle rostliny; Ü tyto názvy jsou odvozeny výhradně ze slovesných základů; fundujícími slovy jsou slovesa nebo dějová substantiva; Ü činitelská jména jsou tvořena slovotvornými příponami měkkými –tel, –č, –ec, –ce, –oš, –ouš, –oň, –ař, –ář, –íř, –ýř, –éř (tvaroslovná charakteristika dle vzoru „muž“) a slovotvornými příponami tvrdými –ek, –ík, –ník, –ák, –och, –an, –oun, –oun, –or, –ér atd. (s tvaroslovnou charakteristikou podle vzoru „pán“); největší pozornost je však při popisu věnována činitelským typům produktivním (zakončení sufixem –tel, –č). Deverbativům, která vyjadřují agens se budeme věnovat v rámci sufixu –ce i v rámci sufixu –ec (viz praktická část – kapitola 4 a kapitola 5). 3.1.1.1 Deverbativa vyjadřující agens na –ce Přípona –ce je dnes omezená jen na názvy činitelské (x –č, –tel...). Činitelská jména na –ce se většinou pociťují jako knižní nebo zastaralá; pojmenovávají činitele dějů intelektuálních. Jména tohoto typu označují vždy jen osoby, a to zpravidla podle oboru činnosti, resp. podle funkce. Tento typ je středně produktivní. Proti jménům zakončeným na –č znamenají činitelská jména se sufixem –ce spíše trvalý stav (najímač – nájemce), proti jménům zakončeným na –ec jsou abstraktnější. Použití přípony –ec často provází vytvoření nespisovné podoby slova (správce x správec). Sufix –ce se připojuje vždy k základu zavřenému, k slovesným základům bez infinitivní kmenotvorné přípony (tam, kde primární slovesný kmen končí samohláskou, je základem kmen přítomný) nebo k základům dějových jmen. Mnohá jména lze vztahovat ke slovesům i ke jménům (např. ochránce k ochránit i k ochrana), část vztahujeme k dějovým substantivům (důchod – důchodce, původ – původce). Jednoznačně slovesem jsou fundovány pouze názvy, kde dějové substantivum neexistuje (např. vůdce, bijce, kárce). Základová slovesa jsou menším dílem prostá (soudit), větším předponová (obhájit); jsou dokonavá (obhájit, zachránit) i nedokonavá (soudit, radit). Jména sama však bývají vidově nezřetelná. 3.1.1.2 Deverbativa vyjadřující agens na –ec Polyfunkční sufix –ec se v souvislosti s činitelskými jmény v odborných publikacích[31] považuje za málo produktivní. Dle MČ1[32] jsou základová slovesa vesměs nedokonavá. Slovotvorným základem je jejich infinitivní kmen zavřený, nebo infinitivní kmen s příponami: –i–, –e/ě–, –a–, –ova–, a nebo přítomný kmen sloves. Existují také varianty –tec, –lec, –dlec. Dle PMČ[33] se sufix –ec připojuje k základům neprefigovaných sloves bez infinitivní kmenotvorné přípony; nebo pomocí sufixu –ec (či jeho variant) vznikají nepravidelně utvořené názvy. V rámci kategorie jmen činitelských je sémantika tohoto slovotvorného typu velmi blízká typu předchozímu, tj. typu na –ce, s nímž má společný formant –c–; jména na –ec abstrahují však ještě ve větší míře od aktuální činnosti, označujíce nejčastěji osobu podle oboru její činnosti. Na rozdíl od jmen na –ce jsou činitelská jména na –ec vždy jen vykonavatelská, tj. jsou motivována slovesy neaktuálními, a tedy nedokonavými: označují osobu nebo vůbec bytost, která se obvykle zabývá určitou činností.[34] 3.1.2 DEVERBATIVA VYJADŘUJÍCÍ PATIENS (NOMINA PATIENTIS) Pro tento typ odvozování není v českých mluvnicích určena samostatná kategorie. Podle TS2 se vyjadřují prostřednictvím nositele vlastnosti[35], a to v rámci tvoření substantiv z přídavných jmen od příčestí trpných; Dokulil zde upozorňuje na to, že je to jediný slovotvorný typ představující slovotvornou kategorii pro vyjádření dějového patiensu[36]. Jinde (např. v ČŘJ[37]) jsou tato deverbativa chápána jako jména prostředků činností zasažených, i zde je však uvedeno, že „nemají v češtině vlastní slovotvornou třídu; suplují ji jména nositelů vlastnosti tvořená ze zpřídavnělých trpných příčestí“[38]. Narozdíl od deverbativ vyjadřujících agens, která jsou derivována více sufixy, deverbativa vyjadřující patiens se derivují pouze polyfunkčním sufixem –ec (viz praktická část – kapitola 5.1.1.1 Deverbativa vyjadřující patiens). 4. DERIVACE DEVERBATIV ZAKONČENÝCH NA –CE V následující kapitole se pokusíme navrhnout popis derivačních pravidel pro odvozování činitelských jmen zakončených na –ce. Použijeme k tomu webové rozhraní Deriv (viz kapitola 2.1.1.2) a data získaná z korpusů ČNK (viz kapitola 2.2.1). Cílem je formulace formálních pravidel pro derivaci těchto deverbativ (činitelských jmen[39]) tvořených sufixem –ce. Zaměříme se na popis alternací v kořenech a alternace samohlásek v prefixech, vytvoříme pravidla derivace a jednotlivé derivační vzory. 4.1 ANALÝZA MATERIÁLU 4.1.1 NÁSTROJ DERIV Jak jsme zmínili v jedné z předcházejících kapitol, nástroj Deriv, webové rozhraní, které pracuje na bázi automatického morfologického analyzátoru češtiny, umožňuje extrakci dat z rozsáhlého elektronického slovníku češtiny. Tohoto nástroje můžeme využít ke zjišťování informací o dvojicích sloveso a potencionální odvozené substantivum a vytvářet tak derivační pravidla. Automaticky generované seznamy dvojic jsou propojeny a) s elektronickými verzemi slovníků a b) s konkordančními seznamy z korpusu SYN2000. Postup je následující: po přihlášení (http://deb.fi.muni.cz/deriv/) zvolíme funkci Hledání dvojic, v prvním řádku zadáme příponu –ce se značkou k1gMnSc1[40], v druhém řádku zadáme značku k5.*mF[41], jako nahrazované zadáme příponu –t a jako nahrazující opět příponu –ce. hledání slovních tvarů, dvojic, trojic, xxx-tice práce s obsahem souborů, soubory, adresáři Hledání značka: k1gMnSc1 RE: ce$ značka: k5.*mF nahrazované: t$ nahrazující: ce uložit do souboru: Kolarova/sufix_ce/ce_1 vyhledat Obrázek č. 1: Ukázka práce s nástrojem Deriv – Hledání dvojic[42] Soubor však není vytvořen, systém hlásí, že „nic nevyhovuje zadaným podmínkám“. Vysvětlení je jednoduché, nástroj Deriv se v tomto případě (při tomto zadání) snažil vyhledat dvojice slov, kdy jeden člen páru končí na –t a druhý člen páru je slovo, které vzniklo odtržením přípony –t a jeho nahrazením příponou –ce. Musíme proto vycházet z charakteristiky tvoření činitelských jmen sufixem –ce[43] a při práci s derivačním rozhraním postupovat v jednotlivých krocích, tzn. nejprve získat taková činitelská jména, kdy se sufix –ce připojuje ke slovesným základům bez infinitivní kmenotvorné přípony, pak činitelská jména odvozená sufixem –ce, kde je základem kmen přítomný, pak činitelská jména, kde je základem dějové jméno. Pozornost budeme věnovat také alternacím, výjimkám a problematice tvoření těchto činitelských jmen od více základů. Informace, které získáme při práci s nástrojem Deriv, budeme zapisovat do tabulky (viz kapitola 4.2.1 Tabulka činitelských jmen zakončených na –ce), díky které potom můžeme jednoduše shrnout derivační pravidla a vytvořit jednotlivé derivační vzory. Základová slova vždy zapisujeme do příslušného sloupce: záleží, jestli jde o slovesný základ bez infinitivní kmenotvorné přípony, jestli jde o dějové jméno nebo jestli je základem jiný tvar slovesa/dějového jména. Ke kontrole a lepší orientaci může sloužit vytvoření seznamu slov (podstatných jmen rodu mužského životného) zakončených na –ce. V případě těchto činitelských jmen máme lepší přehled o tomto slovotvorném typu. Zjistíme např., že téměř 45% slov z tohoto seznamu jsou kompozita (ve větší míře složeniny, jejichž druhá část je v seznamu slov také obsažena). Protože je předmětem práce pouze odvozování (derivace), budeme se činitelským jménům tvořeným skládáním (kompozicí) věnovat jen okrajově. 4.1.1.1 Připojování sufixu –ce ke slovesným základům bez infinitivní kmenotvorné přípony I. Slovesný základ bez infinitivní kmenotvorné přípony –i–: Postupujeme podobným způsobem jako na předchozí stránce; při použití funkce Hledání dvojic však v kolonce pro nahrazované zadáme příponu –it: hledání slovních tvarů, dvojic, trojic, xxx-tice práce s obsahem souborů, soubory, adresáři Hledání značka: k1gMnSc1 RE: ce$ značka: k5.*mF nahrazované: it$ nahrazující: ce uložit do souboru: Kolarova/sufix_ce/ce_it vyhledat Obrázek č. 2: Ukázka práce s nástrojem Deriv – Hledání dvojic Vytvořený soubor (ce_it) obsahuje 28 dvojic (např. dopravit – dopravce, obhájit – obhájce, obránit – obránce, ochránit – ochránce, poradit – poradce, přepravit – přepravce, soudit – soudce, zachránit – zachránce). Vygenerovaná základová slovesa poznačíme do tabulky pod sloupec „it“ (viz kapitola 4.2.1). Objevují se i případy, u kterých je patrné přegenerování: např. činitelské jméno rozhodce je zde chybně generováno od slova jiného významu – rozhodit, místo od slova rozhodnout, rozhodovat. V takovém případě do tabulky zapíšeme sloveso rozhodit s otazníkem („?rozhodit“). Pozn. Otazník před slovesem značí, že činitelské jméno sice bylo vygenerováno podle příslušného pravidla, nicméně na základě slovníkového popisu/analýzy korpusových kontextů se přikláníme interpretovat ho jako derivát od jiného základu a vygenerovanou dvojici tak řadíme mezi případy přegenerování. II. Slovesný základ bez infinitivní kmenotvorné přípony –a–: Pokud do kolonky pro základové slovo (nahrazované) zadáme příponu –at, systém vygeneruje pouze tři dvojice: kárat – kárce, smlouvat – smlouvce a vládat[44] – vládce. Do tabulky opět uděláme poznámky, tentokrát do sloupce „at“. III. Slovesný základ bez infinitivní kmenotvorné přípony –ova–: V případě zadání přípony –ovat získáme devatenáct dvojic, mezi kterými se objevují i dvojice vygenerované jiným způsobem, např. dopravovat – dopravce, porobovat – porobce. Slova zaznamenáme do tabulky do sloupce „ovat“. Tam, kde opět dochází k přegenerování, napíšeme před sloveso otazník: např. ?dovozovat – dovozce, ?károvat – kárce, ?odvozovat – odvozce, ?plátovat – plátce atd. IV. Slovesný základ bez infinitivní kmenotvorné přípony –nou–: Pokud zadáme k základovému slovu příponu –nout, systém vygeneruje správné dvojice[45]. Všimneme si však, že některá činitelská jména (odhadce, rozhodce) jsme vygenerovali i jiným způsobem. Vždy záleží na tom, od jakého základu odvozujeme (např. odhadce – odhad, odhadovat, odhadnout). U derivátů na –ce totiž není omezen vid potenciálního základového slovesa. 4.1.1.2 Připojování sufixu –ce k dějovému jménu Činitelská jména derivovaná sufixem –ce, jejichž základem je dějové jméno, můžeme získat několika způsoby. Záleží, jakým dějovým jménem je derivát na –ce fundován. I. Základem je dějové jméno rodu mužského: Zvolíme značku k1gInSc1[46] a do kolonky nahrazované nezadáme žádnou příponu (žádné zakončení): hledání slovních tvarů, dvojic, trojic, xxx-tice práce s obsahem souborů, soubory, adresáři Hledání značka: k1gMnSc1 RE: ce$ značka: k1gInSc1 nahrazované: $ nahrazující: ce uložit do souboru: Kolarova/sufix_ce/ce_dj vyhledat Obrázek č. 3: Ukázka práce s nástrojem Deriv – Hledání dvojic Uložený soubor obsahuje 69 dvojic, ty však musíme „ručně“ vytřídit, protože se zde objevuje i osm kompozit (např. velkoprodejce – velkoprodej, samosoudce – samosoud[47]). Do tabulky k sloupci „DJ“ (=dějové jméno) proto zapíšeme jen 61 dějových jmen. V šesti případech dochází k přegenerování. II. Základem je dějové jméno rodu středního: Pro základové slovo zvolíme příponu –í a značku k1gNnSc1[48]; systém vygeneruje sedm dvojic, jednu dvojici vyřadíme (jde o kompozita). Šest zbývajících dvojic zapíšeme do tabulky, opět do sloupce „DJ“; základová dějová jména však odlišíme modrou barvou. Ve třech případech došlo k přegenerování. III. Základem je dějové jméno rodu ženského: Pokud pro základové slovo zvolíme příponu –a a značku k1gFnSc1[49], systém vygeneruje 56 dvojic.V devatenácti případech jde o kompozita, proto do tabulky pod sloupec „DJ“ zapíšeme jen 37 dějových jmen, tato jména odlišíme červenou barvou. K přegenerování došlo v šesti případech. Pokud pro základové slovo zvolíme značku k1gFnSc1 a nezadáme žádnou příponu[50], získáme dvojice stráž – střážce a láj - lájce. V dalších dvou případech dochází k přegenerování. 4.1.1.3 Připojování sufixu –ce k přítomnému kmenu Abychom získali činitelská jména, jejichž základem je kmen přítomný, vytvoříme následující zadání (využijeme zde sloveso v 2. osobě imperativu – značka k5.*mRp2.*): hledání slovních tvarů, dvojic, trojic, xxx-tice práce s obsahem souborů, soubory, adresáři Hledání značka: k1gMnSc1 RE: jce$ značka: k5.*mRp2.* nahrazované: j$ nahrazující: jce uložit do souboru: Kolarova/sufix_ce/ce_kp vyhledat Obrázek č. 4: Ukázka práce s nástrojem Deriv – Hledání dvojic Uložený soubor (ce_kp) obsahuje pět dvojic. Vyřadíme kompozitum zlolajce (od zlolát) a zbytek zapíšeme do tabulky ke sloupci „KP/X“[51]. Pozn. v případě dvojice lát – lájce, respektive laj! – lájce dochází k alternaci kořenové samohlásky. Tuto dvojici získáme změnou zadání: .*aj > .*ájce. 4.1.1.4 Alternace v kořeni Webové rozhraní Deriv (http://deb.fi.muni.cz/deriv/) pracuje s regulárními výrazy a umí vyhledávat příbuzná slova (dvojice, trojice, n-tice), to umožňuje vygenerovat alternující dvojice. hledání slovních tvarů, dvojic, trojic, xxx-tice práce s obsahem souborů, soubory, adresáři Hledání značka: k1gMnSc1 RE: á.ce$ značka: k5.*mF nahrazované: a(.)it$ nahrazující: á$1ce uložit do souboru: Kolarova/sufix_ce/platit_plátce vyhledat Obrázek č. 5: Ukázka práce s nástrojem Deriv – Hledání dvojic (vyhledávání alternací) Obrázek č. 5 ukazuje, jakým způsobem lze alternující dvojice získat; v položkách „značka“, „RE“ a „nahrazované“ můžeme použít regulární výrazy: tečka (.) odpovídá libovolnému znaku; hvězdička (*) značí libovolné opakování předcházejícího a znak $ označuje konec řetězce. V položce „nahrazující“ lze navíc použít $1, které se nahradí obsahem případné závorky v regulárním výrazu v položce nahrazované. Pokud potřebujeme vyhledat dvojice typu plátce – platit, je třeba jako značku a RE pro první slovo zadat k1gMnSc1[52] a á.ce$, jako značku pro druhé slovo k5.*mF[53], jako nahrazované a(.)it$ a jako nahrazující á$1ce. Tímto způsobem zachytíme hledanou alternaci a/á. Při práci s webovým rozhraním Deriv hledáme tyto samohláskové alternace: a) .*(a|á|ě|í|ou|u|o).(i|a|ova|nou)t > .*(á|a|í|i|e|u|ou|ů).ce – pro dvojice základové sloveso – odvozené činitelské jméno na –ce; b) .*(a|á|ě|í|ou|u|o). > .*(á|a|í|i|e|u|ou|ů).ce – pro dvojice základové dějové jméno rodu mužského – odvozené činitelské jméno na –ce; c) .*(a|á|ě|í|ou|u|o).a > .*(á|a|í|i|e|u|ou|ů).ce – pro dvojice základové dějové jméno rodu ženského – odvozené činitelské jméno na –ce; a tyto alternace souhláskové: .*řit > .*rce; .*ť > .*tce. 1. samohlásková alternace a/á: n a) .*a.it/.*á.ce (k5.*mF/k1gMnSc1) Pokud postupujeme způsobem, který jsme ukázali v obrázku č. 5, získáme soubor, který obsahuje deset dvojic, např. opravit – oprávce, radit – rádce, zradit – zrádce. Získaná základová slova zapíšeme do tabulky (sloupec „it“, tučné písmo[54]). n b) .*a.ovat/.*á.ce (k5.*mF/k1gMnSc1) Postupujeme podobně jako v bodě a), změníme jen kmenotvornou příponu. Systém vygeneruje šest dvojic. Objevují se však slova, která do tabulky (sloupec „ovat“, tučné písmo) zapíšeme s otazníkem, protože došlo k přegenerování (dvojice z významového hlediska nevyhovují: ?radovat – rádce, ?zradovat – zrádce). n c) .*a./.*á.ce (k1gInSc1/k1gMnSc1) V tomto případě jsme hledali alternaci ve dvojicích: základové dějové jméno rodu mužského – odvozené činitelské jméno. Systém vygeneroval pět dvojic, ale pouze u dvou nejde o přegenerování: dar – dárce, plat – plátce. Základová dějová jména zapíšeme tučně do tabulky ke sloupci „DJ“. n d) .*a.a/.*á.ce (k1gFnSc1/k1gMnSc1) V tomto případě jsme hledali alternaci ve dvojicích: základové dějové jméno rodu ženského – odvozené činitelské jméno. Systém vygeneroval jedenáct dvojic. Vyřadíme čtyři kompozita a zbytek zapíšeme tučně do tabulky ke sloupci „DJ“. K přegenerování došlo ve jednom případě. n e) .*a.e/.*á.ce (k5eAaImIp3nS/k1gMnSc1) Tímto zadáním získáme dvojici krást – krádce. Základové sloveso krást zaznamenáme do tabulky tučně ke sloupci „KP/X“[55]. Pozn. při tomto zadání systém automaticky vygeneroval i dvojici lát – lájce. 2. samohlásková alternace á/a: n a) .*á.it/.*a.ce (k5.*mF/k1gMnSc1) V tomto případě Deriv vygeneroval pouze dvojici chválit – chvalce. Do tabulky zapíšeme tučně ke sloupci „it“. Podobně postupujeme i v případě dalších alternací (základová slova vždy zapisujeme do příslušného sloupce). n b) .*á.a/.*a.ce (k1gFnSc1/k1gMnSc1) Zde získáme dvojici chvála – chvalce. 3. samohlásková alternace ě/í: n a) .*ě.it/.*í.ce (k5.*mF/k1gMnSc1) Opět je vygenerována pouze jedna dvojice: rozdělit – rozdílce. n b) .*ě.ovat/.*í.ce (k5.*mF/k1gMnSc1) Získáme dvojici: rozdělovat – rozdílce, ale v případě dvojice ?směrovat – smírce došlo k přegenerování. 4. samohlásková alternace í/i: n .*í.it/.*i.ce (k5.*mF/k1gMnSc1) I v tomto případě systém vygeneroval pouze jednu dvojici, a to slíbit – slibce. 5. samohlásková alternace í/o: n .*í.at/.*o.ce (k5.*mF/k1gMnSc1) Při tomto zadání systém automaticky vygeneroval jednu dvojici: dozírat – dozorce. 6. samohlásková alternace ou/u: n a) .*ou.it/.*u.ce (k5.*mF/k1gMnSc1) Zde jsou vygenerovány tři dvojice: přestoupit – přestupce, rozsoudit – rozsudce a snoubit – snubce. n b) .*ou.a/.*u.ce (k1gFnSc1/k1gMnSc1) Díky tomuto zadání získáme dvojici smlouva – smluvce. 7. samohlásková alternace u/ou: n a) .*u.it/.*ou.ce (k5.*mF/k1gMnSc1) Zde jsou vygenerovány dvě dvojice: smluvit – smlouvce a zhubit – zhoubce. n b) .*u.ovat/.*ou.ce (k5.*mF/k1gMnSc1) Tímto zadáním získáme dvojici snubovat – snoubce, v případě dvojice ?sudovat – soudce došlo k přegenerování. n c) .*u./.*ou.ce (k1gInSc1/k1gMnSc1) Získáme dvojici snub – snoubce, v případě dvojice ?sud – soudce došlo k přegenerování. 8. samohlásková alternace o/ů: n a) .*o.it/.*ů.ce (k5.*mF/k1gMnSc1) V tomto případě je vygenerováno sedm dvojic (např. strojit – strůjce, škodit – škůdce, vodit – vůdce), ve dvou případech se však jedná o kompozita (ta do tabulky neuvádíme: vojevůdce od vojevodit a vojvůdce od vojvodit). n b) .*o.ovat/.*ů.ce (k5.*mF/k1gMnSc1) V jedné ze tří vygenerovaných dvojic došlo k přegenerování: škůdce - ?škodovat. Základová slovesa odporovat (odpůrce) a podporovat (podpůrce) zapíšeme tučně do tabulky ke sloupci „ovat“. n c) .*o./.*ů.ce (k1gInSc1/k1gMnSc1) Systém vygeneroval dvanáct dvojic. Odstraníme dvě kompozita a devět základových slov (dějová jména jako odboj, odpor, podvod atd.) zapíšeme tučně do tabulky ke sloupci „DJ“. V případě dvojice ?podpor – podpůrce došlo k přegenerování. n d) .*o.a/.*ů.ce (k1gFnSc1/k1gMnSc1) Systém vygeneroval čtyři dvojice. V případě dvojic ?voda – vůdce, ?vzpora – vzpůrce dochází k přegenerování, ale získáme základová dějová jména podpora (podpůrce) a škoda (škůdce). 9. samohlásková alternace í/e: n .*í.at/.*e.ce (k5.*mF/k1gMnSc1) Ve vzniklém souboru nacházíme jednu dvojici: obžírat – obžerce[56]. 10. samohlásková alternace ou/ů: n .*ou.a/.*ů.ce (k1gFnSc1/k1gMnSc1) Při tomto zadání systém automaticky vygeneruje pouze dvojici vzpoura – vzpůrce. 11. samohlásková alternace 0/e: n .*0.a/.*e.ce (k1gFnSc1/k1gMnSc1) Dvojici výhra – výherce získáme zadáním přípony .*ra k základovému slovu (značka k1gFnSc1) a přípony .*erce ke slovu odvozenému (značka k1gMnSc1). 12. samohlásková alternace e,é/o: n .*e.e|.*é.t/.*o.ce (k5eAaPmIp3nS|k5eAaPmF/k1gMnSc1) Při tomto zadání systém automaticky vygeneruje čtyři dvojice dovézt – dovozce, odvézt – odvozce, přenést – přenosce, převést – převodce[57]. Základová slovesa zapíšeme tučně ke sloupci „KP/X“. 13. samohlásková alternace e,é/ů: n .*e.e/.*ů.ce (k5.*mIp3nS/k1gMnSc1) Pomocí tohoto zadání získáme čtyři dvojice: podvést – podvůdce, svést – svůdce, vést – vůdce. V případě dvojice ?odeprat – odpůrce došlo k přegenerování[58]. 14. souhlásková alternace ř/r: n .*řit/.*rce (k5.*mF/k1gMnSc1) Získáme tři dvojice: smířit – smírce, svářit – svárce, tvořit – tvorce. 15. souhlásková alternace ť/t: n .*ť/.*tce (k1gFnSc1/k1gMnSc1) V tomto případě získáme dvojici závěť – závětce. 4.1.1.5 Alternace v prefixu Nástroj Deriv pomáhá sledovat také alternace v prefixech, protože ve funkci Hledání dvojic můžeme zadávat i předpony, tzn. že můžeme mít k dispozici seznamy dvojic: deverbativum (činiteslké jméno zakončené na –ce) se zdlouženou samohláskou v prefixu – základové slovo s nezdlouženou samohláskou v prefixu. Zadání je následující: hledání slovních tvarů, dvojic, trojic, xxx-tice práce s obsahem souborů, soubory, adresáři Hledání značka: k1gMnSc1 RE: vý.*ce$ značka: k5.*mF nahrazované: vy(.*)it$ nahrazující: vý$1ce uložit do souboru: Kolarova/sufix_ce/vy_ce_it vyhledat Obrázek č. 6: Ukázka práce s nástrojem Deriv – Hledání dvojic (vyhledávání alternace v prefixu) Ve bodech 1. – 5. dochází k dloužení samohlásky, v bodech 6. – 8. dochází k alternaci o/ů: 1. alternace v prefixu vy-/vý-: n a) vy.*it/vý.*ce (k5.*mF/k1gMnSc1) Soubor vy_ce_it obsahuje šest dvojic. Základová slovesa zapíšeme zeleně a tučně[59] do tabulky do sloupce „it“. n b) vy.*ovat/vý.*ce (k5.*mF/k1gMnSc1) Postupujeme podobným způsobem, soubor vy_ce_ovat obsahuje pět dvojic, slova opět zapíšeme do příslušného sloupce, tentokrát do sloupce „ovat“. Ve dvojici vyvozovat – vývozce došlo k přegenerování, proto napíšeme sloveso ?vyvozovat s otazníkem. 2. alternace v prefixu na-/ná-: n a) na.*it/ná.*ce (k5.*mF/k1gMnSc1) Podobně postupujeme s dalšími prefixy; v tomto případě obsahuje soubor na_ce_it čtyři dvojice. Některá slovesa zapíšeme do tabulky s otazníkem, protože došlo k přegenerování: např. ?nakupit – nákupce. Pozn. dvojicím typu nakoupit - nákupce, které lze interpretovat jako případ, kdy alternuje jak samohláska v prefixu, tak kořenová samohláska, se budeme věnovat v kapitole 4.1.1.6 Dvojí alternace. n b) na.*ovat/ná.*ce (k5.*mF/k1gMnSc1) V tomto případě získáme správně vygenerované dvojice: nakupovat – nákupce, napravovat – nápravce a nastupovat – nástupce. n c) na.*nout/ná.*ce (k5.*mF/k1gMnSc1) Zde získáme pouze dvojici naleznout – nálezce. n d) na.*e/ná.*ce (k5.*mIp3nS/k1gMnSc1) Při tomto zadání systém vygeneruje dvojice nalézt – nálezce, (vy)naleznout – (vy)nálezce[60]. Tato základová slovesa zapíšeme zelenou barvou a tučně do sloupce „KP/X“. 3. alternace v prefixu při-/pří-: n a) při.*it/pří.*ce (k5.*mF/k1gMnSc1) Soubor pri_ce_it obsahuje čtyři dvojice, jen tři základová slovesa však můžeme zapsat bez otazníku (přidělit, přimluvit, připravit). n b) při.*ovat/pří.*ce (k5.*mF/k1gMnSc1) Získaný soubor obsahuje tři správně vygenerované dvojice: přidělovat – přídělce, přikazovat – příkazce, připravovat – přípravce. 4. alternace v prefixu za-/zá-: n a) za.*it/zá.*ce (k5.*mF/k1gMnSc1) Získáme dvě správně vygenerované dvojice: zahubit – záhubce a zastavit – zástavce. n b) za.*ovat/zá.*ce (k5.*mF/k1gMnSc1) Vygenerovaný soubor obsahuje čtyři dvojice, jen dvě jsou však vygenerovány správně: zastavovat – zástavce, zastupovat – zástupce. Zbylá dvě slovesa napíšeme tučně a zelenou barvou do tabulky (sloupec „ovat“) s otazníkem. 5. alternace v prefixu u-/ú-: n a) u.*it/ú.*ce (k5.*mF/k1gMnSc1) Systém vygeneroval opět čtyři dvojice, z nichž u jedné došlo k přegenerování: ?unosit – únosce. n b) u.*at/ú.*ce (k5.*mF/k1gMnSc1) Získáme pouze dvojici upadat – úpadce. n c) u.*ovat/ú.*ce (k5.*mF/k1gMnSc1) Soubor u_ce_ovat obsahuje opět jen jednu dvojici: upravovat – úpravce. n d) u.*nout/ú.*ce (k5.*mF/k1gMnSc1) Opět získáme jen jednu dvojici: upadnout – úpadce. 6. alternace v prefixu do-/dů-: n do.*it/dů.*ce (k5.*mF/k1gMnSc1) Při tomto zadání Deriv vygeneroval dvojici dochodit – důchodce. 7. alternace v prefixu po-/pů-: n po.*it/pů.*ce (k5.*mF/k1gMnSc1) Systém při tomto zadání vygeneroval dvě dvojice pohonit (= pohánět[61]) – půhonce a povodit (ve významu odvozovat, vyvozovat[62]) – původce. 8. alternace v prefixu pro-/prů-: n a) pro.*it/prů.*ce (k5.*mF/k1gMnSc1) Systém vygeneroval dvojici provodit (= provést[63]) – průvodce. n b) pro.*ovat/prů.*ce (k5.*mF/k1gMnSc1) Díky tomuto zadání jsme získali dvojici probojovat – průbojce. Pozn. dvojicím typu provést – průvodce nebo prozkoumat – průzkumce se budeme věnovat v následující kapitole (4.1.1.6 Dvojí alternace). 4.1.1.6 Dvojí alternace V seznamu činitelských jmen zakončených na –ce najdeme i slova, ve kterých oproti základovému slovu dochází k alternaci jak v kořeni, tak v prefixu (např. nakoupit – nákupce, nastoupit – nástupce, navrátit – návratce atd.). V této podkapitole se proto budeme snažit definovat taková derivační pravidla, abychom získali i dvojice, ve kterých k těmto dvojím alternacím dochází. Pozn. kdybychom se chtěli dvojí alternaci vyhnout, je možné přiklonit se (tam, kde je to možné) k odvozování od dějových jmen (např. nákupce od nákup atp.). Zadání (derivační pravidla), která takto definujeme, jsou v tomto případě tak specifická, že systém většinou pro každé takové zadání vygeneruje pouze jednu dvojici. Základová slovesa budeme zapisovat do sloupce „KP/X“ hnědou barvou a tučně[64]. Alternace v prefixu + alternace samohlásky v kořeni e,é/o: ® pro.e.e/prů.o.ce (k5.*mIp3nS/k1gMnSc1) Systém při tomto zadání automaticky vygeneruje dvojici provést – průvodce. ® na.e.e/ná.o.ce (k5.*mIp3nS/k1gMnSc1) Při tomto zadání Deriv vygeneroval dvě dvojice: nabrat – náborce, navést – návodce. ® při.e.e/pří.o.ce (k5.*mIp3nS/k1gMnSc1) Získáme dvojici přinést – přínosce. ® u.e.e/ú.o.ce (k5.*mIp3nS/k1gMnSc1) Systém vygeneroval dvě dvojice: unést – únosce a uvést – úvodce. ® vy.e.e/vý.o.ce (k5.*mIp3nS/k1gMnSc1) Tímto způsobem získáme dvojici vyvézt – vývozce. Alternace v prefixu + alternace samohlásky v kořeni ou/u: ® na.*ou.it/ná.*u.ce (k5.*mF/k1gMnSc1) Systém vygeneroval dvojice: nakoupit – nákupce, nastoupit – nástupce. ® za.*ou.it/zá.*u.ce (k5.*mF/k1gMnSc1) Získáme dvojici zastoupit – zástupce. ® pro.*ou.at/prů.*u.ce (k5.*mF/k1gMnSc1): prozkoumat – průzkumce. ® vy.*ou.at/vý.*u.ce (k5.*mF/k1gMnSc1) Při tomto zadání systém automaticky vygeneroval dvě dvojice: vyzkoumat – výzkumce, v případě dvojice ?vykoupat – výkupce došlo k přegenerování. Alternace v prefixu + alternace samohlásky v kořeni í/e: ® při.*í.at/pří.*e.ce (k5.*mF/k1gMnSc1): přijímat – příjemce. ® na.*í.at/ná.*e.ce (k5.*mF/k1gMnSc1) Systém vygeneroval dvojice: najímat – nájemce, pronajímat – pronájemce; v případě dvojice ?nalízat – nálezce došlo k přegenerování. ® za.*í.at/zá.*e.ce (k5.*mF/k1gMnSc1): zajímat – zájemce. Alternace v prefixu + alternace samohlásky v kořeni o/ů: ® vy.*o.ovat/vý.*ů.ce (k5.*mF/k1gMnSc1): vyhrožovat – výhrůžce. Zdloužení samohlásky v prefixu + zkrácení kořenové samohlásky: ® na.*á.it/ná.*a.ce (k5.*mF/k1gMnSc1): navrátit – návratce. ® při.*á.at/pří.*a.ce (k5.*mF/k1gMnSc1): přikázat – příkazce. Pozn. naopak je to u derivace činitelského jména zachránce od dějového jména záchrana: ® zá.*a.a/za.*á.ce (k1gFnSc1/k1gMnSc1): záchrana – zachránce. Zvláštní tvoření: ® vy.*j/vý.*jce (k5.*mRp2nS/k1gMnSc1): vydat – výdejce. ® .*ázet/.*ůdce (k5.*mF/k1gMnSc1): předcházet – předchůdce. ® .*ořit/.*ůrce (k5.*mF/k1gMnSc1) Systém vygeneroval dvojice: podpořit – podpůrce, tvořit – tvůrce. ® .*tat/.*tánce (k5.*mF/k1gMnSc1): zastat – zastánce. Výjimky: Ve třech následujících případech dochází ke složitým alternacím, proto tyto dvojice zařazujeme k výjimkám a do tabulky je zapíšeme kurzívou do sloupce „KP/X“. ® vyhrát – výherce ® vzepřít – vzpource ® vzepřít – vzpůrce 4.1.2 KORPUSY ČNK Budeme pracovat s korpusy SYN2000, SYN2005 a SYN2006PUB, které jsme popsali v teoretické části, v kapitole 2.2.1 ČESKÝ NÁRODNÍ KORPUS. 4.1.2.1 Konstrukce dotazu v korpusu Jazykový materiál získáváme z korpusu pomocí korpusového manažeru Bonito, jehož manuál je dostupný na webových stránkách ÚČNK[65]. Po otevření programu Bonito[66] se přihlásíme a vybereme korpus[67], se kterým budeme pracovat (v našem případě budeme postupně pracovat se třemi výše zmíněnými korpusy z toho důvodu, abychom shromáždili co nejrozsáhlejší materiál pro studium vybraného derivačního typu). Postup práce však předvedeme na korpusu SYN2000. Naším úkolem je vyhledat v korpusu činitelská jména odvozená sufixem –ce. Postup je následující: Při spuštění korpusového manažeru Bonito je předem nastavený implicitní atribut word (tzn. vyhledávání pouze tvaru slova, který jsme zadali), pokud však chceme vyhledat slovo ve všech jeho tvarech, musíme nastavit jako implicitní atribut tzv. lemma[68]. Potom do dotazovacího řádku zadáme .*ce, abychom našli výskyty slov končící na –ce. Tečka (.) v dotazovacím jazyku představuje jeden libovolný znak a hvězdička (*) libovolný počet opakování předchozího znaku nebo výrazu. Pokud nechceme měnit předem nastavený implicitní atribut, můžeme zadat dotaz tímto způsobem: [lemma=".*ce"]. Už při pohledu na konkordanční seznam zjišťujeme, že velká část slov nevyhovuje našim požadavkům, např. více, přece, dělnice...[69] Seznam slov tedy musíme dále redukovat, aby vyhovoval slovotvorné kategorii, kterou hledáme. Positivním filtrem tedy vybereme ze seznamu pouze životná maskulina. Zde využijeme toho, že je korpus otagovaný[70]. Vlevo vedle dotazovacího řádku zvolíme položku P filtr a jako implicitní atribut nastavíme tag, poté zadáme dotaz N.M.* Pokud nechceme měnit implicitní atribut, můžeme opět formulovat dotaz v hranatých závorkách [tag="N.M.*"]. Počet výskytů zjistíme vlevo dole (v tomto případě 132542). Pomocí frekvenční distribuce[71] můžeme navíc zjistit, že se v tomto korpusu vyskytuje 141 různých lemmat na –ce, která mají značku N.M.*. Z následujícího seznamu lemmat vidíme, že převážná část slov jsou činitelská jména. Na základě empirických dat můžeme formulovat pravidlo č.1: Pokud u substantiva maskulina životného končícího na –ce předchází před –ce samohláska, pak se nejedná o činitelské jméno. Zde využijeme negativní filtr (vlevo vedle dotazovacího řádku zvolíme položku N filtr), tím vyřadíme ze seznamu lemmat slova nevyhovující tomuto pravidlu (v korpusu SYN2000 jde o vlastní jména Bruce, Grace atd.; v korpusu SYN2005 jde navíc i o chybně otagovaná slova: duce, karbonatace, face, race, sunrice, kopice, joice, bioaktivace, poruce, violace atd.). Nastavíme lemma jako implicitní atribut a zvolíme dotaz: .*(a|e|i|o|u|y|á|é|ě|í|ó|ú|ů|ý)ce Negativním filtrem můžeme vyřadit i vlastní jména jako Pierce, Terence, France...[72] použitím dotazu: (A|Á|B|C|Č|D|E|É|F|G|H|I|Í|J|K|L|M|N|O|P|Q|R|Ř|S|Š|T|U|V|W|X|Y|Z|Ž).* Pomocí frekvenční distribuce zjistíme, že počet životných maskulin zakončených na –ce klesl na 130. Stejně postupujeme i v případě korpusů SYN2005 a SYN2006PUB. Kandidáti činitelských jmen na –ce SYN2000 130 SYN2005 266 SYN2006PUB 143 Pokud sledujeme vybrané kandidáty činitelských jmen na –ce, můžeme pomocí korpusu formulovat pravidlo č. 2: Pokud u substantiva maskulina životného končícího na –ce předchází před –ce souhláska c, č, f, g, h, k, ř, nebo š, nejedná se o činitelské jméno. Zde opět můžeme využít negativní filtr: zvolíme položku N filtr, nastavíme lemma jako implicitní atribut a zvolíme dotaz: .*(c|č|f|g|h|k|ř|š)ce V případě korpusů SYN2000 a SYN2006PUB toto pravidlo nepřineslo žádné změny, ale v korpusu SYN2005 toto pravidlo pomohlo odstranit chybně otagovaná slova (např. podkonstrukce, pičce, prostičce, proakce...), počet kandidátů činitelských jmen zakončených na –ce se tak v korpusu snížil na 248. Markantní rozdíl v počtu nalezených jednotek a uvedené chyby je třeba přičíst na vrub používání guesserů[73]. 4.1.2.2 Srovnání dat z korpusů s nástrojem Deriv Pokud v korpusech ČNK hledáme deverbativa patřící k tomuto slovotvornému typu, (která zároveň nejsou automaticky generována pomocí pravidel zadaných v nástroji Deriv), objevíme jen pár činitelských jmen. To svědčí o tom, že je přípona –ce méně produktivní. Za zmínku stojí tato jména: Ÿ výplatce (od výplata, vyplatit) – SYN2006PUB[74]; Ÿ výkrmce (od výkrm, vykrmit) – SYN2000[75], SYN2006PUB; Ÿ převozce (od převoz, převézt) – SYN2000, SYN2005[76], SYN2006PUB. 4.1.2.3 Význam získaných dat Data, která jsme získali z jednotlivých korpusů, jsou důležitá také ke zjišťování kontextů, frekvencí a kolokací. Díky korpusům můžeme zjistit jednotlivé významy nalezených činitelských jmen končících na –ce a dozvědět se, v jakých kontextech se nejčastěji vyskytují. Podle frekvence zase ve většině případů určujeme zástupce pro jednotlivé derivační vzory. Tabulka nejfrekventovanějších činitelských jmen zakončených na –ce v jednotlivých korpusech ČNK[77]: SYN2000[78] SYN2005 SYN2006PUB zástupce 24094 14631 97643 výrobce 15140 11418 46347 zájemce 9579 5824 46833 vůdce 6880 5470 22508 soudce 5787 7774 27667 tvůrce 5527 4327 19243 důchodce 5157 2437 23405 obránce 5050 3760 32421 poradce 4328 4212 16857 správce 4106 4659 17602 odpůrce 3121 2638 13462 obhájce 2732 1932 12501 prodejce 2533 2789 11261 průvodce 2527 2933 8536 předchůdce 2410 2359 8819 nástupce 2354 2101 9023 strážce 2162 2098 6017 ochránce 2103 1853 9285 zastánce 1815 1648 6593 nájemce 1728 1396 6526 Pozn. V korpusu SYN2005 se mezi dvaceti nejfrekventovanějšími slovy objevuje: vládce (nájemce je na 23. místě). V SYN2006PUB se mezi dvaceti nejfrekventovanějšími slovy objevuje dárce (strážce je na 21. místě). Kromě nejfrekventovanějších slov můžeme v korpusu najít také slova, která se nepoužívají (např. bezprávce) nebo slova, která se vyskytují jen jako součást složenin (např. bijce). 4.2 ZPRACOVÁNÍ INFORMACÍ Informace získané z webového rozhraní Deriv a data z korpusů slouží ke zpracování tabulky činitelských jmen zakončených na –ce (viz následující kapitola 4.2.1), z níž se přehledně dozvíme možnosti derivace. Informace z této tabulky můžeme dále zpracovávat, v našem případě tyto informace slouží k vytvoření jednotlivých derivačních vzorů (viz kapitola 4.2.2 PRAVIDLA DERIVACE, VYTVOŘENÍ DERIVAČNÍCH VZORŮ) a následné formulaci formálních pravidel (viz kapitola 4.3 FORMÁLNÍ PRAVIDLA DERIVACE DEVERBATIV NA –CE). 4.2.1 TABULKA ČINITELSKÝCH JMEN ZAKONČENÝCH NA –CE it at ovat nout KP/X DJ bezprávce bezpráví bijce bít bránce bránit ?brána dárce darovat dar dohodce dohodit dohodovat[79] dohodnout dohoda dopravce dopravit dopravovat doprava dovozce ?dovozit ?dovozovat dovézt dovoz dozorce dozírat ?dozorovat dozor důchodce dochodit důchod hájce hájit ?háj hánce hanit hana hanobce hanobit hanoba chránce chránit chůdce chodit ?chůda/ chod[80] chvalce chválit chvála chválce chválit chvála kárce kárat ?károvat kára[81]/ ?kar/ ?kara krádce krást lájce lát láj[82] mládce mladit mládnout mládí mluvce mluvit mluv[83]/ mluva náborce nabrat nábor nájemce najímat nájem nákupce ?nakupit nakupovat nakoupit nákup nálezce naleznout nalézt/ ?nalízat nález námluvce namluvit námluva nápravce napravit napravovat náprava nástupce nastupovat nastoupit nástup návodce ?navodit navést návod návratce navrátit návrat obdivce obdivovat obdiv obhájce obhájit obhajovat obránce obránit ?obrání/ obrana it at ovat nout KP/X DJ obžalobce obžaloba obžerce obžírat odbojce odboj odbůjce odboj odhadce odhadovat odhadnout odhad odpůrce odporovat ?odeprat odpor odvozce ?odvozit ?odvozovat odvézt odvoz ochránce ochránit ochrana oprávce opravit opravovat oprava plátce platit ?plátovat ?plát/ plat podnájemce podnájem podpisce podpisovat podpis podpůrce podporovat podpořit ?podpor/ podpora podvůdce podvést podvod pojistce pojistit popravce popravit popravovat poprava poradce poradit ?poradovat porada porobce porobit porobovat poroba porotce porota prodejce prodat prodej/ ?prodej pronájemce pronajímat pronájem proradce proradit prorada průbojce probojovat průboj průvodce provodit[84] provést průvod průzkumce prozkoumat průzkum předchůdce předcházet přenosce přenosit přenést přenos předplátce předplatit přepravce přepravit přepravovat přeprava přestupce přestoupit přestupovat přestup převodce převést převod přídělce přidělit přidělovat příděl příjemce přijímat příjem it at ovat nout KP/X DJ příkazce přikazovat přikázat příkaz přímluvce přimluvit přímluva přínosce ?přinosit přinést přínos přípravce připravit připravovat příprava půhonce pohonit[85] půhon působce působit ?působovat původce povodit[86] původ rádce radit ?radovat ?rad/ rada rozdílce rozdělit rozdělovat rozdíl rozhodce ?rozhodit rozhodovat rozhodnout rozhod[87]/ ?rozhoda rozsudce rozsoudit schránce schránit ?schrána slibce slíbit slibovat slib smírce smířit ?směrovat smír smlouvce smluvit smlouvat smlouva smluvce smluvit smlouva snoubce snoubit snubovat snub[88] snubce snoubit snubovat snub soudce soudit ?sudovat soud/ ?sud splátce splatit správce spravit spravovat správa strážce strážit/ stražit[89] stráž strůjce strojit ?strůj/ ?strůj/ stroj svárce svářit svár/ ?svar svůdce svodit[90] svést svod škůdce škodit ?škodovat škoda tvorce tvořit tvor[91] tvůrce tvořit tvor ubijce ubít úmluvce umluvit úmluva únosce ?unosit unést únos úpadce upadat upadnout úpad[92] úpravce upravit upravovat úprava it at ovat nout KP/X DJ úvodce uvodit[93] uvést úvod/ ?úvodí vládce vládat[94] vládnout vláda vůdce vodit vést ?voda výbojce vybojovat výboj výdejce vydat výdej výherce vyhrát výhra výhradce vyhradit výhrada výhrůžce vyhrožovat výkupce vykupovat ?vykoupat výkup vynálezce vynaleznout[95] vynález výprosce vyprosit ?výpros/ ?výprosa výrobce vyrobit výrob[96]/ výroba výstavce vystavit vystavovat výstav[97]/ výstava vývozce vyvozit ?vyvozovat vyvézt vývoz výzdobce vyzdobit vyzdobovat výzdoba výzkumce vyzkoumat výzkum vzpource vzepřít vzpoura vzpůrce vzepřít vzpor/ ?vzpora/ vzpoura zabijce zabít zábojce ?zabojovat záboj záhubce zahubit ?zahubovat záhuba zachránce zachránit záchrana zájemce zajímat zájem zastánce zastat zastání zástavce zastavit zastavovat ?zástav/ zástava zástupce zastupovat zastoupit zástup závětce ?závět/ ?závětí, závěť zbojce zboj zbůjce zbůj[98]/ zboj zhoubce zhubit zhouba zrádce zradit ?zradovat ?zráda/ zrada žalobce žaloba Tabulku jsme vytvořili pomocí seznamu činitelských jmen na –ce získanou při práci s webovým rozhraním Deriv (první sloupec). Při práci s tímto nástrojem jsme také získali většinu základových slov. Vysvětlivky: Ÿ Sloupec „it“ – základová slovesa s infinitivní kmenotvornou příponou –i–. Ÿ Sloupec „at“ – základová slovesa s infinitivní kmenotvornou příponou –a–. Ÿ Sloupec „ovat“ – základová slovesa s infinitivní kmenotvornou příponou –ova–. Ÿ Sloupec „nout“ – základová slovesa s infinitivní kmenotvornou příponou –nou–. Ÿ Sloupec „KP/X“ – základová slovesa, z nichž se činitelská jména derivují připojením sufixu –ce k přítomnému kmenu („KP“) a ostatní základová slova („X“). Ÿ Sloupec „DJ“ – základem jsou dějová jména. Ÿ Otazník před slovem značí přegenerování. V druhém, třetím, čtvrtém a pátém sloupci („it“, „at“, „ovat“, „nout“) jsou základová slova, z nichž se derivují činitelská jména připojením sufixu –ce ke slovesných základům bez infinitivní kmenotvorné přípony (viz kapitola 4.1.1.1); tučně jsou v těchto sloupcích zvýrazněna slova, v nichž došlo k alternaci v kořeni a zelenou barvou a tučně jsou zvýrazněna slova, v nichž došlo k alternaci v prefixu. V šestém sloupci („KP/X“) jsou základová slova, z nichž se derivují činitelská jména připojením sufixu –ce k přítomnému kmenu (černá barva) a ostatní základová slova: alternace v kořeni + zvláštní derivační pravidlo (černá barva, tučně), alternace v prefixu + zvláštní derivační pravidlo (zelená barva, tučně), dvojí alternace (hnědá barva, tučně), výjimky (černá barva, kurzíva). V posledním (sedmém) sloupci („DJ“) jsou vypsány případy, kdy může být základovým slovem dějové jméno (viz kapitola 4.1.1.2); černou barvou jsou napsána dějová jména rodu mužského, modrou barvou jsou napsána dějová jména rodu středního, červená barva označuje dějová jména rodu ženského a tučně jsou zvýrazněna dějová jména, ve kterých došlo k alternaci. 4.2.2 PRAVIDLA DERIVACE, VYTVOŘENÍ DERIVAČNÍCH VZORŮ Při tvorbě jednotlivých derivačních vzorů jsme vycházeli z informací, které poskytla předchozí tabulka. Pro určení zástupce jednotlivého derivačního vzoru jsme pak ve většině případů využili nejfrekventovanější slovo z dané skupiny[99]. Derivační pravidlo Derivační vzor (počet dvojic) Počet přegenerovaných dvojic 1) .*it/k5.*mF > .*ce/k1gMnSc1 soudit – soudce (25) 3 rozhodit – rozhodce 2) .*a.it/k5.*mF > .*á.ce/k1gMnSc1 platit – plátce (10) 0 3) .*á.it/k5.*mF > .*a.ce/k1gMnSc1 chválit – chvalce (1) 0 4) .*ě.it/k5.*mF > .*í.ce/k1gMnSc1 rozdělit – rozdílce (1) 0 5) .*í.it/k5.*mF > .*i.ce/k1gMnSc1 slíbit – slibce (1) 0 6) .*ou.it/k5.*mF > .*u.ce/k1gMnSc1 přestoupit – přestupce (3) 0 7) .*u.it/k5.*mF > .*ou.ce/k1gMnSc1 smluvit – smlouvce (2) 0 8) .*o.it/k5.*mF > .*ů.ce/k1gMnSc1 škodit – škůdce (5) 0 9) .*řit/k5.*mF > .*rce/k1gMnSc1 smířit – smírce (3) 0 10) vy.*it/k5.*mF > vý.*ce/k1gMnSc1 vyrobit – výrobce (6) 0 11) na.*it/k5.*mF > ná.*ce/k1gMnSc1 namluvit – námluvce (2) 2 nakupit – nákupce 12) při.*it/k5.*mF > pří.*ce/k1gMnSc1 připravit – přípravce (3) 1 přinosit – přínosce 13) za.*it/k5.*mF > zá.*ce/k1gMnSc1 zastavit – zástavce (2) 0 14) u.*it/k5.*mF > ú.*ce/k1gMnSc1 upravit – úpravce (3) 1 unosit – únosce 15) do.*it/k5.*mF > dů.*ce/k1gMnSc1 dochodit – důchodce (1) 0 16) po.*it/k5.*mF > pů.*ce/k1gMnSc1 pohonit – půhonce (2) 0 17) pro.*it/k5.*mF > prů.*ce/k1gMnSc1 provodit – průvodce (1) 0 18) .*at/k5.*mF > .*ce/k1gMnSc1 kárat – kárce (3) 0 19) .*í.at/k5.*mF > .*o.ce/k1gMnSc1 dozírat – dozorce (1) 0 20) .*í.at/k5.*mF > .*e.ce/k1gMnSc1 obžírat – obžerce (1) 0 21) u.*at/k5.*mF > ú.*ce/k1gMnSc1 upadat – úpadce (1) 0 22) .*ovat/k5.*mF > .*ce/k1gMnSc1 obdivovat – obdivce (12) 7 károvat – kárce 23) .*a.ovat/k5.*mF > .*á.ce/k1gMnSc1 darovat – dárce (4) 2 radovat – rádce 24) .*ě.ovat/k5.*mF > .*í.ce/k1gMnSc1 rozdělovat – rozdílce (1) 1 směrovat – smírce 25) .*u.ovat/k5.*mF > .*ou.ce/k1gMnSc1 snubovat – snoubce (1) 1 sudovat – soudce 26) .*o.ovat/k5.*mF > .*ů.ce/k1gMnSc1 odporovat – odpůrce (2) 1 škodovat – škůdce 27) vy.*ovat/k5.*mF > vý.*ce/k1gMnSc1 vykupovat – výkupce (4) 1 vyvozovat – vývozce 28) na.*ovat/k5.*mF > ná.*ce/k1gMnSc1 nakupovat – nákupce (3) 0 29) při.*ovat/k5.*mF > pří.*ce/k1gMnSc1 přikazovat – příkazce (3) 0 30) za.*ovat/k5.*mF > zá.*ce/k1gMnSc1 zastupovat – zástupce (2) 2 zahubovat – záhubce 31) u.*ovat/k5.*mF > ú.*ce/k1gMnSc1 upravovat – úpravce (1) 0 32) pro.*ovat/k5.*mF > prů.*ce/k1gMnSc1 probojovat – průbojce (1) 0 33) .*nout/k5.*mF > .*ce/k1gMnSc1 vládnout – vládce (5) 0 34) na.*nout/k5.*mF > ná.*ce/k1gMnSc1 naleznout – nálezce (1) 0 35) u.*nout/k5.*mF > ú.*ce/k1gMnSc1 upadnout – úpadce (1) 0 36) .*/k1gInSc1 > .*ce/k1gMnSc1 důchod - důchodce (55) 6 háj – hájce 37) .*a./k1gInSc1 > .*á.ce/k1gMnSc1 dar – dárce (2) 3 kar – kárce 38) .*u./k1gInSc1 > .*ou.ce/k1gMnSc1 snub – snoubce (1) 1 sud – soudce 39) .*o./k1gInSc1 > .*ů.ce/k1gMnSc1 odboj – odbůjce (9) 1 podpor – podpůrce 40) .*í/k1gNnSc1 > .*ce/k1gMnSc1 bezpráví – bezprávce (3) 3 závětí – závětce 41) .*a/k1gFnSc1 > .*ce/k1gMnSc1 porota – porotce (31) 6 brána – bránce 42) .*a.a/k1gFnSc1 > .*á.ce/k1gMnSc1 zrada – zrádce (6) 1 kara – kárce 43) .*á.a/k1gFnSc1 > .*a.ce/k1gMnSc1 chvála – chvalce (1) 0 44) .*ou.a/k1gFnSc1 > .*u.ce/k1gMnSc1 smlouva – smluvce (1) 0 45) .*o.a/k1gFnSc1 > .*ů.ce/k1gMnSc1 škoda – škůdce (2) 2 voda – vůdce 46) .*ou.a/k1gFnSc1 > .*ů.ce/k1gMnSc1 vzpoura – vzpůrce (1) 0 47) .*0.a/k1gFnSc1 > .*e.ce/k1gMnSc1 výhra – výherce (1) 0 48) .*ť/k1gFnSc1 > .*tce/k1gMnSc1 závěť – závětce (1) 0 49) .*/k1gFnSc1 > .*ce/k1gMnSc1 stráž – strážce (2) 2 strůj – strůjce 50) .*j/k5.*mRp2.* > .*jce/k1gMnSc1 bít – bijce + lát – lájce (5+1) 1 prodat – prodejce 51) .*a.e/k5.*mIp3nS > .*á.ce/k1gMnSc1 krást – krádce (1) 0 52) .*e.e/k5.*aPmIp3nS > .*o.ce/k1gMnSc1 dovézt – dovozce (4) 0 53) .*e.e/k5.*mIp3nS > .*ů.ce/k1gMnSc1 vést – vůdce (3) 1 odeprat – odpůrce 54) na.*e/k5.*mIp3nS > ná.*ce/k1gMnSc1 nalézt – nálezce (2) 0 55) pro.e.e/k5.*mIp3nS > prů.o.ce/k1gMnSc1 provést – průvodce (1) 0 56) na.e.e/k5.*mIp3nS > ná.o.ce/k1gMnSc1 navést – návodce (2) 0 57) při.e.e/k5.*mIp3nS > pří.o.ce/k1gMnSc1 přinést – přínosce (1) 0 58) u.e.e/k5.*mIp3nS > ú.o.ce/k1gMnSc1 unést – únosce (2) 0 59) vy.e.e/k5.*mIp3nS > vý.o.ce/k1gMnSc1 vyvézt – vývozce (1) 0 60) na.*ou.it/k5.*mF > ná.*u.ce/k1gMnSc1 nakoupit – nákupce (2) 0 61) za.*ou.it/k5.*mF > zá.*u.ce/k1gMnSc1 zastoupit – zástupce (1) 0 62) pro.*ou.at/k5.*mF > prů.*u.ce/k1gMnSc1 prozkoumat – průzkumce (1) 0 63) vy.*ou.at/k5.*mF > vý.*u.ce/k1gMnSc1 vyzkoumat – výzkumce (1) 1 vykoupat – výkupce 64) při.*í.at/k5.*mF > pří.*e.ce/k1gMnSc1 přijímat – příjemce (1) 0 65) na.*í.at/k5.*mF > ná.*e.ce/k1gMnSc1 najímat – nájemce (2) 1 nalízat – nálezce 66) za.*í.at/k5.*mF > zá.*e.ce/k1gMnSc1 zajímat – zájemce (1) 0 67) vy.*o.ovat/k5.*mF > vý.*ů.ce/k1gMnSc1 vyhrožovat – výhrůžce (1) 0 68) na.*á.it/k5.*mF > ná.*a.ce/k1gMnSc1 navrátit – návratce (1) 0 69) při.*á.at/k5.*mF > pří.*a.ce/k1gMnSc1 přikázat – příkazce (1) 0 70) zá.*a.a/k1gFnSc1 > za.*á.ce/k1gMnSc1 záchrana – zachránce (1) 0 71) vy.*j/k5.*mRp2nS > vý.*jce/k1gMnSc1 vydat – výdejce (1) 0 72) .*ázet/k5.*mF > .*ůdce/k1gMnSc1 předcházet – předchůdce (1) 0 73) .*ořit/k5.*mF > .*ůrce/k1gMnSc1 tvořit – tvůrce (2) 0 74) .*tat/k5.*mF > .*tánce/k1gMnSc1 zastat – zastánce (1) 0 výjimky vzepřít – vzpůrce (3) celkem 275+3 51 n Pomocí 74 pravidel lze automaticky generovat celkem 326 dvojic sloveso/dějové jméno – substantivum zakončené na –ce[100]. n 275 dvojic (84,4%) je utvořeno správně. n 51 dvojic (15,6%) je utvořeno nesprávně (přegenerováno). n Tři dvojice jsme zařadili k výjimkám. 4.2.3 DERIVACE OD VÍCE ZÁKLADŮ Z tabulky (v kapitole 4.2.1) je patrné, že některá substantiva (činitelská jména na –ce) se mohou derivovat od několika základů. Deriv může být vhodným nástrojem k popisu tohoto typu tvoření. Pomocí funkce Hledání trojic (n-tic) můžeme formulovat derivační pravidla na vyhledávání trojic typu popravit – popravovat – popravce, dar – darovat – dárce atd. Pokud chceme například získat činitelská jména na –ce, která se derivují jak od sloves s infinitivní kmenotvornou příponou –i–, tak od sloves i infinitivní kmenotvornou příponou –ova–, zvolíme pro základové slovo jak příponu –it, tak příponu –ovat. Postup je následující: hledání slovních tvarů, dvojic, trojic, xxx-tice práce s obsahem souborů, soubory, adresáři Hledání značka: k1gMnSc1 RE: ce$ značka: k5.*mF nahrazované: it$ nahrazující: ce značka: k5.*mF nahrazované: ovat$ nahrazující: ce uložit do souboru: Kolarova/sufix_ce/ce_it_ovat vyhledat Obrázek č. 7: Ukázka práce s nástrojem Deriv – Hledání trojic Systém vygeneruje deset dvojic pro obě známá základová slov, např. dopravce – dopravit, dopravovat; popravce – popravit, popravovat; přepravce – přepravit, přepravovat. V těchto případech je první základové slovo dokonavé a druhé nedokonavé. Postup můžeme opakovat i se zadáváním jiných kmenotvorných přípon, popř. jako jedno ze základových slov zvolíme dějové jméno (získáme tak např. trojice typu rádce – rada, radit; dárce – dar, darovat; odpůrce – odpor, odporovat). Tímto způsobem získáváme přehled o dvojí motivaci/fundaci (tedy o tom, která činitelská jména zakončená na –ce se mohou tvořit od více základů). 4.3 FORMÁLNÍ PRAVIDLA DERIVACE DEVERBATIV NA –CE Na základě zjištěných informací z webového rozhraní Deriv, na základě zpracování dat v korpusech ČNK a s využitím teoretických prací jsme zjistili následující pravidla pro tento typ odvozování[101]: 1. Možnými kandidáty jmen činitelských na –ce jsou slova, jejichž lemma končí na –ce a zároveň jde o maskulina životná. 2. Pokud má jít o deverbativum (jméno činitelské), pak po formální stránce může po –c(e) u jednotlivých tvarů následovat pouze uvedený řetězec znaků: .*c(e|i|ů) nebo .*c(e|ů)m nebo .*cích nebo .*cov(i|é). 3. Pokud má jít o deverbativa, před sufixem –ce nemůže předcházet samohláska (přípona –ce se připojuje vždy k základu zavřenému). 4. Před sufixem –ce vždy předchází souhláska. Pokud má jít o deverbativum (jméno činitelské), před –ce předchází pouze tyto souhlásky: b, d, j, l, m, n, p, r, s, t, v, z, ž. 5. Pokud se činitelské jméno zakončené sufixem –ce tvoří od slovesných základů bez kmenotvorné přípony –i–, jsou základovými slovesy slovesa 4. slovesné třídy (vzor trpí). Tato činitelská jména se tvoří odtržením infinitivní koncovky –t, odtržením kmenotvorné přípony –i– od základového slova a připojením sufixu –ce k vzniklému slovesnému základu. Základová slova k těmto činitelským jménům na –ce jsou v tabulce 4.2.1[102] uvedena černou barvou pod sloupcem „it“; derivační pravidlo 1), derivační vzor soudit – soudce (viz tabulka 4.2.2[103]). 6. Pokud se činitelské jméno zakončené sufixem –ce tvoří od slovesných základů bez kmenotvorné přípony –a–, jsou základovými slovesy slovesa 5. slovesné třídy (vzor dělá). Tato činitelská jména se tvoří odtržením infinitivní koncovky –t, odtržením kmenotvorné přípony –a– od základového slova a připojením sufixu –ce k vzniklému slovesnému základu. Základová slova k těmto činitelským jménům jsou v tabulce 4.2.1 uvedena černou barvou pod sloupcem „at“; derivační pravidlo 18), derivační vzor kárat – kárce (viz tabulka 4.2.2). 7. Pokud se činitelské jméno zakončené sufixem –ce tvoří od slovesných základů bez kmenotvorné přípony –ova–, jsou základovými slovesy slovesa 3. slovesné třídy (vzor kupuje). Tato činitelská jména se tvoří odtržením infinitivní koncovky –t, odtržením kmenotvorné přípony –ova– od základového slova a připojením sufixu –ce k vzniklému slovesnému základu. Základová slova k těmto činitelským jménům jsou v tabulce 4.2.1 uvedena černou barvou pod sloupcem „ovat“; derivační pravidlo 22), derivační vzor obdivovat – obdivce (viz tabulka 4.2.2). Pozn. některá jména se mohou tvořit od několika slovesných základů (dopravce – dopravit, dopravovat; obhájce – obhájit, obhajovat; popravce – popravit, popravovat, přepravce – přepravit, přepravovat; přestupce – přestoupit, přestupovat; rozhodce – rozhodovat, rozhodnout; slibce – slíbit, slibovat; výstavce – vystavit, vystavovat; výzdobce – vyzdobit, vyzdobovat...). Často záleží na konkrétním smyslu, v němž je činitelského jména užito, zda je aktualizován vztah ten nebo onen: např. výrobcem můžeme nazvat toho, kdo provozuje výrobu, kdo něco vyrábí, ale také jen toho, kdo něco třeba jen jednou vyrobil, to znamená může jít jak o významovou platnost nositele funkce, tak o aktuální význam vykonatelský. Dovoluje-li formální stránka činitelského jména, aby se spojovalo s různými vidovými podobami slovesa, jsou ovšem souvislosti ještě složitější. Ve shodě s vidovou stránkou základového slovesa označují pak činitelská jména osoby buď jako konající určitou stálou činnost, např. vůdce (ten, kdo vede, vodí), nebo jako konající, resp. vykonavší určitý jednotlivý úkon, např. *výprosce (ten, kdo vyprosil) atp. Vid základového slovesa tedy nemusí být pro význam činitelského jména rozhodující[104]. Těmto činitelským jménům je věnována kapitola 4.2.3 DERIVACE OD VÍCE ZÁKLADŮ. Tato základová slova jsou navíc přehledně zaznamenána v tabulce 4.2.1. 8. Pokud se činitelské jméno zakončené sufixem –ce tvoří od slovesných základů bez kmenotvorné přípony –nou–, jsou základovými slovesy slovesa 2. slovesné třídy (vzor tiskne). Tato činitelská jména se tvoří odtržením infinitivní koncovky –t, odtržením kmenotvorné přípony –nou– od základového slova a připojením sufixu –ce k vzniklému slovesnému základu. Základová slova k těmto činitelským jménům jsou v tabulce 4.2.1 uvedena černou barvou pod sloupcem „nout“; derivační pravidlo 33), derivační vzor vládnout – vládce (viz tabulka 4.2.2). 9. Pokud slovesný kmen končí samohláskou, základem pro odvozování činitelských jmen zakončených na –ce je přítomný kmen (jde většinou o slovesa podle vzoru krýt – 3. slovesná třída). Tato činitelská jména se tvoří od slovesa v přítomném tvaru odtržením koncovky a připojením sufixu –ce. Patří sem omezený počet deverbativ: např. bijce, lájce, ubijce, zabijce. Základová slova k těmto činitelským jménům jsou v tabulce 4.2.1 uvedena černou barvou (základové sloveso lát navíc tučně) pod sloupcem „KP/X“; derivační pravidlo 50), derivační vzor bít – bijce (viz tabulka 4.2.2). 10. Pokud je základem dějové jméno, tvoří se činitelská jména zakončená na –ce: a) připojením sufixu –ce přímo za dějové jméno rodu mužského nebo rodu ženského skloňovaného podle vzoru píseň nebo kost; tato základová dějová jména jsou v tabulce 4.2.1 uvedena černou barvou (v případě dějového jména stráž a láj červenou barvou) pod sloupcem „DJ“; derivační pravidla: 36) a 49), derivační vzory: důchod – důchodce a stráž – strážce (viz tabulka 4.2.2); b) připojením sufixu –ce přímo za dějové jméno, dochází však k alternaci v kořeni; tato základová dějová jména jsou v tabulce 4.2.1 uvedena tučně černou barvou pod sloupcem „DJ“; derivační pravidla: 37), 38), 39), 48), derivační vzory: viz tabulka 4.2.2. c) odtržením flektivní koncovky[105] od dějového jména a následným připojením sufixu –ce; tato základová dějová jména jsou v tabulce 4.2.1 uvedena modrou barvou (pokud jde o neutra) a červenou barvou (pokud jde o feminina) pod sloupcem „DJ“; derivační pravidla: 40) a 41), derivační vzory: bezpráví – bezprávce a porota – porotce (viz tabulka 4.2.2). d) odtržením flektivní koncovky od dějového jména a následným připojením sufixu –ce, dochází však k alternaci v kořeni; tato základová dějová jména jsou v tabulce 4.2.1 uvedena tučně černou barvou pod sloupcem „DJ“; derivační pravidla: 42), 43), 44), 45), 46), 47), derivační vzory: viz tabulka 4.2.2. 11. Při popisu tvoření deverbativ pomocí sufixem –ce dochází k problémům v podobě alternací v KoS a v prefixech. Nová verze webového rozhraní Deriv (http://deb.fi.muni.cz/deriv/), která pracuje s regulárními výrazy, však umožnila vygenerovat i většinu alternujících dvojic. Při tvoření činitelských jmen zakončených na –ce dochází k těmto samohláskovým alternacím: a/á, á/a, ě/í, í/i, í/o, ou/u, u/ou, o/ů, í/e, ou/ů, 0/e, e,é/o, e,é/ů a k těmto alternacím souhláskovým: ř/r, ť/t. Základová slova k těmto činitelským jménům jsou v tabulce 4.2.1 uvedena tučně černou barvou pod všemi sloupci (záleží na tom, jakým způsobem se jednotlivá činitelská jména tvoří); derivační pravidla: 2) – 9), 19) – 21), 23) – 26), 37) – 39), 42) – 48), 51) – 53), derivační vzory: viz tabulka 4.2.2. Pokud jde o samohláskové alternace v prefixech, pomůže nástroj Deriv tyto změny také sledovat. Dochází k těmto alternacím v prefixu: vy-/vý-, na-/ná-, při-/pří-, za-/zá-, u-/ú-, do-/dů-, po-/pů-, pro-/prů-. Základová slova k těmto činitelským jménům jsou v tabulce 4.2.1 uvedena tučně zelenou barvou pod všemi sloupci (záleží na tom, jakým způsobem se jednotlivá činitelská jména tvoří); derivační pravidla: 10) – 17), 27) – 32), 34), 35), 54), derivační vzory: viz tabulka 4.2.2. 12. Při zkoumání informací, které poskytla sestavená tabulka (viz kapitola 4.2.1), jsme zjistili, že v některých dvojicích základové slovo – substantivum na –ce dochází k tzv. dvojí alternaci (alternace v prefixu + alternace v kořeni); základová slova k těmto činitelským jménům jsou v tabulce 4.2.1 uvedena tučně hnědou barvou pod sloupcem „KP/X“; derivační pravidla: 55) – 70), derivační vzory: viz tabulka 4.2.1. Touto dvojí alternací se zabývá kapitola 4.1.1.6, ve které nalezneme i činitelská jména, která se tvoří zvláštním způsobem (základová slova k těmto činitelským jménům jsou v tabulce 4.2.1 uvedena také tučně hnědou barvou pod sloupcem „KP/X“, derivační pravidla: 71) – 76), derivační vzory: viz tabulka 4.2.2) a činitelská jména, která jsme zařadili k výjimkám (základová slova k těmto činitelským jménům jsou v tabulce 4.2.1 uvedena kurzívou pod sloupcem „KP/X“, v tabulce 4.2.2 jsou tyto dvojice zařazeny k výjimkám). 5. DERIVACE DEVERBATIV ZAKONČENÝCH NA –EC Podobným způsobem se pokusíme formulovat formální pravidla pro derivaci deverbativ tvořených sufixem –ec. Postup práce zde však bude odlišný, protože se zaměříme na formální popis pravidel, který by vyřadil slova, která nepatří do příslušné třídy (desubstantiva/deadjektiva). V první řadě se zaměříme na deverbativa vyjadřující agens (činitelská jména), kapitola týkající se deverbativ vyjadřujících patiens bude spíše informativní; v rámci pravidel se však budeme snažit zachytit rozdíl mezi jmény činitelskými, která vyjadřují agens, a deverbativními názvy osob dějem zasažených tvořených tímtéž sufixem, ale od jiného základu. 5.1 ANALÝZA MATERIÁLU 5.1.1 NÁSTROJ DERIV Při práci s nástrojem Deriv postupujeme podobně jako v kapitole 5. Při vyhledávání slovních tvarů zakončených na –ec se značkou k1gMnSc1 (substantivum, rod mužský životný, singulár, nominativ) obsahuje uložený soubor (ec_2) 1835 slov. hledání slovních tvarů, dvojic, trojic, xxx-tice práce s obsahem souborů, soubory, adresáři Hledání značka: k1gMnSc1 RE: ec$ uložit do souboru: Kolarova/sufix_ec/ec_2 vyhledat Obrázek č. 8: Ukázka práce s nástrojem Deriv – Hledání slovních tvarů 5.1.1.1 Postup práce Po otevření souboru (ec_2) zjišťujeme, že velká část slov nepatří do hledané kategorie (deverbativa vyjadřující agens, popř. deverbativa vyjadřující patiens). Jelikož je sufix –ec polyfunkční, musíme vyřadit jména konatelská, jména prostředků, jména nositelů vlastností atd. 5.1.1.1.1 Vyřazení desubstantiv 1. JMÉNA KONATELSKÁ Pokud jde o konatelská jména, sufix –ec odvozuje jen od kompozit – názvů oborů: dějepisec, dřevorubec, těsnopisec, přírodozpytec, bohoslovec apod.[106] V seznamu substantiv rodu mužského životného na –ec najdeme přes 400 kompozit – ty bychom museli vyřadit „ručně“, ale většinu kompozit vyřadíme pomocí webového rozhraní Deriv při automatickém generování, protože ve většině případů k těmto kompozitům neexistuje slovesný protějšek (viz např. dějepsát, dřevorubat atd.); pokud však taková podoba existuje a systém ji automaticky vygeneruje, tyto dvojice vždy uvádíme, viz např. spoluhrát – spoluherec). 2. JMÉNA PODLE PŘÍSLUŠNOSTI a) jména obyvatelská – v tomto případě sufix –ec odvozuje od názvů zemí především tehdy, končí-li základ hláskami –j, –l, –m, –n, –r a –v. (Z odvozovacího základu se vypouští zakončení –ie nebo –sko.) Např.: Thajec, Korejec, Portugalec...[107] b) příslušnost ke skupině lidí – sufix –(ov)ec tvoří především pojmenování od základu vlastních jmen: májovec, aristotelovec, Přemyslovec, bolzanovec, hitlerovec, lumírovec, baťovec...[108] Ze seznamu proto vyřadíme substantiva začínající velkým písmenem[109], mohli bychom také vyřadit většinu slov se zakončením na –ovec, kterých je v seznamu 159, ne vždy se však jedná o odvozená slova (např. vdovec) nebo nejde o deriváty ze substantiv (např. deadjektiva typu hladovec, nebo deverbativa typu lovec). 3. NÁZVY SPECIFIKAČNÍ Tato pojmenování slouží terminologickým okruhům slovní zásoby. Derivaci slouží řada různých prostředků, mezi kterými se vyskytuje i sufix –ec: smyčec, dílec, rámec, jehlanec, praporec, dvorec, vzorec, vlasec, měšec, červec, pražec...[110] Tato substantiva musíme ze seznamu vyřadit „ručně“. 5.1.1.1.2 Vyřazení deadjektiv 1. NÁZVY NOSITELŮ VLASTNOSTÍ Mezi jmény nositelů vlastností rodu mužského zaujímá slovotvorný typ s příponou –ec/-c- přední místo[111]. V tomto případě se sufix –ec připojuje k většině základů zakončených na V+K, popř. spojení slabikotvorného l+K: blbec, zbabělec, lakomec, zazobanec, surovec, ryzec...[112] Názvy nositelů vlastností můžeme vyřazovat tvořením derivačních pravidel pro tato deadjektiva (praktická ukázka viz kapitola 5.1.1.2.1, oddíl I.). Pozn. tato deadjektiva získáme s pomocí derivačního rozhraní: v Derivu např. vyhledáme dvojice, kdy odvozeným slovem je substantivum na .*atec se značkou k1gMnSc1[113] a základovým slovem je adjektivum zakončené na .*atý se značkou k2eAgMnSc1d1[114], podobně získáme i další jména nositelů vlastností. 5.1.1.1.3 Další vyřazování 1. NEGACE Z praktických důvodů vyřadíme slova se záporkou ne-, v seznamu se jich totiž objevuje přes 80, většina z nich se navíc neodvozuje ze sloves (např. neárijec, nechápavec), pokud se objevují deverbativa, jsou v seznamu i bez záporky (např. neplavec viz plavec). Pozn. jména se záporkou ne- můžeme vyřadit tím, že při tvoření derivačních pravidel zadáváme ke značkám, která označují slovesa, písmenka eA (= afirmace negace). 2. JMÉNA PROSTŘEDKŮ Tyto názvy jsme vyřadili již tím, že jsme vygenerovali pouze substantiva rodu mužského životného a jména prostředků mají rod mužský neživotný. Názvy prostředků nejsou předmětem naší práce, i když se jedná o deverbativa. Bylo by však dobré zmínit, že jde o deverbativa vyjadřující prostředek (V > S[instr ]: bodat – bodec). 5.1.1.2 Deverbativa na –ec vyjadřující agens Při tvorbě derivačních pravidel (respektive při vyřazování substantiv rodu mužského životného na –ec, která nevyjadřují agens) se budeme řídit některými charakteristikami, které jsou uvedeny v odborných publikacích (viz kapitola 3.1.1.2 Deverbativa vyjadřující agens na –ec). Vycházíme např. z toho, že se sufix –ec připojuje k základům nedokonavých (neprefigovaných sloves), proto budeme při práci s derivačním rozhraním používat u sloves značku k5eAaImF (nedokonavé sloveso v infinitivu, afirmace negace). 5.1.1.2.1 Připojování sufixu –ec ke slovesným základům bez infinitivní kmenotvorné přípony Při formulaci derivačních pravidel pro tvoření deverbativ vyjadřujících agens získáme automatickým vygenerování v některých případech i deverbativa vyjadřující patiens, protože však tímto způsobem nezískáme velký počet těchto deverbativ, systematičtější popis deverbativ vyjadřujících patiens jsme proto zařadili do kapitoly 5.1.1.3 Deverbativa vyjadřující patiens. V této kapitole půjde o změnu sémantické role (klasicky mutace): V > S[ag]. I. Slovesný základ bez infinitivní kmenotvorné přípony –i–: Pokud bychom postupovali podobným způsobem jako v případě sufixu –ce (http://deb.fi.muni.cz/deriv/)[115], systém vygeneruje 57 dvojic, většina slov však nevyhovuje (dochází buď k přegenerování, nebo slova nepatří k tomuto slovotvornému typu, do slovotvorné kategorie činitelských jmen). hledání slovních tvarů, dvojic, trojic, xxx-tice práce s obsahem souborů, soubory, adresáři Hledání značka: k1gMnSc1 RE: ec$ značka: k5eAaImF nahrazované: it$ nahrazující: ec uložit do souboru: Kolarova/sufix_ec/ec_it vyhledat Obrázek č. 9: Ukázka práce s nástrojem Deriv – Hledání dvojic Důvodem je polyfunkčnost tohoto sufixu. Proto budeme při hledání kandidátů na činitelská jména zakončená sufixem –ec postupovat vylučovací metodou, viz následující tabulka: Kandidát na ČJ Základové sloveso Důvod nezařazení k tomuto typu x babec babit jiný typ/jiná kategorie x bachratec bachratit JNV[116]: .*(a)tý-.*(a)tec/.*(a)tit P batolec[117] batolit x blahověstec blahověstit kompozitum x bohatec bohatit JNV: .*(a)tý-.*(a)tec/.*(a)tit P červec červit x hlušec hlušit JNV: .*(u)chý-.*(u)šec/.*(u)šit x holec holit JNV: .*(o)lý-.*(o)lec/.*(o)lit P honec honit x hranatec hranatit JNV: .*(a)tý-.*(a)tec/.*(a)tit x hrbatec hrbatit JNV: .*(a)tý-.*(a)tec/.*(a)tit x hřebec hřebit neodvozené x huňatec huňatit JNV: .*(a)tý-.*(a)tec/.*(a)tit x chlupatec chlupatit JNV: .*(a)tý-.*(a)tec/.*(a)tit P chodec chodit x chromec chromit JNV: .*(o)mý-.*(o)mec/.*(o)mit P jezdec jezdit x ježatec ježatit JNV: .*(a)tý-.*(a)tec/.*(a)tit P jistec jistit x kanec kanit neodvozené P kolec kolit P kosec kosit x kostrbatec kostrbatit JNV: .*(a)tý-.*(a)tec/.*(a)tit x krvavec krvavit JNV: .*(a)vý-.*(a)vec/.*(a)vit x kupec kupit přegenerování x lakomec lakomit JNV: .*(o)mý-.*(o)mec/.*(o)mit x lakotec lakotit JNV: viz lakomec P lovec lovit P měnec měnit P mluvec mluvit x mrtvec mrtvit JNV: .*vý-.*vec/.*vit x mrzutec mrzutit JNV: .*(u)tý-.*(u)tec/.*(u)tit P nořec nořit x ošklivec ošklivit JNV: .*(i)vý-.*(i)vec/.*(i)vit x pastvec[118] pastvit jiný typ/jiná kategorie x pitomec pitomit JNV: .*()mý-.*(o)mec/.*(o)mit P plavec plavit x protivec protivit neodvozené (viz protivník) P skrbec skrbit P skrblec skrblit x slabec slabit JNV: .*(a)bý-.*(a)bec/.*(a)bit x smělec smělit JNV: .*(ě)lý-.*(ě)lec/.*(ě)lit x smrtec smrtit jiný typ/jiná kategorie P sobec sobit[119] x sršatec sršatit JNV: .*(a)tý-.*(a)tec/.*(a)tit x stálec stálit JNV: .*(á)lý-.*(á)lec x stranec stranit jiný typ/jiná kategorie x světec světit JNV: .*(a)tý-.*(ě)tec/.*(ě)tit x šupinatec šupinatit JNV: .*(a)tý-.*(a)tec/.*(a)tit x tupec tupit JNV: .*(u)pý-.*(u)pec/.*(u)pit x vdovec vdovit neodvozené P věstec věstit P věštec věštit x vzteklec vzteklit JNV: .*lý-.*lec/.*lit x zubatec zubatit JNV: .*(a)tý-.*(a)tec/.*(a)tit x žabec žabit jiný typ x ženec ženit přegenerování Ÿ z praktických důvodů vyřadíme kompozita, která se nepodařila odstranit automatickým generováním[120]; Ÿ dále vyřadíme nevyhovující slovotvorné typy, zejména deadjektiva (jména nositelů vlastností), popř. deverbativa vyjadřující patiens[121], pozn. tato deadjektiva získáme s pomocí derivačního rozhraní: v Derivu např. vyhledáme dvojice, kdy odvozeným slovem je substantivum na .*atec se značkou k1gMnSc1[122] a základovým slovem je adjektivum zakončené na .*atý se značkou k2eAgMnSc1d1[123], podobně získáme i další jména nositelů vlastností[124]; Ÿ odstraníme také slova, která nejsou odvozená (?hřebit - ?hřebec), nebo tato slova patří do jiné slovotvorné kategorie (?žabit - ?žabec).; Ÿ nakonec odstraníme slova, která sice patří k tomuto slovotvornému typu, ale jsou odvozená jiným způsobem, dochází tak k přegenerování: např. ?kupit – kupec, ?ženit – ženec[125]); Ÿ zbytek dvojic, tzn. osmnáct slov jsou hledaná deverbativa vyjadřující agens. Shrnutí: Systém podle zadání v obrázku č. 9 automaticky vygeneroval 57 dvojic, pouze v 18 případech jde o činitelská jména (deverbativa vyjadřující agens), 36 vygenerovaných jmen patří k jinému slovotvornému typu (většinou jde o deadjektiva/deverbativa vyjadřující patiens – viz tabulka), v jednom případě jde o kompozita a ve dvou případech došlo k přegenerování. II. Slovesný základ bez infinitivní kmenotvorné přípony –a–: Pokud k základovému slovu zadáme příponu –at, systém vygeneruje 28 dvojic, pouze ve třech případech jde o činitelská jména (deverbativa vyjadřující agens): P hryzat – hryzec, P plavat – plavec, P tepat – tepec. 17 vygenerovaných jmen patří k jinému slovotvornému typu (např. bratrovec, chromec, sládkovec, svalovec...) a v osmi případech došlo k přegenerování (např. ?hudat – hudec, ?poutat - poutec[126], ?zpěvat – zpěvec). III. Slovesný základ bez infinitivní kmenotvorné přípony –ova–: Soubor ec-ovat obsahuje 26 dvojic, v šesti případech jde o činitelská jména (deverbativa vyjadřující agens): P bojovat – bojec, P kupovat – kupec, P lyžovat – lyžec, P milovat – milec, P rozumovat – rozumec, P zpytovat – zpytec. K jinému slovotvornému typu patří dvanáct vygenerovaných jmen (např. biskupec, chorec, chromec, ošklivec, protivec, slepec...). K přegenerování došlo opět v osmi případech (např. ?honovat – honec, ?letovat – letec, ?litovat – litec, ?tepovat – tepec atd.). Zvláštním typem jsou činitelská jména na –ec (–ovec) opírající se o desubstantivní slovesa s minulým kmenem –ova–: P sport – sportovat – sportovec, P šprým – šprýmovat – šprýmovec, P trh – trhovat – trhovec, P verš – veršovat – veršovec. V tomto případě jsem využili funkci Hledání trojic: hledání slovních tvarů, dvojic, trojic, xxx-tice práce s obsahem souborů, soubory, adresáři Hledání značka: k1gMnSc1 RE: ovec$ značka: k1gInSc1 nahrazované: $ nahrazující: ovec značka: k5eAaImF nahrazované: ovat$ nahrazující: ovec uložit do souboru: Kolarova/sufix_ec/ovec_0_ovat vyhledat Obrázek č. 10: Ukázka práce s nástrojem Deriv – Hledání trojic Systém tímto způsobem vygeneroval sedm trojic, ve třech případech došlo k přegenerování: ?kyt – ?kytovat – ?kytovec, ?pás – ?pásovat – ?pásovec, ?sval – ?svalovat – ?svalovec. IV. Slovesný základ bez infinitivní kmenotvorné přípony –e/ě–: Pokud k základovému slovu zadáme příponu –et, systém vygeneruje pouze dvojici: P běžet – běžec. Pokud však k základovému slovu zadáme příponu –ět, získáme 58 dvojic, pouze ve čtyřech případech jde o činitelská jména (deverbativa vyjadřující agens): P letět – letec, P pištět[127] – pištec, P vědět – vědec, P vidět – videc. 52 vygenerovaných jmen patří k jinému slovotvornému typu (většinou jde o deadjektiva/deverbativa vyjadřující patiens)[128], v jednom případě jde o kompozita a v jednom případě došlo k přegenerování: ?plavět – plavec. 5.1.1.2.2 Další tvoření činitelských jmen na –ec I. Tvoření činitelských jmen na –ec od sloves s kmenem minulým bez přípony: n .*(j)e (k5eAaImIp3nS) – .*(j)ec (k1gMnSc1) Systém vygeneroval 17 dvojic, získáme také činitelská jména s variantou –jec: P bít – bijec, P kout – kujec, P lít – lijec, P rýt – ryjec. Správně vygenerované jsou i tyto dvojice: P houst – hudec, P lézt – lezec, P hnát – ženec, P žít, žnout – žnec. V osmi případech došlo k přegenerování. II. Další varianty sufixu –ec při tvoření tohoto typu činitelských jmen: a) varianta –vec: n .*je (k5eAaImIp3nS) – .*vec (k1gMnSc1) Tímto zadáním jsme získali tři dvojice, pouze dvě však byly vygenerovány správně: P pět – pěvec; P sát – savec. Dále jsme získali kompozitum chvalopěvec. n .*ije (k5eAaImIp3nS) – .*vec (k1gMnSc1) Systém automaticky vygeneroval dvojici: P šít – švec. Pozn. činitelské jméno švec je již téměř neprůhledné a izolované, jeho etymologický derivační vztah ke slovesu šít je zastřen[129]. b) varianta –lec: Jména s variantou –lec jsou někdy na pomezí deverbativ vyjadřujících agens a deverbativ vyjadřujících patiens. Následující výčet jmen však považujeme za deverbativa vyjadřující agens – přihlédli jsme k jejich činitelskému významu, ke slovníkovým interpretacím a k interpretacím uvedeným v mluvnicích, např. MČ1 uvádí, že „variantou –lec je odvozeno několik názvů od otevřených minulých kmenů; opírají se o dějová adjektiva, mají však význam činitelský“[130]. Odvozeniny této kategorie (neplatí jen pro variantu –lec), které jsou fundovány dějovými adjektivy, se s názvy činitelskými (deverbativy vyjadřující agens) úzce stýkají (např. hltavec – hltat, hltavý; váhavec – váhat, váhavý), dále viz kapitola 5.1.1.3.1 Derivace deverbativ vyjadřujících patiens, respektive kapitoly 5.1.1.3.1.1, 5.1.1.3.1.2. n .*ít (k5eAaImF) – .*ělec (k1gMnSc1) Systém automaticky vygeneroval dvě dvojice: P bdít – bdělec, v případě dvojic ?smít – ?smělec došlo k přegenerování. n .*it (k5eAaImF) – .*ilec (k1gMnSc1) Tímto zadáním získáme tři dvojice: P bloudit – bloudilec; P hýřit – hýřilec; P žvanit – žvanilec. n .*ět (k5eAaImF) – .*ělec (k1gMnSc1) Systém vygeneroval dvojici: P umět – umělec, také kompozitum všeumělec, k přegenerování došlo v jednom případě. n .*át (k5eAaImF) – .*alec (k1gMnSc1) Nástroj Deriv automaticky vygeneroval dvě dvojice: P znát – znalec, v jednom případě však došlo k přegenerování. c) varianta –dlec[131]: n .*át (k5eAaImF) – .*adlec (k1gMnSc1) Tímto zadáním získáme dvě dvojice: P tkát – tkadlec (kadlec), v případě dvojice ?kát – kadlec došlo k přegenerování, protože deverbativum kadlec je derivováno také od slovesa tkát. d) zvláštní tvoření: n .*š (k5eAaImRp2nS) – .*sec (k1gMnSc1) Systém vygeneroval pouze dvojici: P psát – pisec. n .*rát (k5eAaImF) – .*erec (k1gMnSc1) Kromě hledané dvojice: P hrát – herec získáme i kompozitum spoluherec. n .*ilovat (k5eAaImF) – .*ilenec (k1gMnSc1) Kromě hledané dvojice: P milovat – milenec získáme i dvojici, která nepatří do této kategorie. Pozn. Substantivum milenec[132] se neopírá o přídavné jméno milený (= milovaný, milý), ale pociťuje se jako odvozené od kořene slovesa milovat formantem –enec s významem aktivním, činitelským[133]. Proto ho zařazujeme k deverbativům, která vyjadřují agens. III. Připojování sufixu –ec zároveň ke slovesům i k dějovým jménům: I u tvoření činitelských jmen na –ec může být základem pro odvozování zároveň sloveso i dějové jméno. Na rozdíl od slovotvorného typu na –ce je zde však významový vztah ke slovesu téměř vždy těsnější než k dějovému jménu[134]. Pokud pomineme složeniny, u kterých se postup derivace spojuje s postupem kompozičním, o sloveso a zároveň i o dějové jméno se opírají následující činitelská jména: a) .*a (k1gFnSc1) – .*ět (k5eAaImF) – .*ec (k1gMnSc1) Systém vygeneroval tři trojice, ale správně je vygenerována pouze trojice: věda – vědět – vědec. Pozn. Spojení s dějovým jménem je v případě sufixu –ec volnější, proto jsou trojice uvedeny pouze informativně; nejde o vyhledání všech činitelských jmen na –ec, která se mohou derivovat z dějových jmen (jak tomu bylo v případě sufixu –ce). b) .*h (k1gInSc1) – .*hat (k5eAaImF) – .*žec (k1gMnSc1) Získáme dvě správně vygenerované trojice: běh – běhat – běžec, tah – tahat – tažec. c) .* (k1gInSc1) – .*it – .*ec (k1gMnSc1) Při tomto zadání získáme 10 dvojic, jen některé jsou však vygenerovány správně, např. hon – honit – honec, lov – lovit – lovec; použít by se dali i trojice chod[135] – chodit – chodec, jezd[136] – jezdit – jezdec, mluv[137] – mluvit – mluvec; u zbylých trojic došlo k přegenerování. Pozn. Podobně by se dali tvořit i další trojice, v této části (u sufixu –ec) však nejde o vyhledání všech činitelských jmen na –ec, která se mohou derivovat z dějových jmen. Chtěli jsme pouze poukázat na to, že je toto tvoření možné. d) varianta –tec Zvláštní situace je u činitelských jmen s variantou –tec (bitec, litec, pitec, rytec, žatec): jde o případy, kdy je prézentní kmenotvorné –j– nahrazeno –t–, ačkoliv nejde o pasivní význam (viz bijec – bitec, lijec – litec...). Hlásková podoba těchto činitelských jmen ukazuje jednoznačně k podstatnému jménu slovesnému (bití, lití, pití, rytí a žatí/žetí), (formální blízkost k příčestím trpným bit, lit, pit, ryt, žat je neutralizována jednoznačně aktivním významem činitelských jmen). Protože se však podstatná jména slovesná liší od ostatních dějových jmen svou bezprostřední včleněností do slovesného systému, je tím zprostředkován i poměrně těsný vztah těchto jmen k finitním tvarům slovesným. Pokud se vztah k finitnímu systému slovesa cítí jako dominantní, chápou se činitelská jména tohoto typu, jako by byla odvozena ze slovesného kořene variantou –tec: li-tec = kdo li-je srv. litec = kdo se zabývá litím[138]. n .*tí (k1gNnSc1) – .*t (k5eAaImNgMnS) – .*tec (k1gMnSc1) Tímto zadáním jsme získali 5 trojic, pouze 4 jsou vygenerovány správně: P bití – bít – bitec, P lití – lít – litec, P pití – pít – pitec, P rytí – rýt – rytec. Činitelské jméno žatec[139] získáme tímto zadáním: n .*ne (k5eAaImIp3nS) – .*t (k5eAaImNgMnS) – .*tec (k1gMnSc1) P žít, žnout – žatec. 5.1.1.2.3 Alternace v kořeni Alternace nejsou tak časté jako v případě tvoření deverbativ sufixem –ce, ale přesto k některým alternacím dochází. Mimo jiné jde o nespisovné podoby slov jako správce – *správec, zástupce – *zástupec, zrádce – *zrádec.. Při práci s webovým rozhraním Deriv nacházíme alternace samohláskové i souhláskové. Pozn. Alternující dvojice v rámci derivace (deverbativ vyjadřujících agens na –ec) od dějových jmen nebudeme uvádět do tabulky v kapitole 5.2.1.1; slouží pouze k tomu, abychom měli o těchto alternacích přehled. 5.1.1.2.3.1 Samohláskové alternace 1. samohlásková alternace á/a: n .*á.it/.*a.ec (k5eAaImF/k1gMnSc1) Tímto způsobem jsme získali tři dvojice, pouze dvě jsou vygenerovány správně: P bránit – branec[140], P mlátit – mlatec. 2. samohlásková alternace é/e: n .*é.at/.*e.ec (k5eAaImF/k1gMnSc1) Systém vygeneroval dvě dvojice: P létat – letec, P lézat (= lézt) – lezec. 3. samohlásková alternace í/ě: n a) .*í.at/.*ě.ec (k5eAaImF/k1gMnSc1) Tímto způsobem jsme získali sedm dvojic, pouze jedna je však vygenerována správně: P zpívat – zpěvec. n b) .*í.a/.*ě.ec (k1gFnSc1/k1gMnSc1) Systém vygeneroval 3 dvojice: P víra – věrec. Při tomto zadání systém automaticky vygeneroval také kompozitum a činitelské jméno se záporkou ne-. 4. samohlásková alternace í/e: n a) .*í.et/.*e.ec (k5eAaImF/k1gMnSc1) Nástroj Deriv automaticky vygeneroval dvojici: P střílet – střelec. n b) .*í..a/.*e..ec (k1gFnSc1/k1gMnSc1) Získáme tři dvojice: P jízda – jezdec; a také dvě kompozita (krasojezdec, spolujezdec). 5. samohlásková alternace ou/u: n a) .*ou.ě/.*u.ec (k1gFnSc1/k1gMnSc1) P koupě – kupec. n b) .*ou.it/.*u.ec (k5eAaImF/k1gMnSc1) Při tomto zadání je automaticky vygenerováno pět dvojic, správně vygenerovaná je však jen jedna dvojice: P troubit – trubec[141]. 6. samohlásková alternace u/ou: n .*u.ovat/.*ou.ec (k5eAaImF/k1gMnSc1) Systém automaticky vygeneroval dvojici: P putovat – poutec[142]. 5.1.1.2.3.2 Souhláskové alternace 1. souhlásková alternace h/ž: n .*hat/.*žec (k5eAaImF/k1gMnSc1) Systém vygeneroval dvě dvojice: P běhat – běžec, P tahat – tažec. 2. souhlásková alternace ř/r: n .*řit/.*rec (k5eAaImF/k1gMnSc1) Systém vygeneroval pět dvojic, pouze tři dvojice jsou vygenerované správně: P bořit – borec[143], P nořit – norec, P věřit – věrec; ve dvou případech došlo k přegenerování. 3. souhlásková alternace r/ř: n .*rovat/.*řec (k5eAaImF/k1gMnSc1) Systém vygeneroval dvě dvojice: P mudrovat – mudřec, v případě dvojice ?norovat – nořec došlo k přegenerování. 5.1.1.3 Deverbativa vyjadřující patiens Jak už jsme se zmiňovali v teoretické části (viz kapitola 3.1.2 DEVERBATIVA VYJADŘUJÍCÍ PATIENS), pro tento typ odvozování není v českých mluvnicích určena samostatná kategorie. Předmětem této práce jsou hlavně deverbativa vyjadřující agens (pokud jde však o činitelská jména derivovaná sufixem –ec, můžeme si všimnout, že některé varianty tohoto sufixu mají blízko i k této kategorii), proto se pokusíme mezi těmito kategoriemi vymezit rozdíl, i když ne vždy to bude úplně jednoznačné (viz různé varianty sufixu –ec). Tato kapitola tedy bude spíše informativní, nechceme dělat složité výčty všech deverbativ vyjadřujících patiens, ale pouze poukázat na některé rozdíly v derivaci oproti deverbativům vyjadřujícím agens a naznačit způsoby, jakými lze tato deverbativa tvořit, respektive způsoby, jakými lze vytvářet derivační pravidla pro automatickou derivaci deverbativ vyjadřujících patiens. 5.1.1.3.1 Derivace deverbativ vyjadřujících patiens Přípona –ec se v případě, že deverbativum vyjadřuje patiens nepojí ke kořeni, ale k příčestí trpnému. Výjimkou jsou však činitelská jména s variantou –tec[144] (bitec, litec, pitec, rytec, žatec); zde –t– neinterpretujeme jako tvarovou koncovku pasivního participia, ale jako „konekt“, který je součástí různých variant sufixu –ec, stejně jako –j– v analogických případech derivátů od sloves 3. třídy, vzor krýt (bijec, lijec...). Podobná situace je i u činitelských jmen s jinými variantami sufixu –ec (např. umělec, znalec, milenec...). Deverbativa vyjadřující patiens se mohou tvořit i od dokonavých prefigovaných sloves (x deverbativa na –ec vyjadřující agens). V případě deverbativ vyjadřujících patiens jde o změnu sémantické role (klasicky mutace): V > S[pat]. 5.1.1.3.1.1 Derivace z přídavných jmen na –vý Jde o deverbativa, která mají vztah i k adjektivům, proto zde využijeme funkci Hledání trojic: hledání slovních tvarů, dvojic, trojic, xxx-tice práce s obsahem souborů, soubory, adresáři Hledání značka: k1gMnSc1 RE: avec$ značka: k5eA.*mAgMnS nahrazované: al$ nahrazující: avec značka: k2eAgMnSc1d1 nahrazované: avý$ nahrazující: avec uložit do souboru: Kolarova/sufix_ec/al_avý_avec vyhledat Obrázek č. 11: Ukázka práce s nástrojem Deriv – Hledání trojic n a) .*al (k5eA.*mAgMnS) – .*avý (k2eAgMnSc1d1) – .*avec (k1gMnSc1) Nástroj Deriv při tomto zadání automaticky vygeneruje 61 trojic, ve většině případech jde o hledaná deverbativa vyjadřující patiens, např. : dolézat – (dolézavý), dolézavec; hádat – (hádavý), hádavec; hlodat – (hlodavý), hlodavec; hltat – (hltavý), hltavec; lekat – (lekavý), lekavec; pajdat – (pajdavý), pajdavec, podezírat – (podezíravý), podezíravec; váhat – (váhavý), váhavec; atd. Pozn. Případy přegenerování zde (ani v jednom bodě) neuvádíme, protože nám nejde o úplný výčet všech deverbativ této kategorie, ale pouze o naznačení, jakým způsobem můžeme tato deverbativa automaticky generovat. n b) .*il (k5eA.*mAgMnS) – .*ivý (k2eAgMnSc1d1) – .*ivec (k1gMnSc1) Systém vygeneroval 43 trojic, tím jsme získali např. tato deverbativa vyjadřující patiens: bláznit – (bláznivý), bláznivec; chlubit – (chlubivý), chlubivec; toužit – (touživý), touživec; spořit – (spořivý), spořivec; zuřit – (zuřivý), zuřivec; atd. n c) .*el (k5eA.*mAgMnS) – .*ivý (k2eAgMnSc1d1) – .*ivec (k1gMnSc1) Získáme čtyři trojice, např.: domýšlet – (domýšlivý), domýšlivec; přemýšlet – (přemýšlivý), přemýšlivec. n d) .*oval (k5eA.*mAgMnS) – .*ivý (k2eAgMnSc1d1) – .*ivec (k1gMnSc1) Při tomto zadání systém vygeneroval sedm trojic, např.: důvěřovat – (důvěřivý), důvěřivec; přizpůsobovat – (přizpůsobivý), přizpůsobivec. 5.1.1.3.1.2 Derivace z přídavných jmen od příčestí l-ových, na –lý n a) .*il (k5eA.*mAgMnS) – .*ilý (k2eAgMnSc1d1) – .*ilec (k1gMnSc1) Nástroj Deriv automaticky vygeneroval 38 dvojic, tím jsme získali např. tato deverbativa vyjadřující patiens: odrodit – (odrodilý), odrodilec; opít – (opilý), opilec; opozdit – (opozdilý), opozdilec; otužit – (otužilý), otužilec; provinit – (provinilý), provinilec; vysloužit – (vysloužilý), vysloužilec; zbloudit – (zbloudilý), zbloudilec; zpozdit – (zpozdilý), zpozdilec; atd. n b) .*ěl (k5eA.*mAgMnS) – .*ělý (k2eAgMnSc1d1) – .*ělec (k1gMnSc1) Systém vygeneroval 25 trojic, např.: dospět – (dospělý), dospělec; osamět – (osamělý), osamělec; ovdovět – (ovdovělý), ovdovělec. n c) .*el (k5eA.*mAgMnS) – .*elý (k2eAgMnSc1d1) – .*elec (k1gMnSc1) Při tomto zadání jsme jedenáct trojic, např.: osiřet – (osiřelý), osiřelec; pohořet – (pohořelý), pohořelec. n d) .*al (k5eA.*mAgMnS) – .*alý (k2eAgMnSc1d1) – .*alec (k1gMnSc1) Při tomto zadání nástroj Deriv automaticky vygeneroval dvacet dvojic, např.: povstat – (povstalý), povstalec; přicestovat – (přicestovalý), přicestovalec; přistěhovat – (přistěhovalý), přistěhovalec; troufat – (troufalý), troufalec; vystěhovat – (vystěhovalý), vystěhovalec; vytrvat – (vytrvalý), vytrvalec; zaostat – (zaostalý), zaostalec; zchátrat – (zchátralý), zchátralec; zoufat – (zoufalý), zoufalec; atd. n e) .*il (k5eA.*mAgMnS) – .*ělý (k2eAgMnSc1d1) – .*ělec (k1gMnSc1) Systém vygeneroval osm dvojic, např. otupit – (otupělý), otupělec; uvědomit – (uvědomělý), uvědomělec. 5.1.1.3.1.3 Derivace z přídavných jmen od příčestí trpných I. Od příčestí n-ových: Pro automatické generování použijeme tvary příčestí trpného (k5eA.*mNgMnS)[145] a funkci Hledání dvojic: hledání slovních tvarů, dvojic, trojic, xxx-tice práce s obsahem souborů, soubory, adresáři Hledání značka: k1gMnSc1 RE: anec$ značka: k5eA.*mNgMnS nahrazované: án$ nahrazující: anec uložit do souboru: Kolarova/sufix_ec/án_anec vyhledat Obrázek č. 12: Ukázka práce s nástrojem Deriv – Hledání dvojic n a) .*án (k5eA.*mNgMnS) – .*anec (k1gMnSc1) Systém při tomto zadání vygeneruje 102 dvojic[146], mezi nimiž nacházíme i hledaná deverbativa vyjadřující patiens, např.[147]: biřmovat – biřmovanec; hnát – hnanec; obřezat – obřezanec; obžalovat – obžalovanec; očkovat – očkovanec; ošetřovat – ošetřovanec; pronásledovat – pronásledovanec; schovat – schovanec; spoutat – spoutanec; štvát – štvanec; trestat – trestanec; vylekat – vylekanec; vzdělat – vzdělanec; zaměstnat – zaměstnanec; zanedbat – zanedbanec; zaprodat – zaprodanec; atd. n b) .*en (k5eA.*mNgMnS) – .*enec (k1gMnSc1) Při tomto zadání nástroj Deriv vygeneruje 250 dvojic, např.: cvičit – cvičenec; dělit – dělenec; doporučit – doporučenec; kojit – kojenec; mísit – míšenec; mučit – mučenec; nalézt – nalezenec; násobit – násobenec; nasytit – nasycenec; oběsit – oběšenec; oblíbit – oblíbenec; odsoudit – odsouzenec; odvést – odvedenec; oslavit – oslavenec; ozbrojit – ozbrojenec; pobouřit – pobouřenec; pověřit – pověřenec; soudit – souzenec; spojit – spojenec; spolčit – spolčenec; svěřit – svěřenec; učit – učenec; utopit – utopenec; volit – volenec; vyvrhnout – vyvrženec; vzbouřit – vzbouřenec; zkoušet – zkoušenec; atd. n c) .*ěn (k5eA.*mNgMnS) – .*ěnec (k1gMnSc1) Nástroj Deriv vygeneroval 57 dvojic, např.: chránit – chráněnec; kleštit – kleštěnec; křtít – křtěnec; mocnit – mocněnec; pěstit – pěstěnec; pojistit – pojištěnec; propustit – propuštěnec; uvěznit – uvězněnec; uvolnit – uvolněnec; vydědit – vyděděnec; vyhostit – vyhoštěnec; zachránit – zachráněnec. zmocnit – zmocněnec; atd. II. Od příčestí t-ových: n a) .*at (k5eA.*mNgMnS) – .*atec (k1gMnSc1) Systém při tomto zadání vygeneroval osm dvojic, např.: zajmout – zajatec. n b) .*ut (k5eA.*mNgMnS) – .*utec (k1gMnSc1) Získáme čtyři dvojice, např.: nadout – nadutec. n b) .*et (k5eA.*mNgMnS) – .*etec (k1gMnSc1) Získali jsme dvě dvojice, např.: zaklít – zakletec. Výčet těchto deverbativ vyjadřujících patiens, respektive výčet tvoření těchto deverbativ jistě není vyčerpávající, nicméně naše účely splňuje, protože jsme nastínili způsob automatické derivace těchto deverbativ. 5.1.2 KORPUSY ČNK Opět budeme pracovat s korpusy SYN2000, SYN2005 a SYN2006PUB. Postup práce však tentokrát předvedeme na korpusu SYN2005. 5.1.2.1 Konstrukce dotazu v korpusu Popis práce s korpusovým manažerem Bonito jsme popsali v kapitole týkající se sufixu –ce (4.1.2), proto nyní jen stručně naznačíme, jak jsme postupovali v případě sufixu –ec. Nyní půjde hlavně o to, abychom zjistili frekvenci jednotlivých deverbativ (ať už jde o ta, která vyjadřují agens nebo o ta, která vyjadřují patiens). Po spuštění programu Bonito zadáme jako implicitní atribut lemma a do dotazovacího řádku zadáme .*ec, abychom našli výskyty slov končící na –ec. Positivním filtrem vybereme ze seznamu pouze životná maskulina: zvolíme položku P filtr, jako implicitní atribut nastavíme tag a zadáme dotaz N.M.* Pomocí frekvenční distribuce[148] zjistíme, že se v tomto korpusu[149] vyskytuje 2081 životných maskulin zakončených na –ec. Z následujícího seznamu lemmat je jasné, že nejde jen o deverbativa, ukazuje to hned prvních pět nejfrekventovanějších slov/lemmat – otec, zaměstnanec, chlapec, poslanec, Němec.[150] Je to způsobeno tím, že sufix –ec je sufixem polyfunkčním, tzn. že se používá i v jiných slovotvorných kategoriích, a to: ¡ u jmen konatelských – dějepisec, přírodozpytec, bohoslovec...; ¡ u jmen obyvatelských – Korejec, Portugalec...; ¡ u jmen, která vyjadřují příslušnost k určité skupině lidí – májovec, Přemyslovec...; ¡ u názvů specifikačních – dvorec, vlasec, měšec...; ¡ u názvů nositelů vlastností – zbabělec, lakomec, surovec... Pomocí manažeru Bonito můžeme vyřadit některá obyvatelská jména: zvolíme položku N filtr, nastavíme lemma jako implicitní atribut a zvolíme dotaz: (A|Á|B|C|Č|D|E|É|F|G|H|I|Í|J|K|L|M|N|O|P|Q|R|Ř|S|Š|T|U|V|W|X|Y|Z|Ž).* Tím ze seznamu lemmat vyřadíme slova začínající velkým písmenem. Pomocí frekvenční distribuce zjistíme, že počet životných maskulin zakončených na –ec klesl na 1282. Když však projdeme seznam lemmat podrobněji, zjistíme, že některá obyvatelská jména zde zůstala – např. argentinec, slovinec..., což je způsobeno chybným pravopisem nebo chybným tagem (některé takové chyby je možné přičíst na vrub používání guesserů[151]). U dalších slovotvorných kategorií je při vyřazování situace složitější: i když je korpus otagovaný, nepozná rozdíl mezi desubstantivními, deadjektivními a deverbálními substantivy, takže v tomto případě by muselo přijít na řadu „ruční“ vyřazování. 5.1.2.2 Srovnání dat z korpusů s nástrojem Deriv Také zde jsme si všímali deverbativ vyjadřujících agens/patiens, která se objevují v korpusech ČNK a zároveň nejsou automaticky generována pomocí pravidel formulovaných ve webovém rozhraní Deriv. Za zmínku stojí např. toto deverbativum: Ÿ zkrachovalec (od zkrachovat, zkrachovalý) – jde o deverbativum vyjadřující patiens (V>S[pat]) a nachází se v korpusu SYN2000 (6), SYN2005 (6) i v korpusu SYN2006PUB (11)[152]. 5.1.2.3 Význam získaných dat Data, která jsme nyní z jednotlivých korpusů získali, jsou v tomto případě důležitá hlavně ke zjištění frekvencí. Také díky nim můžeme zjišťovat kontexty[153] a kolokace. Tabulka nejfrekventovanějších deverbativ zakončených na –ce v jednotlivých korpusech ČNK[154]: SYN2000[155] SYN2005 SYN2006PUB poslanec (S[pat])[156] 25659 10753 97310 zaměstnanec (S[pat]) 20023 19271 76992 herec (S[ag]) 9614 9789 41039 umělec (S[ag]) 9116 9319 32527 vědec (S[ag]) 5405 6262 20093 střelec (S[ag]) 4484 2902 20100 sportovec (S[ag]) 3479 2073 14879 jezdec (S[ag]) 3285 2408 18995 spojenec (S[pat]) 2854 3495 10354 znalec (S[ag]) 2804 2848 12475 milenec (S[ag]) 2180 3798 11759 svěřenec (S[pat]) 1935 1267 4757 lovec (S[ag]) 1837 2343 3674 chodec (S[ag]) 1563 2400 10581 chovanec (S[pat]) 1517 899 7029 povstalec (S[pat]) 1510 882 6657 kupec (S[ag]) 1242 1404 5176 běžec (S[ag]) 1221 830 6226 zajatec (S[pat]) 1199 2022 3171 plavec (S[ag]) 1152 765 5267 letec (S[ag]) 1024 795 3251 Z tabulky je patrné, že mezi dvě nejfrekventovanější slova (dle korpusu SYN2000, SYN2005 i SYN2006PUB) patří deverbativa vyjadřující patiens, mezi jednadvaceti nejfrekventovanějšími deverbativy na –ec však převažují deverbativa vyjadřující agens. Pozn. V korpusu SYN2005 se mezi 21 nejfrekventovanějšími slovy objevuje opilec (1076), vyslanec (1046), přistěhovalec (1002). V SYN2006PUB se objevuje zmocněnec (3673), opět přistěhovalec (3407) a také ozbrojenec (3281). Kromě nejfrekventovanějších slov můžeme v korpusu najít také slova, která se nepoužívají (např. věstec[157]), slova, která se vyskytují převážně jako součást složenin (např. tepec – stříbrotepec; litec – kovolitec...) nebo slova, která se používají v jiném významu (např. činitelské jméno borec se v korpusech neobjevuje ve významu bořitel, ale ve významu „zápasník, bojovník“; „kdo v něčem vyniká“[158]). 5.2 ZPRACOVÁNÍ INFORMACÍ V kapitole 5.1.1 jsme při práci s nástrojem Deriv automaticky vygenerovali 1835 substantiv rodu mužského životného na –ec. V první řadě bylo naším úkolem tato substantiva roztřídit a navrhnout, jakým způsobem z tohoto obsáhlého seznamu získáme pouze deverbativa (vyjadřující agens/patiens). Navrhli jsme derivační pravidla, která teď shrneme a vytvoříme tak jednotlivé derivační vzory (viz kapitola 5.2.1 PRAVIDLA DERIVACE, VYTVOŘENÍ DERIVAČNÍCH VZORŮ). V rámci formulace pravidel se zaměříme na zachycení rozdílu mezi deverbativy, která vyjadřují agens a deverbativy, která vyjadřují patiens. Nakonec se pro každou tuto kategorii pokusíme formulovat formální pravidla (viz kapitola 4.3 FORMÁLNÍ PRAVIDLA DERIVACE DEVERBATIV NA –EC). 5.2.1 PRAVIDLA DERIVACE, VYTVOŘENÍ DERIVAČNÍCH VZORŮ Při tvorbě jednotlivých derivačních vzorů jsme vycházeli z informací, které jsme získali z webového rozhraní Deriv. Pro určení zástupce jednotlivého derivačního vzoru jsme ve většině případů opět použili nejfrekventovanější slovo z dané skupiny[159]. 5.2.1.1 Pravidla derivace, derivační vzory pro deverbativa vyjadřující agens Změna sémantické role: V > S[ag]. Derivační pravidlo Derivační vzor (počet dvojic) Počet přegenerovaných dvojic, (jiná kategorie)[160] 1) .*it/k5eAaImF > .*ec/k1gMnSc1 jezdit – jezdec (18) 2, (37) 2) .*it/k5eAaImF > .*ilec/k1gMnSc1 bloudit – bloudilec (3) 0, (0) 3) .*á.it/k5eAaImF > .*a.ec/k1gMnSc1 mlátit – mlatec (2) 1, (0) 4) .*ou.it/k5eAaImF > .*u.ec/k1gMnSc1 troubit – trubec (1) 3, (1) 5) .*řit/k5eAaImF > .*rec/k1gMnSc1 bořit – borec (3) 1, (1) 6) .*at/k5eAaImF > .*ec/k1gMnSc1 plavat – plavec (3) 8, (17) 7) .*é.at/k5eAaImF > .*e.ec/k1gMnSc1 létat – letec (2) 0, (0) 8) .*í.at/k5eAaImF > .*ě.ec/k1gMnSc1 zpívat – zpěvec (1) 5, (1) 9) .*hat/k5eAaImF > .*žec/k1gMnSc1 tahat – tažec (2) 0, (0) 10) .*ovat/k5eAaImF > .*ec/k1gMnSc1 kupovat – kupec (6) 8, (12) 11) .*ovat/k5eAaImF > .*ovec/k1gMnSc1 sportovat – sportovec (4) 3, (0) 12) .*ilovat/k5eAaImF > .*ilenec/k1gMnSc1 milovat – milenec (1) 0, (1) 13) .*u.ovat/k5eAaImF > .*ou.ec/k1gMnSc1 putovat – poutec (1) 0, (0) 14) .*rovat/k5eAaImF > .*řec/k1gMnSc1 mudrovat – mudřec (1) 1, (0) 15) .*et/k5eAaImF > .*ec/k1gMnSc1 běžet – běžec (1) 0, (0) 16) .*ět/k5eAaImF > .*ec/k1gMnSc1 vědět – vědec (4) 1, (53) 17) .*je/k5eAaImIp3nS > .*vec/k1gMnSc1 pět – pěvec (2) 0, (1) 18) .*ět/k5eAaImF > .*ělec/k1gMnSc1 umět – umělec (1) 1, (1) 19) .*í.et/k5eAaImF > .*e.ec/k1gMnSc1 střílet – střelec (1) 0, (0) 20) .*(j)e/k5eAaImIp3nS > .*(j)ec/k1gMnSc1 bít – bijec (4) lézt – lezec (4) 8, (0) 21) .*ije/k5eAaImIp3nS > .*vec/k1gMnSc1 šít – švec (1) 0, (0) 22) .*ít/k5eAaImF > .*ělec/k1gMnSc1 bdít – bdělec (1) 1, (0) 23) .*át/k5eAaImF > .*alec/k1gMnSc1 znát – znalec (1) 1, (0) 24) .*át/k5eAaImF > .*adlec/k1gMnSc1 tkát – tkadlec, kadlec (1) 1, (0) 25) .*š/k5eAaImRp2nS > .*sec/k1gMnSc1 psát – pisec (1) 0, (0) 26) .*át/k5eAaImF > .*erec/k1gMnSc1 hrát – herec (1) 0, (1) 27) .*t/k5eAaImNgMnS > .*tec/k1gMnSc1, .*tí/k1gMnSc1 > .*ělec/k1gMnSc1 bít – bití – bitec (4) 0, (1) 28) .*t/k5eAaImNgMnS, .*ne/k5eAaImIp3nS > .*tec/k1gMnSc1 žít, žnout – žatec (1) 0, (0) celkem 76 45, (127) n Pomocí 28 pravidel lze automaticky generovat celkem 121 (248) dvojic sloveso – substantivum zakončené na –ec. n 76 (62,8 %) je utvořeno správně. n 45 dvojic (37,2 %) je utvořeno nesprávně (přegenerováno). n 127 jmen patří k jiné slovotvorné kategorii. 5.2.1.2 Pravidla derivace, derivační vzory pro deverbativa vyjadřující patiens Změna sémantické role: V > S[pat]. Derivační pravidlo Derivační vzor Počet vygenerovaných dvojic[161] 1) .*al/k5eA.*mAgMnS (.*avý/k2eAgMnSc1d1) > .*avec/k1gMnSc1 váhat (váhavý) – váhavec 61 2) .*il/k5eA.*mAgMnS (.*ivý/k2eAgMnSc1d1) > .*ivec/k1gMnSc1 zuřit (zuřivý) – zuřivec 43 3) .*el/k5eA.*mAgMnS (.*ivý/k2eAgMnSc1d1) > .*ivec/k1gMnSc1 domýšlet (domýšlivý) – domýšlivec 4 4) .*oval/k5eA.*mAgMnS (.*ivý/k2eAgMnSc1d1) > .*ivec/k1gMnSc1 důvěřovat (důvěřivý) – důvěřivec 7 5) .*il/k5eA.*mAgMnS (.*ilý/k2eAgMnSc1d1) > .*ilec/k1gMnSc1 opít (opilý) – opilec 38 6) .*ěl/k5eA.*mAgMnS (.*ělý/k2eAgMnSc1d1) > .*ělec/k1gMnSc1 dospět (dospělý) – dospělec 25 7) .*el/k5eA.*mAgMnS (.*elý/k2eAgMnSc1d1) > .*elec/k1gMnSc1 osiřet (osiřelý) – osiřelec 11 8) .*al/k5eA.*mAgMnS (.*alý/k2eAgMnSc1d1) > .*alec/k1gMnSc1 povstat (povstalý) – povstalec 20 9) .*il/k5eA.*mAgMnS (.*ělý/k2eAgMnSc1d1) > .*ělec/k1gMnSc1 uvědomit (uvědomělý) – uvědomělec 8 10) .*án/k5eA.*mNgMnS > .*anec/k1gMnSc1 trestat – trestanec 102 11) .*en/k5eA.*mNgMnS > .*enec/k1gMnSc1 kojit – kojenec 250 12) .*ěn/k5eA.*mNgMnS > .*ěnec/k1gMnSc1 pojistit – pojištěnec 156 13) .*at/k5eA.*mNgMnS > .*atec/k1gMnSc1 zajmout – zajatec 8 14) .*ut/k5eA.*mNgMnS > .*utec/k1gMnSc1 nadout – nadutec 4 15) .*et/k5eA.*mNgMnS > .*etec/k1gMnSc1 zaklít – zakletec 2 celkem 739 n Pomocí 15 pravidel lze automaticky generovat celkem 739 dvojic sloveso (přídavné jméno/příčestí trpné) – substantivum zakončené na –ec. n Případy přegenerování jsme sem neuváděli, protože nám nešlo o úplný výčet všech deverbativ této kategorie, ale pouze o naznačení, jakým způsobem je můžeme automaticky vygenerovat. 5.3 FORMÁLNÍ PRAVIDLA DERIVACE DEVERBATIV NA –EC 5.3.1 FORMÁLNÍ PRAVIDLA DERIVACE DEVERBATIV VYJADŘUJÍCÍCH AGENS Na základě zjištěných informací z webového rozhraní Deriv, na základě zpracování dat v korpusech ČNK a s využitím teoretických prací jsme zjistili následující pravidla pro tento typ odvozování[162]: 1. Možnými kandidáty jmen činitelských (deverbativ vyjadřujících agens) na –ec jsou slova, jejichž lemma končí na –ec a zároveň jde o maskulina životná. 2. Pokud má jít o deverbativum vyjadřující agens (jméno činitelské), pak po formální stránce může po –(e)c, respektive po –c– u jednotlivých tvarů následovat pouze uvedený řetězec znaků: .*c(e|i|ů) nebo .*c(e|ů)m nebo .*cích nebo .*cov(i|é) nebo .*če. 3. Před sufixem –ec nemůže předcházet samohláska. 4. Základem pro tvoření deverbativ vyjadřujících agens jsou nedokonavá slovesa (neprefigovaná). Pozn. i u tvoření činitelských jmen na –ec může být základem pro odvozování zároveň sloveso i dějové jméno; významový vztah ke slovesu je však téměř vždy těsnější než k dějovému jménu, proto jsme tyto vztahy uváděli jen informativně a nezapojovali je do konečného shrnutí derivačních pravidel (viz tabulka 5.2.1.1). 5. Pokud se činitelské jméno zakončené sufixem –ec tvoří od slovesných základů bez kmenotvorné přípony –i–, jsou základovými slovesy slovesa 4. slovesné třídy (vzor trpí). Tato činitelská jména se tvoří odtržením infinitivní koncovky –t, odtržením kmenotvorné přípony –i– od základového slova a připojením sufixu –ec k vzniklému slovesnému základu. Derivační pravidlo 1), derivační vzor jezdit – jezdec (viz tabulka 5.2.1.1). 6. Pokud se činitelské jméno zakončené sufixem –ec tvoří od slovesných základů bez kmenotvorné přípony –a–, jsou základovými slovesy slovesa 5. slovesné třídy (vzor dělá). Tato činitelská jména se tvoří odtržením infinitivní koncovky –t, odtržením kmenotvorné přípony –a– od základového slova a připojením sufixu –ec k vzniklému slovesnému základu. Derivační pravidlo 18), derivační vzor plavat – plavec (viz tabulka 5.2.1.1). 7. Pokud se činitelské jméno zakončené sufixem –ec tvoří od slovesných základů bez kmenotvorné přípony –ova–, jsou základovými slovesy slovesa 3. slovesné třídy (vzor kupuje). Tato činitelská jména se tvoří odtržením infinitivní koncovky –t, odtržením kmenotvorné přípony –ova– od základového slova a připojením sufixu –ec k vzniklému slovesnému základu. Derivační pravidlo 10), derivační vzor kupovat – kupec (viz tabulka 5.2.1.1). Zvláštním typem jsou činitelská jména na –ec (–ovec) opírající se o desubstantivní slovesa s minulým kmenem –ova–, tato činitelská jména se v takovém případě tvoří odtržením koncovky –t, odtržením kmenotvorné přípony –ova– od základového slova a připojením sufixu –ovec k vzniklému slovesnému základu. Derivační pravidlo 11), derivační vzor sportovat – sportovec (viz tabulka 5.2.1.1). 8. Pokud se činitelské jméno zakončené sufixem –ec tvoří od slovesných základů bez kmenotvorné přípony –e/ě–, jsou základovými slovesy slovesa 4. slovesné třídy (vzor sázet, trpět). Tato činitelská jména se tvoří odtržením infinitivní koncovky –t, odtržením kmenotvorné přípony –e/ě– od základového slova a připojením sufixu –ec k vzniklému slovesnému základu. Derivační pravidlo 15) a 16), derivační vzory: běžet – běžec, vědět – vědec (viz tabulka 5.2.1.1). 9. Pokud tato činitelská jména na –ec derivují od sloves s kmenem minulým bez přípony, mohou se tvořit od indikativu prézentu 3. osoby singuláru odtržením koncovky –e a následným připojením sufixu –ec k vzniklému základu. Podobným způsobem můžeme derivovat i činitelská jména s variantou –jec. Derivační pravidlo 20), derivační vzory: lézt – lezec a bít – bijec (viz tabulka 5.2.1.1). 10. Pokud se při derivaci těchto činitelských jmen uplatňují různé varianty sufixu –ec, tzn. již výše zmíněná varianta –jec, dále varianta –vec, varianta –lec, varianta –dlec nebo varianta –tec, mohou se tato deverbativa vyjadřující agens tvořit různými způsoby: viz kapitola 5.1.1.2.2 Další tvoření činitelských jmen na –ec; derivační pravidla 2), 17), 18), 21) 22), 23), 24), 27), 28); derivační vzory: bloudit – bloudilec; pět – pěvec; umět – umělec; šít – švec; bdít – bdělec; znát – znalec; tkát – tkadlec, kadlec; bít – bitec; žít, žnout – žatec (viz tabulka 5.2.1.1). 11. Zvláštním způsobem se tvoří deverbativa vyjadřující agens, která jsou uvedena kapitole 5.1.1.2.2 Další tvoření činitelských jmen na –ec; oddíl II., bod d); derivační pravidla 12), 25), 26), derivační vzory: milovat – milenec, psát – pisec, hrát – herec (viz tabulka 5.2.1.1). 12. I při tvoření činitelských jmen na –ec dochází k alternacím, nejsou však tak časté, jak tomu bylo u sufixu –ce. Dochází k těmto samohláskovým alternacím: á/a, é/e, í/ě, í/e, ou/u, u/ou, a k těmto alternacím souhláskovým: h/ž, ř/r, r/ř: viz kapitola 5.1.1.2.3 Alternace v kořeni; derivační pravidla: 3), 4), 5), 7), 8), 9), 13), 14), 19); derivační vzory: mlátit – mlatec, troubit – trubec, bořit – borec, létat – letec, tahat – tažec, putovat – poutec, mudrovat – mudřec (viz tabulka 5.2.1.1). 5.3.2 FORMÁLNÍ PRAVIDLA DERIVACE DEVERBATIV VYJADŘUJÍCÍCH PATIENS Jelikož jsou předmětem této práce deverbativa vyjadřující agens, je část o deverbativech vyjadřujících patiens pouze informativní. Zde proto jen poukážeme na některé rozdíly v derivaci těchto deverbativ oproti deverbativům vyjadřujícím agens: 1. Přípona –ec se v případě, že deverbativum vyjadřuje patiens nepojí ke kořeni, ale k příčestí trpnému. Výjimkou jsou však některá činitelská jména, při jejichž derivaci se uplatňují různé varianty sufixu –ec (–jec, –vec, –lec, –dlec, –tec): viz kapitola 5.1.1.2.2 Další tvoření činitelských jmen na –ec a kapitola 5.1.1.3.1 Derivace deverbativ vyjadřujících patiens. 2. Deverbativa, která vyjadřují patiens, se mohou tvořit i od dokonavých (prefigovaných) sloves, zatímco deverbativa vyjadřující agens se derivují od sloves nedokonavých (neprefigovaných). 3. V případě deverbativ vyjadřujících patiens jde o následující změnu sémantické role: V > S[pat], zatímco v případě deverbativ, která vyjadřují agens, jde o jinou změnu sémantické role: V > S[ag]. 4. Deverbativa vyjadřující patiens se mohou tvořit: n z přídavných jmen na vý-: viz kapitola 5.1.1.3.1.1; derivační pravidla: 1) – 4); derivační vzory: váhat – váhavec; zuřit – zuřivec; domýšlet – domýšlivec; důvěřovat – důvěřivec (viz tabulka 5.2.1.2); n z přídavných jmen od příčestí l-ových, na –lý: viz kapitola 5.1.1.3.1.2; derivační pravidla: 5) – 9); derivační vzory: opít – opilec; dospět – dospělec; osiřet – osiřelec; povstat – povstalec; uvědomit – uvědomělec (viz tabulka 5.2.1.2); n z přídavných jmen od příčestí trpných, a to: a) od příčestí n-ových: viz kapitola 5.1.1.3.1.3, oddíl I.; derivační pravidla: 10) – 12); derivační vzory: trestat – trestanec; kojit – kojenec; pojistit – pojištěnec (viz tabulka 5.2.1.2); b) od příčestí t-ových: viz kapitola 5.1.1.3.1.3, oddíl II.; derivační pravidla: 13) – 15); derivační vzory: zajmout – zajatec; nadout – nadutec; zaklít – zakletec (viz tabulka 5.2.1.2). 6. ZÁVĚR Na tomto místě shrneme výsledky této práce, jejímž cílem bylo podat přehled základních zákonitostí derivace deverbativ (především jmen činitelských) zakončených na –ce a na –ec a za pomocí webového rozhraní Deriv a dat z korpusů ČNK formulovat soubor formálních pravidel pro jejich derivaci. V úvodních kapitolách, které byly zaměřeny teoreticky jsme charakterizovali nástroje, které jsme při práci využívali a také obory, které se zabývají počítačovým zpracováním přirozeného jazyka. Naším úkolem bylo mimo jiné ověřit, jakým způsobem lze tyto nástroje využít k formulaci formálních pravidel derivace vybraných slovotvorných typů (deverbativ zakončených na –ce a na –ec). Oba sledované slovotvorné typy se odvozují od kořene. Není tomu tak v případě deverbativ na –ec, která vyjadřují patiens, ty se odvozují od infinitivního kmene, výjimkou jsou i některá deverbativa na –ec vyjadřující agens – jsou to případy, kdy se tyto deriváty odvozují od infinitivního kmene, ale mají činitelský význam. Zatímco u sufixu –ce jsme se zaměřili na podrobný popis alternací (v kořeni a v prefixech), zabývali se derivací od dějových jmen a naznačili možnosti, jak by se dali formulovat pravidla derivace od více základů, v případě sufixu –ec jsme se snažili spíše o formální popis, který by eliminoval deriváty na –ec, které nepatří k danému slovotvornému typu. Pokud jde o sufix –ec museli jsme navíc vyřešit rozdíly v derivaci deverbativ, která vyjadřují agens oproti těm, která vyjadřují patiens. Deverbativa na –ec (pokud jde o činitelská jména) se tvoří od nedokonavých sloves, u deverbativ na –ce je situace složitější: ta se totiž mohou derivovat od sloves dokonavých i nedokonavých, záleží na tom, v jakém smyslu je konkrétní činitelské jméno užito. Na základě analýzy materiálu, který jsme získali ze slovníku morfologického analyzátoru AJKA (prostřednictvím derivačního rozhraní Deriv) a na základě analýzy dat z korpusů jsme navrhli derivační pravidla, vytvořili jednotlivé derivační vzory (viz kapitola 4.2.2 a kapitola 5.2.1) a následně navrhli formální pravidla derivace deverbativ na –ce (viz kapitola 4.3) a formální pravidla derivace deverbativ na –ec (viz kapitola 5.3), což bylo hlavním cílem této práce. Věříme, že by tato práce (zejména navržená pravidla a výčty případů, kdy došlo k přegenerování) mohla sloužit dalším lingvistickým výzkumům a že by mohla být využita při tvorbě nebo při zdokonalování dalších nástrojů a aplikací, které se využívají při počítačovém zpracování přirozeného jazyka. Pokud srovnáme výsledky výzkumu s odbornou literaturou, můžeme souhlasit s většinou charakteristik, problém spočívá v tom, že popis daných slovotvorných typů v těchto publikacích není dostatečný a některé jevy nejsou vysvětleny. Zásadní problém vidíme v tom, že v mluvnicích není vytvořena kategorie, kam by spadali deverbativa vyjadřující patiens. Doufáme proto, že by tato práce mohla osvětlit některé jevy, kterým je věnovaná nedostatečná pozornost, hlavně pokud jde o méně produktivní formanty, jakými sufixy –ce a –ec jsou. SEZNAM POUŽITÉ LITERATURY: ► Čechová, M. & kol. Čeština – řeč a jazyk. Praha : Institut sociálních vztahů, 1996. ► Čermák, F. Syntagmatika a paradigmatika českého slova II. Morfologie a tvoření slov. Praha : UK, 1990. ► Čermák, F. & kol. Jak využívat Český národní korpus. Praha : Lidové noviny, 2005. ► Čermák, F. Korpusová lingvistika. In Karlík, P., Pleskalová, J., Večerka, R., Krčmová, M. Kapitoly z dějin české jazykovědné bohemistiky. Praha : Academia, 2007, s. 468 -472. ► Daneš, Fr., Dokulil, M., Kuchař, J. & kol. Tvoření slov v češtině 2. Odvozování podstatných jmen. Praha : Academia, 1967. ► Dokulil, M. Tvoření slov v češtině. Praha : Nakladatelství Československé akademie věd, 1962. ► Dokulil, M. & kol. Mluvnice češtiny 1. Praha : Academia, 1986. ► Filipec, J., Daneš, F., Machač, J., Mejstřík, V. Slovník spisovné češtiny pro školu a veřejnost. Praha : Academia, 2005. ► Hajič, J. Statistické modelování a automatická analýza přirozeného jazyka. In Jarošová, A. Slovenčina a čeština v počítačovom spracovaní. Bratislava : Veda, 2001, s. 11-33. ► Hajič, J. Disambiguation of Rich Inflection (Computational Morphology of Czech). Praha: Karolinum Charles University Press, 2004. ► Havránek, B. & kol. Slovník spisovného jazyka českého. Praha : Academia, 1989. ► Hlaváčková, D. Český WordNet - valence a sémantické role. In Jazyky v kontaktu – jazyky v konfliktu a evropský jazykový prostor. Olomouc : Univerzita Palackého v Olomouci, 2005, s. 111-117. ► Hlaváčková, D. Využití lingvistického softwaru při popisu formálních pravidel tvoření sloves. In Tzv. základní výzkum v lingvistice - desideratum, nebo realis. Olomouc : Univerzita Palackého v Olomouci, 2006, s. 126-133. ► Horák, A., Pala, K., Rambousek, A., Povolný, Martin. DEBVisDic - First Version of New Client-Server Wordnet Browsing and Editing Tool. In Proceedings of the Third International WordNet Conference - GWC 2006. Brno : MU, 2005. s. 325-328. Dostupný z WWW: . ► Hujer, O., Smetánka, E., Weingart, M., Havránek, B., Šmilauer, V., Získal, A. (red.). Příruční slovník jazyka českého. Praha : Státní nakladatelství, 1935 – 1957. ► Karlík, P., Nekula, M., Pleskalová, J. & kol. Encyklopedický slovník češtiny. Praha : Nakladatelství Lidové noviny, 2002. ► Karlík, P., Nekula, M., Rusínová, Z. & kol. Příruční mluvnice češtiny. Praha : Lidové noviny, 2003. ► Klímová, J. Počítačové zpracování vybraných slovotvorných typů v češtině (disertační práce). Praha : MFF UK, 2001. ► Klímová, J. Činitelská (a konatelská) jména v současném jazyce (na základě dat ČNK). In Čeština doma a ve světě 4/2002. Praha : FF UK, 2002, s. 297-302. ► Klímová, J., Štícha, F. K možnostem a mezím sufixální derivace substantiv. In Štícha, F. (ed.). Možnosti a meze české gramatiky. Praha : Academia, 2006, s. 127-138. ► Kocek, J. & kol. Český národní korpus : úvod a příručka uživatele. Praha : FF UK, 2000. ► Komárek, M. & kol. Mluvnice češtiny 2. Praha : Academia, 1986. ► Králík, J., Těšitelová, M. Retrográdní slovník současné češtiny. Praha : Academia, 1986. ► Lamprecht, A., Šlosar, D., Bauer, J. Historická mluvnice češtiny. Praha : Státní pedagogické nakladatelství, 1986. ► Machek, V. Etymologický slovník jazyka českého. Praha : Lidové noviny, 1997. ► Osolsobě, K. Algoritmický popis české morfologie a strojový slovník češtiny (disertační práce). Brno: FF MU, 1996. ► Osolsobě, K. Matematická lingvistika. In Karlík, P., Pleskalová, J., Večerka, R., Krčmová, M. Kapitoly z dějin české jazykovědné bohemistiky. Praha : Academia, 2007, s. 447 -466. ► Osolsobě, K. Formální pravidla derivace deverbativ na –č. In Linguistica Brunensia A 56. Brno : MU, 2008, s. 121-135. ► Pala, K., Osolsobě, K. Základy počítačové lingvistiky. Brno : FF MU, 1992. ► Pala, K. Počítačové zpracování přirozeného jazyka. Brno : FI MU, 2000. ► Pala, K., Sedláček, R., Veber, M. Vztah mezi tvarotvornými a slovotvornými vzory v češtině. In Čeština – univerzália a specifika 5. Praha : Nakladatelství Lidové noviny, 2004, s. 151-162. ► Pala, K., Hlaváčková, D. Computer Processing Derivational Relations in Czech. In Computer Treatment of Slavic and East European Languages. Brno : Tribun, 2007, s. 198-208. ► Pala, K., Hlaváčková, D. Slovotvorné vztahy v českém WordNetu. In Gramatika a korpus. Praha : Ústav pro jazyk český, 2007. ► Pala, K., Osolsobě, K., Hlaváčková, D., Šmerk, P. Formální vztahy české morfologie a slovotvorby – abstrakt příspěvku z konference Čeština ve formální gramatice, Brno, 12. 2. 2009. ► Rejzek, J. Český etymologický slovník. Voznice : Leda, 2001. ► Rusínová, Z. Tvoření slov v současné češtině. Brno : MU, 1990. ► Sedláček, R. Morphematic analyser for Czech (disertační práce). Brno : FI MU, 2004. ► Scheer, T. O samohláskové délce při derivaci v češtině. In Hladká, Z., Karlík, P. Čeština – univerzália a specifika 5. Praha : Nakladatelství Lidové noviny, 2004, s. 224-239. ► Slavíčková, E. Retrográdní morfematický slovník češtiny. Praha : Academia, 1975. ► Smrž, P., Pala, K. Elektronická podoba SSJČ. In Hladká, Z., Karlík, P. Čeština – univerzália a specifika 4. Praha : Nakladatelství Lidové noviny, 2002, s. 357-360. ► Spoustová, D., Hajič, J., Votrubec, J., Krbec, P., Květoň, P. The Best of Two Worlds: Cooperation of Statistical and Rule-Based Taggers for Czech. In Proceedings of the Workshop on Balto-Slavonic Natural Language Processing. Praha: ACL, 2007, s. 67-74. ► Šlosar, D. Slovotvorný vývoj českého slovesa. Brno : UJEP, 1981. ► Šmilauer, V. Novočeské tvoření slov. Praha : Státní pedagogické nakladatelství, 1971. ► Ziková, M. Slovotvorba. Počátek 21. století. In Karlík, P., Pleskalová, J., Večerka, R., Krčmová, M. Kapitoly z dějin české jazykovědné bohemistiky. Praha : Academia, 2007, s. 273-277. ELEKTRONICKÉ ZDROJE: ČNK: Ÿ Ÿ Ÿ Ÿ Český národní korpus - SYN2000. Ústav Českého národního korpusu FF UK, Praha 2000. Dostupný z WWW: . Ÿ Český národní korpus - SYN2005. Ústav Českého národního korpusu FF UK, Praha 2005. Dostupný z WWW: . Ÿ Český národní korpus - SYN2006PUB. Ústav Českého národního korpusu FF UK, Praha 2006. Dostupný z WWW: . Laboratoř zpracování přirozeného jazyka (NLP), FI MU: Ÿ Ÿ AJKA: Ÿ http://nlp.fi.muni.cz/projekty/ajka/ Ÿ http://nlp.fi.muni.cz/projekty/ajka/ajkacz.htm Ÿ http://nlp.fi.muni.cz/projekty/wwwajka/WwwAjkaSkripty/morph.cgi?jazyk=0 Ÿ DEB II: Ÿ http://nlp.fi.muni.cz/projekty/deb2/index-cs.php Ÿ http://nlp.fi.muni.cz/projekty/deb2/public-cs.php Deriv: Ÿ http://deb.fi.muni.cz/deriv/ ________________________________ [1] Osolsobě, K. Formální pravidla derivace deverbativ na –č. In Linguistica Brunensia A 56. Brno : MU, 2008, s. 121-135. [2] Osolsobě, K. Matematická lingvistika. In Karlík, P., Pleskalová, J., Večerka, R., Krčmová, M. Kapitoly z dějin české jazykovědné bohemistiky. Praha : Academia, 2007, s. 447-466. [3] Čermák, F. Korpusová lingvistika. In Karlík, P., Pleskalová, J., Večerka, R., Krčmová, M. Kapitoly z dějin české jazykovědné bohemistiky. Praha : Academia, 2007, s. 468-472. [4] AI = artificial itelligence. [5] NLP = Natural Language Processing. [6] Pala, K. Počítačové zpracování přirozeného jazyka. Brno : FI MU, 2000, s. 19. [7] Informace čerpáme z webových stránek Centra zpracování přirozeného jazyka (NLP centre) FI MU. Dostupný z WWW: . [8] Více viz kapitola 2.1.1.3. [9] Viz kapitola 2.1.1.1. [10] Morfologický analyzátor češtiny. Dostupný z WWW: . [11] Sedláček, R. Morphematic analyser for Czech (disertační práce). Brno : FI MU, 2004. [12] Osolsobě, K. Algoritmický popis české morfologie a strojový slovník češtiny (disertační práce). Brno: FF MU, 1996. [13] Sedláček, R. Morphematic analyser for Czech (disertační práce). Brno : FI MU, 2004. [14] . [15] . [16] Český národní korpus. Ústav českého národního korpusu. Dostupný z WWW: . [17] Více na WWW: . [18] U každého výskytu slova v textu lze zobrazit tzv. lemma – základní tvar slova (u podstatných jmen nominativ singuláru, u sloves infinitiv). [19] U každého výskytu slova v textu lze zobrazit morfologickou značku, která vyjadřuje jeho gramatické kategorie. [20] Více na WWW: . [21] Více na WWW: . [22] Osolsobě, K. Formální pravidla derivace deverbativ na –č. In Linguistica Brunensia A 56. Brno : MU, 2008, s. 129. [23] Karlík, P. Mikrosyntax českých deverbálních jmen. In SPFFBU A52, Brno : MU, 2004, s. 71-81. [24] Ziková, M. Slovotvorba. Počátek 21. století. In Karlík, P., Pleskalová, J., Večerka, R., Krčmová, M. Kapitoly z dějin české jazykovědné bohemistiky. Praha : Academia, 2007, s. 273-277. [25] Pala, K. Počítačové zpracování přirozeného jazyka. Brno : FI MU, 2000. [26] Pala, K., Sedláček, R., Veber, M. Vztah mezi tvarotvornými a slovotvornými vzory v češtině. In Čeština – univerzália a specifika 5. Praha : Nakladatelství Lidové noviny, 2004, s. 151-162; Pala, K., Hlaváčková, D. Slovotvorné vztahy v českém WordNetu. In Gramatika a korpus. Praha : Ústav pro jazyk český, 2007. [27] Pala, K., Osolsobě, K., Hlaváčková, D., Šmerk, P. Formální vztahy české morfologie a slovotvorby – abstrakt příspěvku z konference Čeština ve formální gramatice, Brno, 12. 2. 2009. [28] Dokulil, M. Tvoření slov v češtině. Praha : Nakladatelství Československé akademie věd, 1962. [29] Více na WWW: . [30] Mluvnice jsou seřazeny dle roku vydání. [31] TS2, Šmilauer, MČ1, ČŘJ, PMČ. [32] Dokulil, M. & kol. Mluvnice češtiny 1. Praha : Academia, 1986, s. 239-240. [33] Karlík, P., Nekula, M., Rusínová, Z. & kol. Příruční mluvnice češtiny. Praha : Lidové noviny, 2003, s. 141-142. [34] Daneš, Fr., Dokulil, M., Kuchař, J. & kol. Tvoření slov v češtině 2. Odvozování podstatných jmen. Praha : Academia, 1967, s. 56. [35] Deverbativa vyjadřující patiens jsou zařazena do slovotvorné kategorie názvů nositelů vlastností také v PMČ (Šlosar). [36] Daneš, Fr., Dokulil, M., Kuchař, J. & kol. Tvoření slov v češtině 2. Odvozování podstatných jmen. Praha : Academia, 1967, s. 295. [37] Opět M. Dokulil. [38] Čechová, M. & kol. Čeština – řeč a jazyk. Praha : Institut sociálních vztahů, 1996, s. 107. [39] Půjde o změnu sémantické role: V>S[ag]. [40] Substantivum, maskulinum životné, singulár, nominativ. [41] Sloveso v infinitivu. [42] Význam jednotlivých značek – viz odkaz v kapitole 2.1.1.2 Derivační rozhraní Deriv. [43] Sufix –ce se připojuje k slovesným základům bez infinitivní kmenotvorné přípony (tam, kde primární slovesný kmen končí samohláskou, je základem kmen přítomný) nebo k základům dějových jmen. [44] Vládat = vládnout (dle SSJČ). Viz oddíl IV. Slovesný základ bez infinitivní kmenotvorné přípony –nou–. [45] Základová slova do tabulky zaznačíme do sloupce „nout“. [46] Substantivum, maskulinum neživotné, singulár, nominativ. [47] Nelze spolehlivě určit časový sled tvoření (zda bylo dříve kompozitum s druhým členem dějovým jménem, od něhož se utvořilo jméno na –ce, nebo zda od jména na –ce bylo kompozicí utvořeno jméno na –ce složené). [48] Substantivum, neutrum, singulár, nominativ. [49] Substantivum, femininum, singulár, nominativ. [50] Další přípony, respektive zakončení (např. zakončení –e/–ě) nevyhovují. [51] „KP“ = slovesným základem je kmen přítomný; „X“ = ostatní základová slovesa. [52] Význam značky: substantivum, rod mužský životný, singulár, nominativ. [53] Význam značky: sloveso v infinitivu. [54] Základová slova zapsaná tučně vždy značí alternaci. [55] „KP“ = slovesným základem je kmen přítomný; „X“ = ostatní základová slovesa. [56] K tomuto činitelskému jménu nedokázal nástroj Deriv vygenerovat jiné základové slovo než imperfektum obžírat. [57] Dvojici převést – převodce získáme pouze zadáním .*e.e/ k5eAaPmIp3nS > .*o.ce/k1gMnSc1. [58] V případě dvojice odepřít – odpůrce by šlo o složitou alternaci. [59] Zeleně a tučně zapisujeme základová slova, ve kterých dochází k alternaci v prefixu. [60] U dvojice (vy)naleznout – (vy)nálezce šlo o prefix na-/ná-. [61] Dle SSJČ. [62] Dle SSJČ. [63] Dle SSJČ. [64] Hnědá barva značí dvojí alternaci nebo zvláštní tvoření. [65] Dostupné na WWW: . [66] Tomuto kroku předchází ještě uzavření smlouvy s ÚČNK a instalace programu. [67] Horní řádek napravo. [68] V horní liště pod položkou KORPUS. [69] Český národní korpus - SYN2000. Ústav Českého národního korpusu FF UK, Praha 2000. Dostupný z WWW: . [70] Popis morfologických značek dostupný z WWW: . [71] V horní liště pod slovem KORKONDACE – STATISTIKY. [72] Český národní korpus - SYN2000. Ústav Českého národního korpusu FF UK, Praha 2000. Dostupný z WWW: . [73] Více viz kapitola 2.2.1 ČESKÝ NÁRODNÍ KORPUS. [74] Český národní korpus - SYN2006PUB. Ústav Českého národního korpusu FF UK, Praha 2006. Dostupný z WWW: . [75] Český národní korpus - SYN2000. Ústav Českého národního korpusu FF UK, Praha 2000. Dostupný z WWW: . [76] Český národní korpus - SYN2005. Ústav Českého národního korpusu FF UK, Praha 2005. Dostupný z WWW: . [77] Řazeno podle výskytu v korpusu SYN2000. [78] Výskyt slov dle frekvenční distribuce. [79] Dohodovat = dohodnout (dle SSJČ). [80] Chod = chůze (dle SSJČ). [81] Kára = pokárání (dle SSJČ). [82] Láj = lání (dle SSJČ). [83] Mluv = mluva (dle SSJČ). [84] Provodit = provést (dle SSJČ). [85] Pohonit = pohánět (dle SSJČ). [86] Povodit = odvozovat, vyvozovat (dle SSJČ). [87] Rozhod = rozhodnutí (dle SSJČ). [88] Snub = zasnoubení (dle SSJČ). [89] Stražit = strážit (dle SSJČ). [90] Svodit = svést (dle SSJČ). [91] Tvor = výtvor, dílo (dle SSJČ). [92] Úpad = úpadek (dle SSJČ). [93] Uvodit = uvést (dle SSJČ). [94] Vládat = vládnout (dle SSJČ). [95] Vynaleznout = vynalézt (dle SSJČ). [96] Výrob = výroba (dle SSJČ). [97] Výstav = vystavení (dle SSJČ). [98] Zbůj = zboj (dle SSJČ). [99] Podle frekvenční distribuce (SYN2000). [100] Některá substantiva na –ce se však opakují (viz tabulka 4.2.1). [101] Tato pravidla shrnují informace, které jsou uvedené v tabulce činitelských jmen zakončených na –ce (viz kapitola 4.2.1) a v tabulce derivačních pravidel a vzorů (viz 4.2.2). [102] Tzn. kapitola 4.2.1 TABULKA ČINITELSKÝCH JMEN ZAKONČENÝCH NA –CE. [103] Tzn. kapitola 4.2.2 PRAVIDLA DERIVACE, VYTVOŘENÍ DERIVAČNÍCH VZORŮ. [104] Daneš, Fr., Dokulil, M., Kuchař, J. & kol. Tvoření slov v češtině 2. Odvozování podstatných jmen. Praha : Academia, 1967, s. 49, 50. [105] Dějová jména mohou mít a) nulovou koncovku (maskulina, feminina podle vzoru píseň nebo kost), b) nenulovou koncovku (feminina a neutra). [106] Karlík, P., Nekula, M., Rusínová, Z. & kol. Příruční mluvnice češtiny. Praha : Lidové noviny, 2003, s. 115. [107] Karlík, P., Nekula, M., Rusínová, Z. & kol. Příruční mluvnice češtiny. Praha : Lidové noviny, 2003, s. 116. [108] Karlík, P., Nekula, M., Rusínová, Z. & kol. Příruční mluvnice češtiny. Praha : Lidové noviny, 2003, s. 117. [109] V seznamu se objevuje 161 substantiv rodu mužského životného na –ec, která začínají velkým písmenem. [110] Karlík, P., Nekula, M., Rusínová, Z. & kol. Příruční mluvnice češtiny. Praha : Lidové noviny, 2003, s. 132. [111] Daneš, Fr., Dokulil, M., Kuchař, J. & kol. Tvoření slov v češtině 2. Odvozování podstatných jmen. Praha : Academia, 1967, s. 285. [112] Karlík, P., Nekula, M., Rusínová, Z. & kol. Příruční mluvnice češtiny. Praha : Lidové noviny, 2003, s. 133. [113] Substantivum, rod mužský životný, singulár, nominativ. [114] Adjektivum, rod mužský životný, singulár, nominativ, 1. stupeň. [115] Viz obrázek č. 9. [116] JMN = jména nositelů vlastností (deadjektiva) [117] Definice v SSJČ neříká nic o motivaci slovesem, při zařazení slova batolec k deverbativům jsme se řídili podle publikace Tvoření slov v češtině 2, která na straně 56 uvádí následující: „batolec (k batoliti se, denní motýl)“. [118] Pastvec = pastevec (dle SSJČ). [119] Sobit = osobovat si (dle SSJČ). [120] Viz výše. [121] Těm bude věnována pozornost v kapitole 5.1.1.3 Deverbativa vyjadřující patiens. [122] Substantivum, rod mužský životný, singulár, nominativ. [123] Adjektivum, rod mužský životný, singulár, nominativ, 1. stupeň. [124] V případě deadjektiva bachratec (od bachratý) systém automaticky vygeneroval jako základové slovo sloveso bachratit, slovesa tohoto typu jsou však odvozená z adjektiv (bachratit = stávat se bachratým), podobně i hranatit, hrbatit, chlupatit, ježatit atd. [125] Význam tohoto slova získáme z korpusu (SYN2005 a SYN2006PUB). [126] Poutec ve významu poutník (dle SSJČ). [127] Pištět ve významu pískat, hrát na píšťalu (dle SSJČ). [128] Opakuje se podobná situace jako s příponou –it: V případě deadjektiva bachratec systém tentokrát automaticky vygeneroval jako základové slovo sloveso bachratět, slovesa tohoto typu jsou také odvozená z adjektiv (bachratět = stávat se bachratým), podobně i hrbatět, chlupatět, lenivět atd. [129] Daneš, Fr., Dokulil, M., Kuchař, J. & kol. Tvoření slov v češtině 2. Odvozování podstatných jmen. Praha : Academia, 1967, s. 58. [130] Dokulil, M. & kol. Mluvnice češtiny 1. Praha : Academia, 1986, s. 239-240. [131] Je to spíše podvarianta varianty –lec. [132] Milenec = muž v milostném vztahu k ženě; milovník něčeho (dle SSJČ). [133] Daneš, Fr., Dokulil, M., Kuchař, J. & kol. Tvoření slov v češtině 2. Odvozování podstatných jmen. Praha : Academia, 1967, s. 296. [134] Daneš, Fr., Dokulil, M., Kuchař, J. & kol. Tvoření slov v češtině 2. Odvozování podstatných jmen. Praha : Academia, 1967, s. 57. [135] Chod = chůze (dle SSJČ). [136] Jezd = jízda (dle SSJČ). [137] Mluv = mluva (dle SSJČ). [138] Daneš, Fr., Dokulil, M., Kuchař, J. & kol. Tvoření slov v češtině 2. Odvozování podstatných jmen. Praha : Academia, 1967, s. 57-58. [139] Tvoří se od slovesa 2. třídy (vzor tiskne) x ostatní činitelské jména s variantou –tec (bitec, litec, pitec, rytec) se tvoří od sloves 3. třídy (vzor krýt). [140] Branec ve významu obránce, bojovník (dle SSJČ). [141] Trubec ve významu trubač (dle SSJČ). [142] Poutec ve významu poutník (dle SSJČ). [143] Borec ve významu bořitel (dle SSJČ) – užívá se ve složeninách, např. ledoborec. [144] Viz kapitola 5.1.1.2.2, oddíl III., bod d). [145] Příčestí trpné od sloves dokonavých i nedokonavých. [146] V některých případech opět dochází k přegenerování, tyto případy však v této části opět neuvádíme. [147] Ve většině případů uvádíme nejfrekventovanější dvojice. [148] V horní liště pod slovem KORKONDACE – STATISTIKY. [149] SYN2005. [150] Český národní korpus - SYN2005. Ústav Českého národního korpusu FF UK, Praha 2005. Dostupný z WWW: . [151] Více viz kapitola 2.2.1 ČESKÝ NÁRODNÍ KORPUS. [152] Čísla v závorkách uvádějí počet výskytů v jednotlivých korpusech. [153] Díky kontextu v SYN2005 a SYN2006PUB jsme např. zjistili význam slova ženec (toto slovo jsme totiž nenašli v elektronické verzi SSJČ). [154] Řazeno dle výskytu v korpusu SYN2000. [155] Výskyt slov/lemmat dle frekvenční distribuce. [156] V závorkách je uvedeno, jestli deverbativum vyjadřuje agens nebo patiens; deverbativa vyjadřující agens jsou zvýrazněna tučně. [157] Motivující sloveso věstit se však v korpusech vyskytuje. [158] Dle SSJČ. [159] Podle frekvenční distribuce (SYN2000). [160] V závorce uvádíme počet substantiv rodu mužského životného na –ec, která patří k jinému slovotvornému typu/k jiné slovotvorné kategorii, popř. jde-li o kompozita. [161] V tomto případě, tzn. u deverbativ vyjadřujících patiens neuvádíme případy přegenerování. [162] Tato pravidla shrnují informace, které jsou uvedeny v tabulce derivačních pravidel a vzorů (kapitola 5.2.1.1 Pravidla derivace, derivační vzory pro deverbativa vyjadřující agens).