Syntetické futurum v češtině ­ gramatiky, slovníky, korpusy Klára Osolsobě Úvod Cílem našeho příspěvku je ukázat, jak lze využívat jazykový korpus ke studiu jevů stojících na hranici slovníku a gramatiky. Budeme se zabývat tvořením tzv. syntetického futura v češtině. Nejdříve stručně shrneme, co o tomto jevu říkají české gramatiky a slovníky. Dále se podíváme, jak tento jev zachycují reprezentativní korpusy současné češtiny (korpusy SYN2000 a SYN2005). Ukážeme, jak lze i přes nedostatky v morfologickém tagování zkoumaného jevu čerpat z korpusů relevantní informace. Na závěr se pokusíme přesněji popsat význam sloves schopných tvořit v češtině tvary budoucího času prefixem po-. Syntetické futurum v češtině Termínem syntetické futurum se v českých gramatikách označují tvary několika desítek českých nedokonavých sloves tvořených od tvarů indikativu prézentu aktíva prefixem po(pů-) většinou (kromě jet, jít) paralelně ke tvarům opisného futura. Tato slovesa jednotlivé mluvnice 1) významově vymezují a 2) uvádějí jejich seznamy. Ve slovnících jsou zachyceny nejednotně: 1) tvar (1./3. osoba sg. syntetického futura) je samostatným heslovým slovem (viz tabulka 1), 2) v rámci hesla se uvádí informace o možném tvoření syntetického futura (viz tabulka 1), 3) řada sloves (srv. níže) není ve slovnících zachycena. Probereme nejprve, jak jsou v jednotlivých mluvnicích slovesa, mající schopnost vyjadřovat tvary s po-/pů- význam futura, definována. Česká mluvnice (Havránek, Jedlička, 1981), dáje HJ, hovoří o: ... ,,některých slovesech nedokonavých (většinou s významem pohybu, řidčeji stavu) .... Dále uvádí, že ... nemají složený tvar času budoucího, leda v jiném významovém odstínu ...Zmiňuje se též o možnosti tvořit u některých tvarů imperativ ... s malým významovým rozdílem, který je na dvou příkladech charakterizován u slovesa pojď jako ... pohyb k mluvčímu... u sloves poběž, poleť jako ...počátek. Samostatně se zmiňuje imperativ poslyš, který nemá oporu ve tvarech syntetického futura indikativu (slyšet - *poslyším ­ slyš ­ poslyš). Příruční mluvnice češtiny (Karlík, Nekula, Rusínová, 1996), dále PMČ, hovoří o: ... zvláštní skupině sloves pohybu a některých jiných, která pohyb implikují a dále uvádí, že ... u nich lze rozeznat rozdíl mezi určeností a neurčeností co do cíle pohybu... přičemž ... oba tyto významy se vyjadřují v rámci sloves nedokonavého vidu... a konstatuje, že ... nejde o dokonavé futurum, od těchto forem nelze utvořit infinitiv ani préteritum. Jsou však možné formy složené... 1 Čeština řeč a jazyk (Čechová a kol., 1996), dále ČŘJ, v příslušném pasáži píše: U některých nedokonavých sloves (sloves pohybu a změny stavu) se tvoří ještě (míní se kromě tvarů budu + infinitiv nedokonavého slovesa) tvary jednoduché s předponou po-. Mluvnice češtiny 2 (Komárek a kol., 1987), dále MČ2, ke sledované problematice říká, ... prefix po- (s ojediněle se vyskytující variantou pů-): spojuje se s tvary ind. préz. akt. některých nedokonavých sloves, zvláště s významem jednosměrného pohybu v tzv. jednoduché, syntetické futurum ..., má tedy gramatickou kategoriální platnost; tato platnost je oslabena ve tvarech imperativu těchto sloves, ..., které jsou synonymní s tvary bez tohoto prefixu. Dále nalezneme popis tvoření tvarů synt. fut. a slovesa jsou charakterizována jako .... slovesa jednosměrného pohybu a slovesa trvání nebo změny stavu (jež jsou rovněž pojaty jako jednosměrný pohyb). Předpona po- má zde význam pouze gramatický, nikoli lexikální; nemění ani lexikální význam, ani nedokonavý vid slovesa. ... Vedle futurálních tvarů jednoduchých je možno tvořit i pravidelné tvary složené futura opisného, .... Pro praktické potřeby studia češtiny jako cizího jazyka je zajímavé porovnat rozsah dokladů v tištěných zdrojích. Následující tabulka zachycuje, jak mapují tento jev mluvnice a slovníky. tabulka 1 HJ PMČ ČŘJ MČ2 SSJČ SSČ půjdu + + + + +/+* +/+* pojedu + + + -/+* + poběžím + + + - -/+* + poletím + + - + + + polezu + + - - + + popluji + - - + + poplavu + + - - -/+* + potáhnu + + + + - + poteče + - + + + + povleče + - - - + + poženu + + - - + + ponesu + + - + -/- + povedu + + - - -/+* + povezu + + - - - + porostu + + - - + + pokvetu + + + + + + povládnu + - - + -/+* + povrávorám + - - - -/+* + pošlapu + - - - -/+* pomašíruju + - - - -/+* pofičím + - - - -/+* + pokutálím se + - - - -/+* pohrnu se + - - - -/+* + pochvátám + - - - -/+* pokvapím + - - - -/+* - 2 poplyne + - - - + + pocupitám - - - - -/+* poderu se - - - - -/+* pohasím si to - - - - -/+* pojechám - - - - -/+* poklapu - - - - -/+* poklíčí - - - - -/+* pokulhám - - - - -/+* pokulím se - - - - -/+* pokvačím - - - - -/+* poline se - - - - -/+* poloudám se - - - - -/+* popeláším - - - - -/+* poplavím se - - - - -/+* poplazím se - - - - -/+* poplížím se - - - - -/+* porázuju - - - - -/+* pořine se - - - - -/+* poštráduje si to - - - - -/+* povane - - - - -/+* povine se - - - - -/+* povisí - - - - -/+* poleje/polije - - - - -/+* Poznámka: ,,+/+*" značí, že u hesla uvedeného infinitivem slovesa, které může tvořit tvary syntetického futura je tato možnost uvedena a zároveň je ve slovníku samostatné heslo - tvar 1./3. os. sg. syntetického futura, ve kterém se odkazuje k přísl. infinitivu. ,,-/+*" naznačuje, že u hesla uvedeného infinitivem slovesa, které může tvořit tvary syntetického futura se o této možnosti neříká nic, ve slovníku je samostatné heslo - tvar 1./3. os. sg. syntetického futura. Dalším tištěným zdrojem informací o sledovaném jevu, který bychom rádi ocitovali, je skriptum (Čermák, 1990, s. 106). Dokládá syntetické tvoření futura u dalších sloves, které zkoumané slovníky neuvádějí: rajzovat/porajzuju ve významu cestovat, razit někam/porazím někam ve významu jít/půjdu, pálit/popálí / popálí mu to ve významu půjde rychle / bude mu to rychle myslet, šířit se/pošíří se, pršet/poprší. Mylně uvádí sloveso hladit, tvar pohladí není syntetickým futurem zmíněného slovesa, nýbrž tvarem slovesa pohladit. Značkování gramatické kategorie času v korpusech SYN2000 a SYN2005 O značkování slovesných gramatických významů v českých korpusech jsme podrobněji pojednali jinde (Osolsobě, 2007). V tomto článku shrneme stručně, jak jsou tvary syntetického futura zachyceny systémem značek používaných pro anotaci korpusů SYN2000 a SYN2005, poukážeme na nedostatky anotací a budeme se zabývat tvary, které ač nesprávně anotovány jsou ve skutečnosti doklady tvoření syntetického futura. 3 Tvary syntetického futura v korpusech V anotaci SYN2000/SYN2005 mají budoucí čas vyznačeny tvary futura slovesa být používané též pro tvoření analytických tvarů futura (budu, budeš, ...) a tvary některých sloves tvořené prefixem ,,po-,, vyjadřující synteticky futurum. Ostatní tvary zařazené značkou jako slovesný tvar přítomného nebo budoucího času mají vyznačeno, že jde o přítomný čas (otázka interpretace prolínání kategorie vidu a času na úrovni anotací je ponechána stranou). Poznámka: Významy kategorie času jsou v tagsetu SYN2000 a SYN2005 charakterizovány takto: 1) neurčuje se (-), 2) futurum (budoucí čas) - (F), 3) minulost nebo přítomnost - (H), 4) prézens (přítomný čas) (P), 5) minulý čas (R) a 6) libovolný čas (X). Značku tag="VB......F.*" a lemma bez prefixu po- mají ovšem pouze některá slovesa ze sloves, která mohou tvořit syntetické futurum (tabulka 2 s uvedením frekvencí tvarů ­ ,,word" v obou sledovaných korpusech). tabulka 2 SYN2000/SYN2005 lemma: ## jít 11153/14992 jet 3881/4575 nést 748/734 běžet 453/464 letět 348/444 téci 198/219 vézt 143/136 hrnout 66/69 lézt 64/148 plout 47/104 cestovat 41/69 stěhovat 22/19 řítit 2/1 trvat 0/2085 plazit 0/4 Poznámka: Značku tag="Vi......-.*" a lemma bez po- mají v SYN2000 a SYN2005 tvary sloves jít/pojď, slyšet/ poslyš, jet/pojeď, lézt/polez, běžet/poběž, letět/poleť, v SYN2005 navíc i tvary nést/pones, stěhovat/postěhuj. Z dalších sond do materiálu SYN2000/SYN2005 je patrné, že řada slovesných tvarů je automatickou morfologickou analýzou označkována špatně. Poznámka: Jednotlivé doklady jsme získali jednak dotazem [lemma="po.*" & tag= "VB.*"] a ruční analýzou konkordančního seznamu, jednak dotazy na jednotlivé tvary podle seznamu sloves z tištěných zdojů (viz výše). Přehled obou skupin zachycuje následující tabulka. Ve značkování korpusů SYN2000/SYN2005 není nikterak zaznamenávána spojitost reflexivního se a příslušného slovesného tvaru (srv. více Osolsobě 2007). Pro přehlednost uvádíme v závorce (se). Poznámka: Čísla v závorkách jsou orientační. Uvádějí počty nalezených dokladů v SYN2000/SYN2005. Ve druhém sloupci se uvádějí pouze celkové součty. 4 tabulka 3 tvary po- jsou výhradně tvary synt. futura tvary po- nejsou výhradně tvary syntetického futura putovat/putoval/putuje/poputuje (bude putovat) (171/212) vést/vedl/vede/povede (bude vést) (se) : povést/povedl/povede (se) (3544/25+2957* ) plynout/plynul/plyne/poplyne (bude plynout) (70/47) trvat/trval/trvá/potrvá (bude trvat): ?potrvat/?potrval/?potrvá (3242/1849* ) plavat/plaval/plave/poplave (poplav) (bude plavat) (51/41) růst/rostl/roste/poroste (bude růst) : porůst/porostl/poroste (802/712) kvést/kvetl/kvete/pokvete (bude kvést) (24/41) hnát/hnal/žene/požene (bude hnát) (se) : pohnat/pohnal/požene (93/140) vandrovat/vandroval/vandruje/povandruje (bude vandrovat) (8/4) valit/valil/valí/povalí/(bude valit) (se) : povalit/povalil/povalí (29/37) vládnout/vládl/vládne/povládne (bude vládnout) (6/11) mazat/mazal/maže/pomaže/ (bude mazat): pomazat/pomazal/pomaže (23/89) mašírovat/mašíroval/mašíruje/pomašíruje (bude mašírovat) (4/7) šlapat/šlapal/šlape/pošlape (bude šlapat): pošlapat/pošlapal/pošlape (16/29) vanout (vát)/vál(vanul)/vane/povane (bude vanout) (1/6* ) vléct/vlekl/vleče/povleče (bude vléct) (se): povléct/povlékl se/povleče (se) (22/38) pádit/pádil/pádí/popádí (bude pádit) (0/3* ) šinout/šinul/šine/pošine (bude šinout) (se)/(si to): pošinout/pošinul/pošine (si) (2/4) hasit/hasil/hasí/pohasí (bude hasit) (si to) (0/3* ) pást/pásl/pase/popase (bude pást) (se) : popást/popásl/popase (se) (1/4) plavit/plavil/plaví/poplaví (bude plavit) (se) (0/3* ) řinout/řinul/řine/pořine (bude řinout) (se) (0/3* ) kráčet/kráčel/kráčí/pokráčí (bude kráčet) (2/0) kutálet/kutálel/kutálí/pokutálí (bude kutálet) (se) (1/1) fičet/fičel/fičí/pofičí (bude fičet) (1/1* ) pelášit/pelášil/peláší/popeláší (bude pelášit) (0/1* ) plížit/plížil/plíží/poplíží (bude plížit) (se) (0/1* ) * Mezi korpusy SYN2000 a SYN2005 je ve značkování některých tvarů patrný jistý posun (srv. více Osolsobě 2007). Srovnejme seznamy získané a) z výčtů v jednotlivých mluvnicích, b) ze slovníků s c) seznamy dokladů nalezených v korpusech SYN2000/SYN2005. K řadě sloves, která uvádějí tištěné příručky, a) nebyly ve zkoumaných korpusech nalezeny doklady jejich užití s futurálním prefixem po- (pocupitá, podere se, pochvátá, pojechá, poklíčí, pokulhá, pokulí se, pokvačí, pokvapí, poline se, poloudá se, poprší, porajzuje, porázuje, poštráduje si to, pověje, povine (se), povisí, povrávorá), b) nebyly nalezeny doklady 5 lít ­ polije/poleje ve významu bude pršet, razit ­ porazí ve významu vyrazí si, pálit ­ popálí ve významu rychle zmizí/bude mu to dobře myslet. To ovšem nevyvrací potencionální existenci těchto tvarů (některé lze například najít na internetu). V korpusech byly naopak nalezeny doklady (putovat/poputuje, šlapat/pošlape, mazat/pomaže, valit (se)/povalí (se), kráčet/pokráčí, pást (se)/popase (se), šinout (se)/pošine (se)), které žádný ze srovnávaných tištěných zdrojů neuvádí. Poznámka k výskytu některých inovací v mluvených korpusech Pátrali jsme rovněž v korpusech mluvených (pmk, bmk, oral2006) a v korpusu soukromé korespondence (ksk). Vyhledávání v těchto zdrojích je obtížnější, protože nejsou (kromě části ksk dostupné z verze na CD - ksk1) lemmatizovány a morfologicky tagovány. Procházeli jsme tedy rozsáhlé seznamy, které jsme získali dotazem [word="po.*"]. Jediným výsledkem této sondy byly kromě dokladů známých jak z tištěných zdrojů, tak z korpusů psaného jazyka (půjde, pojede, poběží, povede, požene, poletí, poplaví se, ...) jeden doklad nalezený v bmk. Byl jím tvar popečeš inovace z péct s někým ­ kamarádit s někým --> dobře s někým vycházet, zde zřejmě chodit s kým (dívkou/chlapcem). V bmk se vyskytl též jeden doklad, uváděný v tištěných zdrojích, který nezachycují korpusy SYN2000/SYN2005. Je jím tvar poklape od slovesa klapat s významem dobře fungovat a přeneseně vycházet s někým (... v normálním životě vám to poklape ...). Slovníček přenosů významů u sloves, která neuvádějí slovníky SSČ a SSJČ tabulka 4 doklad význam příklad z korpusu putovat jít ... že poputuje co možná nejrychleji do Paříže ... šlapat jít fungovat ... jdi správným směrem a pošlapeš snáz ... ..že ráno nám to tu pošlape ... mazat jít (rychle) ... a teď hezky pomažeš zpátky ... valit (se) jet/jít (masa) jít (masa lidí) téct/řinout se padat (déšť) plynout bude hrát ... až se naše tanky povalí dolů po silnici ... ... ze severu povalí hordy Němců, Holanďanů, ... ... až se přes ně povalí povodeň ... ... se na Čechy povalí shůry ... množství vody... ... halou se brzy povalí klidný, ..., proud ... ... na Slovensko se povalí česká technologie... ... celý večer povalí gotik rocková hudba ... šinout (se)/ šinout si to jít (pomalu) ... že ho dohoním a pošineme se spolu ... ... a pak si to pošineme na stanici ... kráčet jít ...kampak pokráčíš, Panna Maria, ... pást (se) ... tam se jednomyslný ... lid popase sám ... péct (s kým) vycházet s někým můžeš potom rozhodnout s kterou popečeš ... když sou tři ... 6 Sémantická charakteristika sloves schopných tvořit tvary syntetického futura Sledované mluvnice více méně uvádějí dva způsoby klasifikací sloves, která mohou tvořit v češtině syntetické futurum prefixem po-/pů- + tvary ind. préz. akt. Podrobně jsme se věnovali rozsahu a obsahu definice výčtem (porovnání jednotlivých seznamů). Vzhledem k tomu, že jak z definic v příručkách, tak z korpusově orientovaného výzkumu plyne, že jde o omezeně produktivní nicméně otevřenou skupinu, pokusíme se znovu zamyslet nad tím, jak příručky tato slovesa definují po stránce významové. Všechny se shodují v tom, že jde o slovesa vidu nedokonavého. Dále uvádějí význam pohybu, který dále vymezují jako pohyb ,,určený" nebo ,,jednosměrný". Dále se uvádí, že může jít také o slovesa označující ,,stav", jeho ,,trvání" nebo ,,změnu". Tyto charakteristiky jsou dosti vágní. Pokusíme se je tedy (na základě dat) konkretizovat. 1) Pohyb v konkrétním slova smyslu (přemísťování z místa na místo jednosměrně/ v určeném směru) (půjde, pojede, poběží, poplazí se, pokráčí, pošine se, povalí, pomaže, ...), ale i různými směry (pošíří se, poline se, ... ). 2) Proces zahrnující pohyb a) přírodní (povane, pověje, pol(i/e)je, poprší, ...); b) s neživým nositelem (rostlina: pokvete, poroste, poplazí se, strom: ponese (ovoce), ...; hudba: poline se, povalí ...; vůně: pošíří se, poline se, ...; voda: poteče, povalí, ... ); c) mentální (popálí mu to) d) s živým nositelem (poroste, popase se, ... pták: ponese (vejce), ...); d) ve významu fungovat (správně) poklape, pošlape, ..; vycházet s někým, (poklape, pošlape, popeče, povalí, ...). Přenosem významů sloves označujících pohyb, či některý z typů procesů, jež jsme se pokusili přesněji vymezit, vznikají fakticky nová slovesa. Pro strojovou analýzu i uživatele, který není rodilým mluvčím, tak vzrůstá počet homonymních tvarů (srv. sloupec 2 tab.), pro nové slovníkové a mluvnické práce potřeba zpřesnit a zjemnit dosavadní definice. Poznámka: Kromě korpusu by bylo možné využít některého slovníku synonym. Na základě drobné sondy do Slovníku českých synonym (Pala, Všianský, 2000) jsme vybrali další kandidáty: prýštit/poprýští, tryskat/potryská, trtat/potrtá, zdrhat/pozdrhá, ...). Řadu dokladů lze najít rovněž na internetu. Závěr s malým kvízem nakonec Srovnání definic syntetického futura v českých mluvnicích (slovnících) s analýzou korpusových dat dokládá, jak korpusově orientovaný výzkum doplňuje, rozšiřuje a upřesňuje stávající popisy jazyka. Co všechno se z korpusů můžeme o jazyce dozvědět ilustrujeme dvěma příklady, které jsou zajímavé především pro nerodilé mluvčí. Zadáme-li v korpusu SYN2005 dotaz na tvary typu 7 pokráčím, pokráčíš, ... [word="pokráčí.*"], obdržíme dva konkordanční řádky. Oba jsou z knihy Pan Kaplan má třídu rád a z kontextu vyplývá, že tvar pokráčí vytvořil nerodilý mluvčí (žák Pan Kaplan) a rodilý mluvčí (pan profesor) jej pokládá za chybu. Argumentaci, která by mohla vést k vysvětlení, proč je tvar pokráčí špatně, se pan profesor raději vyhne. Proč? Hyman Kaplan vyslechl výtku beze vší zkroušenosti či lítosti. Jen skromně vzdychl: "To moje háčkovaný r je chrosný, pamprésor. Ale budu snášit, aby čistě -" "Příště! Další chyba!" Pan Kaplan zakroutil hlavou. "Já čim dal huš." "Hůř!" vykřikl pan profesor téměř zoufale.(Pouštět se do opravy tvaru "já " nemělo v takové chvíli smysl.) A úplně nakonec: Jak to, že v korpusech můžeme najít a ? Literatura: Čechová a kol.: Čeština, řeč a jazyk. Praha : ISVN, 1996. Čermák, F.: Syntagmatika a paradigmatika českého slova, Praha : Karlova Univerzita, 1990. Hajič J.: Disambiguation of Rich Inflection (Computational Morphology of Czech). Praha : Karolinum, Charles University Press, 2004. Havránek, B., Jedlička, A.: Česká mluvnice. Praha : SPN, 1981. Hladká, Z. a kol.: Čeština v současné soukromé korespondenci. Dopisy, e-maily, SMS. Brno : Masarykova univerzita 2005. Karlík, P., Nekula, M., Rusínová, Z.: Příruční mluvnice češtiny, Praha : NLN, 1996. Komárek, M. a kol.: Mluvnice češtiny II., Praha : Academia, 1986. Osolsobě, K.: Popis gramatických významů jednoduchých slovesných tvarů v anotacích českých (slovenských) korpusů. SPFFMU A, 55, 2007, s. ???-???. Pala, K., Všianský, J.: Slovník českých synonym, Praha : NLN, 2000. Elektronická verze SSJČ a SSČ dostupná z chrome://debdict/content/debdict.xul Český národní korpus - SYN2000. Ústav Českého národního korpusu FF UK, Praha 2000. Dostupný z WWW: . Český národní korpus - SYN2005. Ústav Českého národního korpusu FF UK, Praha 2005. Dostupný z WWW: . Český národní korpus - BMK. Ústav Českého národního korpusu FF UK, Praha 2001. Dostupný z WWW: . Korpusový manažer bonito : http://ucnk.ff.cuni.cz/bonito/ 8