‹#› 1 Syntetické futurum v češtině MAK-CJBB84 25. 4. 2012 ‹#› 2 Značkovaní korpusů je dobrá věc ALE llingvistické předpoklady : morfologický slovník + tagset ltechnická řešení (rozdělení na pozice, různé nelingvistické přístupy k disambiguaci) l ‹#› 3 Kvalita značkování z lingvistického hlediska lkvalita zdrojů lmožnosti a meze formalizace lúplnost výčtu některých okrajových jevů ‹#› 4 Futurum lanalytické futurum (slovesa nedokonavá) ldokonavá slovesa a jejich prézentní tvary lsyntetické futurum (budu, jít, jet, ...) ‹#› 5 Gramatiky a slovníky lgramatiky: definují skupinu sloves pohybu výčtem (rozsah odpovídá rozsahu gramatiky). lpraxe slovníků je nejednotná (u některých sloves např. vézt se SSJČ a SSČ rozcházejí). l ‹#› 6 Česká mluvnice (Havránek, Jedlička, 1981) lhovoří o: … „některých slovesech nedokonavých (většinou s významem pohybu, řidčeji stavu) …. l … nemají složený tvar času budoucího, leda v jiném významovém odstínu … lmožnost tvořit u některých tvarů imperativ … s malým významovým rozdílem, který je na dvou příkladech charakterizován u slovesa pojď jako … pohyb k mluvčímu… u sloves poběž, poleť jako …počátek lsamostatně se zmiňuje imperativ poslyš, který nemá oporu ve tvarech syntetického futura indikativu (slyšet - *poslyším – slyš – poslyš) ‹#› 7 Příruční mluvnice češtiny (Karlík, Nekula, Rusínová, 1996) lhovoří o … zvláštní skupině sloves pohybu a některých jiných, která pohyb implikují ldále uvádí, že … u nich lze rozeznat rozdíl mezi určeností a neurčeností co do cíle pohybu… přičemž … oba tyto významy se vyjadřují v rámci sloves nedokonavého vidu… lkonstatuje, že … nejde o dokonavé futurum, od těchto forem nelze utvořit infinitiv ani préteritum, jsou však možné formy složené ... ‹#› 8 Čeština řeč a jazyk (Čechová a kol., 1996) lU některých nedokonavých sloves (sloves pohybu a změny stavu) se tvoří ještě (míní se kromě tvarů budu + infinitiv nedokonavého slovesa) tvary jednoduché s předponou po-. ‹#› 9 Mluvnice češtiny 2 (Komárek a kol., 1987) l… prefix po- (s ojediněle se vyskytující variantou pů-): spojuje se s tvary ind. préz. akt. některých nedokonavých sloves, zvláště s významem jednosměrného pohybu v tzv. jednoduché, syntetické futurum …, lmá tedy gramatickou kategoriální platnost; tato platnost je oslabena ve tvarech imperativu těchto sloves, …, které jsou synonymní s tvary bez tohoto prefixu. lslovesa jsou charakterizována jako …. slovesa jednosměrného pohybu a slovesa trvání nebo změny stavu (jež jsou rovněž pojaty jako jednosměrný pohyb) lpředpona po- má zde význam pouze gramatický, nikoli lexikální; nemění ani lexikální význam, ani nedokonavý vid slovesa lvedle futurálních tvarů jednoduchých je možno tvořit i pravidelné tvary složené futura opisného, …. ‹#› 10 Mluvnice současné češtiny (Cvrček a kol., 2010) lSpecifická omezená skupina sloves má tvary budoucího času vyjádřené pomocí předpony po/pů : půjdu, pojedu, potrvá, poroste, ponesu, povedu, poběžím, poletíš, polezeš, poteče, poženu, povezeme, poplujete, pohrne, pocestujou, postěhuje, poplazí. ‹#› 11 Syntetické futurum – slovníky a další tištěné zdroje lSSJČ : 50 sloves (27 navíc, které neuvádí SSČ) lSSČ : 21 sloves (3 navíc, které neuvádí SSJČ) lSSSJČ i SSČ : 18 sloves lČermák, 1990, s. 106 : 5 dalších sloves, které neuvádí ani SSJČ, ani SSČ lŠmilauer, 1972 s. 223 : 2 další slovesa lKopečný,1962 s. 46-50 : 115 sloves ‹#› 12 vézt ‹#› 13 vézt ‹#› 14 lézt ‹#› 15 lézt ‹#› 16 Zachycení na úrovni morfologické značky (tagu) lPozice 2 - Detailní určení slovního druhu lB sloveso, tvar přítomného nebo budoucího času lPozice 9 - Čas -neurčuje se lF futurum (budoucí čas) lH minulost nebo přítomnost (P/R)* lP prézens (přítomný čas) lR minulý čas lX libovolný čas (F/R/P)*) ‹#› 17 SYN VB......F.* ltvary budu, budeš, ... lněkolik sloves, která tvoří synteticky futurum prefixem po-/pů- ‹#› 18 Frekvenční seznam lemmat ‹#› 19 Korpus SYN (22) lbýt 5302509 jít 181280 ltrvat 85600 jet 82167 lrůst 14078 nést 12481 lběžet 10456 letět 5800 ltéci 3710 vézt 2555 lvést 2278 hrnout 969 lcestovat 961 plout 758 llézt 755 stěhovat 406 lhnát 382 řítit 22 lplavat 21 plazit 19 lkrást 9 kvést 4 ‹#› 20 Mohou korpusy přispět k poznání tohoto jevu ? la) Výčet získaný pomocí výše uvedeného tagu je úplný/neúplný. lb) Další doklady se vyskytují/nevyskytují v korpusech. lc) Existuje/neexistuje nějaký postup, jak je z korpusů získat/získávat. l ‹#› 21 Hledání kandidátů syntetického futura v lemmatizovaných korpusech l llemma=„po.*“ lP-filtr tag=„(VB......P.*)|(X.*)“ lN-filtrem lze odstranit lemmata na pod-, popo-, pona-, ..., kdy může jít o jiný prefix, kombinaci více prefixů atd. lfrekvenční seznam lemmat lruční výběr kandidátů lověření předpokladu ‹#› 22 Frekvenční seznam lemmat ‹#› 23 Příklady chybné lemmatizace ‹#› 24 Heslo trvat ‹#› 25 Heslo potrvat ‹#› 26 SYN2000 ‹#› 27 SYN2005 ‹#› 28 SYN2010 ‹#› 29 Výsledky získané z korpusů (20) (ne SSJČ a SSČ) lpofrčí/frčet (*)pověje/vát l*pomaže/mazat *povalí (se)/valit (se) lpokráčí/kráčet *popase se/pást se l*pošine se/šinout se posviští/svištět l*potáhne/táhnout se *potrénuje/trénovat l*popeče s kým/péci pošupe/šupat lpobrodí se/brodit se pocrčí/crčet lpošupajdí/šupajdit poharcuje/harcovat lpokoučuje/koučovat *povesluje/veslovat lpoprýští/prýštit pošupačí/šupačit ‹#› 30 Výsledky získané z internetu (3) (ne SSJČ a SSČ) lpotryská/tryskat lpotrtá/trtat lpozdrhá/zdrhat ‹#› 31 pofrčet ? pofrčel.* ? (ani jeden výskyt v SYN) ‹#› 32 povanout ? povanul ? ‹#› 33 povát ? povál ? ‹#› 34 NIKOLI: pověj ‹#› 35 ALE: na internetu l... Možná by neškodilo, kdyby vítr, který nám přinese novou vládu, zavál i do těchto koutů. Uvidíme, jakým směrem pověje i na našem resortním ministerstvu, které přislíbilo o tomto tématu jednat. ... lPověj, větříčku, pověj, moju hlavěnku ověj! Moja hlavěnka mladá větříčkovi je ráda. l... Pověje-li vítr od slunce východu, mříti bude dobytek bez plodu. Pověje-li vítr od slunce západu, králové, páni nemocní budou, ... ‹#› 36 mazat NEBO pomazat ‹#› 37 bmk ‹#› 38 ORAL2008 ‹#› 39 Zastoupení lemmat v tištěných zdrojích, korpusech a na internetu slovníky a tištěné zdroje 53+7 lemmat 72,29 % pouze korpusy 20 lemmat 24,1 % korpusy i slovníky a tištěné zdroje 37 lemmat 44,58 % pouze slovníky a tištěné zdroje 23 lemmat 27,71 % pouze internet 3 lemmata 3,61 % slovníky + tištěné zdroje + korpusy 83 lemmat 100 % ‹#› 40 Podíl dokladů z tištěných zdrojů a z korpusů l l ‹#› 41 Hodnocení lseznam lze nadále doplňovat (slovníky, gramatiky, učebnice) lvysoká míra homonymie – problémy automatické lemmatizace a následné disambiguace ldalší možnosti zkoumat poměr syntetického a analytického vyjádření futura (rozsah korpusů) lsémantické vymezení skupiny sloves ‹#› 42 Upřesnění definice významu sloves schopných tvořit tvary syntetického futura lPohyb v konkrétním slova smyslu (přemísťování z místa na místo jednosměrně/ v určeném směru) : (půjde, pojede, poběží, poplazí se, pokráčí, pošine se, povalí, pomaže, ...) lpohyb bez určení směru (různými směry) : (pošíří se, poline se, ... ). lProces zahrnující pohyb la) přírodní (povane, pověje, pol(i/e)je, poprší, ...); lb) s neživým nositelem (rostlina: pokvete, poroste, poplazí se, strom: ponese (ovoce), ...; hudba: poline se, povalí ...; vůně: pošíří se, poline se, ...; voda: poteče, povalí, pocrčí, poprýští..., zpráva: pošíří se ,... ); lc) mentální (popálí mu to) ld) s živým nositelem (poroste, popase se, ... pták: ponese (vejce), ...); le) ve významu fungovat (v přeneseném významu jít) (správně) poklape, pošlape, povalí ...; vycházet s někým, (poklape, pošlape, popeče, ...). lf) ve významu vést (pokoučuje, potrénuje, povládne) l ‹#› 43 Závěr lotevřená třída sloves lupřesnění definice lopravy chybné lemmatizace a značkování ‹#› 44 Bibliografie l lCVRČEK A KOL. (2010): Mluvnice současné češtiny. Praha : Karolinum. lČECHOVÁ A KOL. (1996): Čeština, řeč a jazyk. Praha : ISVN. lČERMÁK, F. (1990): Syntagmatika a paradigmatika českého slova. Praha : Karlova Univerzita. lHAJIČ J. (1994): Unification Morphology Grammar. Praha : MFF UK, (disert. práce). lHAJIČ J. (2004): Desambiguation of Rich Inflection (Computational Morphology of Czech). Praha : Karolinum. lHAVRÁNEK, B. A KOL. (1989): Slovník spisovného jazyka českého (SSJČ). Praha : Academia. l FILIPEC, J. A KOL. (2005): Slovníku spisovné češtiny pro školu a veřejnost (SSČ). Praha : Academia. lKARLÍK, P., NEKULA, M., RUSÍNOVÁ, Z. (1996): Příruční mluvnice češtiny. Praha : Nakladatelství Lidové noviny. lKARLÍK, P., NEKULA, M., PLESKALOVÁ, J. (2002): Encyklopedický slovník češtiny. Praha: Nakladatelství Lidové noviny. ‹#› 45 Bibliografie lKOMÁREK, M. a kol. (1986): Mluvnice češtiny II., Praha : Academia. lKOPEČNÝ, F. (1962): Slovesný vid v češtině. Praha : Nakladatelství československé akademie věd. lOSOLSOBĚ, K. (2007): Syntetické futurum v češtině – gramatiky, slovníky, korpusy. Přednášky a besedy z XL. běhu LŠSS. Brno, s. 131-144. lOSOLSOBĚ, K. (2007): Popis gramatických významů jednoduchých slovesných tvarů v anotacích českých (slovenských) korpusů. SPFFMU A, 55, s. 201-218. lOSOLSOBĚ, K. (2008): Značkování gramatických kategorií v korpusech ČNK a jejich zachycení v gramatice a ve slovníku (syntetické futurum, stupňování adjektiv, neurčité číslovky a příslovce míry). In Štícha, F. (ed.) Grammar & Corpora / Gramatika a korpus 2007. Academia : Praha, s. 407-416. lSEDLÁČEK, R. (2004): Morphematic analyser for Czech. Brno : FI MU (disert. práce). lŠMILAUER, V. (1972): Nauka o českém jazyku. Praha : SPN. l l ‹#› 46 Elektronické zdroje lSYN: Český národní korpus - SYN. Ústav Českého národního korpusu FF UK, Praha. Cit. 20. 03. 2011, dostupný z WWW: . lKorpusový manažer BONITO [online]. 2011. Cit. 20. 03. 2011, dostupný z . lAutomatický analyzátor ajka [online] 2011. Cit. 20. 03. 2011, dostupný z . lInternetový vyhledávač Google [online]. 2011. Cit. 20. 03. 2011, dostupný z . lDebDict – internetový prohlížeč slovníků umožňující mj. přístup k elektronickým verzím SSJČ, SSČ, PSČ [online]. 2011. Cit. 20. 03. 2011, dostupný z: . ‹#› 47 Úkol- závěrečná prezentace lZe seznamu sloves, která mohou v češtině tvořit futurum synteticky i analyticky vyberte 3 slovesa. Popište, jak lze shromáždit podklady pro korpusový výzkum frekvence a dalších aspektů užití forem syntetických a analytických. Postup i výsledky prezentujte. lOdevzdat do zpt. týdne. 9.5. 2012 je možné přijít na konzultaci (pravidelná výuka nebude). lV případě pozdějšího odevzdání je třeba se omluvit.