Příslovečné spřežky, slovnědruhové přesahy tvary na o PLIN032 O čem budeme hovořit •Adverbium jako slovní druh •Jak jsou lemmatizovány a slovnědruhově interpretovány tvary adverbií, které končí na –o v korpusech SYN •Jak vyhledat tvary potenciálních adverbiálních spřežky i nespřažené ustrnulé tvary (nikoli jen po předložce) •Návrh lemmatizace • Adverbium jako slovní druh •Neohebný, autosémantický, primární syntaktická funkce adverbiální určení •Neohebnost a původ adverbií – slovnědruhová charakteristika •Slovnědruhová přesažnost zájmenných příslovcí •Adverbializace jmen – adverbiální spřežky •Kodifikace variant Slovnědruhová interpretace adverbií •Dg.* •Db.* •X.* •Jiné Jak jsou lemmatizovány a slovnědruhově interpretovány tvary adverbií, které končí na –o v korpusech SYN •[lc=".*o" & tag="D.*"] • • Vytvoříme frekvinční seznam (Vlastní) POS – part of speech Otázky •Proč jsou některá označkována jako stupňovatelná (Dg) a jiná (Db) nikoli? •Je tvar na [eě]ji vždy vztažitelný ke tvaru na o? •Co hraje roli v případě, že tomu tak není? •Existují tvary na o, jejichž lemmatem není tvar na o? • • Je tvar na [eě]ji vždy vztažitelný ke tvaru na o Je tvar na [eě]ji vždy vztažitelný ke tvaru na o? Co hraje roli v případě, že tomu tak není? •Jsou všechny tvary na o, které jsme vyhledali pomocí nástroje Morfio adverbia? • Vyhledej pomocí nástroje Morfio dvojice na o a [eě] Rozdíl •sémantika •syntax •slovnědruhová příslušnost (SD přechod/přesah) líto lítě .*lítěji () Existují tvary na o, jejichž lemmatem není tvar na o? P-filtr [lc=".*o" & lemma!=".*o"] Tvary adverbií na o, které nemají lemma na o, aneb jak je to s ohebností/variantností adverbií? hledání dvojic nástrojem Morfio výpis Jak vyhledat tvary potenciálních adverbiálních spřežky i nespřažené ustrnulé tvary (nikoli jen po předložce) •Podívejte se do korpusu na tvary předložkových spojení a spřežek. • dvojice [eě]/o Pozorujte vyhledané dvojice a pokuste se je klasifikovat. Zopakujte vyhledávání tak, aby typ na o nebyl rozpoznán automatickou analýzou. Úkoly •Výsledky seřaďte podle frekvence vzoru2. •Definujte nedostatky slovníku použitého analyzátoru. •Podívejte se na typ adverbií na y. Jak jsou lemmatizovány a značkovány tvary typu po .*[sc]ku? Jak lemmatizovat a interpretovat tvar such, sucha, sucho, suchy ale i suši? •a. Bylo velké sucho. (substantivum → POS=N) •b. Bylo velmi sucho. (adverbium → POS=D); •c. Bylo sucho. (adverbium → POS=D) •d. Dítě bylo sucho. (adjektivum – jmenný tvar → POS=A); •e. Chlapi seděli v hospodě na sucho. (adverbium → POS=D) •f. Chlapi si v hospodě stěžovali na sucho. (substantivum → POS=N) •g. Do sucha, které ničilo úrodu v roce 1947, jsem hroznější počasí nezažil. (substantivum → POS=N) •h. Utři se do sucha. (adverbium → POS=D) •i. Jsem už zcela such, manželka je sucha i dítka jsou již sucha, ale šaty nejsou dosud zcela suchy. (adjektivum – jmenný tvar → POS=A) •j. Tolik such nebylo ani v minulém století. (substantivum → POS=N) •k. Tak to by bylo v suchu. (adverbium → POS=D) •l. V takovém dlouhotrvajícím suchu dojde snadno k požáru. (substantivum → POS=N) •m. Nevěděli jsme si rady s velkými suchy. (substantivum → POS=N) • • Závěr •Jmenné tvary adjektiv •Adverbializace jmenných tvarů •Pravidla pro zaznamenávání adverbializovaných jmenných tvarů ve slovnících automatických analyzátorů •Pravidla pro desambiguaci homonymní tvarů • Úkol na 24. 10. 2022 •V návrhu na nové značkování české morfologie (NovaMorf) se předpokládá, že tvary pasivních příčestí budou lemmatizovány několikanásobným lemmatem, a sice dlouhým tvarem adjektiva tvořeného z krátkého tvaru (příčestí) a infinitivem. •nesen {nést, nesený} •Jednou z námitek proti tomuto řešení byla nedoloženost dlouhých tvarů. •Pomocí nástroje Morfio vyhledejte dvojice pasivní příčestí na o a adjektivum z něho utvořené (dlouhý tvar) na ý. Vyberte ze seznamu Vzoru 1 krátké tvary s nedoloženými dlouhými tvary a pokuste se k nejfrekventovanějším (s frekvencí vyšší než 20) dlouhé tvary dohledat v korpusech synv10 a pokud nenajdete, v korpusu Araneum.