OSOLSOBĚ, Klára a Hana ŽIŽKOVÁ. Synonymní / variantní tvary verbálního substantiva jako problém konzistentní lemmatizace. In XVI Międzynarodowa Konferencja Naukowa WYRAZ I ZDANIE W JĘZYKACH SŁOWIAŃSKICH OPIS, KONFRONTACJA, PRZEKŁAD. 2022.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Synonymní / variantní tvary verbálního substantiva jako problém konzistentní lemmatizace
Autoři OSOLSOBĚ, Klára a Hana ŽIŽKOVÁ.
Vydání XVI Międzynarodowa Konferencja Naukowa WYRAZ I ZDANIE W JĘZYKACH SŁOWIAŃSKICH OPIS, KONFRONTACJA, PRZEKŁAD, 2022.
Další údaje
Originální jazyk čeština
Typ výsledku Prezentace na konferencích
Obor 60203 Linguistics
Stát vydavatele Polsko
Utajení není předmětem státního či obchodního tajemství
Organizační jednotka Filozofická fakulta
Klíčová slova česky lemmatizace; varianty; verbální substantiva
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnila: Mgr. Hana Žižková, Ph.D., učo 11782. Změněno: 20. 10. 2022 15:47.
Anotace
Jako východisko pro náš příspěvek z oblasti počítačového zpracování přirozeného jazyka, konkrétně automatické morfologické analýzy, jsme zvolili dva koncepty, které byly propracovány v rámci projektu Novamorf. První z nich představuje koncept vícenásobného lemmatu a druhý vyjadřuje tzv. zlaté pravidlo morfologie, tedy požadavek na systematické zpracování variant, aby se každá varianta lišila dvojicí lemma + tag. Tyto dva požadavky vedou k systematickému korpusovému studiu variací v české morfologii. Cílem našeho příspěvku je podat ucelený obraz o důsledné lemmatizaci slovesných podstatných jmen zakončených na -ní/-tí, a to zejména v těch případech, kdy lze dějové jméno vytvořit od dvou podob kmene minulého, jako například nařčení/nařknutí, vysání/vysátí, zmražení/zmrazení ad. Popis tvarosloví verbálních substantiv v synchronní podobě prezentovaný morfologickou anotací korpusů řady SYN (nejnověji SYN v10) vykazuje nekonzistentní řešení v případě, že verbální substantivum má variantní tvary. Zaměříme se tudíž na interpretace tvarů vebálních substantiv od variant jednoho slovesného kmene, které lze interpretovat jako tvary synonymní / variantní. Také se budeme snažit zaznamenat nedostatky pokrytí morfologického slovníku MorfFlex.
Návaznosti
MUNI/A/1137/2021, interní kód MUNázev: Lexikon a gramatika češtiny II - 2022
Investor: Masarykova univerzita, Lexikon a gramatika češtiny II - 2022
VytisknoutZobrazeno: 25. 4. 2024 14:01