2024
Synonymní/variantní tvary verbálního substantiva jako problém konzistentní lemmatizace
OSOLSOBĚ, Klára a Hana ŽIŽKOVÁZákladní údaje
Originální název
Synonymní/variantní tvary verbálního substantiva jako problém konzistentní lemmatizace
Název anglicky
Synonymous/variant forms of verbal nouns as a problem of consistent lemmatization
Autoři
OSOLSOBĚ, Klára (203 Česká republika, domácí) a Hana ŽIŽKOVÁ (203 Česká republika, garant, domácí)
Vydání
Acta Universitatis Wratislaviensis : Slavica Wratislaviensia, Wrocław, Wydawnictwo Uniwersytetu Wrocławskiego, Wydawnictwo „Szermierz” sp. z o.o. 2024, 0137-1150
Další údaje
Jazyk
čeština
Typ výsledku
Článek v odborném periodiku
Obor
60203 Linguistics
Stát vydavatele
Polsko
Utajení
není předmětem státního či obchodního tajemství
Odkazy
Kód RIV
RIV/00216224:14210/24:00137627
Organizační jednotka
Filozofická fakulta
Klíčová slova česky
lemmatizace; verbální substantivum; varianty
Klíčová slova anglicky
lemmatization; verbal noun; variants
Štítky
Příznaky
Mezinárodní význam, Recenzováno
Změněno: 10. 2. 2025 15:37, Bc. Alena Kmochová
V originále
Jako východisko pro náš příspěvek z oblasti počítačového zpracování přirozeného jazyka, konkrétně automatické morfologické analýzy, jsme zvolili dva koncepty, které byly propracovány v rámci projektu NovaMorf. První z nich představuje koncept vícenásobného lemmatu a druhý vyjadřuje tzv. zlaté pravidlo morfologie, tedy požadavek na systematické zpracování variant, aby se každá varianta lišila dvojicí lemma + tag. Tyto dva požadavky vedou k systematickému korpusovému studiu variací v české morfologii. Cílem našeho příspěvku je podat ucelený obraz o důsledné lemmatizaci slovesných podstatných jmen zakončených na -ní/-tí, a to zejména v těch případech, kdy lze dějové jméno vytvořit od dvou podob kmene minulého, jako například nařčení/nařknutí, vysání/vysátí, zmražení/zmrazení ad. Popis tvarosloví verbálních substantiv v synchronní podobě prezentovaný morfologickou anotací korpusů řady SYN (nejnověji syn_v10) vykazuje nekonzistentní řešení v případě, že verbální substantivum má variantní tvary. Zaměříme se tudíž na interpretace tvarů verbálních substantiv od variant jednoho slovesa tvořených od variantního kmene, které lze interpretovat jako tvary synonymní/variantní. Také se budeme snažit zaznamenat nedostatky pokrytí morfologického slovníku MorfFlex.
Anglicky
As a starting point for our contribution in the area of computer processing of natural language, specifically automatic morphological analysis, we have chosen two concepts that have been developed in the NovaMorf project. The first one is the concept of multiple lemmas and the second one follows the so-called golden rule of morphology, i.e., the requirement for systematic processing nařčení/nařknutí, vysání/vysátí, zmražení/zmrazení, etc. The description of the morphology of verbal nouns in synchronic form presented by the morphological annotation of the SYN series corpora (most recently syn_v10) shows inconsistent solutions when the verbal noun has variant forms. We will therefore focus on the interpretations of the forms of verbal sub- stantives from variants of a verb formed from a variant stem, which can be interpreted as synonymous/variant forms. We will also try to note the deficiencies in the coverage of the MorfFlex morphological dictionary.
Návaznosti
MUNI/A/1368/2023, interní kód MU |
|