J 2024

Synonymní/variantní tvary verbálního substantiva jako problém konzistentní lemmatizace

OSOLSOBĚ, Klára a Hana ŽIŽKOVÁ

Základní údaje

Originální název

Synonymní/variantní tvary verbálního substantiva jako problém konzistentní lemmatizace

Název anglicky

Synonymous/variant forms of verbal nouns as a problem of consistent lemmatization

Autoři

OSOLSOBĚ, Klára (203 Česká republika, domácí) a Hana ŽIŽKOVÁ (203 Česká republika, garant, domácí)

Vydání

Acta Universitatis Wratislaviensis : Slavica Wratislaviensia, Wrocław, Wydawnictwo Uniwersytetu Wrocławskiego, Wydawnictwo „Szermierz” sp. z o.o. 2024, 0137-1150

Další údaje

Jazyk

čeština

Typ výsledku

Článek v odborném periodiku

Obor

60203 Linguistics

Stát vydavatele

Polsko

Utajení

není předmětem státního či obchodního tajemství

Odkazy

Kód RIV

RIV/00216224:14210/24:00137627

Organizační jednotka

Filozofická fakulta

Klíčová slova česky

lemmatizace; verbální substantivum; varianty

Klíčová slova anglicky

lemmatization; verbal noun; variants

Štítky

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 10. 2. 2025 15:37, Bc. Alena Kmochová

Anotace

V originále

Jako východisko pro náš příspěvek z oblasti počítačového zpracování přirozeného jazyka, konkrétně automatické morfologické analýzy, jsme zvolili dva koncepty, které byly propracovány v rámci projektu NovaMorf. První z nich představuje koncept vícenásobného lemmatu a druhý vyjadřuje tzv. zlaté pravidlo morfologie, tedy požadavek na systematické zpracování variant, aby se každá varianta lišila dvojicí lemma + tag. Tyto dva požadavky vedou k systematickému korpusovému studiu variací v české morfologii. Cílem našeho příspěvku je podat ucelený obraz o důsledné lemmatizaci slovesných podstatných jmen zakončených na -ní/-tí, a to zejména v těch případech, kdy lze dějové jméno vytvořit od dvou podob kmene minulého, jako například nařčení/nařknutí, vysání/vysátí, zmražení/zmrazení ad. Popis tvarosloví verbálních substantiv v synchronní podobě prezentovaný morfologickou anotací korpusů řady SYN (nejnověji syn_v10) vykazuje nekonzistentní řešení v případě, že verbální substantivum má variantní tvary. Zaměříme se tudíž na interpretace tvarů verbálních substantiv od variant jednoho slovesa tvořených od variantního kmene, které lze interpretovat jako tvary synonymní/variantní. Také se budeme snažit zaznamenat nedostatky pokrytí morfologického slovníku MorfFlex.

Anglicky

As a starting point for our contribution in the area of computer processing of natural language, specifically automatic morphological analysis, we have chosen two concepts that have been developed in the NovaMorf project. The first one is the concept of multiple lemmas and the second one follows the so-called golden rule of morphology, i.e., the requirement for systematic processing nařčení/nařknutí, vysání/vysátí, zmražení/zmrazení, etc. The description of the morphology of verbal nouns in synchronic form presented by the morphological annotation of the SYN series corpora (most recently syn_v10) shows inconsistent solutions when the verbal noun has variant forms. We will therefore focus on the interpretations of the forms of verbal sub- stantives from variants of a verb formed from a variant stem, which can be interpreted as synonymous/variant forms. We will also try to note the deficiencies in the coverage of the MorfFlex morphological dictionary.

Návaznosti

MUNI/A/1368/2023, interní kód MU
Název: Lexikon a gramatika češtiny IV - 2024
Investor: Masarykova univerzita, Lexikon a gramatika češtiny IV - 2024