k 2022

Synonymní / variantní tvary verbálního substantiva jako problém konzistentní lemmatizace

OSOLSOBĚ, Klára and Hana ŽIŽKOVÁ

Basic information

Original name

Synonymní / variantní tvary verbálního substantiva jako problém konzistentní lemmatizace

Edition

XVI Międzynarodowa Konferencja Naukowa WYRAZ I ZDANIE W JĘZYKACH SŁOWIAŃSKICH OPIS, KONFRONTACJA, PRZEKŁAD, 2022

Other information

Language

Czech

Type of outcome

Prezentace na konferencích

Field of Study

60203 Linguistics

Country of publisher

Poland

Confidentiality degree

není předmětem státního či obchodního tajemství

Organization unit

Faculty of Arts

Keywords (in Czech)

lemmatizace; varianty; verbální substantiva

Tags

International impact, Reviewed
Změněno: 20/10/2022 15:47, Mgr. Hana Žižková, Ph.D.

Abstract

V originále

Jako východisko pro náš příspěvek z oblasti počítačového zpracování přirozeného jazyka, konkrétně automatické morfologické analýzy, jsme zvolili dva koncepty, které byly propracovány v rámci projektu Novamorf. První z nich představuje koncept vícenásobného lemmatu a druhý vyjadřuje tzv. zlaté pravidlo morfologie, tedy požadavek na systematické zpracování variant, aby se každá varianta lišila dvojicí lemma + tag. Tyto dva požadavky vedou k systematickému korpusovému studiu variací v české morfologii. Cílem našeho příspěvku je podat ucelený obraz o důsledné lemmatizaci slovesných podstatných jmen zakončených na -ní/-tí, a to zejména v těch případech, kdy lze dějové jméno vytvořit od dvou podob kmene minulého, jako například nařčení/nařknutí, vysání/vysátí, zmražení/zmrazení ad. Popis tvarosloví verbálních substantiv v synchronní podobě prezentovaný morfologickou anotací korpusů řady SYN (nejnověji SYN v10) vykazuje nekonzistentní řešení v případě, že verbální substantivum má variantní tvary. Zaměříme se tudíž na interpretace tvarů vebálních substantiv od variant jednoho slovesného kmene, které lze interpretovat jako tvary synonymní / variantní. Také se budeme snažit zaznamenat nedostatky pokrytí morfologického slovníku MorfFlex.

Links

MUNI/A/1137/2021, interní kód MU
Name: Lexikon a gramatika češtiny II - 2022
Investor: Masaryk University