C 2022

Evaluation of Automatically Constructed Word Meaning Explanations

STARÁ, Marie, Pavel RYCHLÝ a Aleš HORÁK

Základní údaje

Originální název

Evaluation of Automatically Constructed Word Meaning Explanations

Autoři

STARÁ, Marie, Pavel RYCHLÝ a Aleš HORÁK

Vydání

Rickmansworth, UK, Logically Speaking: A Festschrift for Marie Duží, od s. 99-112, 14 s. Tributes, Volume 49, 2022

Nakladatel

College Publications

Další údaje

Jazyk

angličtina

Typ výsledku

Kapitola resp. kapitoly v odborné knize

Obor

10200 1.2 Computer and information sciences

Stát vydavatele

Velká Británie a Severní Irsko

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

tištěná verze "print"

Organizační jednotka

Fakulta informatiky

ISBN

978-1-84890-419-4

Klíčová slova anglicky

explanations; word sketches; explanation construction

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 29. 3. 2023 14:33, RNDr. Pavel Šmerk, Ph.D.

Anotace

V originále

Preparing exact and comprehensive word meaning explanations is one of the key steps in the process of monolingual dictionary writing. In standard methodology, the explanations need an expert lexicographer who spends a substantial amount of time checking the consistency between the descriptive text and corpus evidence. In the following text, we present a new tool that derives explanations automatically based on collective information from very large corpora, particularly on word sketches. We also propose a quantitative evaluation of the constructed explanations, concentrating on explanations of nouns. The methodology is to a certain extent language independent; however, the presented verification is limited to Czech and English. We show that the presented approach allows to create explanations that contain data useful for understanding the word meaning in approximately 90% of cases. However, in many cases, the result requires post-editing to remove redundant information.

Návaznosti

LM2018101, projekt VaV
Název: Digitální výzkumná infrastruktura pro jazykové technologie, umění a humanitní vědy (Akronym: LINDAT/CLARIAH-CZ)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, LINDAT/CLARIAH-CZ - Digitální výzkumná infrastruktura pro jazykové technologie, umění a humanitní vědy