D 2024

On Rapid Annotation of Czech Headwords : Analysing the First Tasks of Czech Dictionary Express

KOVAŘÍK, František; Vojtěch KOVÁŘ a Marek BLAHUŠ

Základní údaje

Originální název

On Rapid Annotation of Czech Headwords : Analysing the First Tasks of Czech Dictionary Express

Autoři

KOVAŘÍK, František (203 Česká republika, garant, domácí); Vojtěch KOVÁŘ ORCID (203 Česká republika, domácí) a Marek BLAHUŠ (203 Česká republika)

Vydání

Cavtat, Lexicography and Semantics : Proceedings of the XXI EURALEX International Congress, od s. 336-344, 9 s. 2024

Nakladatel

Institut za hrvatski jezik

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

60203 Linguistics

Stát vydavatele

Chorvatsko

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

elektronická verze "online"

Odkazy

Kód RIV

RIV/00216224:14210/24:00137475

Organizační jednotka

Filozofická fakulta

ISBN

978-953-7967-77-2

ISSN

EID Scopus

2-s2.0-85207503814

Klíčová slova česky

návrh slovníku; post-editing lexicography; anotace korpusu; poloautomatická tvorba slovníku; Dictionary Express; čeština

Klíčová slova anglicky

dictionary drafting; post-editing lexicography; corpus annotation; semi-automatic dictionary making; Dictionary Express; Czech

Štítky

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 12. 2. 2025 09:45, Bc. Alena Kmochová

Anotace

V originále

Czech Dictionary Express has been introduced as a project of a semi- automatically made dictionary of the Czech language. (Kovařík, 2023) The Dictionary Express method (formerly known as rapid dictionaries) has been used for several different languages (Baisa et al., 2019; Blahuš et al., 2023).In this paper, we analyse the automatic and manual tools used in Czech Dictionary Express and inspect the statistical and qualitative data such tools provide. As the first task of the project – the headword annotation –comes to an end, we examine some opportunities and difficulties of the method used, as well as the data acquired in the process.

Návaznosti

MUNI/A/1368/2023, interní kód MU
Název: Lexikon a gramatika češtiny IV - 2024
Investor: Masarykova univerzita, Lexikon a gramatika češtiny IV - 2024