OSOLSOBĚ, Klára a Hana ŽIŽKOVÁ. Homonymie mezi apelativy a proprii jako problém automatické morfologické analýzy češtiny. Acta onomastica. AV ČR, Ústav pro jazyk český, 2020, roč. 61, č. 1, s. 161-174. ISSN 1211-4413.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Homonymie mezi apelativy a proprii jako problém automatické morfologické analýzy češtiny
Název anglicky Homonymy among Czech common and proper nouns as the problem of automatic morphological analysis
Autoři OSOLSOBĚ, Klára (203 Česká republika, garant, domácí) a Hana ŽIŽKOVÁ (203 Česká republika, domácí).
Vydání Acta onomastica, AV ČR, Ústav pro jazyk český, 2020, 1211-4413.
Další údaje
Originální jazyk čeština
Typ výsledku Článek v odborném periodiku
Obor 60203 Linguistics
Stát vydavatele Česká republika
Utajení není předmětem státního či obchodního tajemství
WWW Acta Onomastica URL
Kód RIV RIV/00216224:14210/20:00115564
Organizační jednotka Filozofická fakulta
Klíčová slova anglicky tokenisation; lemmatisation; disambiguation; corpus linguistics
Příznaky Recenzováno
Změnil Změnila: doc. PhDr. Klára Osolsobě, Dr., učo 1996. Změněno: 18. 10. 2022 12:43.
Anotace
Cílem této práce je korpusová analýza jednoho typu českých podstatných jmen (typ Zubří). Adekvátní anotace (lemmatizace a morfologické značkování) vlastních podstatných jmen typu Zubří závisí na několika okolnostech: 1) pokrytí slovníku automatického analyzátoru; 2) přesný popis variability forem flexe; 3) netriviální desambiguace četných homonymních slovních forem. Věříme, že i když je splnění prvních dvou podmínek možné, adekvátní desambiguace jde nad možnosti automatické morfologické analýzy.
Anotace anglicky
The aim of this paper is a corpus-based analysis of one type of Czech proper nouns (type Zubří). We will argue that adequate annotation (lemmatisation and morphological tagging) of proper nouns type Zubří depends on several circumstances: 1) coverage of the dictionary of the automatic analyzer; 2) accurate description of the variability of inflexion forms; 3) not trivial disambiguation of numerous homonym word-forms. We believe that while satisfying the first two conditions is possible, adequate disambiguation goes beyond the possibilities of automatic morphological analysis.
Návaznosti
MUNI/A/0913/2019, interní kód MUNázev: Čeština v jednotě synchronie a diachronie - 2020
Investor: Masarykova univerzita, Čeština v jednotě synchronie a diachronie - 2020, DO R. 2020_Kategorie A - Specifický výzkum - Studentské výzkumné projekty
VytisknoutZobrazeno: 25. 4. 2024 18:00