D 2018

An Update of the Manually Annotated Amharic Corpus

RYCHLÝ, Pavel a Gezahegn Tsegaye LEMMA

Základní údaje

Originální název

An Update of the Manually Annotated Amharic Corpus

Autoři

RYCHLÝ, Pavel (203 Česká republika, garant, domácí) a Gezahegn Tsegaye LEMMA (231 Etiopie)

Vydání

Brno, Proceedings of the Twelfth Workshop on Recent Advances in Slavonic Natural Languages Processing, RASLAN 2018, od s. 124-128, 5 s. 2018

Nakladatel

Tribun EU

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10200 1.2 Computer and information sciences

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

tištěná verze "print"

Odkazy

Kód RIV

RIV/00216224:14330/18:00101542

Organizační jednotka

Fakulta informatiky

ISBN

978-80-263-1517-9

ISSN

UT WoS

000612420300015

Klíčová slova anglicky

text corpus; Amharic corpus; part-of-speech tagging
Změněno: 16. 5. 2022 15:45, Mgr. Michal Petr

Anotace

V originále

The paper describes an update of the manually annotated Amharic corpus WIC 2.0. It lists the problems of the previous version of the corpus and shows that even small changes in the corpus annotation could lead to a higher quality of trained part-of-speech taggers.

Návaznosti

GA18-23891S, projekt VaV
Název: Hyperintensionální usuzování nad texty přirozeného jazyka
Investor: Grantová agentura ČR, Hyperintensionální usuzování nad texty přirozeného jazyka
LM2015071, projekt VaV
Název: Jazyková výzkumná infrastruktura v České republice (Akronym: LINDAT-Clarin)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Projekt LINDAT-Clarin - Vybudování a provoz českého uzlu pan-evropské infrastruktury pro výzkum