J 2004

Unsupervised Learning of Rules for Morphological Disambiguation

ŠMERK, Pavel

Základní údaje

Originální název

Unsupervised Learning of Rules for Morphological Disambiguation

Název česky

Učení bez učitele morfologických pravidel pro desambiguaci

Autoři

ŠMERK, Pavel (203 Česká republika, garant, domácí)

Vydání

Lecture Notes in Computer Science, Berlin, Springer Verlag, 2004, 0302-9743

Další údaje

Jazyk

angličtina

Typ výsledku

Článek v odborném periodiku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Impakt faktor

Impact factor: 0.513

Kód RIV

RIV/00216224:14330/04:00010303

Organizační jednotka

Fakulta informatiky

UT WoS

000224026300027

Klíčová slova anglicky

morphological disambiguation;tagging;morphological tagging;unsupervised learning

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 14. 6. 2013 15:49, RNDr. Pavel Šmerk, Ph.D.

Anotace

V originále

State-of-the-art rule-based tools for morphological disambiguation use either manually crafted rules or rules learnt from manually annotated data. This paper presents a new method of learning rules for morphological disambiguation using only unannotated data. The inductive logic programming and active learning are employed. The induced rules display very promising acurracy. Also the probable limitations of the proposed method are discussed.

Česky

Současné nástroje pro morfologickou desambiguaci využívají manuálně vytvořených pravidel anebo jsou trénovány na morfologicky označkovaných datech. Článek představuje novou metodu učení pravidel pro morfologickou desambiguaci, která se učí pouze na neoznačkovaných datech s využitím induktivního logického programování a aktivního učení. Získaná pravidla vykazují velmi slibnou přesnost. V článku jsou diskutována i pravděpodobná omezení navrhované metody.