J 2004

Unsupervised Learning of Rules for Morphological Disambiguation

ŠMERK, Pavel

Basic information

Original name

Unsupervised Learning of Rules for Morphological Disambiguation

Name in Czech

Učení bez učitele morfologických pravidel pro desambiguaci

Authors

ŠMERK, Pavel (203 Czech Republic, guarantor, belonging to the institution)

Edition

Lecture Notes in Computer Science, Berlin, Springer Verlag, 2004, 0302-9743

Other information

Language

English

Type of outcome

Článek v odborném periodiku

Field of Study

10201 Computer sciences, information science, bioinformatics

Country of publisher

Czech Republic

Confidentiality degree

není předmětem státního či obchodního tajemství

Impact factor

Impact factor: 0.513

RIV identification code

RIV/00216224:14330/04:00010303

Organization unit

Faculty of Informatics

UT WoS

000224026300027

Keywords in English

morphological disambiguation;tagging;morphological tagging;unsupervised learning

Tags

International impact, Reviewed
Změněno: 14/6/2013 15:49, RNDr. Pavel Šmerk, Ph.D.

Abstract

V originále

State-of-the-art rule-based tools for morphological disambiguation use either manually crafted rules or rules learnt from manually annotated data. This paper presents a new method of learning rules for morphological disambiguation using only unannotated data. The inductive logic programming and active learning are employed. The induced rules display very promising acurracy. Also the probable limitations of the proposed method are discussed.

In Czech

Současné nástroje pro morfologickou desambiguaci využívají manuálně vytvořených pravidel anebo jsou trénovány na morfologicky označkovaných datech. Článek představuje novou metodu učení pravidel pro morfologickou desambiguaci, která se učí pouze na neoznačkovaných datech s využitím induktivního logického programování a aktivního učení. Získaná pravidla vykazují velmi slibnou přesnost. V článku jsou diskutována i pravděpodobná omezení navrhované metody.