D 2001

Three Approaches to Word Sense Disambiguation for Czech

KRÁL, Robert

Základní údaje

Originální název

Three Approaches to Word Sense Disambiguation for Czech

Autoři

KRÁL, Robert

Vydání

Berlin, Text, Speech and Dialogue, 4th International Conference, TSD 2001, s. 174-179, LNAI 2166, 2001

Nakladatel

Springer-Verlag

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

20206 Computer hardware and architecture

Stát vydavatele

Německo

Utajení

není předmětem státního či obchodního tajemství

Kód RIV

RIV/00216224:14330/01:00004673

Organizační jednotka

Fakulta informatiky

ISBN

3-540-42557-8
Změněno: 27. 5. 2002 14:11, Mgr. BcA. Robert Král, Ph.D.

Anotace

V originále

Before building a full wsd system it is necessary to have a balanced and representative corpus annotated with sense tags. This requirement is not certainly fulfilled for the Czech language. Thus, we decided to develop some particular methods for annotating texts and we have started with the most common nouns. In our approach, the disambiguation algorithm based on sets of words (called bags) was used. The advantage of this approach is the possibility of filling bags in various ways. Our ultimate goal is to reduce manual work as much as possible. Here we present three basic ways of filling bags. The first one is based on the machine readable version of SSJČ, the second takes the advantage of learning from manually annotated text and the strategy of pseudoclustering is the third one.

Návaznosti

MSM 143300003, záměr
Název: Interakce člověka s počítačem, dialogové systémy a asistivní technologie
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Interakce člověka s počítačem, dialogové systémy a asistivní technologie