D 2003

Detecting Annotation Errors in a Corpus by Induction of Syntactic Patterns

NEPIL, Miloslav

Základní údaje

Originální název

Detecting Annotation Errors in a Corpus by Induction of Syntactic Patterns

Autoři

NEPIL, Miloslav

Vydání

Berlin, Text, Speech and Dialogue: Sixth International Conference, TSD 2003, od s. 74-81, 8 s. 2003

Nakladatel

Springer Verlag

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Kód RIV

RIV/00216224:14330/03:00008945

Organizační jednotka

Fakulta informatiky

ISBN

3-540-200-24-X

UT WoS

000186386400010

Klíčová slova anglicky

error detection; morphological tagging; relational rule induction; syntactic patterns
Změněno: 9. 10. 2003 15:18, Mgr. Miloslav Nepil, Ph.D.

Anotace

V originále

This paper brings a new method for acquisition of syntactic patterns capable of detecting errors in annotated corpora. These patterns are acquired semi-automatically, by means of an inductive logic programming (relational data mining) system followed by a human expert supervision. The patterns acquired have been used for automatic detection and subsequent manual correction of the annotation errors found in DESAM, a morphologically annotated corpus of written Czech.

Návaznosti

MSM 143300003, záměr
Název: Interakce člověka s počítačem, dialogové systémy a asistivní technologie
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Interakce člověka s počítačem, dialogové systémy a asistivní technologie