D 2003

Text Corpus with Errors

PALA, Karel; Pavel RYCHLÝ a Pavel SMRŽ

Základní údaje

Originální název

Text Corpus with Errors

Autoři

PALA, Karel; Pavel RYCHLÝ a Pavel SMRŽ

Vydání

Berlin, Text, Speech and Dialogue: Sixth International Conference, TSD 2003, od s. 90-97, 8 s. 2003

Nakladatel

Springer Verlag

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Odkazy

Kód RIV

RIV/00216224:14330/03:00009149

Organizační jednotka

Fakulta informatiky

ISBN

3-540-200-24-X

UT WoS

000186386400012

Klíčová slova anglicky

error detection

Štítky

Změněno: 26. 5. 2004 15:13, doc. Mgr. Pavel Rychlý, Ph.D.

Anotace

V originále

This paper presents a description of a Czech text corpus (Chyby) containing various kinds of errors such as spelling, typographical, grammatical, style, lexical. We explain how Chyby has been built, how the errors in it have been discovered, marked and annotated. The classification of the errors is presented and the statistics concerning the types of errors is given. The tools for annotating the errors are also described. To the best of our knowledge, this is first text corpus of this sort prepared for Czech.

Návaznosti

MSM 143300003, záměr
Název: Interakce člověka s počítačem, dialogové systémy a asistivní technologie
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Interakce člověka s počítačem, dialogové systémy a asistivní technologie