2003
Text Corpus with Errors
PALA, Karel; Pavel RYCHLÝ a Pavel SMRŽZákladní údaje
Originální název
Text Corpus with Errors
Autoři
PALA, Karel; Pavel RYCHLÝ a Pavel SMRŽ
Vydání
Berlin, Text, Speech and Dialogue: Sixth International Conference, TSD 2003, od s. 90-97, 8 s. 2003
Nakladatel
Springer Verlag
Další údaje
Jazyk
angličtina
Typ výsledku
Stať ve sborníku
Obor
10201 Computer sciences, information science, bioinformatics
Stát vydavatele
Česká republika
Utajení
není předmětem státního či obchodního tajemství
Odkazy
Kód RIV
RIV/00216224:14330/03:00009149
Organizační jednotka
Fakulta informatiky
ISBN
3-540-200-24-X
UT WoS
000186386400012
Klíčová slova anglicky
error detection
Štítky
Změněno: 26. 5. 2004 15:13, doc. Mgr. Pavel Rychlý, Ph.D.
Anotace
V originále
This paper presents a description of a Czech text corpus (Chyby) containing various kinds of errors such as spelling, typographical, grammatical, style, lexical. We explain how Chyby has been built, how the errors in it have been discovered, marked and annotated. The classification of the errors is presented and the statistics concerning the types of errors is given. The tools for annotating the errors are also described. To the best of our knowledge, this is first text corpus of this sort prepared for Czech.
Návaznosti
| MSM 143300003, záměr |
|