HLAVÁČKOVÁ, Dana, Barbora HRABALOVÁ, Jakub MACHURA, Markéta MASOPUSTOVÁ, Vojtěch MRKÝVKA, Marie VALÍČKOVÁ a Hana ŽIŽKOVÁ. New Online Proofreader for Czech. In Horák, Aleš; Rychlý, Pavel; Rambousek, Adam (eds.): Slavonic Natural Language Processing in the 21st Century. Brno: Tribun EU, 2019. s. 79-92, 14 s. ISBN 978-80-263-1545-2.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název New Online Proofreader for Czech
Autoři HLAVÁČKOVÁ, Dana (203 Česko, garant, domácí), Barbora HRABALOVÁ (203 Česko, domácí), Jakub MACHURA (203 Česko, domácí), Markéta MASOPUSTOVÁ (203 Česko, domácí), Vojtěch MRKÝVKA (203 Česko, domácí), Marie VALÍČKOVÁ (203 Česko, domácí) a Hana ŽIŽKOVÁ (203 Česko, domácí).
Vydání Brno, Horák, Aleš; Rychlý, Pavel; Rambousek, Adam (eds.): Slavonic Natural Language Processing in the 21st Century, od s. 79-92, 14 s. 2019.
Nakladatel Tribun EU
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor 60203 Linguistics
Stát vydavatele Česko
Utajení není předmětem státního či obchodního tajemství
Forma vydání tištěná verze "print"
Kód RIV RIV/00216224:14210/19:00108376
Organizační jednotka Filozofická fakulta
ISBN 978-80-263-1545-2
Klíčová slova anglicky checker; grammar; agreement; error; punctuation; mistake; tool; Czech
Změnil Změnila: Mgr. Dana Hlaváčková, Ph.D., učo 17907. Změněno: 28. 6. 2020 16:17.
Anotace
This paper focuses on the new web-based language checker – tool currently developed to help users to produce Czech texts with correct grammar and spelling. The paper describes the inner workings of the existing prototype, its modular structure and aims at its upcoming language-checking compounds. Currently, the punctuational module is able to insert nearly two-thirds of all commas into particular types of texts. If a sentence contains a connector, it is easier to find a position where the comma should be placed. However, to detect a boundary between two clauses without the presence of the connector or two members of the complex multiple element represents a harder task. Another module aims at an agreement, especially at two types of agreement: agreeing pre-/post-nominal adjectives and at subject-predicate agreement. The paper also introduces a module dealing with the selected small mistakes in the Czech language. Whereas all modules and the tool itself as well need quality testing data, building of an annotated database of authentic sentences and errors is described as well.
Návaznosti
MUNI/A/1061/2018, interní kód MUNázev: Čeština v jednotě synchronie a diachronie - 2019
Investor: Masarykova univerzita, Grantová agentura MU, Kategorie A - Specifický výzkum - Studentské výzkumné projekty
TL02000146, projekt VaVNázev: Webový pravopisný, gramatický a typografický korektor pro český jazyk
Investor: Technologická agentura ČR, ÉTA
VytisknoutZobrazeno: 9. 8. 2020 11:11