D 2019

New Online Proofreader for Czech

HLAVÁČKOVÁ, Dana, Barbora HRABALOVÁ, Jakub MACHURA, Markéta MASOPUSTOVÁ, Vojtěch MRKÝVKA et. al.

Základní údaje

Originální název

New Online Proofreader for Czech

Autoři

HLAVÁČKOVÁ, Dana (203 Česká republika, garant, domácí), Barbora HRABALOVÁ (203 Česká republika, domácí), Jakub MACHURA (203 Česká republika, domácí), Markéta MASOPUSTOVÁ (203 Česká republika, domácí), Vojtěch MRKÝVKA (203 Česká republika, domácí), Marie VALÍČKOVÁ (203 Česká republika, domácí) a Hana ŽIŽKOVÁ (203 Česká republika, domácí)

Vydání

Brno, Horák, Aleš; Rychlý, Pavel; Rambousek, Adam (eds.): Slavonic Natural Language Processing in the 21st Century, od s. 79-92, 14 s. 2019

Nakladatel

Tribun EU

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

60203 Linguistics

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

tištěná verze "print"

Kód RIV

RIV/00216224:14210/19:00108376

Organizační jednotka

Filozofická fakulta

ISBN

978-80-263-1545-2

Klíčová slova anglicky

checker; grammar; agreement; error; punctuation; mistake; tool; Czech
Změněno: 14. 1. 2021 22:47, prof. Mgr. Pavel Kosek, Ph.D.

Anotace

V originále

This paper focuses on the new web-based language checker – tool currently developed to help users to produce Czech texts with correct grammar and spelling. The paper describes the inner workings of the existing prototype, its modular structure and aims at its upcoming language-checking compounds. Currently, the punctuational module is able to insert nearly two-thirds of all commas into particular types of texts. If a sentence contains a connector, it is easier to find a position where the comma should be placed. However, to detect a boundary between two clauses without the presence of the connector or two members of the complex multiple element represents a harder task. Another module aims at an agreement, especially at two types of agreement: agreeing pre-/post-nominal adjectives and at subject-predicate agreement. The paper also introduces a module dealing with the selected small mistakes in the Czech language. Whereas all modules and the tool itself as well need quality testing data, building of an annotated database of authentic sentences and errors is described as well.

Návaznosti

MUNI/A/1061/2018, interní kód MU
Název: Čeština v jednotě synchronie a diachronie - 2019
Investor: Masarykova univerzita, Čeština v jednotě synchronie a diachronie - 2019, DO R. 2020_Kategorie A - Specifický výzkum - Studentské výzkumné projekty
TL02000146, projekt VaV
Název: Webový pravopisný, gramatický a typografický korektor pro český jazyk
Investor: Technologická agentura ČR, Webový pravopisný, gramatický a typografický korektor pro český jazyk