D 1999

Automatic Structuring of Written Texts

VEBER, Marek; Aleš HORÁK; Rostislav JULINEK a Pavel SMRŽ

Základní údaje

Originální název

Automatic Structuring of Written Texts

Název česky

Automatické strukturování psaných textů

Autoři

VEBER, Marek (203 Česká republika); Aleš HORÁK (203 Česká republika, garant); Rostislav JULINEK (203 Česká republika) a Pavel SMRŽ (203 Česká republika)

Vydání

Berlin, Proceedings of 2nd International Conference on Text, Speech, and Dialogue (TSD 1999), od s. 101-104, 4 s. 1999

Nakladatel

Springer-Verlag

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

20200 2.2 Electrical engineering, Electronic engineering, Information engineering

Stát vydavatele

Německo

Utajení

není předmětem státního či obchodního tajemství

Odkazy

Impakt faktor

Impact factor: 0.872

Kód RIV

RIV/00216224:14330/99:00001590

Organizační jednotka

Fakulta informatiky

ISBN

3-540-66494-7

ISSN

UT WoS

000089259200018

Klíčová slova česky

struktura textu

Klíčová slova anglicky

text structure

Štítky

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 25. 3. 2010 11:53, doc. RNDr. Aleš Horák, Ph.D.

Anotace

V originále

This paper deals with automatic structuring and sentence boundary labelling in natural language texts. We describe the implemented structure tagging algorithm and heuristic rules that are used for automatic or semiautomatic labelling. Inside the detected sentence the algorithm performs a decomposition to clauses and then marks the parts of text which do not form a sentence, i.e. headings, signatures, tables and other structured data. We also pay attention to the processing of matched symbols in the text, especially to the analysis of direct speech notation.

Návaznosti

VS97028, projekt VaV
Název: Laboratoř zpracování přirozeného jazyka (s aplikacemi pro podporu výuky zrakově postižených)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Laboratoř zpracování přirozeného jazyka (s aplikacemi pro podporu výuky zrakově postižených)