1999
Automatic Structuring of Written Texts
VEBER, Marek; Aleš HORÁK; Rostislav JULINEK a Pavel SMRŽZákladní údaje
Originální název
Automatic Structuring of Written Texts
Název česky
Automatické strukturování psaných textů
Autoři
VEBER, Marek (203 Česká republika); Aleš HORÁK (203 Česká republika, garant); Rostislav JULINEK (203 Česká republika) a Pavel SMRŽ (203 Česká republika)
Vydání
Berlin, Proceedings of 2nd International Conference on Text, Speech, and Dialogue (TSD 1999), od s. 101-104, 4 s. 1999
Nakladatel
Springer-Verlag
Další údaje
Jazyk
angličtina
Typ výsledku
Stať ve sborníku
Obor
20200 2.2 Electrical engineering, Electronic engineering, Information engineering
Stát vydavatele
Německo
Utajení
není předmětem státního či obchodního tajemství
Odkazy
Impakt faktor
Impact factor: 0.872
Kód RIV
RIV/00216224:14330/99:00001590
Organizační jednotka
Fakulta informatiky
ISBN
3-540-66494-7
ISSN
UT WoS
000089259200018
Klíčová slova česky
struktura textu
Klíčová slova anglicky
text structure
Štítky
Příznaky
Mezinárodní význam, Recenzováno
Změněno: 25. 3. 2010 11:53, doc. RNDr. Aleš Horák, Ph.D.
Anotace
V originále
This paper deals with automatic structuring and sentence boundary labelling in natural language texts. We describe the implemented structure tagging algorithm and heuristic rules that are used for automatic or semiautomatic labelling. Inside the detected sentence the algorithm performs a decomposition to clauses and then marks the parts of text which do not form a sentence, i.e. headings, signatures, tables and other structured data. We also pay attention to the processing of matched symbols in the text, especially to the analysis of direct speech notation.
Návaznosti
VS97028, projekt VaV |
|