VEBER, Marek, Aleš HORÁK, Rostislav JULINEK a Pavel SMRŽ. Automatic Structuring of Written Texts. In Proceedings of 2nd International Conference on Text, Speech, and Dialogue (TSD 1999). Berlin: Springer-Verlag, 1999, s. 101-104. ISBN 3-540-66494-7.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Automatic Structuring of Written Texts
Název česky Automatické strukturování psaných textů
Autoři VEBER, Marek (203 Česká republika), Aleš HORÁK (203 Česká republika, garant), Rostislav JULINEK (203 Česká republika) a Pavel SMRŽ (203 Česká republika).
Vydání Berlin, Proceedings of 2nd International Conference on Text, Speech, and Dialogue (TSD 1999), od s. 101-104, 4 s. 1999.
Nakladatel Springer-Verlag
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor 20200 2.2 Electrical engineering, Electronic engineering, Information engineering
Stát vydavatele Německo
Utajení není předmětem státního či obchodního tajemství
WWW URL
Impakt faktor Impact factor: 0.872
Kód RIV RIV/00216224:14330/99:00001590
Organizační jednotka Fakulta informatiky
ISBN 3-540-66494-7
ISSN 0302-9743
UT WoS 000089259200018
Klíčová slova česky struktura textu
Klíčová slova anglicky text structure
Štítky text structure
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnil: doc. RNDr. Aleš Horák, Ph.D., učo 1648. Změněno: 25. 3. 2010 11:53.
Anotace
This paper deals with automatic structuring and sentence boundary labelling in natural language texts. We describe the implemented structure tagging algorithm and heuristic rules that are used for automatic or semiautomatic labelling. Inside the detected sentence the algorithm performs a decomposition to clauses and then marks the parts of text which do not form a sentence, i.e. headings, signatures, tables and other structured data. We also pay attention to the processing of matched symbols in the text, especially to the analysis of direct speech notation.
Návaznosti
VS97028, projekt VaVNázev: Laboratoř zpracování přirozeného jazyka (s aplikacemi pro podporu výuky zrakově postižených)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Laboratoř zpracování přirozeného jazyka (s aplikacemi pro podporu výuky zrakově postižených)
VytisknoutZobrazeno: 28. 7. 2024 20:33