2007
Power Networks Dialogues - Automatic Analysis and Evaluation of a Domain-Specific Text Corpus
KOVÁŘ, Vojtěch a Aleš HORÁKZákladní údaje
Originální název
Power Networks Dialogues - Automatic Analysis and Evaluation of a Domain-Specific Text Corpus
Název česky
Dialogy o elektrorozvodných sítích - automatická analýza a vyhodnocení doménově specifického korpusu textů
Autoři
KOVÁŘ, Vojtěch (203 Česká republika) a Aleš HORÁK (203 Česká republika, garant)
Vydání
Ostrava, Proceedings of ELNET 2007, s. 30-37, 2007
Nakladatel
Faculty of Electrical Engineering and Computer Science, VŠB - Technical University of Ostrava
Další údaje
Jazyk
angličtina
Typ výsledku
Stať ve sborníku
Obor
10201 Computer sciences, information science, bioinformatics
Stát vydavatele
Česká republika
Utajení
není předmětem státního či obchodního tajemství
Kód RIV
RIV/00216224:14330/07:00019534
Organizační jednotka
Fakulta informatiky
ISBN
978-80-248-1681-4
Klíčová slova anglicky
power network; corpus; dialogue; domain-specific; synt; syntactic analysis
Štítky
Příznaky
Mezinárodní význam, Recenzováno
Změněno: 20. 10. 2010 14:34, RNDr. Vojtěch Kovář, Ph.D.
V originále
Automatic analysis of domain-specific dialogues is a special part of common analysis of natural language texts. In this paper, we describe the creation of fundamental resource for working with dialogues about electrical power networks - the corpus of 1 million tokens specialized to the power networks topics. We show the details of building such corpus and results of automatic analysis of the corpus content such as the term extraction, morphological disambiguation and syntactic analysis of the domain-specific texts.
Česky
Článek popisuje sestavení milionového specializovaného korpusu textů o elektrorozvodných sítích. Jsou popsány výsledky automatické analýzy obsahu korpusu jako extrakce termínů, morfologická desambiguace a syntaktická analýza doménově specifických textů.
Návaznosti
1ET100300414, projekt VaV |
| ||
2C06009, projekt VaV |
|