KOVÁŘ, Vojtěch a Aleš HORÁK. Power Networks Dialogues - Automatic Analysis and Evaluation of a Domain-Specific Text Corpus. In Proceedings of ELNET 2007. Ostrava: Faculty of Electrical Engineering and Computer Science, VŠB - Technical University of Ostrava, 2007, s. 30-37. ISBN 978-80-248-1681-4.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Power Networks Dialogues - Automatic Analysis and Evaluation of a Domain-Specific Text Corpus
Název česky Dialogy o elektrorozvodných sítích - automatická analýza a vyhodnocení doménově specifického korpusu textů
Autoři KOVÁŘ, Vojtěch (203 Česká republika) a Aleš HORÁK (203 Česká republika, garant).
Vydání Ostrava, Proceedings of ELNET 2007, s. 30-37, 2007.
Nakladatel Faculty of Electrical Engineering and Computer Science, VŠB - Technical University of Ostrava
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor 10201 Computer sciences, information science, bioinformatics
Stát vydavatele Česká republika
Utajení není předmětem státního či obchodního tajemství
Kód RIV RIV/00216224:14330/07:00019534
Organizační jednotka Fakulta informatiky
ISBN 978-80-248-1681-4
Klíčová slova anglicky power network; corpus; dialogue; domain-specific; synt; syntactic analysis
Štítky corpus, Dialogue, domain-specific, power network, synt, syntactic analysis
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnil: RNDr. Vojtěch Kovář, Ph.D., učo 139915. Změněno: 20. 10. 2010 14:34.
Anotace
Automatic analysis of domain-specific dialogues is a special part of common analysis of natural language texts. In this paper, we describe the creation of fundamental resource for working with dialogues about electrical power networks - the corpus of 1 million tokens specialized to the power networks topics. We show the details of building such corpus and results of automatic analysis of the corpus content such as the term extraction, morphological disambiguation and syntactic analysis of the domain-specific texts.
Anotace česky
Článek popisuje sestavení milionového specializovaného korpusu textů o elektrorozvodných sítích. Jsou popsány výsledky automatické analýzy obsahu korpusu jako extrakce termínů, morfologická desambiguace a syntaktická analýza doménově specifických textů.
Návaznosti
1ET100300414, projekt VaVNázev: Inteligentní metody pro zvýšení spolehlivosti elektrických sítí
Investor: Akademie věd ČR, Inteligentní metody pro zvýšení spolehlivosti elektrických sítí
2C06009, projekt VaVNázev: Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce (Akronym: COT-SEWing)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce
VytisknoutZobrazeno: 22. 6. 2024 20:39