D 2007

Power Networks Dialogues - Automatic Analysis and Evaluation of a Domain-Specific Text Corpus

KOVÁŘ, Vojtěch a Aleš HORÁK

Základní údaje

Originální název

Power Networks Dialogues - Automatic Analysis and Evaluation of a Domain-Specific Text Corpus

Název česky

Dialogy o elektrorozvodných sítích - automatická analýza a vyhodnocení doménově specifického korpusu textů

Autoři

KOVÁŘ, Vojtěch (203 Česká republika) a Aleš HORÁK (203 Česká republika, garant)

Vydání

Ostrava, Proceedings of ELNET 2007, s. 30-37, 2007

Nakladatel

Faculty of Electrical Engineering and Computer Science, VŠB - Technical University of Ostrava

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Kód RIV

RIV/00216224:14330/07:00019534

Organizační jednotka

Fakulta informatiky

ISBN

978-80-248-1681-4

Klíčová slova anglicky

power network; corpus; dialogue; domain-specific; synt; syntactic analysis

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 20. 10. 2010 14:34, RNDr. Vojtěch Kovář, Ph.D.

Anotace

V originále

Automatic analysis of domain-specific dialogues is a special part of common analysis of natural language texts. In this paper, we describe the creation of fundamental resource for working with dialogues about electrical power networks - the corpus of 1 million tokens specialized to the power networks topics. We show the details of building such corpus and results of automatic analysis of the corpus content such as the term extraction, morphological disambiguation and syntactic analysis of the domain-specific texts.

Česky

Článek popisuje sestavení milionového specializovaného korpusu textů o elektrorozvodných sítích. Jsou popsány výsledky automatické analýzy obsahu korpusu jako extrakce termínů, morfologická desambiguace a syntaktická analýza doménově specifických textů.

Návaznosti

1ET100300414, projekt VaV
Název: Inteligentní metody pro zvýšení spolehlivosti elektrických sítí
Investor: Akademie věd ČR, Inteligentní metody pro zvýšení spolehlivosti elektrických sítí
2C06009, projekt VaV
Název: Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce (Akronym: COT-SEWing)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce