2011
Information Extraction for Czech Based on Syntactic Analysis
BAISA, Vít a Vojtěch KOVÁŘZákladní údaje
Originální název
Information Extraction for Czech Based on Syntactic Analysis
Název česky
Extrakce informací pro češtinu založená na syntaktické analýze
Autoři
BAISA, Vít (203 Česká republika, garant, domácí) a Vojtěch KOVÁŘ (203 Česká republika, domácí)
Vydání
Poznań, Human Language Technologies as a Challenge for Computer Science and Linguistics, Proceedings of 5th Language and Technology Conference, od s. 466-470, 5 s. 2011
Nakladatel
Funcacja Universytetu im. A. Mickiewicza
Další údaje
Jazyk
angličtina
Typ výsledku
Stať ve sborníku
Obor
10201 Computer sciences, information science, bioinformatics
Stát vydavatele
Česká republika
Utajení
není předmětem státního či obchodního tajemství
Kód RIV
RIV/00216224:14330/11:00050162
Organizační jednotka
Fakulta informatiky
ISBN
978-83-932640-1-8
UT WoS
000345651500013
Klíčová slova česky
extrakce informací;syntaktická analýza;sémantická klasifikace;morfologická desambiguace
Klíčová slova anglicky
information extraction; syntactic analysis; semantic classification; morphological disambiguation
Příznaky
Mezinárodní význam, Recenzováno
Změněno: 28. 6. 2012 12:45, Mgr. et Mgr. Vít Baisa, Ph.D.
V originále
We present a complex pipeline of natural language processing tools for Czech that performs extraction of basic facts presented in a text. The input for the tool is a plain text, the output contains verb and noun phrases with basic semantic classification. Automatic syntactic analysis of Czech plays a crucial role in the pipeline. In this paper, we describe the particular tools used in the system, then we give an example of its usage and conclude with a basic evaluation of the overall system accuracy.
Česky
Článek popisuje postupnou aplikaci několika nástrojů pro zpracování češtiny, jejímž výsledkem je extrakce základních faktů z textu. Vstupem nástroje je volný text, výstupem jsou jmenné a slovesné fráze spolu se základní sémantickou klasifikací. Důležitou roli hrají nástroje pro automatickou syntaktickou analýzu češtiny.
Návaznosti
GAP401/10/0792, projekt VaV |
| ||
GA407/07/0679, projekt VaV |
| ||
VF20102014003, projekt VaV |
|