D 2011

Information Extraction for Czech Based on Syntactic Analysis

BAISA, Vít a Vojtěch KOVÁŘ

Základní údaje

Originální název

Information Extraction for Czech Based on Syntactic Analysis

Název česky

Extrakce informací pro češtinu založená na syntaktické analýze

Autoři

BAISA, Vít (203 Česká republika, garant, domácí) a Vojtěch KOVÁŘ (203 Česká republika, domácí)

Vydání

Poznań, Human Language Technologies as a Challenge for Computer Science and Linguistics, Proceedings of 5th Language and Technology Conference, od s. 466-470, 5 s. 2011

Nakladatel

Funcacja Universytetu im. A. Mickiewicza

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Kód RIV

RIV/00216224:14330/11:00050162

Organizační jednotka

Fakulta informatiky

ISBN

978-83-932640-1-8

UT WoS

000345651500013

Klíčová slova česky

extrakce informací;syntaktická analýza;sémantická klasifikace;morfologická desambiguace

Klíčová slova anglicky

information extraction; syntactic analysis; semantic classification; morphological disambiguation

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 28. 6. 2012 12:45, Mgr. et Mgr. Vít Baisa, Ph.D.

Anotace

V originále

We present a complex pipeline of natural language processing tools for Czech that performs extraction of basic facts presented in a text. The input for the tool is a plain text, the output contains verb and noun phrases with basic semantic classification. Automatic syntactic analysis of Czech plays a crucial role in the pipeline. In this paper, we describe the particular tools used in the system, then we give an example of its usage and conclude with a basic evaluation of the overall system accuracy.

Česky

Článek popisuje postupnou aplikaci několika nástrojů pro zpracování češtiny, jejímž výsledkem je extrakce základních faktů z textu. Vstupem nástroje je volný text, výstupem jsou jmenné a slovesné fráze spolu se základní sémantickou klasifikací. Důležitou roli hrají nástroje pro automatickou syntaktickou analýzu češtiny.

Návaznosti

GAP401/10/0792, projekt VaV
Název: Temporální aspekty znalostí a informací
Investor: Grantová agentura ČR, Temporální aspekty znalostí a informací
GA407/07/0679, projekt VaV
Název: Právní e-slovník - PES
Investor: Grantová agentura ČR, Právní e-slovník - PES
VF20102014003, projekt VaV
Název: Analýza přirozeného jazyka v prostředí internetu (Akronym: APJI)
Investor: Ministerstvo vnitra ČR, Analýza přirozeného jazyka v prostředí internetu