BAISA, Vít a Vojtěch KOVÁŘ. Information Extraction for Czech Based on Syntactic Analysis. In Zygmunt Vetulani. Human Language Technologies as a Challenge for Computer Science and Linguistics, Proceedings of 5th Language and Technology Conference. Poznań: Funcacja Universytetu im. A. Mickiewicza, 2011, s. 466-470. ISBN 978-83-932640-1-8.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Information Extraction for Czech Based on Syntactic Analysis
Název česky Extrakce informací pro češtinu založená na syntaktické analýze
Autoři BAISA, Vít (203 Česká republika, garant, domácí) a Vojtěch KOVÁŘ (203 Česká republika, domácí).
Vydání Poznań, Human Language Technologies as a Challenge for Computer Science and Linguistics, Proceedings of 5th Language and Technology Conference, od s. 466-470, 5 s. 2011.
Nakladatel Funcacja Universytetu im. A. Mickiewicza
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor 10201 Computer sciences, information science, bioinformatics
Stát vydavatele Česká republika
Utajení není předmětem státního či obchodního tajemství
Kód RIV RIV/00216224:14330/11:00050162
Organizační jednotka Fakulta informatiky
ISBN 978-83-932640-1-8
UT WoS 000345651500013
Klíčová slova česky extrakce informací;syntaktická analýza;sémantická klasifikace;morfologická desambiguace
Klíčová slova anglicky information extraction; syntactic analysis; semantic classification; morphological disambiguation
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnil: Mgr. et Mgr. Vít Baisa, Ph.D., učo 139654. Změněno: 28. 6. 2012 12:45.
Anotace
We present a complex pipeline of natural language processing tools for Czech that performs extraction of basic facts presented in a text. The input for the tool is a plain text, the output contains verb and noun phrases with basic semantic classification. Automatic syntactic analysis of Czech plays a crucial role in the pipeline. In this paper, we describe the particular tools used in the system, then we give an example of its usage and conclude with a basic evaluation of the overall system accuracy.
Anotace česky
Článek popisuje postupnou aplikaci několika nástrojů pro zpracování češtiny, jejímž výsledkem je extrakce základních faktů z textu. Vstupem nástroje je volný text, výstupem jsou jmenné a slovesné fráze spolu se základní sémantickou klasifikací. Důležitou roli hrají nástroje pro automatickou syntaktickou analýzu češtiny.
Návaznosti
GAP401/10/0792, projekt VaVNázev: Temporální aspekty znalostí a informací
Investor: Grantová agentura ČR, Temporální aspekty znalostí a informací
GA407/07/0679, projekt VaVNázev: Právní e-slovník - PES
Investor: Grantová agentura ČR, Právní e-slovník - PES
VF20102014003, projekt VaVNázev: Analýza přirozeného jazyka v prostředí internetu (Akronym: APJI)
Investor: Ministerstvo vnitra ČR, Analýza přirozeného jazyka v prostředí internetu
VytisknoutZobrazeno: 6. 5. 2024 21:47