D 2009

Mining Phrases from Syntactic Analysis

JAKUBÍČEK, Miloš, Aleš HORÁK a Vojtěch KOVÁŘ

Základní údaje

Originální název

Mining Phrases from Syntactic Analysis

Název česky

Extrakce frází ze syntaktické analýzy

Autoři

JAKUBÍČEK, Miloš (203 Česká republika, garant, domácí), Aleš HORÁK (203 Česká republika, domácí) a Vojtěch KOVÁŘ (203 Česká republika, domácí)

Vydání

1. vyd. Berlin Heidelberg, Text, Speech, Dialogue 2009, od s. 124-130, 7 s. 2009

Nakladatel

Springer Verlag

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

tištěná verze "print"

Odkazy

Impakt faktor

Impact factor: 0.402 v roce 2005

Kód RIV

RIV/00216224:14330/09:00065773

Organizační jednotka

Fakulta informatiky

ISBN

978-3-642-04207-2

ISSN

UT WoS

000270445700018

Klíčová slova česky

syntaktická analýza; extrakce frází; syntaktické struktury

Klíčová slova anglicky

parsing; syntactic structures; mining phrases

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 30. 4. 2014 05:53, RNDr. Pavel Šmerk, Ph.D.

Anotace

V originále

In this paper we describe the exploitation of the syntactic parser synt to obtain information about syntactic structures (such as noun or verb phrases) of common sentences in Czech. The parser has been extended in such a way that enables its highly ambiguous output to be used for mining those phrases unambiguously and offers several ways how to identify them. Finally, an application for shallow valency extraction and punctuation correction is presented.

Česky

Tento článek popisuje rozšíření syntaktického analyzátoru synt umožňující získat informace o syntaktický strukturách (jako jsou jmenné nebo slovesné fráze) běžných českých vět. Tyto struktury je možné získávat z víceznačného výstupu analyzátoru jednoznačně, a to různým způsobem podle typu fráze. Závěrem jsou prezentovány aplikace pro automatickou extrakci valencí a interpunkční korektor.

Návaznosti

LC536, projekt VaV
Název: Centrum komputační lingvistiky
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Centrum komputační lingvistiky
1ET100300419, projekt VaV
Název: Inteligentní modely, algoritmy, metody a nástroje pro vytváření sémantického webu
Investor: Akademie věd ČR, Inteligentní modely, algoritmy, metody a nástroje pro vytváření sémantického webu
2C06009, projekt VaV
Název: Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce (Akronym: COT-SEWing)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce