C 2009

Czech Word Sketch Relations with Full Syntax Parser

HORÁK, Aleš; Pavel RYCHLÝ a Adam KILGARRIFF

Základní údaje

Originální název

Czech Word Sketch Relations with Full Syntax Parser

Název česky

České relace slovních profilů s využitím plného syntaktického analyzátoru

Autoři

HORÁK, Aleš; Pavel RYCHLÝ a Adam KILGARRIFF

Vydání

Brno, Czech Republic, After Half a Century of Slavonic Natural Language Processing, od s. 101-112, 12 s. 2009

Nakladatel

Masaryk University

Další údaje

Jazyk

angličtina

Typ výsledku

Kapitola resp. kapitoly v odborné knize

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Označené pro přenos do RIV

Ano

Kód RIV

RIV/00216224:14330/09:00029609

Organizační jednotka

Fakulta informatiky

ISBN

978-80-7399-815-8

Klíčová slova česky

slovní profily;syntaktická analýza

Klíčová slova anglicky

word sketch;syntax parsing

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 10. 2. 2010 16:13, doc. RNDr. Aleš Horák, Ph.D.

Anotace

V originále

This paper describes the exploitation of dependency relations obtained from syntactic parsing of Czech for building new Czech Word Sketch tables. Standard Word Sketch construction process usually uses so called Sketch grammars -- a simplified process of identifying dependency relations based on regular expressions. This may, of course, lead to errors, which should however not influence (so much) the overall numbers computed on a very big corpus. The paper presents an experiment of using relations resulting from full syntactic parsing -- will they perform better than the standard Sketch grammar or not?

Česky

Článek popisuje využití závislostních vazeb získaných ze syntaktického analyzátoru češtiny pro tvorbu nových tabulek slovníck profilů (Word Sketch).

Návaznosti

GA407/07/0679, projekt VaV
Název: Právní e-slovník - PES
Investor: Grantová agentura ČR, Právní e-slovník - PES
LC536, projekt VaV
Název: Centrum komputační lingvistiky
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Centrum komputační lingvistiky
2C06009, projekt VaV
Název: Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce (Akronym: COT-SEWing)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce