D 2010

Can Corpus Pattern Analysis Be Used in NLP?

CINKOVÁ, Silvie; Martin HOLUB; Pavel RYCHLÝ; Lenka SMEJKALOVÁ; Jana ŠINDLEROVÁ et. al.

Základní údaje

Originální název

Can Corpus Pattern Analysis Be Used in NLP?

Název česky

Může být Corpus Pattern Analysis použita v ZPJ?

Autoři

CINKOVÁ, Silvie (203 Česká republika, garant); Martin HOLUB (203 Česká republika); Pavel RYCHLÝ (203 Česká republika, domácí); Lenka SMEJKALOVÁ (203 Česká republika) a Jana ŠINDLEROVÁ (203 Česká republika)

Vydání

Berlin, Text, Speech and Dialogue, 2010, od s. 67-74, 8 s. 2010

Nakladatel

Springer

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

60200 6.2 Languages and Literature

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

tištěná verze "print"

Odkazy

Impakt faktor

Impact factor: 0.402 v roce 2005

Kód RIV

RIV/00216224:14330/10:00057182

Organizační jednotka

Fakulta informatiky

ISBN

978-3-642-15759-2

ISSN

UT WoS

000288619400010

Klíčová slova česky

korpus; nlp

Klíčová slova anglicky

corpus; nlp; corpus pattern analysis
Změněno: 23. 4. 2013 10:50, RNDr. Pavel Šmerk, Ph.D.

Anotace

V originále

Corpus Pattern Analysis (CPA), coined and implemented by Hanks as the Pattern Dictionary of English Verbs (PDEV), appears to be the only deliberate and consistent implementation of Sinclair's concept of Lexical Item. In his theoretical inquiries Hanks hypothesizes that the pattern repository produced by CPA can also support the word sense disambiguation task. Although more than 670 verb entries have already been compiled in PDEV, no systematic evaluation of this ambitious project has been reported yet. Assuming that the Sinclairian concept of the Lexical Item is correct, we started to closely examine PDEV with its possible NLP application in mind. Our experiments presented in this paper have been performed on a pilot sample of English verbs to provide a first reliable view on whether humans can agree in assigning PDEV patterns to verbs in a corpus. As a conclusion we suggest procedures for future development of PDEV.

Návaznosti

GAP401/10/0792, projekt VaV
Název: Temporální aspekty znalostí a informací
Investor: Grantová agentura ČR, Temporální aspekty znalostí a informací
GA407/07/0679, projekt VaV
Název: Právní e-slovník - PES
Investor: Grantová agentura ČR, Právní e-slovník - PES
2C06009, projekt VaV
Název: Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce (Akronym: COT-SEWing)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce