D 2009

Rozpoznávání a četnost víceslovných výrazů v textu

ČAPEK, Tomáš a Jan BUŠTA

Základní údaje

Originální název

Rozpoznávání a četnost víceslovných výrazů v textu

Název česky

Rozpoznávání a četnost víceslovných výrazů v textu

Název anglicky

Multi-Word Expression Recognition and Frequencies in Text

Vydání

2009

Další údaje

Typ výsledku

Stať ve sborníku

Utajení

není předmětem státního či obchodního tajemství

Označené pro přenos do RIV

Ne

Organizační jednotka

Fakulta informatiky

ISBN

978-80-970561-1-7

Klíčová slova česky

víceslovné výrazy, korpusy, fráze

Klíčová slova anglicky

multi-word expressions, corpora, phrases
Změněno: 9. 12. 2010 16:02, Mgr. Tomáš Čapek

Anotace

V originále

Při automatickém počítačovém zpracování textu dochází často k obtížím při získávání významů víceslovných spojení. Problém spočívá především v porušení Fregeho principu kompozicionality, který říká, že význam slovního spojení je odvoditelný z významů jednotlivých slovo, které ho tvoří. Hledání víceslovných spojení předpokládá, že jsme schopni automaticky tyto výrazy rozpoznat od "neterminologických", které jsou jednoduše významově uchopitelné.

Návaznosti

LC536, projekt VaV
Název: Centrum komputační lingvistiky
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Centrum komputační lingvistiky