Rozpoznávání a četnost víceslovných výrazů v textu

D 2009

Rozpoznávání a četnost víceslovných výrazů v textu

ČAPEK, Tomáš a Jan BUŠTA

Základní údaje

Originální název

Rozpoznávání a četnost víceslovných výrazů v textu

Název česky

Rozpoznávání a četnost víceslovných výrazů v textu

Název anglicky

Multi-Word Expression Recognition and Frequencies in Text

Autoři

ČAPEK, Tomáš a Jan BUŠTA

Vydání

2009

Další údaje

Typ výsledku

Stať ve sborníku

Utajení

není předmětem státního či obchodního tajemství

Označené pro přenos do RIV

Ne

Organizační jednotka

Fakulta informatiky

ISBN

978-80-970561-1-7

Klíčová slova česky

víceslovné výrazy, korpusy, fráze

Klíčová slova anglicky

multi-word expressions, corpora, phrases

Změněno: 9. 12. 2010 16:02, Mgr. Tomáš Čapek

Anotace

V originále

Při automatickém počítačovém zpracování textu dochází často k obtížím při získávání významů víceslovných spojení. Problém spočívá především v porušení Fregeho principu kompozicionality, který říká, že význam slovního spojení je odvoditelný z významů jednotlivých slovo, které ho tvoří. Hledání víceslovných spojení předpokládá, že jsme schopni automaticky tyto výrazy rozpoznat od "neterminologických", které jsou jednoduše významově uchopitelné.

Návaznosti

LC536, projekt VaV

Název: Centrum komputační lingvistiky

Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Centrum komputační lingvistiky

Přehled o publikaci