D 2000

Competing Patterns for Language Engineering

SOJKA, Petr

Základní údaje

Originální název

Competing Patterns for Language Engineering

Autoři

SOJKA, Petr (203 Česká republika, garant)

Vydání

Heidelberg, Proceedings of Third International Workshop on Text, Speech and Dialogue, TSD 2000, s. 157-162, 2000

Nakladatel

Springer-Verlag

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

20200 2.2 Electrical engineering, Electronic engineering, Information engineering

Stát vydavatele

Německo

Utajení

není předmětem státního či obchodního tajemství

Odkazy

URL

Kód RIV

RIV/00216224:14330/00:00000123

Organizační jednotka

Fakulta informatiky

ISBN

3-540-41042-2

UT WoS

000170595900027

Klíčová slova anglicky

patterns;finite automata;natural language processing;language engineering

Štítky

Finite Automata, language engineering, natural language processing, patterns

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 15. 6. 2009 21:26, doc. RNDr. Petr Sojka, Ph.D.

Anotace

V originále

In this paper we describe a method of effective handling of linguistic data by means of \emph{covering and inhibiting patterns}---patterns that ``compete'' each other. A methodology of developing such patterns is outlined. Applications in the areas of morphology, hyphenation and part-of-speech tagging are shown. This pattern-driven approach to language engineering allows the combination of linguist expertise with the data learned from corpora---layering of knowledge. Searching for information in pattern database (dictionary problem) is blindingly fast---linear with respect to the length of searching word as with other finite-state approaches.

Návaznosti

MSM 143300003, záměr
Název: Interakce člověka s počítačem, dialogové systémy a asistivní technologie
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Interakce člověka s počítačem, dialogové systémy a asistivní technologie
VS97028, projekt VaV
Název: Laboratoř zpracování přirozeného jazyka (s aplikacemi pro podporu výuky zrakově postižených)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Laboratoř zpracování přirozeného jazyka (s aplikacemi pro podporu výuky zrakově postižených)
Zobrazeno: 10. 11. 2024 20:08