SOJKA, Petr. Competing Patterns for Language Engineering. In Proceedings of Third International Workshop on Text, Speech and Dialogue, TSD 2000. Heidelberg: Springer-Verlag, 2000, s. 157-162. ISBN 3-540-41042-2.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Competing Patterns for Language Engineering
Autoři SOJKA, Petr (203 Česká republika, garant).
Vydání Heidelberg, Proceedings of Third International Workshop on Text, Speech and Dialogue, TSD 2000, s. 157-162, 2000.
Nakladatel Springer-Verlag
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor 20200 2.2 Electrical engineering, Electronic engineering, Information engineering
Stát vydavatele Německo
Utajení není předmětem státního či obchodního tajemství
WWW URL
Kód RIV RIV/00216224:14330/00:00000123
Organizační jednotka Fakulta informatiky
ISBN 3-540-41042-2
UT WoS 000170595900027
Klíčová slova anglicky patterns;finite automata;natural language processing;language engineering
Štítky Finite Automata, language engineering, natural language processing, patterns
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnil: doc. RNDr. Petr Sojka, Ph.D., učo 2378. Změněno: 15. 6. 2009 21:26.
Anotace
In this paper we describe a method of effective handling of linguistic data by means of \emph{covering and inhibiting patterns}---patterns that ``compete'' each other. A methodology of developing such patterns is outlined. Applications in the areas of morphology, hyphenation and part-of-speech tagging are shown. This pattern-driven approach to language engineering allows the combination of linguist expertise with the data learned from corpora---layering of knowledge. Searching for information in pattern database (dictionary problem) is blindingly fast---linear with respect to the length of searching word as with other finite-state approaches.
Návaznosti
MSM 143300003, záměrNázev: Interakce člověka s počítačem, dialogové systémy a asistivní technologie
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Interakce člověka s počítačem, dialogové systémy a asistivní technologie
VS97028, projekt VaVNázev: Laboratoř zpracování přirozeného jazyka (s aplikacemi pro podporu výuky zrakově postižených)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Laboratoř zpracování přirozeného jazyka (s aplikacemi pro podporu výuky zrakově postižených)
VytisknoutZobrazeno: 17. 5. 2024 16:56