MEDVEĎ, Marek, Miloš JAKUBÍČEK a Vojtěch KOVÁŘ. Towards taggers and parsers for Slovak. In Zygmunt Vetulani & Hans Uszkoreit. Human Language Technologies as a Challenge for Computer Science and Linguistics. Proceedings of the 6th Language and Technology Conference. Poznań, Poland: Fundacja Uniwersytetu im. A. Mickiewicza, 2013, s. 527-530. ISBN 978-83-932640-3-2.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Towards taggers and parsers for Slovak
Autoři MEDVEĎ, Marek (703 Slovensko, domácí), Miloš JAKUBÍČEK (203 Česká republika, garant, domácí) a Vojtěch KOVÁŘ (203 Česká republika, domácí).
Vydání Poznań, Poland, Human Language Technologies as a Challenge for Computer Science and Linguistics. Proceedings of the 6th Language and Technology Conference, od s. 527-530, 4 s. 2013.
Nakladatel Fundacja Uniwersytetu im. A. Mickiewicza
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor 10201 Computer sciences, information science, bioinformatics
Stát vydavatele Polsko
Utajení není předmětem státního či obchodního tajemství
Forma vydání tištěná verze "print"
WWW LTC website
Kód RIV RIV/00216224:14330/13:00070329
Organizační jednotka Fakulta informatiky
ISBN 978-83-932640-3-2
Klíčová slova anglicky Slovak; parsing; tagging; parser adaptation
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnil: RNDr. Vojtěch Kovář, Ph.D., učo 139915. Změněno: 28. 4. 2014 10:28.
Anotace
In this paper we present tools prepared for morphological and syntactic processing of Slovak: a model trained for tagging by the RFTagger and two syntactic analyzers Synt and SET for which we adapted their Czech grammars for Slovak. We describe the training process of RFTagger using the r-mak corpus and modifications of both parsers that have been performed partially in the lexical analysis and mainly in the formal grammars used in both systems. Finally we provide an evaluation of both tagging and parsing, the latter on two datasets – a phrasal and dependency treebank of Slovak.
Návaznosti
LM2010013, projekt VaVNázev: LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat (Akronym: LINDAT-Clarin)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Projekt LINDAT-Clarin - Vybudování a provoz českého uzlu pan-evropské infrastruktury pro výzkum
VytisknoutZobrazeno: 1. 9. 2024 01:04