JAKUBÍČEK, Miloš, Pavel RYCHLÝ a Adam KILGARRIFF. Effective Corpus Virtualization. In Marc Kupietz, Hanno Biber, Harald Lüngen, Piotr Bański, Evelyn Breiteneder, Karlheinz Mörth, Andreas Witt, Jani Takhsha. Challenges in the Management of Large Corpora (CMLC-2). Reykjavik: EUROPEAN LANGUAGE RESOURCES ASSOCIATION-ELRA, 2014. s. 7-9, 3 s. ISBN 978-2-9517408-8-4.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Effective Corpus Virtualization
Autoři JAKUBÍČEK, Miloš (203 Česká republika, garant, domácí), Pavel RYCHLÝ (203 Česká republika, domácí) a Adam KILGARRIFF (826 Spojené království).
Vydání Reykjavik, Challenges in the Management of Large Corpora (CMLC-2), od s. 7-9, 3 s. 2014.
Nakladatel EUROPEAN LANGUAGE RESOURCES ASSOCIATION-ELRA
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor 10201 Computer sciences, information science, bioinformatics
Stát vydavatele Francie
Utajení není předmětem státního či obchodního tajemství
Forma vydání elektronická verze "online"
WWW URL
Kód RIV RIV/00216224:14330/14:00094187
Organizační jednotka Fakulta informatiky
ISBN 978-2-9517408-8-4
UT WoS 000355611000045
Klíčová slova anglicky corpus; corpus linguistics; virtualization; indexing; database
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnil: RNDr. Pavel Šmerk, Ph.D., učo 3880. Změněno: 11. 5. 2017 19:47.
Anotace
In this paper we describe an implementation of corpus virtualization within the Manatee corpus management system. Under corpus virtualization we understand logical manipulation with corpora or their parts grouping them into new (virtual) corpora. We discuss the motivation for such a setup in detail and show space and time efficiency of this approach evaluated on a 11 billion word corpus of Spanish.
Návaznosti
LM2010013, projekt VaVNázev: LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat (Akronym: LINDAT-Clarin)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Velké infrastruktury pro výzkum, vývoj a inovace
VF20102014003, projekt VaVNázev: Analýza přirozeného jazyka v prostředí internetu (Akronym: APJI)
Investor: Ministerstvo vnitra ČR, Jiné dotační projekty
VytisknoutZobrazeno: 26. 1. 2020 21:54