D 2015

Interactive Visualizations of Corpus Data in Sketch Engine

KOCINCOVÁ, Lucia, Miloš JAKUBÍČEK, Vojtěch KOVÁŘ a Vít BAISA

Základní údaje

Originální název

Interactive Visualizations of Corpus Data in Sketch Engine

Autoři

KOCINCOVÁ, Lucia (703 Slovensko, garant, domácí), Miloš JAKUBÍČEK (203 Česká republika, domácí), Vojtěch KOVÁŘ (203 Česká republika, domácí) a Vít BAISA (203 Česká republika, domácí)

Vydání

Vilnius, Lithuania, Proceedings of the Workshop on Innovative Corpus Query and Visualization Tools at NODALIDA 2015, od s. 17-22, 6 s. 2015

Nakladatel

Linköping University Electronic Press, Linköpings universitet

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Litva

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

elektronická verze "online"

Kód RIV

RIV/00216224:14330/15:00082917

Organizační jednotka

Fakulta informatiky

ISBN

978-91-7519-035-8

ISSN

Klíčová slova česky

vizualizace informací; interaktivní vizualizace; korpus; Sketch Engine; tezaurus; word sketch; Data-Driven Documents; generativní design

Klíčová slova anglicky

information visualization; interactive visualization; corpora; Sketch Engine; thesaurus; word sketch; Data-Driven Documents; generative design

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 26. 5. 2015 15:59, Mgr. Lucia Kocincová

Anotace

V originále

Automatic analysis of large text corpora produces large amounts of figures as result of various functions. These provide empirical evidence for a research hypothesis or serve in numerous practical applications of natural language processing. Usually, the results are presented in the form of tables containing raw data to be interpreted by domain experts. This paper describes an ongoing work on new visualizations and user interface enhancements in Sketch Engine corpus management system which aim at easing the interpretation of the data for both novice users and language professionals.

Návaznosti

LM2010013, projekt VaV
Název: LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat (Akronym: LINDAT-Clarin)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Projekt LINDAT-Clarin - Vybudování a provoz českého uzlu pan-evropské infrastruktury pro výzkum
7F14047, projekt VaV
Název: Harvesting big text data for under-resourced languages (Akronym: HaBiT)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Harvesting big text data for under-resourced languages