D 2016

Large Scale Keyword Extraction using a Finite State Backend

JAKUBÍČEK, Miloš a Pavel ŠMERK

Základní údaje

Originální název

Large Scale Keyword Extraction using a Finite State Backend

Autoři

JAKUBÍČEK, Miloš (203 Česká republika, domácí) a Pavel ŠMERK (203 Česká republika, domácí)

Vydání

Brno, Tenth Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2016, od s. 143-146, 4 s. 2016

Nakladatel

Tribun EU

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

tištěná verze "print"

Odkazy

Kód RIV

RIV/00216224:14330/16:00092379

Organizační jednotka

Fakulta informatiky

ISBN

978-80-263-1095-2

ISSN

UT WoS

000466886400016

Klíčová slova anglicky

terminology extraction; keyword extraction; fsa; Sketch Engine
Změněno: 21. 5. 2021 23:15, RNDr. Pavel Šmerk, Ph.D.

Anotace

V originále

We present a novel method for performing fast keyword extraction from large text corpora using a finite state backend. The FSA3 package has been adopted for this purposes. We outline the basic approach and present a comparison with previous hash-based method as used in Sketch Engine.

Návaznosti

7F14047, projekt VaV
Název: Harvesting big text data for under-resourced languages (Akronym: HaBiT)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Harvesting big text data for under-resourced languages