2011
A Bayesian Approach to Query Language Identification
MATERNA, Jiří a Juraj HREŠKOZákladní údaje
Originální název
A Bayesian Approach to Query Language Identification
Název česky
Bayesovský přístup k detekci jazyka dotazu
Autoři
MATERNA, Jiří (203 Česká republika, garant, domácí) a Juraj HREŠKO (703 Slovensko, domácí)
Vydání
Brno, Czech Republic, Recent Advances in Slavonic Natural Language Processing, od s. 111-116, 137 s. 2011
Nakladatel
Tribun EU
Další údaje
Jazyk
angličtina
Typ výsledku
Stať ve sborníku
Obor
10201 Computer sciences, information science, bioinformatics
Stát vydavatele
Česká republika
Utajení
není předmětem státního či obchodního tajemství
Forma vydání
tištěná verze "print"
Odkazy
Kód RIV
RIV/00216224:14330/11:00054043
Organizační jednotka
Fakulta informatiky
ISBN
978-80-263-0077-9
Klíčová slova česky
detekce jazyka; jazyk dotazu; fulltextové vyhledávání
Klíčová slova anglicky
language identification; query language; information retrieval
Štítky
Změněno: 28. 5. 2021 12:04, RNDr. Jiří Materna, Ph.D.
V originále
In this paper we present a Bayesian approach to language identification of queries sent to an information retrieval system. The aim of the work is to identify both the language of a query as a whole and the language of particular words in the query. The method is evaluated on a test set of manually labelled queries. The evaluation shows that our method performs better than the Google Language Detect API and an implementation of the n-gram method on our testing set of queries.
Česky
V tomoto článku představujeme Bayesovský přístup k detekci jazyka dotazů, zaslaných fulltextovému vyhledávači. Cílem práce je identifikovat jak jazyk dotazu jako celku, tak i jazyk jednotlivých slov dotazu. Metoda byla vyhodnocena na množině manuálně označkovaných dotazů. Ukázalo se, že naše metoda na dané testovací množině překonala kvalitu n-gramové metody i implementace Google Language Detect API.
Návaznosti
LC536, projekt VaV |
|