D 2018

ON THE USE OF GRAPHEME MODELS FOR SEARCHING IN LARGE SPOKEN ARCHIVES

SVEC, Jan, Josef V. PSUTKA, Jan TRMAL, Lubos SMIDL, Pavel IRCING et. al.

Základní údaje

Originální název

ON THE USE OF GRAPHEME MODELS FOR SEARCHING IN LARGE SPOKEN ARCHIVES

Autoři

SVEC, Jan (203 Česká republika), Josef V. PSUTKA (203 Česká republika), Jan TRMAL (203 Česká republika), Lubos SMIDL (203 Česká republika), Pavel IRCING (203 Česká republika) a Jan SEDMIDUBSKÝ (203 Česká republika, garant, domácí)

Vydání

Neuveden, 43rd IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2018), od s. 6259-6263, 5 s. 2018

Nakladatel

IEEE Computer Society

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

paměťový nosič (CD, DVD, flash disk)

Kód RIV

RIV/00216224:14330/18:00100802

Organizační jednotka

Fakulta informatiky

ISBN

978-1-5386-4658-8

ISSN

UT WoS

000446384606084

Klíčová slova anglicky

spoken term detection; speech indexing; grapheme-based speech recognition; keyword search

Štítky

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 13. 5. 2020 19:39, RNDr. Pavel Šmerk, Ph.D.

Anotace

V originále

This paper explores the possibility to use grapheme-based word and sub-word models in the task of spoken term detection (STD). The usage of grapheme models eliminates the need for expert-prepared pronunciation lexicons (which are often far from complete) and/or trainable grapheme-to-phoneme (G2P) algorithms that are frequently rather inaccurate, especially for rare words (words coming from a different language). Moreover, the G2P conversion of the search terms that need to be performed on-line can substantially increase the response time of the STD system. Our results show that using various grapheme-based models, we can achieve STD performance (measured in terms of ATWV) comparable with phoneme-based models but without the additional burden of G2P conversion.

Návaznosti

GBP103/12/G084, projekt VaV
Název: Centrum pro multi-modální interpretaci dat velkého rozsahu
Investor: Grantová agentura ČR, Centrum pro multi-modální interpretaci dat velkého rozsahu