SVEC, Jan, Josef V. PSUTKA, Jan TRMAL, Lubos SMIDL, Pavel IRCING a Jan SEDMIDUBSKÝ. ON THE USE OF GRAPHEME MODELS FOR SEARCHING IN LARGE SPOKEN ARCHIVES. In 43rd IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2018). Neuveden: IEEE Computer Society, 2018. s. 6259-6263, 5 s. ISBN 978-1-5386-4658-8. doi:10.1109/ICASSP.2018.8461774.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název ON THE USE OF GRAPHEME MODELS FOR SEARCHING IN LARGE SPOKEN ARCHIVES
Autoři SVEC, Jan (203 Česká republika), Josef V. PSUTKA (203 Česká republika), Jan TRMAL (203 Česká republika), Lubos SMIDL (203 Česká republika), Pavel IRCING (203 Česká republika) a Jan SEDMIDUBSKÝ (203 Česká republika, garant, domácí).
Vydání Neuveden, 43rd IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2018), od s. 6259-6263, 5 s. 2018.
Nakladatel IEEE Computer Society
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor 10201 Computer sciences, information science, bioinformatics
Utajení není předmětem státního či obchodního tajemství
Forma vydání paměťový nosič (CD, DVD, flash disk)
Kód RIV RIV/00216224:14330/18:00100802
Organizační jednotka Fakulta informatiky
ISBN 978-1-5386-4658-8
ISSN 1520-6149
Doi http://dx.doi.org/10.1109/ICASSP.2018.8461774
Klíčová slova anglicky spoken term detection; speech indexing; grapheme-based speech recognition; keyword search
Štítky DISA, firank_A
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnil: RNDr. Pavel Šmerk, Ph.D., učo 3880. Změněno: 30. 4. 2019 06:10.
Anotace
This paper explores the possibility to use grapheme-based word and sub-word models in the task of spoken term detection (STD). The usage of grapheme models eliminates the need for expert-prepared pronunciation lexicons (which are often far from complete) and/or trainable grapheme-to-phoneme (G2P) algorithms that are frequently rather inaccurate, especially for rare words (words coming from a different language). Moreover, the G2P conversion of the search terms that need to be performed on-line can substantially increase the response time of the STD system. Our results show that using various grapheme-based models, we can achieve STD performance (measured in terms of ATWV) comparable with phoneme-based models but without the additional burden of G2P conversion.
Návaznosti
GBP103/12/G084, projekt VaVNázev: Centrum pro multi-modální interpretaci dat velkého rozsahu
Investor: Grantová agentura ČR, Projekty na podporu excelence v základním výzkumu
VytisknoutZobrazeno: 23. 1. 2020 07:12