PB125 Řečová komunikace a dialogové systémy

Fakulta informatiky
jaro 2009
Rozsah
0/2. 2 kr. (plus ukončení). Doporučované ukončení: k. Jiná možná ukončení: z.
Vyučující
Mgr. Luděk Bártek, Ph.D. (přednášející)
doc. RNDr. Ivan Kopeček, CSc. (přednášející)
Garance
prof. Ing. Václav Přenosil, CSc.
Katedra strojového učení a zpracování dat – Fakulta informatiky
Rozvrh
Pá 12:00–13:50 B204
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
předmět má 19 mateřských oborů, zobrazit
Cíle předmětu
Náplní předmětu je práce na aktuálních problémech z oblasti řečové komunikace mezi člověkem a počítačem. Předmět je veden formou semináře. Studenti si na začátku vyberou problém (buď přijdou sami s nějakým návrhem nebo si vyberou jeden z nabídnutých) a do konce semestru vypracují jeho řešení. Na konci semestru proběhnou krátké prezentace všech projektů. Studenti získají dovednosti nutné pro tvorbu dialových systémů a základní přehled v oblastech syntézy a rozpoznávání řeči.
Osnova
  • Předmět tématicky pokrývá tato témata: Syntéza řeči - zpracování textu pro syntézu řeči, fonetický přepis, modelování prozodie, výběr segmentů, akustické modelování, vyhodnocení kvality Rozpoznávání řeči - akustické modelování, rozpoznávání izolovaných slov, rozpoznávání plynulé řeči, identifikace řečníka, jazykové modelování Dialogové systémy - VoiceXML, tvorba dialogových systémů, dialogové systémy pro získávání informací, nástroje pro návrh dialogových systémů, dialogové strategie, modelování uživatele Zpracování řečových dat - řečové korpusy, značkování řečových korpusů, poslechové a řečové experimenty Aplikace pro zdravotně postižené - dialogové systémy pro nevidomé, řečově orientované hry Programování řečově orientovaných aplikací - spolupráce na probíhajících projektech, implementace standardů, připojování řečových rozhraní Prezentace laboratoře - tvorba www stránek Další témata související s řečovou komunikací mezi člověkem a počítačem - zpracování zvuku na počítači obecně
Literatura
  • DUTOIT, Thierry. An introduction to text-to-speech synthesis. Dordrecht: Kluwer Academic Publishers, 1997, vii, 285 s. ISBN 0-7923-4498-7. info
  • RABINER, Lawrence R. a Biing-Hwang JUANG. Fundamentals of speech recognition. Englewood Cliffs: Prentice Hall PTR, 1993, xxxv, 507. ISBN 0-13-015157-2. info
Metody hodnocení
Samostatná práce na zvolených problémech v rámci semináře.
Navazující předměty
Další komentáře
Studijní materiály
Předmět je vyučován každoročně.
Předmět je zařazen také v obdobích jaro 2003, jaro 2004, jaro 2005, jaro 2007, jaro 2008, jaro 2010, jaro 2011, jaro 2012.