FI:PB095 Úvod do zpracování řeči - Informace o předmětu
PB095 Úvod do počítačového zpracování řeči
Fakulta informatikypodzim 2024
- Rozsah
- 2/0/0. 2 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: k, z.
Vyučováno kontaktně - Vyučující
- Mgr. Luděk Bártek, Ph.D. (přednášející)
- Garance
- Mgr. Luděk Bártek, Ph.D.
Katedra strojového učení a zpracování dat – Fakulta informatiky
Dodavatelské pracoviště: Katedra strojového učení a zpracování dat – Fakulta informatiky - Rozvrh
- St 25. 9. až St 18. 12. St 12:00–13:50 B410
- Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
- Mateřské obory/plány
- předmět má 39 mateřských oborů, zobrazit
- Cíle předmětu
- Přednáška poskytuje úvod do teorie počítačového zpracování řeči, zejména ve vztahu k interakci člověk-počítač, tj. se zvláštním zřetelem na problematiku syntézy řeči, rozpoznávání řeči a dialogových systémů. Základní cíle jsou: Porozumět principům vytváření a vnímání řeči; Porozumět principům rozpoznávání řeči, syntézy řeči a dialogových systémů; Získat základní přehled v oblasti.
- Výstupy z učení
- Student bude po skončení kurzu schopen popsat a vysvetlit základní pojmy, postupy a standardy z oblastí:
- fyzikální akustiky,
- fyziologické akustiky, zejména z oblasti tvorby a vnímání mluvené řeči,
- fonetiky a fonologie,
- digitalizace a základního zpracování digitalizovaného signálu v časové a frekvenční oblasti,
- rozpoznávání izolovaných slov,
- rozpoznávání souvislých promluv,
- syntézy řeči v časové a frekvenční oblasti,
- vztahu prozódie a emocí k rozpoznávání a syntéze řeči,
- dialogové komunikace,
- dialogových systémů,
- modelování uživatele v dialogových systémech,
- aplikací dialogových systémů.
- Osnova
- Úvod do problematiky
- Stručná historie
- Současný stav a problémy
- Základy fyzikální a fyziologické akustiky
- Vytváření a vnímání řeči
- Základy fonetiky a fonologie
- Časová a frekvenční analýza signálu
- Principy syntézy řeči
- Řečové segmenty a syntéza řeči v časové oblasti
- Prozodie, emoce
- Principy rozpoznávání řeči
- Statistické přístupy
- Modelování pomocí skrytých Markovových modelů
- Jazykové modely
- Komunikace člověk-člověk a člověk-počítač
- Dialog
- Dialogové systémy - standardy W3C Voice Browser Activity (VoiceXML, SRGS, SISR, atd.)
- Modelování uživatele
- Dialogové systémy a jejich aplikace
- Literatura
- Výukové metody
- Úvodní přednáška do problematiky. Základní teoretická příprava.
- Metody hodnocení
- Pro ukončení zkouškou písemný test a ústní část vztažená k písemnému testu. Pro ostatní způsoby ukončení je nutné zodpovědět prakticky orientované otázky z probírané látky. Během semestru jsou zadávány bodované, prakticky orientované úlohy z probírané látky.
- Další komentáře
- Studijní materiály
Předmět je vyučován každoročně.
- Statistika zápisu (nejnovější)
- Permalink: https://is.muni.cz/predmet/fi/podzim2024/PB095