PB095 Úvod do počítačového zpracování řeči

Fakulta informatiky
podzim 2023
Rozsah
2/0/0. 2 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: k, z.
Vyučující
Mgr. Luděk Bártek, Ph.D. (přednášející)
Garance
Mgr. Luděk Bártek, Ph.D.
Katedra strojového učení a zpracování dat – Fakulta informatiky
Dodavatelské pracoviště: Katedra strojového učení a zpracování dat – Fakulta informatiky
Rozvrh
Po 12:00–13:50 B204
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
předmět má 65 mateřských oborů, zobrazit
Cíle předmětu
Přednáška poskytuje úvod do teorie počítačového zpracování řeči, zejména ve vztahu k interakci člověk-počítač, tj. se zvláštním zřetelem na problematiku syntézy řeči, rozpoznávání řeči a dialogových systémů. Základní cíle jsou: Porozumět principům vytváření a vnímání řeči; Porozumět principům rozpoznávání řeči, syntézy řeči a dialogových systémů; Získat základní přehled v oblasti.
Výstupy z učení
Student bude po skončení kurzu schopen popsat a vysvetlit základní pojmy, postupy a standardy z oblastí:
  • fyzikální akustiky,
  • fyziologické akustiky, zejména z oblasti tvorby a vnímání mluvené řeči,
  • fonetiky a fonologie,
  • digitalizace a základního zpracování digitalizovaného signálu v časové a frekvenční oblasti,
  • rozpoznávání izolovaných slov,
  • rozpoznávání souvislých promluv,
  • syntézy řeči v časové a frekvenční oblasti,
  • vztahu prozódie a emocí k rozpoznávání a syntéze řeči,
  • dialogové komunikace,
  • dialogových systémů,
  • modelování uživatele v dialogových systémech,
  • aplikací dialogových systémů.
  • Osnova
    • Úvod do problematiky
    • Stručná historie
    • Současný stav a problémy
    • Základy fyzikální a fyziologické akustiky
    • Vytváření a vnímání řeči
    • Základy fonetiky a fonologie
    • Časová a frekvenční analýza signálu
    • Principy syntézy řeči
    • Řečové segmenty a syntéza řeči v časové oblasti
    • Prozodie, emoce
    • Principy rozpoznávání řeči
    • Statistické přístupy
    • Modelování pomocí skrytých Markovových modelů
    • Jazykové modely
    • Komunikace člověk-člověk a člověk-počítač
    • Dialog
    • Dialogové systémy - standardy W3C Voice Browser Activity (VoiceXML, SRGS, SISR, atd.)
    • Modelování uživatele
    • Dialogové systémy a jejich aplikace
    Literatura
    • MCTEAR, Michael. Spoken dialogue technology : toward the conversational user interface. Edited by T. V. Raman. New York: Springer, 2004, xii, 432. ISBN 1852336722. info
    • PSUTKA, Josef. Komunikace s počítačem mluvenou řečí. Praha: Academia, 1995, 287 s. ISBN 8020002030. info
    Výukové metody
    Úvodní přednáška do problematiky. Základní teoretická příprava.
    Metody hodnocení
    Pro ukončení zkouškou písemný test a ústní část vztažená k písemnému testu. Pro ostatní způsoby ukončení je nutné zodpovědět prakticky orientované otázky z probírané látky. Během semestru jsou zadávány bodované, prakticky orientované úlohy z probírané látky.
    Další komentáře
    Studijní materiály
    Předmět je vyučován každoročně.
    Předmět je zařazen také v obdobích podzim 2002, podzim 2003, podzim 2004, podzim 2005, podzim 2006, podzim 2007, jaro 2008, podzim 2008, podzim 2009, podzim 2010, podzim 2011, podzim 2012, podzim 2013, podzim 2014, podzim 2015, podzim 2016, podzim 2017, podzim 2018, podzim 2019, podzim 2020, podzim 2021, podzim 2022, podzim 2024.