Úvod do počítačového zpracování řeči
Mgr. Luděk Bártek, Ph.D.
Úvod do počítačového zpracování řeči
Kapitola obsahuje:
1
Studijní text
Učitel doporučuje studovat od 18. 9. 2023 do 24. 9. 2023.
Kapitola obsahuje:
1
Studijní text
Učitel doporučuje studovat od 25. 9. 2023 do 1. 10. 2023.
Kapitola obsahuje:
1
Studijní text
Učitel doporučuje studovat od 2. 10. 2023 do 8. 10. 2023.
Kapitola obsahuje:
1
Studijní text
Učitel doporučuje studovat od 9. 10. 2023 do 15. 10. 2023.
Kapitola obsahuje:
1
Studijní text
Učitel doporučuje studovat od 16. 10. 2023 do 22. 10. 2023.
Kapitola obsahuje:
1
Studijní text
Učitel doporučuje studovat od 23. 10. 2023 do 29. 10. 2023.
Kapitola obsahuje:
1
Studijní text
Učitel doporučuje studovat od 30. 10. 2023 do 5. 11. 2023.
Kapitola obsahuje:
1
Studijní text
Učitel doporučuje studovat od 6. 11. 2023 do 12. 11. 2023.
Kapitola obsahuje:
1
Studijní text
Učitel doporučuje studovat od 13. 11. 2023 do 19. 11. 2023.
Kapitola obsahuje:
1
Studijní text
Učitel doporučuje studovat od 20. 11. 2023 do 26. 11. 2023.
Kapitola obsahuje:
1
Studijní text
Učitel doporučuje studovat od 27. 11. 2023 do 3. 12. 2023.
Kapitola obsahuje:
1
Studijní text
Učitel doporučuje studovat od 4. 12. 2023 do 10. 12. 2023.
Kapitola obsahuje:
1
Studijní text
Učitel doporučuje studovat od 11. 12. 2023 do 17. 12. 2023.

Týden 1 - Organizace, Historie zpracování a generování zvuku, Akustika

Organizace předmětu (slidy)

  • Cíle předmětu
  • Struktura a hodnocení předmětu

Stručná historie zpracování a generování zvuku (slidy)

  • Co je to zvuk a co je to řeč
  • Stručný přehled nistorie zpracování a napodobování řeči
  • Aktuální stav

Akustika (slidy)

  • Co je a čím se zabývá akustika
  • Druhy akustiky

Fyzikální akustika (slidy)

  • Základní veličinny
  • Vlnění
  • Vnímání zvuku
  • Základní a složený tón, spektrum zvuku
  • Spektrální analýza zvuku

Týden 2 - Fyziologická akustika, Fonetika, Digitalizace signálu

Fyziologická akustika (slidy)

Fonetika (slidy, ukázky a data)

Digitalizace singálu (slidy)

Týden 3 - Analýza signálu

Slidy, knihovna pro octave, ukázkové vzorky.

  1. Metody zpracování digitalizovaného signálu.
  2. Krátkodobá analýza digitalizovaného signálu
    1. mikrosegment,
    2. váhová okénka.
  3. Zpracování signálu v časové oblasti.
  4. Zpracování signálu ve frekvenční oblasti.
  5. Využití analýzy ve frekvenční oblasti.

Týden 4 - Rozpoznávání řeči

Ukázky zpracování signálu

  1. Zpracování signálu ve časové oblasti pomocí octave
  2. Zpracování signálu ve frekvenční oblasti pomocí audacity

1. domácí úloha

Rozpoznávání řeči (slidy)

  1. Rozpoznávání řeči
    1. Cíle rozpoznávání řeči
    2. Obecný postup rozpoznávání řeči
  2. Rozpoznání izolovaných slov
    1. Cíl rozpoznávání
    2. Vektory příznaků
    3. Klasifikátory
      1. DTW
      2. HMM
      3. DNN
  3. Rozpoznávání plynulé řeči
    1. Rozdíly oproti rozpoznávání izolovaných slov
    2. Jazykové modely
    3. Gramatiky pro podporu rozpoznávání řeči

Týden 5 - Syntéza řeči

Syntéza řeči (slidy)

  1. Cíl syntézy řeči
  2. Fáze syntézy řeči
    1. Fonetický přepis
    2. Syntéza přepsaného textu
    3. Případné dodatečné zpracování
  3. Fonetický přepis
  4. Druhy syntézy řeči
    1. Syntéza v časové oblasti
    2. Syntéza ve frekvenční oblasti
  5. Syntéza ve frekvenční oblasti
    1. Oblasti využití
    2. Způsoby kódování parametrů
      1. syntéza formantového typu
      2. LPC syntéza
      3. HMM
  6. Syntéza v časové oblasti
    1. Používané  řečové segmenty

Týden 6 - Syntéza řeči - dokončení


Syntéza řeči v časové oblasti (slidy)

Syntéza řeči - následné zpracování (slidy, ukázky)

Týden 7 - Dialogové systémy, Dialogová komunikace

Dialogové systémy (slidy)

  • Dialogové systémy
  • Struktura dialogového systému

Dialogová komunikace ()

  • Dialogová komunikace
  • Pravidla pro vedení kooperativního dialogu
  • Iniciativa  v dialogu
  • Zpětná vazba v dialogovém systému
  • Další aspekty dialogových strategií

Týden 8 - Simulace dialogu metodou WOZ, Implementace dialogových systémů

SImulace dialogů metodou WOZ (slidy)

  1. Princip metody Wizard of Ozz
  2. Vylepšení metody WOZ

Implementace dialogových systémů (slidy)

  1. Způsoby přístupu k DS
  2. Části dialogových systémů
  3. VoIP
  4. Gramatiky pro podporu rozpoznávání promluv
  5. Sémantická interpretace promluvy
  6. Způsoby popisu strategie dialogového manažeru
  7. Syntéza řeči
  8. Implementační platformy

Týden 9 - Standardy W3C Voice Browser Activity



W3C Voice Browser Activity (slidy, ukázky)

  1. W3C Voice Browser Activity WG
  2. VoiceXML
  3. SRGS

Týden 10 - Standardy W3C Voice Browser Activity - pokračování

W3C Voice Browser Activity - pokračování (slidy, )

  1. SRGS + SISR
  2. PLS
  3. SSML



Týden 11 - Standardy W3C Voice Browser Activity

Standardy W3C Voice Browser Activity (slidy, ukázky)

Týden 12 - Multimodální dialogová komunikace

Multimodální dialogová komunikace (slidy)

  • Co je to multimodální komunikace
  • Kanály při multimodální komunikaci
  • Emoce


Týden 13 - Chat Bots

Chat Bots (slidy, ukázky)

domácí úloha

  • Dotazovací systémy
  • AIML