4. TEORIE HUDEBNÍHO SIGNÁLU 4.3 METODY ZVUKOVÉ ANALÝZY 123 K LA—D—B-A Obr. 4.27 Časový průběh řečového signálu I 4.3 Metody zvukové analýzy Konkrétní metodiku analýzy zvukového signálu v hudební akustice určuje především složitost vztahů mezi jeho objektivními vlastnostmi a jejich subjektivní reflexive sluchovém vjemu. Přestože analýza je spojována především s rozborem frekvenčních vlastností signálu ve smyslu fourierovského pojetí jeho struktury, existuje řada metod, které jsou autonomně zaměřeny na časovou doménu signálu. Vyšetřování změn v časovém průběhu signálu v jeho reálné délce umožňuje jednoduché trojrozměrné grafické uspořádání jednotlivých period příp. jejich násobků. Tuto časovou závislost periodicity signálu, jejíž použití je známo především z diagnostiky poruch lidského hlasu, přináší obr. 4.28 s prezentací tónu klarinetu. Klarinet ton g in B non vibrato konec 1. periody Obr. 4.28 Periodicita tónu klarinetu Tvarové dispozice časového signálu, které odrážejí též fázové poměry frekvenčních složek, lze vyjádřit také histogramem amplitud, tj. četností výskytu jejich velikostí v pravidelných časových intervalech (např. u jednotlivých vzorků digitálního signálu). Na obr. 4.29 je uveden histogram reálného tónu klarinetu (A), dále histogram tónu získaného zpětnou syntézou (re-syntézou) z prvních deseti harmonických složek při zachování jejich původních fázových vztahů (B) a histogram téhož tónu po normování fáze, tj. „sfázování" harmonických složek (C). Uvedené metody jsou orientovány především na signály tónového charakteru a nehodí se pro analýzu stochastických signálů nebo signálů s podílem stochastické složky, 4. TEORIE HUDEBNÍHO SIGNÁLU Klarinet tón f1 in B Re-syntéza tónu z 10 harmonických složek Normovaná fáze složek Re-syntéza tónu z 10 harmonických složek - max. O Amplituda + max. Obr. 4.29 Amplitudové histogramy tónu klarinetu s^lvrJoT 7 :\ se ri9ná,u/(0 nevysk^ují skr*é períodicky» ***** Vzd emnéU ^í"? "í" °V'ÍVnÍt VJem ^ ^ V U™ném P™*™. R.:(T)= frffM + rfat [4.20] 4.3 METODY ZVUKOVÉ ANALÝZY 125 V časové doméně se používá celá řada dalších metod analýzy, které jsou orientovány už na zcela konkrétní problémy související také se zpětnou syntézou zvuku či tónu, např. proces ,sledování" (demodulace) obálky tónu aj. Pro jednoduchou analýzu ve frekvenční doméně bývá používána klasická analogová metoda pásmová filtrace signálu. Jako pásmový filtr je označován elektronický obvod, který přenáší elektrický signál pouze ve vymezeném, často velmi úzkém frekvenčním intervalu. Ve frekvenční doméně představuje filtrace, resp. výsledné spektrum filtrovaného signálu H(w) součin spektra nefiltrovaného signálu F(a>) a frekvenční charakteristiky filtru G(co). V časové doméně tomuto součinu odpovídá konvoluce H(t) časového průběhu signálu/(/) a časové impulzní odezvy filtru g(t). H{co) = F((0) . G(có) Obr. 4.30 přináší grafickou podobu tohoto tzv. konvolučního teorému na příkladu výsledného frekvenčního spektra „víření" na malý buben jako opakování jednotlivých úderů, které jsou zobrazeny jako impulzy f(ť) s periodou opakování T. ČASOVÁ DOMÉNA Úder 1 Časový průběh f(t) * FREKVENČNÍ DOMÉNA Spektrum Sas frekvence Opakovací funkce g(t) G(uj) "Víření" f(t)*g(t) 1/T Cas FÍUJ) .G(u>) frekvence Obr. 4.30 Periodické opakování impulzů - úderů na malý buben (lit 50) Vlastnosti pásmového filtru jsou charakterizovány šířkou pásma B, dolní mezní frekvencí/d a horní mezní frekvencí/h (viz obr. 4.31). Pro účely spektrální analýzy bývá filtr přelaďován po frekvenční ose, a to bud' plynule nebo skokem. Pokud se při přelaďování šířka filtru nemění, jedná se o filtr s konstantní absolutní šířkou pásma. B=A-L [4.22] 126 4. TEORIE HUDEBNÍHO SIGNÁLU ] ,0 Zvlnění filtru 3 dB bod 3 dB šířka pásma f Lin. frekvenční n stupnice Efektivní šířka pásma B Obr. 4.31 Ideální a skutečný filtr (lit. 50) Pokud se při přelaďování šířka pásma filtru mění, ale poměr absolutní šířky ke střední frekvenci/szůstává zachován, je tento filtr označován jako filtr s konstantní relativní šířkou pásma. B T Á-A [4.23] Střední frekvence ft u konstantní absolutní šířky pásma filtru je dána aritmetickým průměrem dolní a horní mezní frekvence, u konstantní relativní šířky pásma jejich geometrickým průměrem. /.+/; /, =VX7ď [4.24] Volba mezi konstantní absolutní a relativní šířkou pásma filtru souvisí nejenom s vlastní metodikou analýzy, ale také s řadou dalších důvodů vyplývajících např. z výhod použití logaritmické frekvenční stupnice. Obr. 4.32 zobrazuje rozdíl v použití konstantní absolutní či relativní šířky pásma. Skutečný filtr (viz obr. 4.31), resp. jeho charakteristika se od teoretického ideálního filtru liší. Efektivní šířka pásma je taková šířka ideálního filtru, který přenese stejný výkon šumového signálu jako odpovídající skutečný filtr. V praxi je šířka pásma skutečného filtru vymezena jeho šířkou mezi tzv. 3 dB body, které odpovídají charakteristice filtru s polovičním přenášeným výkonem. U filtru s konstantní absolutní šířkou je jeho charakteristika symetrická vůči lineární frekvenční ose. U filtru s konstantní relativní šířkou, který má charakteristiku symetrickou vůči logaritmické frekvenční ose, se šířka filtru udává prostřednictvím jeho oktávové selektivity (obr. 4.33). 4.3 METODY ZVUKOVÉ ANALÝZY 127 I 5 % Konst. relativní šířka pásma 5 * Konst. absolutní ^| šířka pásma 4 6 8 Lineární frekvenční stupnice Konst. abs. šířka pásma 5 * Konst. relativní šířka pásma 100 Hz 1 kllz Logaritmická frekvenční stupnice Obr. 4.32 Konstantní absolutní a relativní šířka pásma filtru (lit. 50) dB 0 «J ■p tt A -20 se lek tli / i \ -40 / \ -60 i i 0 1 5 1,0 2 1- .0 Log. frekvenční stupnice oktávn Obr. 4.33 Oktávová selektivita filtru (lit 50) 4. TEORIE HUDEBNÍHO SIGNÁLU Volba šířky pásma filtru souvisí s efektivní délkou analyzovaného signálu Tcf podle vztahu: 1 B> T tak, aby byla respektována časová odezva filtru 7"R. [4.25] [4.26] Tato časová odezva je nutná doba k ustálení poměrů ve filtru a je tím delší, čím užší šířku pásma má filtr. Proto např. při analýze filtrem o šířce 2 Hz musí mít analyzovaný signál minimální délku 0.5 sec. Podle konkrétního provedení lze filtry používané pro analogovou frekvenční analýzu rozdělit na pevně naladěné a plynule laditelné. V současné době se z těchto klasických filtrů ještě používají hlavně sady pevně naladěných filtrů např. v analyzátorech pracujících v reálném čase. Plynule laditelné filtry slouží dnes převážně jen pro individuální odlaďovaní zvolených složek nebo frekvenčních oblastí tónu. Nejrozšířenějšími filtry s normalizovanou konstantní relativní šířkou pásma jsou oktávové a třetinooktávové s následujícími hodnotami středních frekvencí: Oktávové filtry (fh = 2/d) 16, 31.5, 63, 125, 250, 500, 1000, 2000, 4000, 8000, 16000 Hz Třetinooktávové filtry [fh = 2 ]%) 16, 20, 25, 31.5, 40, 50, 63, 80, 100, 125, 160, 200, 250, 315, 400, 500, 630, 800, 1000, 1250, 1600, 2000, 2500, 3150, 4000, 5000, 6300, 8000, 10000, 12500, 16000, 20000 Hz Rozlišovací schopnost různého typu filtru při spektrální analýze tónu hoboje je zřejmá z obr. 4.34. Tón byl analyzován pomocí oktávových a třetinooktávových filtrů, dále plynule laditelným filtrem nejprve o konstantní relativní šířce pásma 8.5 % a pak o absolutní šířce pásma 31.6 Hz a nakonec pro porovnání výpočtem diskrétní Fourierovy transformace DFT (Discrete Fourier Transform). Velkou nevýhodou analogových pevně naladěných filtruje hlavně jejich malá rozlišovací schopnost pro účely harmonické analýzy, tj. analýzy jednotlivých harmonických složek tónu. U laditelných filtrů je to zase nemožnost analýzy spektra v reálném čase, protože se jednotlivé složky drženého tónu vyhledávají postupným přelaďováním filtru. Přestože byla v minulosti vyvinuta řada důmyslných konstrukcí analogových úzkopás-mových analyzátorů pracujících v reálném čase, byly tyto překonány nástupem digitální techniky ve zpracování a analýze zvuku. Digitální filtry mimo jiné přinesly též možnost ještě užší konstantní relativní šířky pásma až na 1/24 oktávy, tj. až na interval čtvrttónu. Frekvenční analýza analogovými i digitálními filtry je schopna reprodukovat převážně jenom statický pohled na strukturu zvukového resp. hudebního signálu ve smyslu dvojrozměrných spekter promítajících se do harmonické roviny (viz obr. 4.2). Dynamické 4.3 METODY ZVUKOVÉ ANALÝZY 129 • 1/1 okt. Hoboj . 2 cis 1/3 okt ! 8,5 % 31,6 HZ I i I JI jj DFT 0,5 1 2 5 10 kHz Obr. 4.34 Spektra tónu hoboje pojetí signálu je již doménou jeho digitálního (číslicového) zpracování. Přechod od analogové (spojité) podoby signálu k digitální (číslicové) podobě signálu vede přes jeho dis-kretizaci v čase - vzorkování, i v amplitudě - kvantování. V praxi to znamená, že signál nabývá hodnot pouze v určitých časových okamžicích a na určitých hladinách amplitudy (obr. 4.35). Digitální podoba zpracovávaného či analyzovaného signálu resp. jeho vymezeného úseku je potom reprezentována konečným počtem čísel - vzorků o konečné přesnosti. Čím vyšším počtem vzorků (za jednotku času) a větším počtem hladin, resp. jejich jemnějším dělením je signál reprezentován, tím přesněji odpovídá své realitě. Počet odebraných vzorků za sekundu se nazývá vzorkovací frekvencí, např. u zvukového záznamu na CD 44.1 kHz, počet hladin amplitudy vyjádřený v binární po- 130 4. TEORIE HUDEBNÍHO SIGNÁLU době se nazývá formátem záznamu či zpracování signálu, který je u komerčního zvukového CD 16 bitů, což představuje 65536 možných hladin amplitudy. Velikost vzorkovací frekvence/, omezuje podle tzv. vzorkovacího teorému frekvenci fm nejvyšší složky zpracovávaného signálu maximálně do poloviny frekvence/,, a počet bitů N určuje dynamiku signálu v decibelech. /v>2/m L = 20 log 2N Teoretický rozsah dynamiky 16ti bitového zvukového zoznamuje 96 dB. [4.27] vzorkováni čas vzorky ^ T Vzorkovací perioda (krok) -^m Obr. 4.35 Diskretizace signálu Omezení frekvenčního rozsahu digitalizovaného signálu souvisíš jevem zvaným aliasing, který představuje prolínání reálné polohy spektra se zrcadlovým obrazem jeho opakování na pozici vzorkovací frekvence (viz obr. 4.36). Aliasing přináší nepřípustné a neodstranitelné zkreslení signálu a jeho vyloučení je nejčastěji realizováno dolnopro-pustní filtrací před převodem signálu do digitální podoby nebo podstatným zvýšením vzorkovací frekvence tak, aby byl dodržen vzorkovací teorém. 43 METODY ZVUKOVÉ ANALÝZY 131 Spektrum analogového signálu Horní hranice spektra Aliasing frekvence Spektrum diskrétního signálu \ t t 2 Zrcadlový obra'/. spektra f' — vzorkovací v frekvence Obr. 4.36 Vznik aliasingu při diskretizaci signálu Digitální podoba zvukového signálu dovoluje převést obecný problém jeho analýzy do roviny numerického řešení Fourierových řad a integrálů a dalších vztahů. Digitální analýza pracuje s diskrétní podobou Fourierovy transformace DFT, která je adekvátní vztahům [4.15] a [4.16], a platí pro diskrétní časovou funkci g(n) a pro diskrétní spektrální funkci G(k) kde i N-l 2rc*n G(*)=^£sMe~JN ^ .1=0 n = 0.1, až N-1 ... odpovídající vzorek v časové doméně, k = 0.1, až N-1 ... odpovídající vzorek ve frekvenční doméně a N ... počet vzorků signálu. [4.29] U digitální analýzy odpovídá vzorkovanému signálu v časové doméně obdobně vzor-kované spektrum ve frekvenční doméně. 132 TEORIE HUDEBNÍHO SIGNÁLU Ze vztahu [4.16] (resp. [4.29]) vyplývá, že spektrum F(co) (resp. G(k)) je pouze funkcí frekvence. Čas jako nezávisle proměnná je „nahrazen" frekvencí, ale fyzikálně touto proměnnou i nadále zůstává. Časová závislost frekvenčního spektra se řeší zavedením konkrétních mezí integrace do vztahu [4.16], výpočtem (diskrétní podoby) tohoto upraveného vztahu a následným posuvem těchto mezí po časové ose a opakováním výpočtu. Časově závislá spektra jsou vymezena buď jednostranně jako tzv. plovoucí (tekoucí) F(a>)= J/(/)e 1 \ii F(a>)= J/(/)e 'dl [4.30] -* t ! nebo oboustranně jako tzv. okamžitá. [4.31] Uvedené vztahy jsou z důvodu větší srozumitelnosti uvedeny ve „spojité" integrální podobě. Plovoucí spektra s posouvající se horní mezí integrace jsou používána při analýze proměnného narůstajícího signálu (obr. 4.37 A) a zachycují postupný vývoj jeho frekvenční struktury při akceptování již proběhlých, minulých událostí. Tento typ spektra je zaměřený „paměťově". Naopak posouvající se dolní mez analyzuje postupný zánik signálu s akceptováním ještě neproběhlých, budoucích událostí (obr. 4.37 B). Tento typ spektra je zaměřený „predikčně". Okamžité spektrum slouží k analýze oboustranně vymezeného časového úseku signálu (obr. 4.37 C ). Okénko Okénko JLu. Obr. 4.37 časové okénko u plovoucího o okamžitého spektra 4.3 METODY ZVUKOVÉ ANALÝZY 133 Jednostranné i oboustranné vymezení signálu na časové ose se nazývá okénkováním nebo váhováním, časová funkce, kterou se analyzovaný signál násobí - váhuje, se nazývá časovým okénkem nebo váhovou funkcí. Toto okénko se posouvá po časové ose a pro každou polohu se provede výpočet spektra dle vztahu [4.30]. Proces analýzy si lze zjednodušeně představit jako nekonečné opakování okénka na časové ose. Tak vznikne fiktivní periodický signál, u kterého se vypočtou Fourierovým rozvojem harmonické složky. Pokud je při analýze periodického signálu délka časového okénka (resp. rozdíl T2- T,) rovna přesně periodě analyzovaného signálu, pak vypočtené spektrální čáry souhlasí s jeho skutečnými harmonickými složkami. Pokud je délka okénka rovna celistvému násobku počtu period analyzovaného signálu, např. 10ti násobku, pak skutečné harmonické složky budou souhlasit s každou 10. vypočtenou spektrální čárou, ostatní čáry budou popisovat realitu frekvenčního prostoru mezi harmonickými složkami. Protože však délku okénka nelze jednoduše přizpůsobit délce periody analyzovaného signálu, nebude s jeho průběhem souhlasit ani zmíněný fiktivní signál (viz obr. 4.38). Tuto situaci lze připodobnit špatnému střihu na uzavřené smyčce magnetofonového pásku se záznamem drženého tónu, což se zvukově projeví jako zřetelné „lupnutí". Vzniklá diskontinuita pak zkreslí resp. obohatí obsah vypočteného spektra, které samozřejmě nebude zachycovat realitu frekvenční struktury analyzovaného signálu. Reálný signál Časové okénko Fiktivní signál di skont lnui ty. Obr. 4.38 Problém vymezení délky časového okénka Délka časového okénka úzce souvisíš požadavkem na frekvenční rozlišitelnost či přesnost ve spektru podle principu neurčitosti Z\t Aí~ konst. Dlouhému okénku bude odpovídat vysoká frekvenční rozlišitelnost např. při posuzování harmonicity spektra a naopak. V dlouhém okénku se však ztrácí rozlišitelnost časových změn frekvenčního spektra v důsledku jejich zprůměrování. Digitální analýza používá z důvodu urychlení výpočtu spektra algoritmus rychlé Fou-rierovy transformace - FFT(Fast FourierTransform), který ve své nejjednodušší podobě pracuje s délkou časového okénka vyjádřené počtem vzorků v mocninách 2. Diskontinuity vzniklé pevným vymezením délky okénka (např. na 2048 vzorků) se eliminují jeho 134 4. TEORIE HUDEBNÍHO SIGNÁLU vhodným tvarem, který ke krajům okénka postupně zmenšuje velikost vzorků nejčastěji na nulovou hodnotu, viz obr. 4.39. Jak je zřejmé z obr. 4.40, použití Hanningovo okénka (cos2) podstatně sníží úroveň zkreslujících frekvenčních složek ve výkonovém spektru, zejména mezi harmonickými nižších pořadových čísel, avšak pozmění fázové spektrum. Míra potlačení zkreslujících složek a změn ve fázovém spektru je závislá na typu (tvaru) časového okénka, proto se v praxi vybírá okénko z několika desítek ustálených typů podle konkrétního zaměření zvukové analýzy. obdčlníkov OKÉNKO 4 Hanningovo h Kl! rinet tón h in B Obr. 4.39 Váháván! časového průběhu tónu klarinetu dB o -20 -40--60" ♦180° +90°- Klarinet tón h in B Obdélníkové okénko 7. 9. Hanningovo okénko 7. 9. 17. harai. 1960 3g20 1960 3920 3920 Hz -90*i . • . . +180° — o°. -90°. -180°J Obr 4.40 Spektrum tónu klarinetu pro různá časová okénka 4.3 METODY ZVUKOVÉ ANALÝZY 135 Při analýze časového vývoje spektra ovlivňuje rozlišitelnost časových změn jak rychlost posuvu okénka, tak jeho délka i tvar. V každé poloze okénka se provede výpočet tzv. krátkodobé Fourierovy transformace - STFT (ShortTime FourierTransform) podle času T F{a>,t)= J/(r)Y*(T-/)e^dr [4.32] kde Y*(l- t)... komplexně sdružený obraz funkce časového okénka, t... časový okamžik výpočtu spektra analyzovaného signálu f(r). Na obr. 4.41 je vynesen časový vývoj výkonového spektra tónu klarinetu výpočtem STFT s obdélníkovým okénkem. Tento vývoj představuje v- smyslu obr. 4.2 posun harmonické roviny po časové ose (/). Klarinet ton h in B Obr. 4.41 Časový vývoj spektra tónu klarinetu Krátkodobou Fourierovu transformaci lze interpretovat také jako analýzu pomocí sady filtrů s konstantní absolutní šířkou pásma, která odpovídá převrácené hodnotě okénkem vymezeného časového intervalu. Při posuvu po časové ose okénko svoji délku nemění. V řadě případů je však konstantní absolutní šířka nevyhovující, resp. neodpovídající závislosti subjektivního vjemu výšky tónu resp. změny jeho výšky, která probíhá podle Fechnerova-Weberova zákona [2.1]. V tomto případě lze STFT ve výsledku přepočítat na pásmová spektra s konstantní relativní šířkou (např. 1/12 oktávy) nebo na bárková pásma (viz kap. 2.5 a obr. 2.10). Jako analýzu filtrem s konstantní relativní šířkou pásma lze interpretovat vlnkovou transformaci - WT (Wavelet Transform). U této transformace je časové okénko nahrazeno „vlnkou" proměnného měřítka, která představuje impulzní odezvu filtru posouvá- 136 4- TEORIE HUDEBNÍHO SIGNÁLU [4.33] víz obr. 4.42, P '"ovanou délku a odpovídající frekvenci