Akustická a auditivní fonetika zaměřuje svou pozornost na výsledný signál lidské řeči bez ohledu na artikulační mechanismy, jimiž byl vytvořen. Předmětem zkoumání se blíží fyziologické akustice, odvětví fyziologie zabývajícímu se otázkami lidského hlasu, problémy slyšení zvuků a akustice jako součásti fyziky.
Pohled akustické fonetiky je soustředěn na studium autentického, nezobecněného signálu lidské řeči, který je objektivními fyzikálními metodami a pomocí experimentu zkoumán a popisován v celé složitosti. Toto odvětví výzkumu se velmi rozvíjí v posledních desetiletích dík rozvoji fyzikálních metod analýzy zvuku a dík nebývalým možnostem vyhodnocovat zjištěné údaje pomocí počítače a verifikovat výsledky analýz pomocí modelů. Výsledky jsou pak využívány nejen pro hlubší poznání lidské řeči, ale mají také praktické využití v nejrůznějších oblastech komunikace mezi člověkem a strojem (hlasové vstupy, hlasové výstupy, počítačové programy schopné "číst" srozumitelně nahlas jakýkoli psaný text apod.) nebo usnadňují komunikaci mezi lidmi. Akustická analýza umožní také identifikaci mluvčího a má pak využití mj. v kriminalistice. Možnosti akustických zkoumání a jejich uvádění do praxe nejsou ani zdaleka vyčerpány.
Na základě poznání akustiky řeči byla vybudována poměrně exaktní terminologie popisující jednotlivé hlásky i prozodické prostředky řeči. Pracuje s ní hlavně literatura oboru a šířeji speciální fonetická literatura, zatímco lingvistika věrna tradicím dává přednost terminologii artikulačně-auditivní.
Auditivní pohled na lidskou řeč je mnohem starší: je založen na analýze a hodnocení řeči sluchem. Není ani zdaleka tak přesný jako pohled akustický, protože lidské ucho má omezenou možnost vnímání (srov. i 6.6) a není ani možno jej dokonale objektivizovat, protože je do jisté míry poznamenán subjektem člověka, který výzkum provádí. Na druhé straně je vzhledem k roli řeči v komunikaci daleko adekvátnější než studium akustiky, protože přirozenou cestou umožní zachytit a zhodnotit ty zvukové prostředky řeči, které jsou percipovatelné, a tedy v řeči důležité. V současnosti můžeme konstatovat, že akustická zkoumání podstatně upřesnila poznatky, k nimž filologové došli auditivní cestou, umožnila interpretovat souvislosti, které zůstávaly skryty a celkově posunula obor na daleko exaktnější úroveň, než byla tradiční cestou možné. Na druhé straně sluchové hodnocení, ovšem připravené do podoby testů a co nejobjektivněji zpracované, zůstává první orientací ve zvukovém materiálu a je součástí verifikace poznatků experimentálních.
Auditivní fonetika je paralelou fonetiky artikulační (5), zjednodušeně můžeme říci, že určité znění, přesněji znění, které ucho vnímá jako "obvyklé", vzniká vždy jedním a týmž mechanismem tvoření. Výjimky v této zjednodušené souvislosti existují a jsou dobře známy, mj. i logopedům, pro lingvistiku jsou však nevýznamné. Důsledkem paralelnosti je však pro lingvistiku skutečnost, že vedle termínů postihujících artikulaci jednotlivých hlásek je tu i tradiční terminologie založená na jejich auditivním hodnocení. A navíc, autoři užívají obě terminologické soustavy promiskue. Je proto nutno i soubor termínů, na který dále upozorníme, ovládat.
Akustický signál řeči je vnímán posluchačem také opticky. Okrajově si těchto složek všímá artikulační fonetika, detailněji se stává optický signál artikulace důležitý pro neslyšící, ale také např. při dabingu.
Ve vizuálním kontaktu mezi mluvčím a posluchačem je zvukový signál provázen signály kinetickými, mimikou, gesty, postojem apod. Mnozí mluvčí tak provázejí i ostatní mluvené projevy (při telefonování, při samomluvě). Tyto signály, významně usnadňující a modifikující komunikaci, analyzuje např. psychologie a sémiotika.
Nositelkou akustického signálu řeči je zvuková vlna, jejíž podstatou jsou podélné kmity molekul vzduchu.
Podnět pro toto kmitání je dán mluvními orgány. V zásadě existuje vztah mezi typem artikulace a vzniklým zvukem, v některých případech však vznikají akusticky velmi blízké (a sluchem neodlišované) zvuky různým způsobem artikulace (např. výslovnost souhlásky [l] horní plochou špičky jazyka a [ĺ] vyslovované retroflexně), a naopak někdy i nevelká obměna tvoření má pro posluchače patrné akustické důsledky (rozdíl mezi spojením[ [t]+[s] a [°] (=c) je v češtině dobře slyšitelný - srovnej vyslovené přece - před sebe (-ts-).
Fonetik zabývající se akustickou fonetikou užívá přirozeně příslušné fyzikální terminologie. Pro běžné výklady kurzu pro lingvisty vystačíme s několika základními termíny; jejich definice a složitý matematický aparát s nimi spojený ponecháme exaktním vědám.
Výška zvuku je dána u jednoduchého tónu kmitočtem jeho zdroje, u složeného tónu interferencí výšek tónů částkových. Udává se v hertzích (značka Hz) : kmitočet rovný 1 Hz má takový periodický děj, jehož 1 (dvoj)kmit trvá 1 sekundu.
Intenzita zvuku je dána velikostí akustického výkonu, jenž projde určitou plochou kolmou na směr šíření zvuku. V běžném životě se mezi akustickým výkonem a intenzitou nerozlišuje: mluvíme o síle hluku, hudby apod. a vyjadřujeme ji v decibelech (dB), desetinách základní jednotky akustického výkonu, jíž je bel.
Pro subjektivní vnímání, při němž se sluchový dojem opírá jak o výšku, tak o sílu zvuku, se čistě fyzikální jednotky nehodí, pracuje se se speciální jednotkou fón. 1 fón je u čistého tónu s frekvencí 1 kHz při intenzitě 1 dB.
Hlasitost zvuku je sluchovým odhadem poměru síly hodnoceného zvuku a síly referenčního zvuku s hladinou hlasitosti 40 fónů. Je mírou subjektivně posuzované intenzity zvuku a její jednotkou je son.
Barva zvuku řeči vzniká interferencí výšek a intenzit všech tónových a šumových složek.
Kvantita, trvání v čase.
Zvuky dělíme podle průběhu zvukových vln na pravidelné a nepravidelné. Pravidelné (periodické) označujeme jako tóny, nepravidelný průběh mají šumy. Nejjednodušší periodické zvuky jsou jednoduché tóny, běžnější jsou však tóny složené. Mnohé zvuky v přírodě jsou kombinací tónové a šumové složky. I v lidské řeči se uplatňují tóny (samohlásky), zvuky kombinující tónovou a šumovou složku (např. [l], [r] nebo - jinak složené - znělé souhlásky) a čisté šumy (neznělé souhlásky).
Chceme-li sledovat průběh zvukové vlny v počítači, musíme ji takzvaně digitalizovat. Digitalizace je proces, při kterém se původní analogový signál (tedy v našem případě tlak vzduchu v určitém místě) převede na nějakou číslicovou reprezentaci.
Představme si tedy člověka, který mluví do mikrofonu. Proud vzduchu, který tento člověk vytváří, vychyluje jazýček v mikrofonu z jeho základní polohy. Mikrofon vysílá (stále ještě v analogové podobě) tuto výchylku do zvukové karty počítače. Zvuková karta v pravidelných intervalech (např. 22050krát za sekundu) zjistí hodnotu výchylky a převede ji na číslo v intervalu např. 0-255. 0 odpovídá maximální výchylce směrem dolů, 127 klidové hodnotě jazýčku a 255 maximální výchylce směrem nahoru. Tato čísla se potom dají zobrazit graficky jako posloupnost bodů v rovině (viz obrázek). Osa x odpovídá časové ose, osa y akustické intenzitě.
Žádné z výše uvedených čísel není natolik magické, jak by se mohlo na první pohled zdát. Frekvence 22050 Hz se používá pro záznam řeči proto, že zvuk vzorkovaný na této frekvenci dokáže spolehlivě zachytit i nejvyšší frekvence, které člověk při mluvení vytváří (zhruba 6kHz, hlavně u sykavek). Je samozřejmě možné vzorkovat i na jiných frekvencích, typicky se používají např. 12 kHz a 16 kHz. Pro záznam hudby v CD kvalitě, kde je potřeba vyšší rozlišení, se používá frekvence 44,1 kHz.
Klasifikace polohy jazýčku pomocí jedné z 256 hodnot se používá z ryze praktických důvodů. Čísla 0-255 jsou právě ta čísla, která se dají vyjádřit pomocí 8 bitů, neboli jednoho bytu, což je základní jednotka uložení informací v počítači. V dnešní době se vzhledem k rostoucímu výkonu počítačů používá spíše šestnáctibitové kódování, které je daleko přesnější popisuje polohu jazýčku pomocí čísla v intervalu -32768 –32767.
| + |
| = |
|
Obrázek 23a: Tón o frekvenci 100 Hz, tón o frekvenci 200 Hz a jejich složení. |
| + |
| = |
|
Obrázek 23b: Tón o frekvenci 100 Hz, šum a jejich složení. |
Složené tóny lidské řeči vznikají jednak interferencí pulzů kmitů tělesa, které je zdrojem zvuku (vedle pružného tělesa kmitajícího jako celek vznikají periodické kmity jeho jednotlivých částí - důsledkem jsou tzv. tóny harmonické), jednak tím, že se základní tón doplňuje při průchodu prostředím rezonancí, tj. vynucenými změnami kmitání částic vzduchu v částečně uzavřených prostorech - rezonátorech; v těchto rezonátorech dochází buď k doplnění tónu nebo zesílení existujících svrchních harmonických tónů, tedy ke skutečné rezonanci, nebo jsou naopak existující svrchní tóny utlumeny : tento jev se nazývá antirezonance. Vyšší neharmonické složky lidského hlasu vznikající při artikulaci řeči rezonancí dutiny hrdelní, ústní a nosní se nazývají formanty hlásek.
Složený tón lze analyzovat harmonickou analýzou na jednotlivé složky. Starší způsob analýzy založený na matematických vztazích mezi interferujícími tóny a výsledným složeným tónem dnes nahradila analýza pomocí přístrojů. Je rychlá, kvalitní, umožňuje tedy analyzovat všechny přechodové zvuky v časovém průběhu a základě zjištění také jejich stavbu a sled napodobit.
Spektra ("plátky" spektrogramu) v časech 7, 14 a 30 ms. Značky v původním obrázku ukazují místa, ze kterých byly plátky vyříznuty. | ||
Obrázek 24: Zvukový záznam slova vál a jeho spektrogram. |
Akustická struktura lidské řeči je velmi složitá a je dosud prozkoumána jen z části. Při popisu vydělujeme obvykle jednotlivé řečové zvuky ze souvislého proudu. V něm jedna složka plynule navazuje na druhou, vzájemně se ovlivňují a pozměňují, a to někdy do té míry, že se charakteristické vlastnosti jen vzdáleně podobají témuž typu zvuku v jiném hláskovém okolí. Proto jsou akustické popisu jednotlivých hlásek zobecněním (podobně jako popisy artikulační). Výsledky studia přechodových zvuků, dnes velmi rozvinutého a důležitého i pro syntézu řeči, se zatím do popisu akustické struktury řeči zařazují jen v zobecněné formě. Zvuk řeči je v celém průběhu významně ovlivňován i modulací celku promluvy (intonací, silou řeči apod.); o těchto vlastnostech se pojednává dále.
Obrázek 25: Samohláska í ve slovech kývá a dívá |
Základem zvuku lidské řeči je u mnoha hlásek hlas vytvářející se činností hlasivek. Jeho výška je individuálně proměnlivá : hlasové rozpětí se běžně pohybuje v 1-1,5 oktávy při řeči, při zpěvu se (dík vrozeným dispozicím i hlasové výchově) výrazně zvětšuje (2-4,5 oktávy). Výška mluvního hlasu u mužů se uvádí kolem 120 Hz, u žen 220 Hz, děti mají obvykle hlas vyšší. Při zpěvu však může výška dostoupit až 1000 Hz. U souhlásek neznělých, kde se hlasivky na tvorbě řeči nepodílejí, je akustická charakteristika založena na šumu různé výšky a typu, ve znělých souhláskách se na jejich akustické struktuře podílí šum i tón, vokály jsou hlásky tónové.
Výška a síla hlasu jsou společně prostředkem
vyjádření intonace (blíže 7.2).
Obrázek 26: Průběh intonace ve větě "Budu tam v pět". |
Z akustického hlediska je nejvhodnější rozdělit hlásky na :
/1/ Hlásky s volným vyzněním hlasu doplněným rezonancemi - vokály (samohlásky). Artikulačně jde o hlásky založené na apertuře.
/2/ Hlásky, jejichž zvukový obraz je založen na šumu (samostatném nebo doplněném i složkou tónovou) - konsonanty (souhlásky). Artikulačně jde o hlásky, v jejichž tvoření je uplatňuje striktura.
Početná skupina konsonantů není z akustického hlediska stejnorodá, podle vztahu mezi hlasovou a šumovou složkou je lze dále dělit na :
/a/ Hlásky klouzavé (glide), jež nemají plně rozvinutou tónovou složku, ale chybí jim i složka šumová. Tyto hlásky mají poměrně nejblíže k vokálům, v některých jazycích se dokonce v jednotlivých slovech se skutečným vokálem střídají. Artikulačně jde o aproximanty, tj. [j] a [].
/b/ Sonory - hlásky s poměrně větším podílem tónové složky, ale obsahující i složku šumovou; na jejich akustickém obrazu se vedle hlasu podílí i rezonance: dělí se na likvidy (souhlásky plynné, [l], [r]), u nichž tónovou složku vytváří rezonance v ústech, a nazály, kde je doplňující rezonance nosní (např. [m][n]). Blízkost těchto souhlásek, zvláště likvid, k vokálům ukazuje jejich schopnost fungovat v některých jazycích jako jádro slabiky (tak i v češtině - např. jednoslabičná slova vlk, prst).
Označení "sonora", "likvida" jsou typickým termínem založeným na sluchovém dojmu, užívají se však i tam, kde se preferuje pojmenovaní na základě artikulace nebo akustiky.
/c/ Vlastní konsonanty (konsonanty šumové) mají zřetelnou složku neperiodických kmitů (šumů). Částečně tónovou složku mají z této skupiny sonorní konsonanty (konsonanty znělé - tvoří ji znění základního hlasu), nesonorní konsonanty (neznělé souhlásky) jsou čistými šumy.
Jak je vidět, tradiční dělení na samohlásky a souhlásky vyhovuje jen pro základní orientaci v jazykovém materiálu, ale akustickou složku řeči (stejně jako artikulační) postihuje nedostatečně.
Starší, auditivní fonetika si byla rozdílů mezi typy konsonantů dobře vědoma. Termíny sonora, likvida, nazála jsou velmi staré, poslední desetiletí přinesla jen termín glide (tomu odpovídá i fakt, že je odvozen z angličtiny); o specifiku konsonantů j nebo v však věděli už lingvisté 19. století.
Vokály jsou hlásky s tónovou strukturou. Jejich tón je složený, vedle laryngálního hlasu se na nich podílejí i rezonance vzniklé v nadhrtanových dutinách (a další svrchní tóny). Diferenciace vokálů vychází z toho, že u každé samohlásky jde o jinou kombinaci rezonancí, které vedou k soustředění zvukové energie v jistých tónových pásmech; každý vokál má tedy jinou strukturu a jiný vzájemný poměr tónových složek. Složený tón jednotlivých vokálů je pak nápadně odlišný.
Laryngální hlas je pro všechny vokály stejný, k diferenciaci dochází při průchodu hlasu rezonančním prostorem tvořeným hrdlem a ústní dutinou zakončenou rty, popřípadě dutinou nosní. Délka a šíře tohoto rezonátoru je do určité míry proměnlivá. Jde totiž o zahnutou trubici, kterou postavení jazyka dělí na dva "subrezonátory", na rezonátor "hrdelní" a "ústní". Ty se musejí podílet na výslovnosti každého vokálu. V některých jazycích se navíc může uplatnit jako rezonátor i dutina nosní. Pohybem jazyka se mění vzájemný poměr rezonátorů; ve výsledném znění se odrážejí i proměny výstupního otvoru rezonátorů dané postavením rtů. V této složité rezonanční soustavě dochází ke vzniku formantů, typických pásem zesílení zvukové energie. Pro vytvoření a identifikaci vokálů jsou nutné nejméně dva formanty, samohlásky lidské řeči jich však mají více (uvádí se až 6 formantů, k nim přibývají i další -svrchní tóny). Při hlasité řeči se připojuje formant laryngálního hlasu, který je "budičem charakteristiky" formantů ostatních.
Obrázek 34: Samohláska a.
| |
Obrázek 35: Samohláska e.
| |
Obrázek 36: Samohláska i.
| |
Obrázek 37: Samohláska o.
| |
Obrázek 38: Samohláska u. |
Vztah mezi laryngálním hlasem a formantovou strukturou vokálů vysvětluje několik teorií. Jako nejpřesvědčivější se jeví pulzační teorie Hermannova. Zvukové vlny vzniklé činností hlasivek podle ní rozechvívají sloupec vzduchu v hrdelní a ústní dutině. Tím vznikají oba základní formanty. Sloupec vzduchu v ústech a hrdle má u jednotlivce přibližně stálý objem pro každou samohlásku, formanty mají proto ustálený charakter. Základní tón řeči se naproti tomu může obměňovat (např. při zpěvu). Proto lze i ve zpívaném textu rozeznávat jednotlivé samohlásky. Při extrémně vysokých polohách však může dojít u vokálů ke zkreslení. Při šeptaných samohláskách laryngální hlas chybí. Přesto mají i tyto samohlásky formantovou strukturu a jsou dobře poznatelné. Jako "budič charakteristiky" se u nich uplatňuje prostý výdechový proud doplněný šumem vzniklým při průchodu vzduchu mezi částečně sblíženými hlasivkami.
Výška formantů je pro jednotlivé vokály v daném jazyce omezena na jistá frekvenční pásma, nejde tedy o jediný tón. Tradiční fonetika označovala jednotlivé formanty podle předpokládaného místa vzniku termíny odvozenými z artikulační fonetiky: mluvilo se pak o formantu ústním, hrdelním. Dnes se dává přednost označení číslicemi vycházejícími z výšky formantů, jak ji zachycují objektivní metody analýzy zvuku řeči. Formant základního hlasu má označení F0, nejbližší vyšší F1, další F2 atd. Např. v češtině se F1 pohybuje v rozmezí 300 Hz [i:] - 800 Hz [a:], F2 799 Hz [u:] - 2300 Hz [i:]; čísla jsou průměrná, skutečné realizace se pohybují v širokém rozmezí kolem těchto výšek.
Formanty jednotlivých vokálů jsou navzájem odlišeny. Zřetelně se liší rezonance vznikající v ústní dutině, rezonance vznikající v dutině hrdelní jsou odlišeny méně. Pro identifikaci vokálů však jsou důležité nikoli absolutní hodnoty formantů, nýbrž vzájemný poměr F1 a F2: pro vokály, které hodnotíme jako i-ové, je to např. velký výškový rozdíl mezi oběma formanty, a-ové zvuky mají oba formanty blízko sebe a jsou umístěny přibližně ve středu výškového pásma, u-ové vokály mají oba formanty nízké atd. Na základě toho hodnotíme i uměle vytvořené složené tónové zvuky jako podobné tomu či onomu vokálu. Kombinace neodpovídající modelu formantové struktury vokálů známého jazyka sice označíme také za samohlásku, ale nejsme s to ji identifikovat; podobné potíže můžeme mít při identifikaci zvláštních typů vokálů jazyka cizího.
V některých jazycích (polštině, francouzštině) se uplatňuje i nosní rezonátor. Akustická struktura těchto vokálů se tím pochopitelně mění. Jak ukázaly analýzy v polštině, nedochází však k připojení nosního formantu", nosní prostor je zřejmě zdrojem antirezonance.
Důležitou složkou akustiky vokálů je jejich časový průběh. Objektivně zjistitelná kvantita je jevem fonetickým. Měření ukázala, že skutečná délka vokálu závisí na jeho typu (vysoké vokály bývají v průměru kratší) a na pozici ve fonické řadě (např. před sonorami se vokály krátí). Údaje o fyzikálně zjištěném trvání hlásek nejsou zcela přesné, neboť je někdy obtížné v souvislém proudu řeči hranice mezi konsonantem a vokálem stanovit. V mnoha jazycích se délka vokálu mění také v závislosti na přízvuku (v ruštině). Trvání vokálu se pozměňuje při emfázi - má móře peněz, vokál se může zkracovat v delších slovech nebo při rychlejší řeči apod.
Obrázek 39: Délka samohlásek ve slovech péče a peče
|
Obrázek 40: Délka samohlásek ve slovech balík a bílek |
Tyto objektivní vlastnosti mají pro rozlišování významu jen malý smysl : nutné je pouze zachovat minimální trvání hlásky (zkrácení pro tento limit způsobí, že vokál nelze identifikovat) a trvání "maximální" - nadměrně prodloužený zvuk již neinterpretujeme jako hlásku, ale jako výkřik, povzdech apod. Pro odlišení významových jednotek se v jazycích jako je čeština využívá relativní kvantita, tj. poměru mezi krátkým a dlouhým vokálem takřka stejné formantové struktury.
Nahrávka řečového segmentu kib. |
Nahrávka řečového segmentu kib s hláskou 'i' dodanou ze segmentu bik. |
Obrázek 41: Ukázka vlivu koartikulace |
Formantová struktura vokálu je typická pouze v jeho
vrcholové fázi, v místech napojení k sousedním konsonantům se modifikuje. V
přirozeně vyslovované řeči jsou tyto přechody
tak samozřejmé, že je ani nevnímáme. Patří do celkového obrazu
konkrétního jazyka.
Jinak je tomu při akustické analýze, kde je možno
sledovat složení zvuku v kterémkoli vybraném momentu. Pro vazbu mezi segmenty
svědčí to, že přeneseme-li (technicky) realizaci vokálu do jiného hláskového
okolí, přirozeným sluchem vnímáme neobvyklost, nesprávnost výsledku. Srov. i 6.3.
Obrázek 42: Průběh vlny a spektrogram "slova" kobo
|
Obrázek 43: Průběh vlny a spektrogram "slova" koubou
|
Obrázek 44: Průběh vlny a spektrogram "slova" kubu |
Diftong je zvláštním typem hlásek s tónovou strukturou. Zatímco formantová charakteristika vokálu je v jeho průběhu celkem stálá, v diftongu dochází k plynulé proměně struktury. Fonetická literatura připomíná dva typy dvojhlásek : Pravé diftongy, v nichž si obě složky zachovávají plnou vokaličnost (tento typ je velmi vzácný) a diftongy nepravé, v nichž si plnou vokalickou stavbu uchovává jen část, zatímco druhá složka ji částečně ztrácí, mění se na polosamohlásku. Podle postavení této oslabené složky se nepravé diftongy dělí na stoupavé, v nichž je oslabená složka počátkem diftongu (např. slovenské diftongy jsou stoupavé - mlieko - [mlieko], kôň - [kuoň]), a klesavé, v nichž je oslabená část na konci (např. české [o] (=psané ou). Termínem diftong se, pokud není jinak uvedeno, rozumí v literatuře obvykle diftong nepravý. Specifikum tónového průběhu diftongu, ev. složitějších vokalických zvuků (triftongů, polyftongů) odpovídá proměnlivosti jeho artikulace (5.3).
V některých jazycích diftongy neexistují (např. v ruštině), v jiných jazycích mohou existovat i složitější kombinace vokalických a klouzavých prvků (např. v nám blízké slovenštině - dievča [jie±a].
Proměny zvuku vokálu mohou vznikat
v některých jazycích i při obměnách jejich tvoření v závislosti na artikulační
bázi jazyka nebo na hláskovém okolí. V ruštině se např. vyslovuje po retnicích o s nádechem u, podobně se tu
vyslovuje o i na počátku slova. Taková výslovnost se
označuje jako diftongoidní (podle Ščerby).
Do široké skupiny konsonantů patří hlásky, v jejich spektru je přítomen šum, hlásky jsou charakterizovány konsonantností. Tento šum se realizuje buď samostatně, nebo je provázen zněním laryngálního hlasu. Do širší skupiny konsonantů patří v běžném pojetí i sonory a hlásky klouzavé, vzhledem k mnoha specifikům ve vývoji jazyka i v současnosti je však vyčleňujeme do samostatné skupiny (6.5).
Šum je podstatou všech typických souhlásek jazyků. Proto se vedle termínu šumové souhlásky užívá i termín vlastní konsonanty. Týž typ šumu (vytvořeného činností mluvních orgánů) může být realizován jak s doprovodem hlasu, tak bez něho. Této skutečnosti využívají mnohé jazyky světa k vytváření tzv. znělostně párových souhlásek, tj. dvojic souhlásek lišících se vzájemně znělostí. Takové páry souhlásek bývají při realizaci v proudu řeči ve vzájemných vztazích, např. se při asimilaci znělosti (viz 7.3) nahrazují.
Šum tvořící souhlásku může být tří typů :
/a/ Jednorázový velmi krátký šum typu pulzu; před vznikem šumu dochází k přerušení zvukového proudu. Takový charakter má šum hlásek okluzivních. Z auditivního hlediska se označují jako (ex)plozivy - souhlásky ražené.
/b/ Trvací šum (časově omezený limity daného jazyka) navazující na předcházející zvuky souvisle. Takový charakter má šum konstriktivy. Z auditivního hlediska jsou tyto konsonanty označovány jako frikativy, hlásky třené, též spiranty.
/c/ Jako kombinaci obou způsobů, kratičkou pauzu a slabou explozi přecházející v konstrikci, je možno označit zvuk vznikající u souhlásek semiokluzivních. Z auditivního hlediska je jejich zvuk vnímán jako blízký frikativám, proto se u nich ustálil název afrikáty, aspiráty.
Šumové hlásky mají další akustické vlastnosti:
/a/ Znělost (sonoritu) vznikající doplněním akustické charakteristiky o tón laryngálního hlasu; takové souhlásky mají pak i jeden formant Fo, ten je však diferencuje jen ve srovnání s obdobným šumem bez sonority.
/b/ Výšku šumu, tj. soustředění energie šumu do určitého výškového pásma; výška šumu odlišuje i na pouhý poslech např. konsonanty [s], [z] od podobných [] (=š), [¥] (=ž). Rozdíly jsou v šíři výškového pásma, v němž se šum realizuje (u hlásek s větším prostorem v ústní dutině - labiály, veláry - je šum tupější, tj. zabírá širší výškové pásmo). Šum může být posunut ke středu zvukového spektra hlásek (u postalveolár, palatál, velár, laryngál), nebo být na jeho okraji. Zvláštním typem šumu je tzv. "bílý šum", v němž je zvuková energie rovnoměrně rozložena ve všech výškových pásmech. Sluchově připomíná takový šum zvuk lesa za mírného větru a není žádné souhlásce podobný.
/c/ Časový průběh je u konsonantů spojen především s jejich kvalitou : úžinové jsou delší než závěrové, neznělé než znělé; může se odrážet i přízvuk (prodlužování konsonantů v přízvučné slabice). Jde však o rozdíly málo uvědomované. V některých jazycích se využívá kvantita jako rys schopný diferencovat význam i u konsonantů (korejština, italština). Jde pak o relativní kvantitu založenou na poměru mezi krátkou a obdobně tvořenou dlouhou souhláskou. Akustický dojem dlouhé souhlásky může vznikat také při spojité výslovnosti dvou stejných souhlásek.
Je samozřejmé, že konsonanty mají jistou mez trvání, jež je nutná pro jejich identifikaci. Vyjadřuje se v setinách sekundy, [l] např. trvá v češtině kolem 10 setin, [c] 16 setin, [s] 26 setin sekundy. I tu jde o průměrné hodnoty a údaje v pramenech se mohou lišit, neboť hranici mezi hláskami lze těžko stanovit.
/d/ V některých jazycích si uživatelé uvědomují i další akustické vlastnosti konsonantů, např. abruptivnost, aspirovanost.
V souvislé řeči se akustické charakteristiky konsonantů modifikují vlivem koartikulace. Zvlášť patrný je takový vztah mezi konsonanty a vokály : zatímco vokál má zvukovou strukturu poměrně vyhraněnou, u některých konsonantů je jejich skutečný průběh tak krátký, že se ani nemohou samostatně zvukově plně realizovat (takto nevýrazně vyznívají explozivy, zejména neznělé). Přesto si je v proudu řeči uvědomujeme. Je tomu tak proto, že konsonanty ovlivňují svým charakterem zvukovou výstavbu sousedících vokálů : posunují nebo zakřivují okrajové fáze formantů (především F2) způsobem, který je pro určitou skupinu souhlásek naprosto typický. Tak v sousedství retnic se okraje formantů snižují, u alveolár zvyšují, u palatál je zvýšení větší než u alveolár a v sousedství veláry se okraje formantů rozbíhají. Tento rozdíl lze někdy vnímat i sluchem.
Pro vokál je typická existence
většího počtu formantů, míst koncentrace akustické energie. Známe však i
hlásky, které mají šumovou složku velmi slabou, ale ani tónová složka u nich
není rozvinuta. Tyto hlásky jsou akusticky na pomezí mezi konsonanty a vokály;
vzhledem k fungování mimo jádro slabiky je řadíme mezi konsonanty. Vztah
takových hlásek k nejblíže podobným vokálům je dán postavením v soustavě zvuků
jazyka : někdy se mohou střídat tak, že je pokládáme za realizaci téže jednotky
(slabičné - neslabičné [i], [v]),
jindy, např. v češtině [j], se mohou kombinovat i v
jediné slabice a jsou zvuky samostatnými. Ve starší terminologii bylo zvykem
tyto hlásky zařazovat k sonorám, s nimiž mají společné rysy při využití v
souvislé řeči.
Obrázek 45: Klouzavá souhláska j ve slově máj.
|
Obrázek 46: Klouzavá souhláska j ve slově bij. |
Zvukové realizace velmi podobné hláskám [j] a [] existují jako složka diftongů (viz 6.2). V této pozici se označují jako polosamohlásky : termín má vystihovat jejich blízkost k vokálů a současně připomínat rozdílnou funkci (postavení mimo jádro slabiky).
Označení polosamohláska dávali někteří jazykovědci také hláskám, které jsou sice vokály, ale velmi specifickými, s mimořádně krátkou kvantitou nebo neobvyklou strukturou. Tak dostal toto označení velmi krátký vokalický zvuk nepřipomínající jinou samohlásku [c] ("smíšená samohláska", přibližně takový zvuk, jaký provází konsonant, pokud se jej snažíme vyslovit samostatně) Podobně se označovaly i tzv. jery, velmi krátké vokalické hlásky, které měly v praslovanštině rozlišující funkci. Starší termín je v češtině projevem rozpaků nad zvuky s nezvyklou stavbou.
Blíže konsonantům jsou hlásky, které mají vedle formantu základního hlasu jen jeden další formant vzniklý rezonancí na základě laryngálního hlasu. Sonory, jak se tradičně nazývají, mají i šumovou složku sbližující je s konsonanty, je však oslabena (např. šumová složka [m] je slabší než šum obdobně tvořeného znělého [b]). Jsou tedy odlišné nejen od vokálů, ale i od konsonantů, které formant (kromě laryngálního hlasu u části z nich) nemají. Tradičně jsou tyto hlásky řazeny mezi souhlásky, s nimiž je spojuje schopnost stát mimo jádro slabiky (4.3), mají však nejen v akustice, nýbrž i v artikulaci a ve spojování s ostatními hláskami své zvláštnosti.
Tento charakter mají hlásky l-ové, r-ové, ve většině jazyků také nosní souhlásky. U nazál se podílí na zvuku rezonátor nosní, u [l] rezonuje prostor úst při zvláštním postavení jazyka, [r] umožňuje rezonanci při vibrantní výslovnosti. U všech těchto hlásek však lze současně určit místo a způsob tvoření jako u konsonantů. Pro hlásky l-ové a r-ové se užívá i označení likvidy (hlásky plynné).
Obrázek 47: Zvukové spektrum výrazu celerem.
|
Obrázek 48: Zvukové spektrum výrazu celerem s potlačenými frekvencemi pod 800 Hz. |
Do skupiny sonor se dále řadí nazály,
souhlásky nosní, u nichž je šum doprovázen rezonancí, ev. antirezonancí dutiny
nosní. Nazální by mohly být všechny typy souhlásek, ve skutečnosti jsou však
doloženy jen nazální okluzivy; tvoří třetí souhlásku v řadách [p] - [b] - [m]; [t] - [d]
- [n], [k] - [g] - [ŋ]; souhláska [
] = ň je rozšířena v mnoha jazycích.
Nazály jsou obvykle jedinečné znělé.
Akustický signál nelze ztotožnit se zvukem skutečně vnímaným. Vnímatel slyší jen část zvukových charakteristik, a to v rozsahu svého sluchového pole. Sluchové pole je dáno hodnotami výšky a síly zvuku, jež jedinec vnímá.
Intenzita se udává v decibelech (dB). Intenzitu 1 dB má zvuk o frekvenci 1000 Hz, který je na hranici slyšitelnosti (normálním sluchem). Decibel je jednotka nelineární, tj. zvýšení intenzity zvuku o 10 dB znamená jeho desateronásobné zesílení. Lidské ucho je schopno vnímat bez potíží zvuky v síle 1 - 100 dB; za touto hranicí působí již zvuk bolest. Omezení není na závadu dorozumívání, neboť normální hovor na vzdálenost 1 m má sílu asi 60 dB. Velmi slabý řečový signál je slyšitelný, není však srozumitelný; za hranici porozumění řeči se pokládá síla 25 dB. Samo měřítko síly je však poněkud klamné : lidské ucho vnímá zvuk v závislosti na jeho výšce, vyšší zvuky jsou i při menší síle lépe slyšitelné. Proto se zavádí speciální jednotka sluchového hodnocení hlasitosti son (srov. 6). V běžném kontextu se mluvívá (nepřesně) o dB.
Sluchové pole člověka je omezeno i co do výšky zvuku. Pod 16 Hz zvuk nevnímáme jako souvislý, výšky nad 20 000 Hz jsou neslyšitelné. Zatímco dolní hranice sluchového pole je celkem stálá, horní hranice s věkem klesá. Relevantní pásmo zvuků řeči se rozkládá do 8 000 Hz a pro porozumění stačí i mnohem méně (do asi 3 000 Hz). Při omezeném vnímání vysokých tónů je ztíženo hlavně poznávání sykavek.
Subjektivní vnímání výšky nelze ztotožnit s fyzikálně zjištěnými údaji o frekvenci kmitů vzduchových molekul. Je totiž závislé též na intenzitě zvuku a jeho barvě. Jednotkou tohoto vnímání výšky zvuku je 1 mel (název je odvozen od slova melodie). Výška tónu vyjádřená v melech se číselně rovná kmitočtu jednoduchého tónu o hladině intenzity rovné 40 dB, který normální lidské ucho vnímá jako stejně vysoký.
Doposud nebylo dostatečně vyjasněno, jak probíhá proces slyšení. Anatomická stavba sluchového orgánu je sice již podrobně popsána, zatím však není jasné, jako dochází k přenosu zvukových vln z lymfy v uchu na nervová zakončení. Existující teorie (rezonanční Helmholtzova, Békésyho hydromechanická, Weverova - Braylova teorie salv apod.) se zatím nepodařilo prověřit v úplnosti experimentálně.
Dobré slyšení zvuku řeči nezaručí, že bude posluchač také rozumět. To si uvědomujeme při poslechu cizího jazyka, neschopnost rozumět může však vzniknout při tzv. korové hluchotě i u jazyka mateřského : ucho sice identifikuje (někdy i velmi přesně) zvuky, ale člověk ztrácí (po mrtvici, po úraze, vlivem sklerózy) schopnost přiřadit zvuku významy. Při porozumění řeči se tedy vedle sluchu uplatňuje i vyšší nervová činnost člověka.
Tento vztah osvětluje Ewaldova teorie zvukových obrazů, jež předpokládá, že člověk si utváří v mozku obrazy zvuků (slov, vět) dříve slyšených a nové řečové vjemy k nim přirovnává. Tento výklad je schopen vysvětlit např. to, že je snazší poznávat hlásky ve skutečných slovech jazyka než v logatomech (elementárních slabikách tvořených obvyklým způsobem, ale nemajících v jazyce význam; užívají se např. k prověřování kvality přenosových zařízení). Lze jí vyložit i přeslechnutí u slov méně známých nebo u vlastních jmen (došlo ke ztotožnění zvuku s nepravým obrazem).
Proces
porozumění řeči si lze představit
takto:
Přijímáme zvuk a průběžně jej analyzujeme : odhlížíme nejprve od zvuků nejazykových, na něž reagujeme podle potřeby na reflexní úrovni; dále odhlížíme od irelevantních vlastností obsažených v řeči; uvědomujeme si jen složky zvuku schopné rozlišit význam, ukládáme je v příslušném pořadí v krátkodobé paměti, identifikujeme význam seskupení a teprve na této úrovni rozumíme.
Výzkumy ukázaly ještě jednu zvláštnost vnímání řeči : na poznávání se podílí i artikulační zkušenost mluvčího, při poslechu řeči vzniká u posluchače artikulační napětí v orgánech, které mluvčí aktivizoval. Dlouhé poslouchání se pak u vnímatele projeví také únavou mluvních orgánů, pocitem napětí v hlasivkách apod. Zřejmě má i tato složka vliv na porozumění, proto se někdy mluví o tom, že mluvčí předává posluchači obrazy akusticko-artikulační.
Sluch má vedle funkce vnímání signálu přicházejícího k posluchači i další význam : zaručuje zpětnou vazbu u mluvčího samého, artikulace probíhá za stálé vlastní sluchové kontroly síly, zřetelnosti a výšky mluvy. Proto lidé s oslabeným sluchem nesprávně odhadují hlasitost řeči a často u nich trpí i artikulace. Při vlastním učení řeči má sluch nezastupitelnou úlohu : dítě se učí jen na základě nápodoby ostatních lidí kontrolované vlastním sluchem, proto se neslyšící dítě samo mluvit nenaučí.