Aleš Bičan: Materiály k předmětu Fonotaktika, FF MU, jaro 2024 Doložená a očekávaná frekvence Tab. 1: Počty nakažených koronavirem v ČR (jaro 2020) věk Počet nakažených Procenta 65+ 1935 30,97 % 34-64 3075 49,22 % <34 1238 19,81 % Celkem 6248 100% Aleš Bičan: Materiály k předmětu Fonotaktika, FF MU, jaro 2024 Tab. 2: Rozložení obyvatelstva ČR podle věku věk Poměr Procenta 65+ 0,196 19,6 % 34-64 0,437 43,7 % <34 0,367 36,7 % Celkem 1 100% Aleš Bičan: Materiály k předmětu Fonotaktika, FF MU, jaro 2024 Tab. 3: Očekávaná frekvence nakažených koronavirem věk Očekávaná frekvence výpočet 65+ 1224,608 = 0,196 x 6248 34-64 2730,376 = 0,437 x 6248 <34 2293,016 = 0,367 x 6248 Celkem 6248 1 Aleš Bičan: Materiály k předmětu Fonotaktika, FF MU, jaro 2024 Tab. 4: Poměr mezi doloženou a očekávanou frekvencí (D/O) věk Doložená frekvence (d) očekávaná frekvence (0) Poměr d/O 65+ 1935 1224,608 1,580097 34-64 3075 2730,376 1,126219 <34 1238 2293,016 0,5399 Celkem 6248 6248 Aleš Bičan: Materiály k předmětu Fonotaktika, FF MU, jaro 2024 Tab. 5: Hypotetická frekvence kombinací CV přední Střední Zadní Celkem C labiální 200 600 225 1025 koronální 550 1000 675 2225 Velární 250 400 600 1250 Celkem V 1000 2000 1500 4500 Poměr V 0,222222 0,444444 0,333333 1 Procenta 22,2222 % 44,4444 % 33,3333 % Výpočet poměru = 1000 / 4500 = 2000 / 4500 = 1500 / 4500 Aleš Bičan: Materiály k předmětu Fonotaktika, FF MU, jaro 2024 Tab. 6: Očekávaná frekvence kombinací CV (zaokrouhleno) přední Střední Zadní Celkem C Labiální 227,778 455,555 341,666 1025 koronální 494,444 988,888 741,666 2225 Velární 277,778 555,555 416,666 1250 Celkem V 1000 2000 1500 4500 Tab. 7: Výpočet těchto frekvencí přední Střední Zadní Celkem C Labiální = 0,222 x 1025 = 0,444 x 1025 = 0,333 x 1025 1025 Koronální = 0,222 x 2225 = 0,444 x 2225 = 0,333 x 2225 2225 Velární = 0,222 x 1250 = 0,444 x 1250 = 0,333 x 1250 1250 Celkem V 1000 2000 1500 4500 Aleš Bičan: Materiály k předmětu Fonotaktika, FF MU, jaro 2024 Tab. 8: Vzorce pro výpočet těchto frekvencí Přední Střední Zadní Celk. C Lab. = [poměr Př. V] x = [poměr Stř. V] = [poměr Zad. V] 1025 [počet Lab. C] x [počet Lab. C] x [počet Lab. C] Kor. = [poměr Př. V] x = [poměr Stř. V] = [poměr Zad. V] 2225 [počet Alv. C] x [počet Alv. C] x [počet Alv. C] Vel = [poměr Př. V] x = [poměr Stř. V] = [poměr Zad. V] 1250 [počet Vel. C] x [počet Vel. C] x [počet Vel. C] Celk. V 1000 2000 1500 4500 Obecný vzorec pro výpočet očekávané frekvence kombinace A B počet A počet všech prvků x počet B Aleš Bičan: Materiály k předmětu Fonotaktika, FF MU, jaro 2024 Tab. 9: Poměr mezi doloženou a očekávanou frekvencí (D/O) přední Střední Zadní Labiální 0,87805 1,317074 0,658537 koronální 1,112361 1,011237 0,910113 Velární 0,900001 0,720001 1,440001 Vzorec pro výpočet procentuálně vyjádřeného rozdílu mezi D/O (D-O) 100 x O Tab. 10: Procentuálně vyjádřený rozdíl mezi D/O Přední Střední Zadní Labiální -12,195 31,70745 -34,1463 Koronální 11,23607 1,123697 -8,98867 Velární -9,99991 -27,9999 44,00014 Aleš Bičan: Materiály k předmětu Fonotaktika, FF MU, jaro 2024 Tab. 11: Signifikantnost výsledku (podle Pozdniakov-Segerer 2007) Značka Rozpětí nesignifikantní bez označení < 15% signifikantní +, - 115-30 %| vysoce signifikantní + +, -- > 30% Tab. 12: Převod tab. 10 do tohoto značení (žluté = signifikantní) přední Střední Zadní labiální -12,195 31,70745 -34,1463 koronální 11,23607 1,123697 -8,98867 Velární -9,99991 -27,9999 44,00014 přední Střední Zadní labiální + + - - koronální Velární - + + Aleš Bičan: Materiály k předmětu Fonotaktika, FF MU, jaro 2024 Signifikantnost poměru O/E • lze ji ověřit statistickými testy, především x2 • viz např. https://www.socscistatistics.com/tests/chisquare2/default2.aspx • test matematicky vyjadřuje, zda jsou odchylky mezi D a 0 tak velké, že je možné s nejméně 90% pravděpodobností pokládat na nenáhodné • problém je ovšem se velkými daty - test pak vyhodnocuje každou sebemenší odchylku jako signifikantní • lze vyřešit samplováním