V roce 1999 došlo ke změně studijních plánů a předmět základy zpracování geologických dat byl přesunut z 2. ročníku studia do 1. Z tohoto důvodu ve školním roce 1999/2000 měli současně výuku studenti 1. i 2. ročníku. V tabulce je uvedený celkový zisk bodů jednotlivých studentů ve třech průběžných testech (max. 60 bodů). "a) nejprve ověř normalitu obou souborů (utvoř histogram absolutních experimentálních a absolutních očekávaných četností a b) potom vhodným testem ověř, zda studijní výsledky studentů odou ročníků byly srovnatelné." pracuj s hladinou významnosti 5%. a) ověření normality obou výběrových souborů pomocí Analýzy dat/histogram zjistím četnosti v jednotlivých intervalech očekávané čet 2.ročník hranice kumul relat relat četn absol četn chi-kvadrát test zadám do histogramu vlastní hranice = POZOR oblast dat I10:I14 2. ročník 1. ročník interval 23 střed int Četnost 0.023193535 (no-ne)^2/no Třídy Četnost 1 24 1 21 1 29 26 5 0.081498425 0.05830489 2.469569129 2.59279253 29 5 2 27 2 22 2 35 32 5 0.21235637 0.130857945 5.542635332 0.053125109 35 5 3 28 3 23 3 41 38 6 0.420161336 0.207804967 8.801812918 0.8918794 41 6 4 28 4 24 4 47 44 10 0.653693069 0.233531733 9.891498998 0.00119016 47 10 5 29 5 24 5 53 50 5 0.839425983 0.185732914 7.866926297 1.044787517 53 5 6 30 6 26 6 59 56 8 0.943957675 0.104531693 4.427557326 2.882480275 Další 8 7 31 7 27 39 0.920764141 39 7.466254991 test krit 8 34 8 28 7.814727903 krit hodnota CHISQ.INV(0.95;3) 9 35 9 29 očekávané čet staré MS Office CHIINV(0.05;3) 10 35 10 29 1. ročník hranice kumul relat relat četn absol četn chi-kvadrát test 11 36 11 31 interval 20 střed int Četnost 0.025069591 oček absol četn (no-ne)^2/no Třídy Četnost 12 37 12 32 1 26 23 6 0.101795455 0.076725864 3.277661382 2.261102257 26 6 13 37 13 33 2 32 29 6 0.279610201 0.177814746 7.596089431 0.335370126 32 6 14 38 14 34 3 38 35 11 0.541172298 0.261562097 11.17370254 0.00270032 38 11 15 39 15 35 4 44 41 9 0.785462331 0.244290033 10.43585518 0.197557371 44 9 16 39 16 35 5 50 47 7 0.930317834 0.144855503 6.188099572 0.106524192 50 7 17 42 17 36 6 56 53 2 0.984827195 0.05450936 2.328591895 0.046368208 Další 2 18 43 18 36 41 0.959757604 41 2.949622473 test krit 19 43 19 36 7.814727903 krit hodnota CHISQ.INV(0.95;3) 20 43 20 37 staré MS Office CHIINV(0.05;3) 21 44 21 37 22 44 22 38 2. ročník - bodové zisky odpovídají normálnímu rozdělení pravděpodobností 23 45 23 38 1. ročník - bodové zisky odpovídají normálnímu rozdělení pravděpodobností 24 46 24 39 25 47 25 40 "Můžu použít parametrický t-test, k testování shody výsledků " 26 47 26 41 b) 27 48 27 41 testování shody výsledků studentů 1. a 2. ročníku 28 50 28 42 "nejprve provedu F-test Ho:Sx2=Sy2, k volbě vhodného t-testu" 29 51 29 42 1.326656373 testovací kritérium 30 51 30 42 1.886174274 kritická hodnota F.INV(0.975;38;40) 31 53 31 43 nebo FINV(0.025;38;40) 32 55 32 43 "Ho přijmu, rozptyly jsou si rovny" 33 55 33 45 34 56 34 45 Dvouvýběrový t-test s rovností rozptylů (tento test vyberu v data/analýza dat) 35 56 35 46 36 57 36 47 Soubor 1 Soubor 2 všechny tyto parametry uvedené v tabulce spočte zvolený test automaticky (pro nás z pohledu interpretace testu jsou podstatné jen ty níže popsané) 37 58 37 48 Stř. hodnota 43.02564103 37.09756098 38 58 38 48 Rozptyl 101.0782726 76.1902439 39 59 39 49 Pozorování 39 41 43.02564103 40 53 Společný rozptyl 88.31518096 10.05376907 41 56 Hyp. rozdíl stř. hodnot 0 "zadává se obvykle 0 (pokud testujeme shodu průměrů , tedy předpoklad hypotetického rozdílu mezi průměry dvou souborů je 0)" 101.0782726 37.09756098 Rozdíl 78 "v případě, že chcete aby např. hodnota průměrů dvou souborů se lišila, pak se zadává hodnota toho rozdílu" 8.728702303 t Stat 2.820172129 vypočtená hodnota testovacího kritéria 76.1902439 P(T<=t) (1) 0.003041585 t krit (1) 1.664624645 kritická hodnota pro jednostrannou variantu testu 35 35 variační rozpětí P(T<=t) (2) 0.006083171 6.250513203 6.322186727 k počet intervalů t krit (2) 1.990847069 kritická hodnota pro oboustrannou variantu testu 6.244997998 6.403124237 k počet intervalů 5.833333333 šířka intervalů "Ho zamítám, mezi výsledky testů studentů 1. a 2. ročníku je statisticky významný rozdíl" ##### Sheet/List 2 ##### Byly stanovené koncentrace stopových prvků v drobách a břidlicích moravsko-slezského kulmu. "Zhodnoť, zda obsahy REE (suma všech REE bez Y - ppm) jsou v obou litologiích srovnatelné." Nejprve a) ověř normalitu obou výběrových souborů (znázorni relativní kumulované četnosti - experimentální i očekávané do histogramu A b) vhodným testem ověř shodu mezi obsahy REE v drobách a břidlicích (pracuj s a=5%). 4.973595943 stanovení počtu intervalů (rozdělím data do 5 intervalů) a) ověření normality obou výběrů 4 Ho: výběrový soubor má normální rozdělení pravděpodobností 6.020599913 pro ověření normality musím data zpracovat na intervaly a zjistit četnosti v těchto intervalech četnosti výběr souboru pomocí Analýzy dat/histogram stanoveny četnosti v jednotlivých intervalech REE ppm REE ppm seřazená data droby stanovení hranic abs četn abs kumul kumul rel oček rel kum test Kolm-Smir zadám do histogramu vlastní hranice = POZOR oblast dat L12:L15 droby břidlice droby břidlice interval DH (bez) HH (včetně) ne Ne Fe Fo abs(Fe-Fo) 1 130.46 225.38 103.64 125.29 1 100 120 2 139.39 143.31 106.2 143.31 2 120 140 3 113.46 190.27 108.69 156.24 3 140 160 4 122.22 206.95 111.46 168.35 4 160 180 5 115.36 125.29 113.34 178.69 5 180 200 6 126.62 258.96 113.46 185.31 testovací kritérium 7 124.23 296.34 115.36 190.27 četnosti výběr souboru kritická hodnota (tabulky) 8 113.34 168.35 122.22 202.78 břidlice stanovení hranic abs četn abs kumul kumul rel oček rel kum test Kolm-Smir zadám do histogramu vlastní hranice = POZOR oblast dat L21:L24 9 111.46 236.74 122.58 206.95 interval DH (bez) HH (včetně) ne Ne Fe Fo abs(Fe-Fo) 10 108.69 185.31 124.23 219.54 1 125 160 11 152.96 269.59 126.62 225.38 2 160 195 12 148.26 178.69 130.46 236.74 3 195 230 13 122.58 202.78 139.39 248.36 4 230 265 14 103.64 248.36 148.26 258.96 5 265 300 15 199.25 219.54 152.96 269.59 testovací kritérium 16 106.2 156.24 199.25 296.34 kritická hodnota (tabulky) aritm průmer 95.61 171.05 variační rozp "ze sloupce ne vyplývá, že Chi-kvadrat test není vhodný, příliš malé soubory -1) více než 20% četností menší než 5 a 2) přítomnost nulových četností" sm odch 19.122 34.21 šířka int (var rozp/počet int) normalitu dat ověřím testem Kolmogorov- Smirnov pro 1 výběr výběr rozptyl 20 35 šířka int - zaokrouhleno nahoru "Ho přijmu, oba soubory dat mají přibližně normální rozdělení pravděpodobností" b) "soubory mají přibližně normální rozdělení, můžu použí vhodný t-test (parametrický)" nebo neparametrický test Kolmogorov-Smirnov pro 2 vybery testování shody koncentrací REEdroby = REEbřidlice var rozp celkove "nejprve provedu F-test Ho:Sx2=Sy2, k volbě vhodného t-testu" šířka int- zaokrouhleno nahoru testovací kritérium droby stanovení hranic kritická hodnota F.INV(0.975;15;15) nové MS Office droby břidlice nebo FINV(0.025;15;15) staré MS Office interval DH (bez) HH (včetně) n1 n2 N1 N2 F1 F2 abs(Fi1-Fi2) "Ho zamítnu, rozptyly si nejsou rovny" 1 2 max zvolím t-test s nerovností rozptylů 3 Dvouvýběrový t-test s nerovností rozptylů 4 5 6 testovací kritérium "0,75>0,48" "Ho zamítnu, mezi koncentracemi REE v drobách a břidlicích je statisticky významný rozdíl" krit hodn "1,36*odmocnina((n1+n2)/(n1*n2))" 5.97>2.07 "Ho zamítnu, mezi koncentracemi REE v drobách a břidlicích je statisticky významný rozdíl" ##### Sheet/List 3 ##### Ve vzorcích půd v okolí 2 benzínových čerpacích stanic byly na několika vybraných lokalitách stanovené obsahy PCBs. "a) Limit dle vyhlášky č. 13/1994 je v případě celkové sumy sledovaných PCBs v půdách 10 ng/g. Otestujte, zda koncentrace látek v půdě převyšují stanovený limit." "Předpokládáme, že koncentrace PCBs ve stanovených vzorcích mají normální rozdělení." Pracuj s hladinou významnosti 5% V následující tabulce jsou uvedené koncentrace PCBs (ng/g) ve vzorcích půd oblast 1 oblast 2 suma PCBs suma PCBs lokalita 1 9.8 12.8 lokalita 2 36.2 17.5 lokalita 3 6.3 16.2 lokalita 4 41.6 15.9 lokalita 5 15.5 14.9 lokalita 6 7.8 25.8 lokalita 7 8.9 10.6 lokalita 8 9.6 12.3 lokalita 9 4.5 14.4 lokalita 10 13.3 11 lokalita 11 18.2 18.3 lokalita 12 4.6 10.8 lokalita 13 11.9 6.2 aritmetický průměr SMODCH.VÝBĚR.S t-test 1 výběr Ho: 14.48≤10 Ho: 14.36≤10 Ha: 14.48>10 Ha: 14.36>10 testovací kritérium "kritická hodnota Tk(1-a, n-1)" jedná se o jednostrannou variantu testu - tedy kritická hodnota se stanoví pro jednostrannou variantu testu- hodnota kvantilu 0.95 studentova rozdelení pro 12 stupňů volnosti rozhodnutí testu Ho: 14.48≤10 Ha: 14.36>10 koncentrace PBCs ve druhé oblasti převyšují stanové limity ##### Sheet/List 4 ##### Kritické hodnoty D1;p Kolmogorova-Smirnovova testu pro jeden výběr n a = 0.05 1 0.975 2 0.842 3 0.708 4 0.624 5 0.563 6 0.519 7 0.483 8 0.454 9 0.43 10 0.4 11 0.391 12 0.375 13 0.361 14 0.349 15 0.338 16 0.327 17 0.318 18 0.309 19 0.301 20 0.294 21 0.287 22 0.281 23 0.275 24 0.269 25 0.264 26 0.259 27 0.254 28 0.25 29 0.246 30 0.242 31 0.238 32 0.234 33 0.231 34 0.227 35 0.224 36 0.221 37 0.218 38 0.215 39 0.213 40 0.21