as VYUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ ŕ-RA A frequency table of nominal data The location of sparrow nests. Nest site Number of nests observed A. Vines 56 B. Building eaves 60 C. Low tree branches 46 D. Tree and building cavities 49 0) -Q I 70 60 50 40 30 20 10 0 B D Nest site A bar graph of the sparrow nest data. An example of a bar graph for nominal data. VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ A frequency table of nominal data The location of sparrow nests. Nest site Number of nests observed A. Vines 56 B. Building eaves 60 C. Low tree branches 46 D. Tree and building cavities 49 0) -Q I A bar graph of the sparrow nest data, drawn with the vertical axis starting at 45. Compare this with bar graph, where the axis starts at 0. B D Nest site VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ ŕ-RA A frequency table of ordinal data Numbers of sun fish, tabulated according to amount of black pigmentation Pigmentation class Amount of pigmentation Number of fish 0 No black pigmentation 13 1 Faintly speckled 68 2 Moderately speckled 44 3 Heavily speckled 21 4 Solid black pigmentation 8 .<0 0) -Q I 80-70-60-50-40-30-20- 10- r 0 12 3 Pigmentation class A bar graph of the sunfish pigmentation data. An example of a bar graph for ordinal data. VYUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ ŕ-RA A frequency table of discrete data Frequency of occurrence of various litter sizes in foxes Litter size Frequency 3 10 4 27 5 22 6 4 7 1 S2 O v. Q) -Q S 30-25-20-15-10-5-0- A bar graph of the fox litter data. An example of a bar graph for discrete, ratio scale, data. _l ggg^ 3 4 5 6 7 Litter size VYUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ ŕ-RA A frequency table of a discrete data Number of aphids observed per clover plant Number of aphids on Number of plants a plant observed Number of aphids on a plant Number of plants observed 0 3 20 17 1 1 21 18 2 1 22 23 3 1 23 17 4 2 24 19 5 3 25 18 6 5 26 19 7 7 27 21 8 8 28 18 9 11 29 13 10 10 30 10 11 11 31 14 12 13 32 9 13 12 33 10 14 16 34 8 15 13 35 5 16 14 36 4 17 16 37 1 18 15 38 2 19 14 39 1 40 0 41 1 Total number of observations = 424 VYUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ A frequency table of a discrete data Number of aphids observed per clover plant Number of aphids on a plant Number of plants observed 0-3 6 4-7 17 8-11 40 12-15 54 16-19 59 20-23 75 24-27 77 28-31 55 32-35 32 36-39 8 40-43 1 c p ■s 1 0) CD c > '-I—' 03 CD DĹ Grafický popis rozložení - příklad Histogram: relativní frekvence 01 23456789 10 11 12 Věk (měsíce) □ Kuřáci Histogram: kumulativní relativní frekvence 11 si ^ CD 100 80 60 40 20 0 0 1 2 3 4 5 6 7 8 9 10 11 12 Věk (měsíce) Nekuřáci Křivka relativní kumulativní frekvence 4 6 8 Věk (měsíce) 10 12 Věk prvního růstu zubů u dětí kuřáků (----- ) a nekuřáků (------) (Rantakalio and Mäkinen, 1984) CENTRUM BIOSTATISTIKY A ANALÝZ VÝUKA: Biostatistika - základní kurz r*JtA Příklad: spojitá čísla mohou mít různá rozložení cp(x) cp(x) S3 VÝUKA: Biostatistika-základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ ru Histogram - tvar rozložení a relevantní ^^^^^^u karate I střed c^^^^^^™^ Symetrické rozložení, medián je blízko průměru Asymetrické rozložení, kde průměr je menší než medián Asymetrické rozložení, kde průměr je větší než medián Reálný význam mediánu a průměru jako ukazatelů středu rozložení bude záviset na charakteru sledovaného znaku (např. znečištění vody v určité oblasti dusičnany; respirace půdy po ovlivnění kontaminantem; koncentrace látky v krvi pokusných zvířat). Při posuzování rozložení sledovaného znaku v cílové populaci je nutné uvážit jak velký výběr (n), na základě kterého byly zobrazené histogramy spojeny. as VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ r*JtA d) o c d) > d) >a> > u o o Q. Q) O C 350 300 250 200 150 100 50 0 35 30 25 20 15 10 5 0 Příklad: věk účastníku vážných dopravniun nenod Správný histogram ? td 10 20 30 40 Věk (roky) 50 60 70 80 1- Správný histogram ? Věk f 0-4 28 5-9 46 10-15 58 16-19 20 20-24 114 25-59 316 >60 103 0 10 20 30 40 50 60 70 80 Věk (roky) VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ r*JtA as VYUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ ŕ-RA Sumární statistiky středu Modus Medián Aritmetický průměr i x, X = n Geometrický průměr n y\. G --- -A / ./Ví tJ\/r\ ,A"> • • »Jv --- W I I Jvj Harmonický průměr Xh = 1 n n , x, S3 VYUKA: Biostatistika-základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ Výpočet mediánu z primárních dat A. Lichý počet (n) B. Sudý počet (n) Vzorek: Vzorek: 5; 1; 8; 3; 4 1; 3; 4; 5; 7; 8 Medián - pořadí: (n + 1)/2 = 3. číslo = 4 m VYUKA: Biostatistika - základní kurz Medián - pořadí: (n / 2); [(n + 2) / 2] = (4 + 5)/2 = 4.5 CENTRUM BIOSTATISTIKY A ANALÝZ ŕ-RA Průměr a medián u frekvenčně tříděných dat /. Dostupná původní data x: Měsíční výdaje rodiny na bydlení f: frekvence 3,3 3,4 3,5 3,6 3,7 3,8 3,9 4,0 4,1 4,2 4,3 4,4 4,5 1 0 1 2 1 3 3 4 3 2 2 2 1 Průměr: Medián: - Z x^ X = 13-té číslo = 4,0 = 3,976 Při současném odhadu mediánu a průměru jako ukazatelů středu symetrických rozložení je medián méně přesný než průměr. as VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ r*JtA Examples Example 3.1 A sample from a population of butterfly wing lengths. Xi(cm) Xi(cm) Example 3.2 The data from Example 3.1 recorded as a frequency table. X/cmJ f, fiXJcrn) 3.3 3.5 3.6 3.6 3.7 3.8 3.8 3.8 3.9 3.9 3.9 4.0 4.0 4.0 4.0 4.1 4.1 4.1 4.2 4.2 4.3 4.3 4.4 4.5 Y,X, =95.0 cm n = 24 Y,X, _95.0 cm X n 24 3.96 cm 3.3 3.4 3.5 3.6 3.7 3.8 3.9 4.0 4.1 4.2 4.3 4.4 4.5 3.3 0 3.5 7.2 3.7 11.4 11.7 16.0 12.3 8.4 8.6 4.4 4.5 Z/ =« = 24 X ^_E^_95.0cjw n 24 3.96 cm median = 3.95 cm + \ — (0.1 cm) = 3.95 cm + 0.025 cm = 3.975 cm I/, = 24 IÄ = 95.0 cm 4-1 Figure 3.1 3-A histogram of the data in Example 3.2. ~ The mean (3.96 cm) is the center of § 2 -gravity of the histogram, and the sr median (3.975 cm) divides the 1 -histogram into two equal areas. 3.3 3.4 3.5 3.6 3.7 3.8 3.9 4 4.1 4.2 4.3 4.4 4.5 Wing Length (Xj) in cm VYUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ ŕ-RA Examples Example 3.3 Life expectancy of two hypothetical species of birds in captivity. Species A X,{mo) Species B XJmo) 34 36 34 36 « = 10 37 39 37 39 median = —-------2 40 41 n = 9 40 41 40 mo+ 41 mo 2 = 40.5 mo X = 40.1 mo 42 43 79 median = X5 = 40 mo X = 43A mo 42 43 44 45 VYUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ as VYUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ ŕ-RA Příklady - rozloženi odhady Rozložení náhodné veličiny, charakteristiky dat, Testy hypotéz, odhady Příklad 1 Nakreslete schematicky graf Gausovy křivky pro standardizované normální rozložení a pomocí symbolu A vyjádřete následující pravděpodobnosti: Pravděpodobnost, že hodnota sled. veličiny Symbol leží mezi 0 a Z A leží mezi -Z a Z 2A leží mimo interval -Z,+Z 1-2A je menší než Z (Zje kladné) 2A+(1-2A)/2=1/2+A je menší než Z (Zje záporné) (1-2A)/2 je větší než Z (Zje kladné) (1-2AV2 je větší než Z (Z je záporné) 2A+(1-2A)/2=1/2+A VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ Příklady - rozloženi odhady Příklad 2. A. Zakreslete schematicky následující dvojice rozložení: a)N(n = 5,CT = 1)aN(n =3, a = 1) b) N(jli = 0, a = 2) a N(jli = 6, a = 2) a) f b) f i—n------1------1 ^i 4 6 8 10 12 Příklad 2. B. Najděte následující kvantily. a) 95 % kvantil Studentova rozložení pro výběr o n = 20 b) 95 % kvantil Studentova rozložení pro výběr o n = 120 í0,95(22.16) = 1-F(2.16) = 0.015 tedy vzorků s koncentrací nižší než62ng/kg je 1.5%. Najděte takovou koncentraci chemikálie, kterou může v jezeře překročit 5 % populace ryb. hledáme hodnotu, pro kterou bude platit, že 95% vzorků má nižší koncentraci než tato hodnota, tedy: f 0.05 = P ju-61.56 f X> V 2.57 j = \-P ju-61.56 X< V 2.57 N ( = 1- -F J V ju-61.56 0.95 = F ji-61.56 2.57 = F(1.65) as VYUKA: Biostatistika - základní kurz 2.57 ,í/ = 1.65*2.57+ 67.56 = 71.08 CENTRUM BIOSTATISTIKY A ANALÝZ 5% populace ryb překročí hodnotu chemikálie 71.08ng/kg Příklady - rozloženi odhady Příklad 3. c) Předpokládejme, že podle mezinárodních norem nesmí koncentrace vysoce toxických látek v mléčných výrobcích překročit hranici 30 pg/kg tuku Qde o vymyšlené hodnoty). Výrobce, který hodlá začít zpracovávat mléko od nového dodavatele zjistil, že je schopen produkovat výrobky s průměrnou koncentrací 28 pg/kg, ale se směrodatnou odchylkou 1.6 pg/kg. Jaký podíl jeho nových výrobků by pravděpodobně nesplnil podmínky pro uvedení na trh? P X> 30-28 1.6 = 1- / -p v x< 30-28 1.6 = 1-F(l.25) = 1-0.8943 = 0.1057 10.6% nových výrobků nesplní podmínky pro uvedení na trh Zavedením přísné kontroly dodávaného mléka by bylo možné snížit rozptyl hodnot při zachování průměrné koncentrace sledovaných látek v mléce na 28 pg/kg. Jaká by musela být směrodatná odchylka, aby pouze 2 % nové produkce překračovalo povolený limit? r 0.02 = P X> 30-28 0.98 = F 30-28 <7 = \-P x< v <7 = F(2.06) 30-28 <7 = \-F 30-28 <7 (7 = 2/2.06 = 0.97 aby produkce překračovala povolený limit pouze o 2% musí být sm. odchylka jen 0.97 pg/kg as VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ ra* Příklady - rozloženi odhady Příklad 4. a) U následujícího souboru dat (koncentrace zinku v půdě na deseti sousedících kontaminovaných lokalitách) navrhněte vhodné charakteristiky polohy a rozptylu a vypočítejte je. 40.60, 40.29, 37.51, 38.90, 38.13, 38.15, 34.81, 37.00, 39.95, 40.43 jako charakteristiku polohy použijeme průměr: X = - Y X, = —385,77 = 38,58 néf 10 i=\ jako charakteristiku rozptylu použijeme směrodatnou odchylku: s,= -Y(X,-X)2 =J—30,65=1,75 i=\ b) Jaké charakteristiky souboru dat lze přibližně zjistit z histogramu četností? Popište co nejpřesněji soubory dat, které jsou zobrazeny na následujících histogramech: 0 12 3 4 5 6 Počet zlomenin za rok 0 12 3 4 5 6 Počet dětí v rodině 0123456789 10 Počet zdravých listů Z histogramu četností se dá přibližně zjistit modus, minimální a maximální hodnota, kvantily. as VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ Příklady - rozloženi odhady Příklad 5. a) Při stanovení průměrného obsahu dusičnanů v říční vodě iontově selektivní elektrodou má měření směrodatnou odchylku o = 1.5 mg/l. Kolik vzorků vody musí badatel odebrat (n = ?), pokud požaduje odhad průměrné hodnoty se směrodatnou odchylkou 0.2 mg/l? n) 0,975 G n f n 1 N 1,96-12 v2 j = 139 Pokud chceme odhadnout průměrnou koncentraci na lokalitě tak, aby 95% interval spolehlivosti měl šířku 4 jednotky, potřebujeme k tomu 139 vzorků. Finanční prostředky vystačí pouze na 100 vzorků, tedy jsou nedostatečné. Budeme-li uvažovat jen 90% interval spolehlivosti, u0i95=1,645. Počet vzorků získáme stejným výpočtem (n=98). V tomto případě budou finanční prostředky dostatečné. as VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ r»A Příklady - rozloženi odhady Příklad 5. c/ Limit EPA pro vypouštění suspendovaných pevných odpadů do řek je maximálně 60 mg na litr denně, s maximálním měsíčním průměrem 30 mg na litr denně. Předpokládejte, že chcete testovat náhodně vybrané vzorky vody z jedné řeky s cílem odhadnout průměrnou denní dávku pevných kontaminantů, které pocházejí z těžebních závodů na břehu řeky. Pokud chcete získat 95 % interval pro průměr s šířkou 2 mg, jak velký počet vzorků vody musíte zpracovat ? Předchozí zkoušky prokázaly, že výsledky analýzy vodních vzorků jsou přibližně normálně rozloženy se směrodatnou odchylkou 5 mg. obdobně jako v předchozím příkladu platí 2 = L2-L\ = x + u 0,975 G \ n f G x-u 0,975 V = 2u 0,975 nj G n = (1,96 • 5)2 =96 Tedy pro získání 95% intervalu spolehlivosti potrebujeme získat 96 vzorků. d/ Podle Food and Drug Administration (FDA) obsahuje průměrný šálek kávy (7 g kávy) 115 mg kofeinu, a tato hodnota kolísá od 60 do 170 mg (rozsah výsledků provedených analýz). Máte za úkol tyto testy zopakovat tak, aby přesnost vašich závěrů byla v rozsahu 5 mg s 95% pravděpodobností. Kolik šálků kávy musíte přibližně analyzovat k dosažení takových výsledků? min=60 Z rozsahu minimálních a maximálních hodnot vypočítáme směrodatnou odchylku. Platí, že ±3s pokrývají max=170 99,9% všech hodnot normálního rozložení. Tedy 170-60=6s —► s=18,3 m-11omg r0zsah 95% intervalu spolehlivosti je 5mg, pro dosažení obdobných výsledků bude zapotřebí 206 šálků kávy. 5 = L2 - L\ = x + u, G f 0,975 JC 1Á, G \ 0,975 V = 2u, G f- 'n J 0,975 n = \ 1,96 18,3 V5 j ^206 as VYUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ ŕ-RA Příklady - rozloženi odhady Příklad 6. Jsou naměřena následující čísla (opakovaná měření délky jednoho objektu v cm): 15; 13; 12; 11 a) Vypočítejte aritmetický průměr, směrodatnou odchylku a standardní chybu. b) Vyjádřete správně přesnost odhadu průměru a vysvětlete použitý způsob vyjádření. c) Jaký význam v tomto případě má interval spolehlivosti pro odhad průměru? d) Změnil by se odhad ukazatelů variability při měření na 1 desetinné místo? (např. 15.3; 12.7; 12.2; 10.8) e) Změnil by se odhad ukazatelů variability při zvětšení počtu měření? a) X = -fjXi.=12,75 S2=l-±{Xi-X)2=2,\9 S = 1,48 2=1 SE = S = 0,74 d) X = -fjXi.=12,75 «7=ŕ S2=l-±{Xi-X)2=2ß5 S = 1,63 2=1 SE = S in = 0,82 Variabilita při měření na 1 desetinné místo vzroste. c) interval spolehlivosti pro odhad průměru nám říká, pokud budeme znovu provádět vzorkování na souboru, ze kterého byl interval spolehlivosti spočítán, průměrná hodnota nového souboru se bude s 95% pravděpodobností vyskytovat v daném intervalu spolehlivosti e) Při zvětšení počtu měření vy variabilita klesla. as VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ Příklady - rozloženi odhady Příklad 7. Měření vzorku 25ti malých semenáčků ve školce (zadáno jako odhad pro celou výsadbu přibližně 600 jedinců) vedlo k následujícím výsledkům: Průměr: 62.8 cm; SD: 11,8 cm Vypočítejte 95% interval spolehlivosti pro odhad průměru. G = 62,8-1,96^1 = 58,17 95% interval spolehlivosti: (58,17; 67,43) = 62,8 +1,96 Íu = 67,43 a/25 LtY — Jí Uq 975 \Jn _£-/jíĹ — *\ \~ vtr\ Q7í (7 -\ln Příklad 8. Bylo provedeno vzorkování na dvou polních lokalitách s cílem posoudit aktivitu extracelulární ureázy v půdě. Na každé lokalitě bylo odebráno 10 vzorků s následujícími výsledky: a) Průměr 15,1 U/g (d.w.) / SD 3,1 U/g (d.w.) b) Průměr 241 U/g (d.w.) / SD 25,8 U/g (d.w.) Která z obou lokalit je v daném znaku variabilnější ? Má smysl porovnávat intervaly spolehlivosti pro odhad průměru mezi lokalitami A a B? Pro posouzení variability určíme koeficient variance: C — S / X Ca ~ s/x ~ j,1/1j ,1 — yj,Z\jJ Větší variabilitu má vzorek a. Spíše než intervaly spolehlivosti samotné c _ s I j- _ 25 8/241 = 0 107 by bylo lepší porovnávat šířku těchto intervalů. VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ ruA Příklady - rozloženi odhady Příklad 9. Když je medián 15. číslo ve vzestupně seřazeném souboru, jak velký je celkový vzorek (n Spočítejte medián pro následující vzorky a) Vzorek I: 5; 1;8; 3; 4 b) Vzorek 11:1; 3; 4; 5; 7; 8 Pokud je medián 15.číslo, celkový vzorek obsahuje 2n-1=29 čísel. a) medián vzorku I. je 4, protože při lichém počtu prvků je medián (n+1 )/2 prvek b) medián vzorku II. je 4,5, protože při sudém počtu prvků je medián průměrem n/2 prvku a n/2+1 prvku. = ?^ Přikladlo. Je naměřena následující sada hodnot (hmotnosti rostlin v g) a je třeba vyjádřit výsledek měření v sumarizované podobě jako odhad průměru a odpovídající interval spolehlivosti (95%). Posuďte možnost správného vyjádření a toto proveďte. Průměr Medián SD SE X: originální data (g) 10,2 15,3 14,1 11,2 18,2 11,2 22,5 23,5 27,5 17,1 15,3 6,2 2,1 Ln(X) 2,32 2,73 2,65 2,42 2,90 2,42 2,97 3,02 3,11 2,78 2,72 0,36 0,12 as VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ Výpočet mediánu z frekvenčních dat a) Určete medián tohoto souboru dat: 1,3,4,5,7,8 [4,5] b) Určete medián tohoto souboru dat: 5,1,8,3,4 [4] c) Tento příklad je ukázkou výpočtu mediánu u velkého souboru dat. V následující tabulce je uveden rozbor rozložení souboru dat od 179 krav, kde sledovanou veličinou byl počet dní od narození telete do znovuobnovení menstruačního cyklu. Uvedená data jsou velmi zjednodušena a jsou zde uvedena pouze pro ilustraci: Class limits (days) 0,5-20,5 20,5-40,5 40,5-60,5 60,5-80,5 80,5-100,5 100,5-120,5 120,5-140,5 140,5-160,5 160,5-180,5 180,5-200,5 200,5-220,5 Frequency 8 33 50 32 15 20 11 6 2 1 1 Cumulative frequency 8 41 91 123 138 158 169 175 177 178 179 Frekvence zastoupení dosahuje nejvyšší hodnoty u třídy od 40,5 - 60,5 dnů. Druhý (menší) frekvenční pík lze pozorovat u intervalu od 100,5 do 120,5 dní. Existence dvou maxim (bimodální data) je důkazem nenormality tohoto konkrétního souboru. as VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ rnA Výpočet mediánu z frekvenčních dat Jelikož n =179, pak je medián devadesátá hodnota od počátku souboru, a dále je zřejmé, že bude horní hranici třídy 40,5 - 60,5 dní. Za předpokladu, že 50 hodnot této třídy je v ní rovnoměrně rozmí použít následující vzorec: > y M = X T + -£----, kde velmi blízko stěno lze XL = hodnota X (sledované veličiny) na spodní hranici třídy obsahující medián: zde 40,5 dní g = pořadová hodnota mediánu minus kumulativní frekvence do horní hranice předchozí třídy, tj. 90-41= 49 I = třídní interval: 20 dní f = frekvence ve třídě obsahující medián • Dosadíme-li do uvedeného vzorce, získáme odhad mediánu jako 60 dní. Průměr tohoto datového souboru je 69,9, což je významně odlišná hodnota, a potvrzuje znovu nenormální charakter dat. • U velkých vzorků z normálních populací je výběrový odhad mediánu normálně rozložen kolem populační hodnoty se směrodatnou odchylkou 1,253 g /yfň. U normálního rozložení, kde medián i průměr představují odhad stejné hodnoty, je medián méně přesný než průměr. Proto hlavní význam mediánu spočívá u nesymetrických distribucí. • Existuje velmi jednoduchá metoda pro výpočet intervalu spolehlivosti pro odhad mediánu a jako horní a spodní hranice slouží pořadová čísla vypočítaná podle následujícího vztahu: n představuje velikost datového souboru, zje kvantil standardizovaného normálního rozložení pro příslušnou pravděpodobnost. U našeho příkladu je n = 179 a pro 95% interval spolehlivosti je z přibližně rovno 2. Horní a spodní limit pro odhad mediánu tedy je 90±Vl79 =77 a 103- 95% interval spolehlivosti je tedy tvořen počty dní, které mají pořadí 77 a 103: 77: Počet dní = 40,5+(36)(20)/50 = 55 dní 103: Počet dní = 60,5+(12)(20)/32 = 68 dní Medián cílové populace byl tedy odhadnut 95% intervalem spolehlivosti jako hodnota ležící mezi 55 a 68 dny. Interpretujte tento výsledek. VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ r»A Průměr a medián u frekvenčně tříděných dat: priklaa II. Symetrická rozložení Y X: třídně uspořádaná koncentrace látky zjišťovaná v n = 27 jedincích Třída f. 1,85-1,95 2 1,95-2,05 1 2,05-2,15 2 2,15-2,25 3 2,25-2,35 5 2,35-2,45 6 2,45-2,55 4 2,55-2,65 3 2,65-2,75 1 Medián (M) ~ 14. číslo M = XL + -9-jJ- = 2,35 + ^P" 2,367 Průměr = 2,33 Modus = 2,4 XL ... hodnota x na spodní hranici třídy obsahující medián g ... požadovaná hodnota mediánu - kumulativní frekvence do horní hranice předchozí třídy I ... třídní interval f ... frekvence ve třídě obsahující medián VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ r*JtA Príklady - rozložení a testy pro dva výběry S3 VYUKA: Biostatistika-základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ ŕu Příklad 1: Hodnotili by jste následující sumární statistiky jako smysluplné (tedy jako interpretovatelné a správně spočítané ?) Je-li to možné, pojmenujte typ rozložení pro každou takto specifikovanou proměnnou. ZNAK X1 = počet dnů v roce s deštivým počasím - hodnoceno pro 20 relativně hodně vzdálených lokalit ( n = 20) Průměr: 189,6 Medián: 142 SD: 85,3 log-normální rozložení ZNAK X2 = hmotnost myší pod vlivem určitého typu diety - hodnoceno pro 20 jedinců ( n = 20) Průměr: 100 MIN/MAX: 20/180 SE: 15,9 ZNAK X3 = nosnost slepic za určité období - hodnoceno pro 20 jedinců ( n = 20) Geometrický průměr: 42,3 Medián: 38 MIN /MAX: 15/114 normální rozložení log-normální rozložení as VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ ra* Příklad 2: Čtete vědeckou literaturu a v ní naleznete následující údaj o výšce rostliny: n = 20 Geometrický průměr: 42,3 MIN /MAX: 10/114 Dovedete přibližně určit v jakých hranicích se pohybuje spolehlivý odhad průměru (uvažujte pro výpočet 95 % spolehlivost) ? Příklad 3: Chemický experiment (n = 5) Výsledky jednotlivých opakování: X1 = 5,3; X2 = 5,6; X3 = 5,9; X4 = 8,2; X5 = 5,0 Do jaké míry by mohlo být oprávněné vyloučit hodnotu X4 = 8,2 ? VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ r-BA Příklad 4: Toxikologická laboratoř musela přejít na nový způsob chovu morcat, které používala na průzkum vlivu organických kontaminantů na tělesnou hmotnost organismu v době intenzivního růstu. Dvacet těchto nových morcat ze specializované laboratoře je živeno touto speciální kontaminovanou dietou, jejich průměrný přírůstek na hmotnosti je během dvou měsíců 28g. V předchozích experimentech s bývalou populací o relativně velkém rozsahu (n > 500) byl průměrný přírůstek morcat za těchto podmínek 29,8g a rozptyl s2 = 25. Testujte hypotézu, zda je nová populace srovnatelná s předchozí. Test se bude provádět využitím jednovýběrového t-testu s nulovou hypotézou: X — jd s a/25 t (19) = 2 093 ř0,975 ^,\JSJ protože (19) t < t0 975 nulovou hypotézu nezamítáme. Nová populace je srovnatelná s předchozí. as VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ r»A Příklad 5: Máte za úkol testovat, zda nově vyvinuté antibiotikum proniká do mléka, je-li podáváno kravám po dobu dvou týdnů. Stanovte cíl experimentu, typ sledované veličiny a uspořádání experimentu. Diskutujte pravděpodobnosti a význam možných chyb. Dále diskutujte předpokládané rozložení sledované veličiny a navrhněte způsob testování. Za normálních podmínek se antibiotikum v mléce vůbec nevyskytuje. Formulujte hypotézu a systém testování pro následující situace: a) již stopový průnik antibiotika mléko znehodnotí b) antibiotikum znehodnotí mléko až od koncentrace Ck Cílem experimentu bude ověřit hypotézu, že antibiotikum do mléka neproniká. Experiment můžeme uspořádat jako párový test, tedy vyšetřit skupinu krav před podáváním antibiotika a po podávání antibiotika. Tím zajistíme, že výskyt antibiotika v mléce po jeho podávání nebude ovlivněn jeho přítomností před podáváním. hypotéza a) množství antibiotika v mléce po jeho podávání je nulové hypotéza b) množství antibiotika v mléce po jeho podávání není větší než koncentrace ck Příklad 6: Na Iontově selektivní elektrodě je napsáno, že průměrný obsah dusičnanů ve vzorku naměří se směrodatnou odchylkou 1,5 mg/ml. Jak velký počet opakovaných měření musíte udělat, je-li stanovení průměrné koncentrace požadováno s přesností danou standardní chybou 0,2 mg/ml ? <7 = 1 5m217 ( V musíme udělat 57 měření, pokud se = 0.2mgll Jn \sej -- 57 požaduje odhad průměrné hodnoty se směrodatnou odchylkou 0.2mgl. VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ rnA Příklad 7: Nepříliš čistá protilátka není jako směs proteinů přesně definovaná a její složení je kolísavé, což zvyšuje variabilitu opakovaných stanovení při reakci s antigenem. Jelikož není k dispozici lepší zdroj, je nutné před každým pokusem danou šarži testovat na standard - tedy na antigenní vzorek o přesně známé koncentraci. Je-li rozptyl stanovení pod hranicí o02, lze látku použít k nejdůležitějším stanovením a naopak, překročí-li hodnotu am2, nelze daný preparát použít vůbec. Navrhněte standardní způsob testování takových experimentů i pro následující konkrétní situaci: Pravdivá koncentrace testovaného antigénu je 115,2 ug/ml ve standardním vzorku. n = 10 0,5 Nezamítáme nulovou hypotézu shody rozptylů. Je tedy možné vypočítat společný rozptyl jako vážený průměr rozptylů obou proměnných: s2p= 19,19 as VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ r*JtA Tabulka Pozn: Vzhledem k tomu, že naše H0 byla oboustranná, je třeba k testování použít tabulky (F-rozdělení): f2 = d. /. for Smaller Mean Square /•! = d./. for Larger Mean Square 2 4 6 8 10 12 15 20 30 nekon. 2 39,00 39,25 39,33 39,37 39,40 39,42 39,43 39,45 39,46 39,50 3 16,04 15,10 14,74 14,54 14,42 14,34 14,25 14,17 14,08 13,90 4 10,65 9,60 9,20 8,98 8,84 8,75 8,66 8,56 8,46 8,26 5 8,43 7,39 6,98 6,76 6,62 6,52 6,43 6,33 6,23 6,02 6 7,26 6,23 5,82 5,60 5,46 5,37 5,27 5,17 5,07 4,85 7 6,54 5,52 5,12 4,90 4,76 4,67 4,57 4,47 4,36 4,14 8 6,06 5,05 4,65 4,43 4,30 4,20 4,10 4,00 3,89 3,67 9 5,71 4,72 4,32 4,10 3,96 3,87 3,77 3,67 3,56 3,33 10 5,46 4,47 4,07 3,85 3,72 3,62 3,52 3,42 3,31 3,08 12 5,10 4,12 3,73 3,51 3,37 3,28 3,18 3,07 2,96 2,72 15 4,76 3,80 3,41 3,20 3,06 2,96 2,86 2,76 2,64 2,40 20 4,46 3,51 3,13 2,91 2,77 2,68 2,57 2,46 2,35 2,09 30 4,18 3,25 2,87 2,65 2,51 2,41 2,31 2,20 2,07 1,79 nekon. 3,69 2,79 2,41 2,19 2,05 1,94 1,83 1,71 1,57 1,00 Pro vypočítaný poměr obou rozptylů (1,42) lze vypočítat interval spolehlivosti. Interpretujte výsledek tohoto výpočtu vyjádřený jako: P f o2 0,298 < -^ \ < 5,61 V g: = 0,95 J VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ Srovnání parametrů dvou výběrů Experimenty pro dva pokusné zásahy Příklad 2: Pomocí F-testu uvedeného v úloze 1, lze rovněž testovat rovnost dvou koeficientů variance: F = (Slog)l (Slog)2 Je třeba ověřit, zda má koncentrace Zn nalezená v kontaminovaných půdách stejný rozptyl jako obsah mikrobiální biomasy naměřený na stejných lokalitách (srovnání často nutné pro správnou volbu metody současné analýzy obou proměnných). Nulovou hypotézu budeme testovat srovnáním koeficientů variance podle výše uvedeného vztahu: Obsah Zn (mg/kg) Log (Zn) Obsah biomasy (mg C/kg) Log (biomasa) 72,5 1,86034 183,0 2,26245 71,7 1,85552 172,3 2,23629 60,8 1,78390 180,1 2,25551 63,2 1,80072 190,2 2,27921 71,4 1,85370 191,4 2,28194 73,1 1,86392 169,9 2,22943 77,9 1,89154 166,4 2,22115 75,7 1,89910 177,6 2,24944 72,0 1,85733 - - 69,0 1,84 - - as VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ r*JtA Srovnání parametru dvou výběru Experimenty pro dva pokusné zásahy Vi = -9 Xl = = 70,73kg ssx = 246,1610kg sf = = 27,3512kg2 si = 5,23kg \- = 0,0739 (SS log)1 = 0,00987026 32 (sfo, X = 0,00109669 59 0,0010966959 _ 0,0004961076 F = 4 82 A 0,05(2) "+?0^ 0,20 < p < 0,50 Nezamítáme H0. v2 = --1 X2 = 178,82cm ss2 = 590,1350cm s^ = = 84,3050cm2 s2 = = 9,18cm v2 = = 0,0513 (SSlog)2= 0,0034727534 (s*)2 = 0,004961076 VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ Příklad - two sample test (párový x nepárový) Pokus na zvířatech - srovnání dvou variant (n = 7 jedinců) kontrola před ošetřením: Xi = 8,74; sf = 4,026; _s* 0,575 kontrola po ošetření: X2 = 7,73; s22 = 2,904; .s* 0,415 r = 0,981 Cov = 3,352 D = 1,01; sd2 =0,225 sĽ = 0,179 t = Ď/ss = 5,639 9 9 6-s, + 6-s, „ A/,A ----í--------2- = 3,464 12 s-_-2=V2.sp/V^ = 0,995 1,01 ,Mr t= —— = 1,016 0.995 p < 0.01 p < 0.328 S3 VYUKA: Biostatistika-základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ ŕu Příklad Průměrný denní příjem výživy odhadovaný 10 dní před lékařským zásahem a 10 dní po lékařském zásahu. Pacient před lékařským zásahem po lékařském zásahu diference 1 5260 3910 1350 2 5470 4220 1250 3 5640 3885 1755 4 6180 5160 1020 5 6390 5645 745 6 6515 4680 1835 7 6805 5265 1540 8 7515 5975 1540 9 7515 6790 725 10 8230 6900 1330 11 8770 7335 1435 Průměr 6753,6 5433,2 1320,5 Medián 6515 5265 1350 SD 1142,1 1216,8 366,7 h£ Odhadněte 95% interval spolehlivosti pro rozdíl mezi průměry. Ověřte zda je rozdíl statisticky významný (testujte nulovou hypotézu). Pearsonova korelace: r = 0,9536 Je možné použít neparametrickou alternativu pro tyto testy ? Test provedeme využitím párového t-testu nebo jednovýberovým t-testem s nulovou hypotézou, že průměrná hodnota diferencí se neliší od nuly CENTRUM BIOSTATISTIKY A ANALÝZ VÝUKA: Biostatistika - základní kurz Příklady I Příklad 1 Při sledování určitého fyziologického parametru souvisejícího s činností srdce, nesmí rozptyl hodnot přesáhnout stanovený limit, aby možné odchylky od normálu nezanikly v šumu. Tato limitní hodnota je a0 = 4.5. Po zakoupení nového přístroje testovala klinika měření na n = 30 pacientech s výsledkem s = 4.0. Je možné dále pokračovat ve vyšetřování na novém přístroji, nebo je nutné tento test provádět na přesnějším stroji? Proveďte komplexní rozbor situace, včetně závěrů o dalším postupu měření. (Jde v podstatě o test shody výběrového odhadu rozptylu a rozptylu cílové populace.) 2 (n-l).s2 Testujeme nulovou hypotézu H0: s2 < o2 na 5% hladině významnosti, jako testovou statistiku použijeme X----------~2----- G 2 (n-l)S2 29-42 2 (»"D _ 2 (29) _ X =-------y— =------T~ = 22,91 Porovnáme-li hodnotu testové statistiky s kvantilem t\-a -%""< -^z,dd/ .2 452 0,95 2 2 (29) platí, že X < Xo,95 tedy nulovou hypotézu nezamítneme. Je možné dále pokračovat ve vyšetřování na novém přístroji. Příklad 2. Aby bylo podávané antibiotikum účinné proti bakteriím v ledvinách, musí jeho koncentrace v krvi dosáhnout alespoň hodnoty 18 jednotek/ ml. Z dřívějších rozsáhlých výzkumů víme, že stanovení obsahu antibiotika v krvi vykazuje směrodatnou odchylku a = 3.3. Při testování nové varianty antibiotika na myších byla u n = 9 myší nalezena průměrná koncentrace látky v krvi 10.2 jednotky. Při a = 0.05 testujte, zda je tato hodnota dostatečná pro účinnost antibiotika v ledvinách. - x-u. r Testujeme nulovou hypotézu H0: x > li na 5% hladině významnosti, jako testovou statistiku použijeme t =-------vn s t = x-|X r^ = 10,2-18 /^ = _7 09 Porovnáme-li hodnotu testové statistiky s kvantilem t (ra_l) = L J8) = -186 s 3,3 (8) platí, že t < t0 05 tedy nulovou hypotézu zamítneme. Tato hodnota není dostatečná pro účinnost antibiotika v ledvinách. VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ ra* Příklady II Příklad 3. a) Deset myší bylo testováno na přítomnost jater poškozující toxické látky, která se může vyskytnout v jednom druhu masových konzerv. K testování bylo odebráno 100 konzerv a po deseti dnech uhynuly 2 myši, tzn. ve dvou konzervách byla látka prokázána. Jaký je interval spolehlivosti výskytu této látky v celém souboru konzerv? n=100 IMl-p) /O 02-0 98 p=0>02 ^=fbr=^^=0'014 \p(\-p) interval spolehlivosti (1-a)100% n\ p±Z,a/-J^ f1 = 0,02 ± Z , -0,014 1 /2 V n-\ n b) Bylo zkoumáno 115 žen starších 36 let, zda měly potíže s chrupem během těhotenství. Kladně odpovědělo 46 žen. Jaké jsou vaše závěry o celé populaci žen tohoto věku při 99% spolehlivosti? (Vypočítejte interval spolehlivosti pro p) r=46 F p V n-\ Í 114 interval spolehlivosti 99% n\ p±Z} A1 P) = 0,4±Z0995 -0,046 = 0,4±2,58-0,046 = 0,4±0,12 1 /2 \l n-l 28%-52% žen tohoto věku má potíže s chrupem během těhotenství při 99% spolehlivosti. VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ Příklady III Příklad 3. c) Pravděpodobnost narození chlapce je asi 1/2. Máte zhodnotit výsledky průzkumu populace, která žije v silně poškozeném životním prostředí. Průzkum se týká 1000 náhodně vybraných rodin a zjištěný podíl narozených chlapců je 0.41. Jaké jsou vaše závěry o této populaci? Jak se váš odhad zpřesní, když použijete vzorek n = 10 000 rodin při zachování odhadu p = 0.41? Použijeme jednovýběrový binomický test s nulovou hypotézou H0: p=tt, hladina významnosti a=0,05 n-p-n-n 1000-0,41-1000-0,5 testová statistika Z = n •P(l-P) = -5 79 a příslušný kvantil Z „ = Zn q7Z 0 975 nulovou hypotézu zamítáme. Chlapci se ve zkoumavé populaci nerodí s pravděpodobností 0,5. interval spolehlivosti n\ p±Z} ,. BL^J = 0,4±Z0975 -0,046 = 0,41 ±1,96-0,016 = 0,41 ±0,03 1_/2 V n-\ ' j (\- ) pokud použijeme n=10 000, bude int. spolehlivosti užší n\ p±Z^ a/-J— — = 0,41 ±1,96 -0,005 = 0,41 ±0,01 1 /2 \l n-\ d) Jaká je pravděpodobnost, že rodina se třemi dětmi bude mít 2 (3) chlapce? Podrobně analyzujte problém a použijte obecného definičního vztahu pro binomické rozložení. n = 3 r = 2 p=0,5 (stejná pravděpodobnost narození chlapce jako narození dívky) r = 3 platí p(3) = ^ P(r)= •pr-(l-Pr) = n! .r „ln—r) P(2): v2y !(n-r)l ■p -q ■0,52-0,5(l 3! ■0,52-0,5(l)= 0,375 pravděpodobnost narození 2 chlapců v rodině se třemi dětmi je 0,375 21(1)1 '" )dobnos v rodině se třemi dětmi je 0,125 J i „ 3 „ o _ i 0 ^3 0 ^o _ q i jr pravděpodobnost narození 3 chlapců v3y as VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ ra* Příklady IV Příklad 3. e) Předpokládá se, že lidé trpící určitou krevní chorobou mají abnormální jeden z chromozómů. S cílem odhadnout podíl takto postižených chromozómů bylo studováno 5 buněk od každého ze 120 pacientů a byl zjišťován počet buněk s postiženým chromozómem (tento počet = sledovaný jev = r). Výsledky jsou uvedeny v následující tabulce. Odhadněte podíl postižených chromozómů u populace nemocných lidí. r(četnost jevu) 0 1 2 3 4 5 celkem f(poč. pacientů) 6 31 42 29 10 2 120 X/VE/ Pro odhad p se používá vztah p i=\ i=\ *i fi Xjfj 0 6 0 1 31 31 2 42 84 3 29 87 4 10 40 5 2 10 n 2/^=252 252/120 „ ._ pravděpodobnost výskytu p-------------= U,4z 5 postiženého chromozomu as VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ r»A S3 VYUKA: Biostatistika-základní kurz lady - různé CENTRUM BIOSTATISTIKY A ANALÝZ ra* Příklad 1. Two-tailed t test for significant diference between a mean and a hypothesized population mean of jU 0=22 year. Věk smrti (v letech) 25 koní určitého druhu: 17,2, 18,0, 18,7, 19,8, 20,3, 20,9, 21,0, 21,7, 22,3, 22,6, 23,1, 23,4, 23,8, 24,2, 24,6, 25,8, 26,0, 26,3, 27,2, 27,6, 28,1,28,6, 29,3, 30,1, 35,1. H0: jU = 22 HA: fii*22 a = 0,05 n = 25 X = 24,23 s2 =18,0388 , = X-1L__ 24,23-22 s- 0,85 v = ft-l = 25-l = 24 18,0388 2 nQ_ s- = ní-------------= 0,85 25 ^0,05(2),24 — A"64 Protože > t 0,05(2),24 , zamítáme H0 a usuzujeme, že soubor 25 životních délek koňů pochází z populace jejíž průměr, ju, není 22 let. 0,01 < P(t > 2,624 ) < 0,02 as VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ ra* Příklad 2. A two-tailed t test for significant diference between a sample mean and a hypothesized population mean of zero. Hmotnostní změny 12 potkanů po pobytu v režimu nuceného cvičení. Každá změna hmotnosti (v gramech) je definována jako hmotnost po cvičení mínus hmotnost před cvičením. oj H0:£l = 0 0,2 0,9 a = 0,05 -1,2 -0,9 n = 12 -1,8 ___ X = -0,65g s2 = l,5682g2 = -1,81 1,4 ■1,8 ■2,0 t = X-S -ju _-0,65g 0,36g V = -n- ■1 = 11 t = 2 201 ř0,05 (2), 11 ^?^u± W^ = 036ř Protože K | < ^ o .os (2 x n , nezamítáme H0. 0,05 45 sec Doby rozpustnosti (v sekundách) drogy v žaludeční šťávě:: 42,7, 43,4, 44,6, 45,1, 45,6, 45,9, 46,8, 47,6. H0: ju< 45sek X = 45,2lsek HA=jU> 45sek SS = lS,S2SSsek2 a = 0,05 s2 = 2,6S9Ssek2 n = S { _ 45,2\sek - 45sek _ Q ^ s_ = 0 ^spk 0,58sek v = 7 *0,05(1),7 = A?O^J Když t > t q 05(i)7 ' zarnítáme H0. Závěr: nezamítáme H0. P (t > 0,36 ) > 0,50 VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ r*JtA Příklad 4. 9 9 9 9 A two-tailed variance ratio test for the hypothese HO: 1,42) > 0,50 2 218,73moŕ/w2+107,50moŕ/w2 1rt1rt , 2 sn =--------------------------------------= \9A9moths p 10 + 7 The hypotheses may be submitted to the variance ratio test, for which one calculates v 2 s 2 z? = i or 77 - __2_ j whichever is larger. 2 2 ^2 ^ 1 VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ ŕ-RA Srovnání parametru dvou výběru Experimenty pro dva pokusné zásahy Přikladl. a) Máte k dispozici počty jedinců kůrovce, které byli polapeny do dvou pastí umístněných v zamořené oblasti. Vaším úkolem je srovnat rozptyl obou proměnných H0: a\ = o\ Počty jed nců Past 1 41 34 33 36 40 25 31 37 34 30 38 Past 2 52 57 62 55 64 57 56 55 - - - K otestování shody rozptylů použijeme tzv. F-test pro poměr rozptylů (Variance ratio test) nl = 11,^ =10 n2=8,v2=7 ^=21,87;^ =15,36 F Max (sj* l.s22) _ 21 ,87 Min (si .si) 15 ,36 F(0,05)[l0;7] = 4,76 P>0,5 1,42 Nezamítáme nulovou hypotézu shody rozptylu. Je tedy možné vypočítat společný rozptyl jako vážený průměr rozptylů obou proměnných: ^ = 19,19 as VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ r*JtA Srovnání parametru dvou výběru Experimenty pro dva pokusné zásahy Pozn.: Vzhledem k tomu, že naše H0 byla oboustranná, je třeba k testování použít tabulky: 5 LEVEL (TWO-TAILED) OF THE DISTRIBUTION OF F f2 = d.f. for Smaller Mean Square f, = d.f. for Larger Mean Square 2 4 6 8 10 12 15 20 30 00 2 39,00 39,25 39,33 39,37 39,40 39,42 39,43 39,45 39,46 39,50 3 16,04 15,10 14,74 14,54 14,42 14,34 14,25 14,17 14,08 13,90 4 10,65 9,60 9,20 8,98 8,84 8,75 8,66 8,56 8,46 8,26 5 8,43 7,39 6,98 6,76 6,62 6,52 6,43 6,33 6,23 6,02 6 7,26 6,23 5,82 5,60 5,46 5,37 5,27 5,17 5,07 4,85 7 6,54 5,52 5,12 4,90 4,76 4,67 4,57 4,47 4,36 4,14 8 6,06 5,05 4,65 4,43 4,30 4,20 4,10 4,00 3,89 3,67 9 5,71 4,72 4,32 4,10 3,96 3,87 3,77 3,67 3,56 3,33 10 5,46 4,47 4,07 3,85 3,72 3,62 3,52 3,42 3,31 3,08 12 5,10 4,12 3,73 3,51 3,37 3,28 3,18 3,07 2,96 2,72 15 4,76 3,80 3,41 3,20 3,06 2,96 2,86 2,76 2,64 2,40 20 4,46 3,51 3,13 2,91 2,77 2,68 2,57 2,46 2,35 2,09 30 4,18 3,25 2,87 2,65 2,51 2,41 2,31 2,20 2,07 1,79 00 3,96 2,79 2,41 2,19 2,05 1,94 1,83 1,71 1,57 1,00 16 Pro vypočítaný poměr obou rozptylů (1,42) lze vypočítat interval spolehlivosti. Interpretujte výsledek tohoto výpočtu vyjádřený jako: i P(0,298 <^< 5,61) = 0,95 5,21) < 0,05 CENTRUM BIOSTATISTIKY A ANALÝZ Confidence interval for variance ratio 2 /_2 A 1-a confidence interval for the variance ratio, ox / 's defined by its lower confidence limit, A = ^1 \S2 J 1 A \ or(2),vl5v2 J and its upper confidence limit, L, = V^2 J F a{2),v1,vl 2/2 In Example 9.1, s{jsL2 =1,42,F005(2)107 =4,76, and F005{2)710 = 3,95 . Therefore, we would calculate L.^0,298 and L2=5,61, and we could state f P