* 1 STATISTIKA © Biochemický ústav LF MU (V.P.) 2007 2 STATISTICS © Department of Biochemistry, Faculty of Medicine, MU (V.P.) 2007 3 Účelem není znát vzorce a výpočty (to by bylo zcela zbytečné), ale vědět, co to znamená ! The purpose is not the knowledge of formulas and calculations (it would be useless), however to know what it means ! 4 Některé technické ievv konstantnost „jistota u Some technical events constancy nn confidence" Biologické jevy —> variabilita —» pravděpodobnost 7 Biological events —> variability —> probability 8 živý organismus —» biologická variabilita rozdělení četnosti biologických jevů symetrické, asymetrické „normální rozdělení" „Gaussovské rozdělení" 9 living Organismus —» biological variability the frequencv distribution of biological y \ events symmetrical, non-symmetrical „the normal distribution", „the Gaussian distribution" 10 Carl Friedrich Gauß (1777-1855) německý matematik the German mathematician AY4758071D1 nm htoih i:>:'' ÍJ -"« "■•:;~ fte mms&mtmi Gaussova křivka the Gaussian curve n r» Křivka rozložení funkce pravděpodobnosti je symetrická a zvonovitého tvaru (= „normální rozdělení", „Gaussovské rozdělení") > ■N ■'m ífi ¥ p ■ H-l ■ ■ h m m n í7s %1 jn.ift-itii^i—r- The curve of the probability density function is symmetrical and bell-shaped (= „normal distribution", „the Gaussian distribution") 12 Intervaly pravděpodobnosti rozložení v % jsou dány aritmetickým průměrem (x) a standardními odchylkami (s) . x + Is 63.27% 55,45% ——--------— >: + 2s 99,73% ---------=-------- -»*- K + 3s 13 The probability intervals of distribution in % are given by arithmetic mean (x) and standard deviations (s) . 55^5% —r=----- X + 99,73% ---------=■ 2s -»*• Jy. 3s 14 „Normální hodnoty66 : x + 1,96s = 2.5% O-'«) .___:> p a 5 % <---1 v medicínských a biologických studiích je to dohodnuté rozpětí hodnot vymezené 95 % intervalem spolehlivosti (oboustranně ohraničený interval spolehlivosti) 15 The „normal range66 : - 2.5% d-'«) x + 1,96s !-----> p = 5" % <---' in medical and biological studies this range is conventionally given by the 95 % interval of confidence (two-sided limits of confidence interval) 16 14 Normální hodnoty44 („referenční hodnoty44) : od do 2.5% d-'<°) Podle běžné konvence referenční hodnoty zahrnují celou populaci. Interval je však ohraničen oboustranně 2,5 % pásmem očekávaných hodnot. Ve skutečnosti tedy 5 % výsledků „normální" zdravé populace bude ležet mimo referenční hodnoty. 17 The „normal range44 (the „reference range44) : from to 2.5% d-'<°) By current convention, the reference range includes all. But the top and bottom are 2,5 % of results expected from a population of healthy people. So that 5 % of „normal" healthy population will have test values falling outside the reference range. 18 Nesymetrické rozdelení: X modus X median o v X levostranne asymetrické rozdělení, „logaritmicko-normální" (lognormální) rozdělení Non-symmetrical distribution k modus X median x there is: left-hand side non-symmetrical, logarithmic-normal (lognormal) distribution 20 Nesymetrické rozdělení: X > X pravostranné asymetrické rozdělení, „logaritmicko-normální" (lognormalní) rozdělení u symetrického rozdělení: x = X = Non-symmetrical distribution : x > x > there is: right-hand side non-symmetrical, logarithmic-normal (lognormal) distribution in symmetrical distribution: x = X = X 95 % interval spolehlivosti odvozený z jednotlivých hodnot, seřazených podle své velikosti 2,5 % ----; t X . *J2 mm jrrf1111 I 50 % w~% ^y 95 % 100 % (n) 97,5 1 i T*T !xmax _^/ The 95 % interval of confidence derived from individual values arranged according to their size 97,5 % 2,5 % x . Jr\1) 1 .--". T min 50 % JťT 95 % 100 % (n) T'ŕ T i < t t i3^ ax _y t Dohodnutá symbolika / conventional symbolism : základní soubor population výběrový soubor sample průměr mean, average P X směrodatná odchylka standard deviation G S °n-l \ n \n-l 25 Směrodatná odchylka výukový vzorec praktický vzorec „s" nebo „on_i" = pro výberový soubor, v angl. literatuře také SD (standard deviation) 26 The standard deviation : the didactic formula the practical formula „s" or „-x)2 nebo VK'+VK' ...... 2/ po provedených výpočtech jsou druhé mocniny „vráceny" do původního stavu druhou odmocninou, proto vzorce: Z(*-*)2 z 2 —2 x - nx n-1 v n-1 KJVK^+VK* 30 How does the statistics obtain the non-zero values ? 1/ squared values of all numbers (positive or negative) are positive, therefore you can see: 2>-x)2 or CVA2+CV A ' ^ VB 2/ after calculations the squared values are „retained" to the previous one by the square root, therefore the formulas: 2 —2 x - nx I(x-x)2 I___ n-1 V n-1 K ^CVl + CV, 2 B 31 Spolehlivost = správnost + přesnost správně, přesně Charakteristikou přesnosti je variabilita. Mírou variability je např. rozptyl (s2) nebo variační koeficient (VK). VK = 4- * 100 (%) x 32 Reliability = accuracy + precision accurate, precise The characteristic of precision is variability. The measure of variability are for example: variance (s2) or coefficient of variation (C V) . CV = — • 100 (%) x 33 Spolehlivost = správnost + přesnost Nesprávné výsledky jsou dány odchylkou od správné hodnoty (nenáhodná, systematická chyba) přesně, nesprávně 34 Reliability = accuracy + precision Non-accurate results are due to the difference from the accurate value (non-accidental, systematic error). precise, inaccurate 35 Spolehlivost = správnost + přesnost • ••• • • • • • • • • • • • správně, nepresne 36 Reliabilitv = accuracy + precision f. accurate, imprecise 37 biologické jevy variabilita pravděpodobnost: 1/ prostá (nepodmíněná) 2/ podmíněná biological events variability probability : 1/ the simple probability (unconditional) 2/ the conditional probability Pravděpodobnost prostá (nepodmíněná): ( hra v kostky ) p = - = 0,166 = 16,6% Počet hodů: 100/16,66 = 6 P = - • - = 0,166 • 0,166 = 0,1662= 0,027 = 2,7% 6 6 Počet hodů: 100/2,7 = 37 P = -•-•- = 0,1663 = 0,004 = 0,4% 6 6 6 Počet hodů: 100/0,4 = 250 40 The simple probability (unconditional) (dice ) P = - = 0,166 = 16,6% 6 Number of rolls: 100/ 16,66 = 6 P = - ■ - = 0,166 • 0,166 = 0,1662 = 0,027 = 2,7% 6 6 Number of rolls: 100/2.7 = 37 P = -■-■- = 0,1663 = 0,004 = 0,4% 6 6 6 Number of rolls: 100/0,4 = 250 41 Pravděpodobnost prostá (nepodmíněná): - • - = 0,166 • 0,166 = 0,1662 = 0,027 = 2,7% 6 6 • • • • • • • • P = l Počet hodů: 100/2,7 = 37 navzájem nezávislé jevy " součin pravděpodobností (nikoliv součet! ) 42 The simple probability (unconditional): P = - • - = 0,166 • 0,166 = 0,1662 = 0,027 = 2,7% 6 6 Number of rolls: 100/2,7 = 37 the events independent of one another the product of probabilities (notthe sum !) 43 Pravděpodobnost prostá (nepodmíněná) P = 16.6% p — 2 1°/ Cím více jevu, tím nižší celková pravděpodobnost! P = 0.4 % 44 The simple probability (unconditional) P = 16.6% P = 2.7 % The more events, the lower whole probability ! P = 0.4 % 45 Pravděpodobnost prostá (nepodmíněná): w P = 0.951 = 95 % W W P = 0.952 = 90.25 % Cím více současně požadovaných laboratorních stanovení, tím menší pravděpodobnost, že výsledek jediného z nich bude ležet uvnitř 95 % intervalu spolehlivosti (u zdravého jedince). www P = 0.953 = 85.74 % 46 The simple probability (unconditional): P = 0.951 = 95 % P = 0.952 = 90.25 % The more laboratory determinations together demanded, the lower probability, that the only one result will lie within the 95 % confidence interval (in healthy individual). \j \j \j P = 0,953 = 85.74 % 47 Pravděpodobnost prostá (nepodmíněná) pravděpodobnost výskytu 1 výsledku (zdravý jedinec): - uvnitř - mimo i 95 % interval spolehlivosti l obecně: P = 0,95" p = (1 - 0,95)" 0 -i * P = 0,95* p = (1 - 0,95)* = 95 % = 5 % tt ^> ^> W \J \y U v> n = 10 ......► P = 0,95*" P = (1 - 0,95) = 0,5987 = 0,4013 ~ 60% ~ 40% 10 48 The simple probability (unconditional) the probability of occurence of one result (healthy individual) : - within - outside I the 95 % confidence interval I o -i in general: p = 0,95" /? = (!" 0,95)" * P = 0,95* p = (1 - 0,95/ = 95 % = 5 % \j \j \j \j n = 10 ......»P = 0,95*" P = (1 - 0,95) = 0,5987 = 0,4013 ~ 60% ~ 40% \J 10 49 Podmíněná pravděpodobnost: P (T/D) = pravděpodobnost jevu „T" za podmínky „D" podmínka ,,D" i e vždv přítomna T = test T+ = positivní test T- = negativní test D = diagnóza, nemoc (disease) D+ = daná diagnóza je přítomna, nemoc je přítomna D- = daná diagnóza není přítomna, nemoc není přítomna The conditional probability: P (T/D) = the probability of the event „T" given the condition „D" the condition „D" is always present T = test T+ = positive test T- = negative test D = diagnose, disease D+ = the given diagnose is present, the disease is present D- = the given diagnose is not present the disease is not present l/ALIDITU DIAGNOSTICKÝCH TBSTU. Aéere' dávají'pouze dra druhy odpovedi' (tese aeaaéfir*/' a čert p0*itAré*r)t /gg yy/ddnt dvěma, mdkt&ď*é**/ pemerňym/ uka&aůe// ^ seMsnťtWtou a speaWciů&u,. 52 D+ T— dvě překrývající se křivky D- 53 kritická hodnota pro diferenciaci I T+ <— D+ . t~ two overlapping > curves D- G * k/^^ J h c pNf ^ř ^^ y \ %t ^T^ ' * í F cutoff value 54 D+ r r správna pozitivita 7- —> D-d \ správná - negativita i ,—*^ -----------------*\ ■ ^^^^^^^fa. + b -■ 55 true positivity 56 falešná pozitivita f falešná negativita 57 false positivity false negativity D+ spravna pozitivita D- ú správná negativita falešná pozitivita \ falešná negativita 59 true positivity false positivity false negativity 60 pacient s nemocí (D+) pacient bez nemoci (D-) test je pozitivní (T+) a c test je negativní (T-) b d a = správná pozitivita cx _ , ( , v i ry i v r ,- - , ^l --- ŽI / (íl """ Dl b = ialesna negativita v 7 c = falešná pozitivita d = správná negativita SF = d / (c + d) 6 i pacient with disease (D+) pacient without disease (D-) test is positive (T+) a c test is negative (T-) b d a = true positivity b = false negativity c = false positivity d = true negativity ST= a/(a + b) SF= d/(c + d) 62 Podmíněná pravděpodobnost: P (T-/D-) = správná negativita, specifičnost, specificita (SF) SF = 0,7 —» použitelná metoda SF > 0,95 —» velmi dobrá metoda P (T+/D+) = správná pozitivita, senzitivita (ST) efektivita (vydatnost) = nejvyšší pravděpodobnost shody testu s diagnózou 63 The conditional probability: P (T-/D-) = the true negativity, the specificity (SF) SF = 0,7 —» the usable method SF > 0,95 —» the very good method P (T+/D+) = the true positivity, the sensitivity (ST) the efficiency = the greatest probability of concordance of the test with the diagnose 64 Senzitivita = podíl správné pozitivity testu „senzitivita" ST= P(T+/D+) -„pozitivita" = podmíněná pravděpodobnost P (T+/D+), že pacient s hledanou nemocí (D+) má pozitivní výsledek testu (T+) = pravděpodobnost pozitivního testu (T+) u pacientů s nemocí (D+) = schopnost testu dát pozitivní odpověď (T+) v případě, že vyšetřovaná osoba trpí danou nemocí (D+) 65 Sensitivity = the proportion of true positivity of the test „sensitivity ST = P (T+/D+) ~ „positivity" = the conditional probability P (T+/D+), that the pacient with given disease (D+) has a positive result of the test (T+) = the probability of a positive test (T+) among patients with disease (D+) = the ability of the test to give a positive response (T+), when the tested person suffers from the given disease (D+) 66 Specificita = podíl správné negativity testu SF = P (T/D) = podmíněná pravděpodobnost P (T-/D-), že pacient bez hledané nemoci (D-) má negativní výsledek testu (T-) = pravděpodobnost negativního testu (T-) u pacientů bez nemoci (D-) = schopnost testu dát zápornou odpověď (T-) v případě, že vyšetřovaná osoba nemá danou nemoc (D-) 67 Specificity = the proportion of true negativity of the test SF = P (T/D) = the conditional probability P (T-/D-), that the pacient without given disease (D-) has a negative result of the test (T-) = probability of a negative test (T-) among patients without disease (D-) = the ability of the test to give a negative response (T-), when the tested person does not suffer from the given disease (D-) 68 Operativní charakteristická křivka 1.00 I nespecifita 1,00 1-SF Receiver operating characteristic curve 0,00 0.25 0,50 nonspecifity 1,00 1-SF senzitivita „ST", citlivost = správná pozitivita = 1 - falešná negativita „1 - FN" ROC - křivka 1 - specifická „1 - SP" = nespecifická = falešná positivita „FP" ?i sensitivity „ST" = true positive rate „TPR" = 1 - false negativity rate „1 - FNR" ROC - curve 1 - specificity „1 - SP" = nonspecificity = false positive rate „FPR 72 « ideální bod (nedosažitelný) ~ 100 % správné pozitivity a 0 % falešné pozitivity ROC - křivka « the ideal point (unattainable) ~ 100 % true positivity and 0 % false positivity ROC - curve 74 ST 1,0 0,5-1 27,5 0,S 10 l-SF 75 40 frekvence normální hodnoty albumin (9/0 Dva soubory S-albuminu : 1 D+ 2 D- D+: hnisání rány, dehiscence rány, bronchopneumonie, sepse, tvorba dekubitů 76 40 frekvence Two data files of S-albumin : 1 D+ 2 D- normal values albumin (9/0 D+: suppuration of wounds, dehiscence of wounds, bronchopneumonia, sepsis, pressure sores 77 frekvence normální hodnoty albumin (9/1) 1,0 l-SF Kritická hodnota pro diferenciaci a ROC křivka (1): 78 frekvence normal values albumin (9/1) í-SF Cutoff value and the ROC curve (1) : 79 frekvence normální hodnoty albumin (9/1) 1,0 l-SF Kritická hodnota pro diferenciaci a ROC křivka (2): 80 frekvence 1,0 f-SF normal values albumin (9/1) Cutoff value and the ROC curve (2) : frekvence normální hodnoty albumin (9/1) 1,0 l-SF Kritická hodnota pro diferenciaci a ROC křivka (3): 82 frekvence /- SF normal values albumin (9/1) Cutoff value and the ROC curve (3) : 83 1,0-- 29,95 A í - F ■ Ml . * - TT 40 35 / / / / / / / / / 0,5 LO P(T+) 84 Kriticky rozdíl je veličina k posouzení statisticky významné odlišnosti dvou srovnávaných hodnot u stejného pacienta („sám sobě kontrolou") kritický rozdíl = K- ^VK2A + VK2B A = analytická variabilita (reprodukovatelnost po dnech) B = biologická variabilita (proměnlivost u daného jedince) K= 2,77 = 1,96 • V2 2 srovnávané hodnoty X ± 1,96 S (95 % interval spolehlivosti) 85 The critical difference is the quantity to judge the significant difference of two comparing values in the same patient (he himself to oneself as a control) critical difference = K• -JČv[+ČV^ A = analytical variability (reproducibility day to day) B = biological variability (variability in given individual) K= 2,77 = 1,96 • a/2 2 comparing values X + l,96s (the 95% interval of confidence) 86 Kritický rozdíl: Cholesterol: minulé stanovení 8,0 mmol/1 (~ 100 %) - 25 % (pokles) dnešní stanovení 6,0 mmol/1 (~ 75 %) 87 The critical difference Cholesterol: previous determination today determination 8,0 mmol/1 (~ 100 %) I - 25 % (decrease) 6,0 mmol/1 (~ 75 %) Kriticky rozdíl: Cholesterol: minulé stanovení 8,0 mmol/1 (~ 100 %) - 25 % (pokles) dnešní stanovení 6,0 mmol/1 (~ 75 %) Laboratoří sdělený kritický rozdíl pro cholesterol byl 19 % . Rozdíl u našeho pacienta (25 %) je větší než kritický rozdíl. Rozdíl u pacienta je tedy statisticky významný, (je větší než součet analytické a biologické variability). Pouhou náhodou může být způsoben jen výjimečně (s pravděpodobností < 5 %) 89 The critical difference : Cholesterol: previous determination 8,0 m m o 1/1 (~ 100 %) I - 25 % (decrease) today determination 6,0 m m o l/l (~ 75 %) The critical difference for cholesterol according to the laboratory was 19 % . The difference in our patient (25 %) is grater than the critical difference. The pacient difference is statistical significant, (it is grater than the sum of analytical and biological variability). The change can be done accidentally only exceptionaly (with the probability < 5 %) 90 Referenční hodnotv („normální hodnoty") : referenční jedinec —» NE: 1. těhotné ženy 2. dítě / věk ? muž / žena ? 3. jedinci po fyzické námaze / po vystavení stresu 4. po požití potravy (výjimka: zátěžové stavy) 5. po podání léků 6. nemoc / rizikové faktory 7..... „zdraví dárci krve" 91 Reference range („normal values") : reference individual —> NO : 1. pregnant women 2. child / age ? male / female ? 3. individuals after physical exersise / after exposure of stress 4. after ingestion of food (the exception: load tests) 5. after application of drugs 6. disease / risk factors 7..... „healthy donators of blood" Preanalvtická variabilita : Standardní odběr: • poloha (vleže vs. ambulantně) • denní doba • nalačno • komprese žíly / prstu • doba a způsob srážení (druh a koncentrace antikoagulantu) • skladování (teplota, UV,...) • doba dodání do laboratoře 93 Preanalvtical variability : The standard withdrawal: • position (laying vs. sitting) • daytime • in the fasting state • compression of vein / finger • the time and the way of clotting (kind and concentration of antikoagulant) • storage (temperature, UV,...) • the time of delivery to the laboratory 94 KONTROLA PROVOZU 95 \ fotirok presnosti®' faj • • j • • , * / i • \ " í * ■■—■ \\Z_ ' %V7 <=y z^ 96 Regulační diagram 98 Kontr. dat Westgard uvolni sérii ANO mimo kontrolu odvrhni sérii 12s kontroluje se, jestli alespoň jeden výsledek kontroly překročil ± 2s !3s kontroluje se, jestli alespoň jeden výsledek kontroly překročil ± 3s 22s R4s kontroluje se, jestli dva po sobě jdoucí výsledky kontroly překročily buď2s nebo -2s_________________________ kontroluje se, jestli rozdíl (variační rozpětí) mezi dvěma výsledky kontrolního vzorku > 4s___________________ 4 kontroluje se, jestli 4 po sobě jdoucí výsledky téhož kontrolního vzorku přesahují buď4 x Is nebo 4 x (-Is) 10x kontroluje se, zda 10 po sobě jdoucích výsledku stanovení téhož kontrolního vzorku je na jedné nebo druhé straně průměru__________________________________________ 100 Analvtv moce, G426 Cyklus: 010/98, strana 2 z 3 Vzorek B mtnol/l Kreatinin Mimo: 8 12,38 -9,58 • 6,78 -"í os ■ ^m i « — _ ■ m m* m m m 1 --■--; m ■ i • : ■ ■ < 1 8, 83 I 13,53 i 18,23 Vzorek A 1 22,93 1 27,63 Analvťv" krevního séra, G426 Cyklus: 002/93, strana 4 z 6 fikati 13,10 -- CQ CD 10,30 -- O > 7,50 - 4,70 -L 1,90 0,814 ALP Mimo: 1 2,414 —i— 4,014 5,614 Vzorek A 102 \>-btlfa Nedorozumění laboratorních a klinických oddělení: 1/ 95 % interval spolehlivosti 2/ „kvalita samotného laboratorního výsledku nikdy nemůže být lepší než kvalita dodaného vzorku !" 3/ biochemický „make up" 104 Misunderstanding of laboratory and clinical departments : 1/ 95 % confidence interval 2/ „the quality of laboratory determination cannot be better than he quality of delivered sample !" 3/ biochemical „make up" 105 106