Statistické vyhodnocování farmaceutických studií I Metody hodnocení a formulační dokumentace léčivých přípravků Základní definice a pojmy: Náhodná veličina • Náhodná veličina (náhodná proměnná) jsou hodnoty, rozměry, kterými se charakterizují výsledky experimentu, (pozorování) • Náhodná veličina nabývá určitých hodnot s určitou pravděpodobností • Proměnlivost výsledků je důvod, proč je zapotřebí statistických metod při plánování pokusů a analyzování výsledků • spojitá náhodná veličina – hodnota z intervalu – např. hmotnost tablet → daná citlivostí vah • diskrétní náhodná veličina - jen celé číslo – např. počet bakteriálních kolonií Základní definice a pojmy: Náhodná veličina • číselná data → plně kvantifikují popisovanou vlastnost (teplota) • ordinální data → např. roztřídění bolesti na určitý stupeň (žádná bolest –0, nepatrná –1, mírná –2,..) • kategoriální (nominální) data → zařazení do určité kategorie, uspořádání nemá smysl (vedlejší účinky léčby (nevolnost, bolest hlavy, ..) • rozdělení četnosti → ke každé hodnotě (variantě) proměnné je uvedena odpovídající četnost – intervalové rozdělení četnosti - četnost přísluší intervalům hodnot – obecně platí, že je vhodná stejná velikost intervalů a co nejmíň intervalů má být prázdných – Sturgersovo pravidlo: k=1+3,3.log N • N = počet různých hodnot proměnné Základní definice a pojmy: Vzorek a populace • Populace = základní soubor → velký soubor prvků (soubor všech dat) • Vzorek = výběrový soubor, výběr → relativně malý počet prvků vybraných z populace (pacienti vybraní pro klinickou studii) • parametry popisné charakteristiky (populace, souboru) – parametry populace jsou odhadovány pomocí parametrů vzorku – dvě skupiny parametrů: střední hodnoty souboru a charakteristiky variability • výběrový průměr - (střední hodnota populace μ) • medián → rozděluje data přesně na polovinu, není ovlivnitelný extrémními hodnotami souboru • modus → hodnota, která se vyskytuje v souboru nejčastěji xx x Základní definice a pojmy: Vzorek a populace • Rozpětí R = rozdíl mezi největší a nejmenší hodnotou souboru, R= xmax – xmin • Rozptyl s2: • Směrodatná odchylka s = odmocnina z rozptylu – v rozmezí ± s je asi 68% dat, v rozmezí ± 2s asi 95% dat, v rozmezí ± 3s asi 99% dat • Variační koeficient v = poměr směrodatné odchylky a průměru 1 )( 2 2     N xx s Základní definice a pojmy: Pravděpodobnost • podmínka náhodných jevů → nelze dopředu určit, zda jev nastane nebo ne → náhodný pokus • poměr absolutní četnosti jevu A a celkového počtu pokusů (pozorování) → relativní četnost náhodného jevu A: pA = • Pravděpodobnost výskytu jevu A: P(A)= lim(N→∞) • hodnota 100xP je odhadem, v kolika procentech všech pokusů lze očekávat výskyt jevu A N AN )( N AN )( Základní definice a pojmy: Pravděpodobnost • Základní vlastnosti pravděpodobnosti jsou: – Pravděpodobnost výskytu jevu nemůže být menší než 0 a větší než 1; 0 ≤ P(A) ≤ 1 – Pravděpodobnost jistého jevu je jedna; P(J) = 1 – Pravděpodobnost výskytu nemožného jevu je nula; P(ø) = 0 – Mezi pravděpodobností výskytu jevu A, a opačného jevu Ā existuje vztah P(Ā) = 1 – P(A) – Pravděpodobnost výskytu sjednocení neslučitelných jevů (tj. jevů, které nemohou nastat současně) je rovna součtu pravděpodobností těchto jevů; P(A1 A2 …) = P(A1) + P(A2) +... – Součet pravděpodobností výskytu neslučitelných jevů zahrnujících všechny možné výsledky je jedna; P(A) + P(B) + P(C) + …=1. Diskrétní rozdělení náhodné veličiny: Binomické rozdělení • Binomické rozdělení (rozdělení pravděpodobnosti) → výsledky pokusu do jedné ze dvou kategorií: – LD 50 – střední letální dávka (dávka, jež usmrtí 50% zvířat; zvíře pokus přežilo nebo nepřežilo), léčba je úspěšná nebo neúspěšná • jednoznačně určeno dvěma parametry: pravděpodobností výsledku a počtem pozorování • Pravděpodobnost výsledků z N pokusů z binomického rozvoje: – (p+q)N, kde p je pravděpodobnost úspěchu a q je pravděpodobnost neúspěchu Diskrétní rozdělení náhodné veličiny: Binomické rozdělení • Pravděpodobnost, že náhodná proměnná X nabude hodnoty x (v n pokusech nastal jev x-krát): – px(1-p)n-x = – Je-li např. pravděpodobnost vyléčení pacienta určitým antibiotikem 0,75, tak pravděpodobnost, že se vyléčí 3 ze 4 pacientů je: – ∙ (0,75)3 ∙ (0,25)1 = ∙ 0,42188∙ 0,25 = 0,42188 (42,188 %) • když n>30 a n*p*q<9 → aproximace Poissonovým rozdělením • když n>30 a n*p*q>9 → aproximace Normálním rozdělením       x n       3 4 1123 1234   )!(! ! XNX N       x n Spojitá rozdělení • Rozdělení spojité náhodné veličiny X je dáno distribuční funkcí F(x), případně hustotou pravděpodobnosti (frekvenční funkcí) f(x) • Distribuční funkce F(x) pro reálné číslo x udává pravděpodobnost, že náhodná veličina X nabude hodnoty menší nebo rovno než je toto číslo x: F(x) = P(X x) • Znamená to, že ve 100∙F(x) % případů lze očekávat výskyt hodnot menších než x • Pravděpodobnost, že náhodná veličina nabude hodnoty z intervalu (x1, x2) je rovna rozdílu distribučních funkcí horní a dolní meze intervalu: P(x1 X x2) = P(X x2) - P(X x1) = = F(x2) – F(x1)      Spojitá rozdělení • Grafickým vyjádřením hustoty pravděpodobnosti f(x) je spojitá frekvenční křivka • Plocha pod frekvenční křivkou je rovna číslu 1, protože pravděpodobnost, že veličina nabude libovolné hodnoty od mínus nekonečna do plus nekonečna je rovna jistotě (P=1) • Hustota pravděpodobnosti umožňuje určit pro každý interval (x1, x2) pravděpodobnost, že náhodná veličina nabude hodnoty z tohoto intervalu jako plochu vymezenou grafem funkce f(x) nad tímto intervalem: p f(x) x1 x2 0 x x+Δx x Spojitá rozdělení • Při řešení statistických úloh často potřebujeme pro danou pravděpodobnost p nalézt zpětně z tabulky distribuční funkce takovou hodnotu xp, pro kterou platí: P(X≤xp) = F(xp) = p • Tato hodnota se nazývá 100*p%-ním kvantilem. • Jinak řečeno: 100*p% kvantil rozdělí reálnou osu, na které jsou rozloženy hodnoty náhodné veličiny x, na dva intervaly. • V intervalu (-∞, xp) se nachází 100*p% hodnot a v intervalu (xp, ∞) pak 100*(1 - p)% hodnot náhodné veličiny → 100*p% hodnot je menších nebo rovno než je hodnota kvantilu, 100*(1 - p)% hodnot je větších než xp. • pomocí kvantilů se často vyjadřují kritické hodnoty jednotlivých rozdělení