Statistické vyhodnocování
farmaceutických studií I
Metody hodnocení a formulační
dokumentace léčivých přípravků
Základní definice a pojmy:
Náhodná veličina
• Náhodná veličina (náhodná proměnná) jsou hodnoty,
rozměry, kterými se charakterizují výsledky experimentu,
(pozorování)
• Náhodná veličina nabývá určitých hodnot s určitou
pravděpodobností
• Proměnlivost výsledků je důvod, proč je zapotřebí
statistických metod při plánování pokusů a analyzování
výsledků
• spojitá náhodná veličina – hodnota z intervalu
– např. hmotnost tablet → daná citlivostí vah
• diskrétní náhodná veličina - jen celé číslo
– např. počet bakteriálních kolonií
Základní definice a pojmy:
Náhodná veličina
• číselná data → plně kvantifikují popisovanou vlastnost
(teplota)
• ordinální data → např. roztřídění bolesti na určitý stupeň
(žádná bolest –0, nepatrná –1, mírná –2,..)
• kategoriální (nominální) data → zařazení do určité kategorie,
uspořádání nemá smysl (vedlejší účinky léčby (nevolnost,
bolest hlavy, ..)
• rozdělení četnosti → ke každé hodnotě (variantě) proměnné
je uvedena odpovídající četnost
– intervalové rozdělení četnosti - četnost přísluší intervalům
hodnot
– obecně platí, že je vhodná stejná velikost intervalů a co nejmíň
intervalů má být prázdných
– Sturgersovo pravidlo: k=1+3,3.log N
• N = počet různých hodnot proměnné
Základní definice a pojmy:
Vzorek a populace
• Populace = základní soubor → velký soubor prvků (soubor všech
dat)
• Vzorek = výběrový soubor, výběr → relativně malý počet prvků
vybraných z populace (pacienti vybraní pro klinickou studii)
• parametry popisné charakteristiky (populace, souboru)
– parametry populace jsou odhadovány pomocí parametrů vzorku
– dvě skupiny parametrů: střední hodnoty souboru a charakteristiky
variability
• výběrový průměr - (střední hodnota populace μ)
• medián → rozděluje data přesně na polovinu, není ovlivnitelný
extrémními hodnotami souboru
• modus → hodnota, která se vyskytuje v souboru nejčastěji
xx
x
Základní definice a pojmy:
Vzorek a populace
• Rozpětí R = rozdíl mezi největší a nejmenší hodnotou souboru,
R= xmax – xmin
• Rozptyl s2:
• Směrodatná odchylka s = odmocnina z rozptylu
– v rozmezí ± s je asi 68% dat, v rozmezí ± 2s asi 95% dat, v rozmezí
± 3s asi 99% dat
• Variační koeficient v = poměr směrodatné odchylky a průměru
1
)( 2
2




N
xx
s
Základní definice a pojmy:
Pravděpodobnost
• podmínka náhodných jevů → nelze dopředu určit, zda jev
nastane nebo ne → náhodný pokus
• poměr absolutní četnosti jevu A a celkového počtu pokusů
(pozorování) → relativní četnost náhodného jevu A:
pA =
• Pravděpodobnost výskytu jevu A:
P(A)= lim(N→∞)
• hodnota 100xP je odhadem, v kolika procentech všech pokusů
lze očekávat výskyt jevu A
N
AN )(
N
AN )(
Základní definice a pojmy:
Pravděpodobnost
• Základní vlastnosti pravděpodobnosti jsou:
– Pravděpodobnost výskytu jevu nemůže být menší než 0 a větší než
1; 0 ≤ P(A) ≤ 1
– Pravděpodobnost jistého jevu je jedna; P(J) = 1
– Pravděpodobnost výskytu nemožného jevu je nula; P(ø) = 0
– Mezi pravděpodobností výskytu jevu A, a opačného jevu Ā existuje
vztah P(Ā) = 1 – P(A)
– Pravděpodobnost výskytu sjednocení neslučitelných jevů (tj. jevů,
které nemohou nastat současně) je rovna součtu pravděpodobností
těchto jevů; P(A1 A2 …) = P(A1) + P(A2) +...
– Součet pravděpodobností výskytu neslučitelných jevů zahrnujících
všechny možné výsledky je jedna; P(A) + P(B) + P(C) + …=1.
Diskrétní rozdělení náhodné veličiny:
Binomické rozdělení
• Binomické rozdělení (rozdělení pravděpodobnosti) → výsledky
pokusu do jedné ze dvou kategorií:
– LD 50 – střední letální dávka (dávka, jež usmrtí 50% zvířat; zvíře
pokus přežilo nebo nepřežilo), léčba je úspěšná nebo neúspěšná
• jednoznačně určeno dvěma parametry: pravděpodobností
výsledku a počtem pozorování
• Pravděpodobnost výsledků z N pokusů z binomického rozvoje:
– (p+q)N, kde p je pravděpodobnost úspěchu a q je pravděpodobnost
neúspěchu
Diskrétní rozdělení náhodné veličiny:
Binomické rozdělení
• Pravděpodobnost, že náhodná proměnná X nabude hodnoty x (v n
pokusech nastal jev x-krát):
– px(1-p)n-x =
– Je-li např. pravděpodobnost vyléčení pacienta určitým antibiotikem
0,75, tak pravděpodobnost, že se vyléčí 3 ze 4 pacientů je:
– ∙ (0,75)3 ∙ (0,25)1 = ∙ 0,42188∙ 0,25 = 0,42188 (42,188 %)
• když n>30 a n*p*q<9 → aproximace Poissonovým rozdělením
• když n>30 a n*p*q>9 → aproximace Normálním rozdělením






x
n






3
4
1123
1234


)!(!
!
XNX
N






x
n
Spojitá rozdělení
• Rozdělení spojité náhodné veličiny X je dáno distribuční funkcí
F(x), případně hustotou pravděpodobnosti (frekvenční funkcí)
f(x)
• Distribuční funkce F(x) pro reálné číslo x udává
pravděpodobnost, že náhodná veličina X nabude hodnoty menší
nebo rovno než je toto číslo x: F(x) = P(X x)
• Znamená to, že ve 100∙F(x) % případů lze očekávat výskyt hodnot
menších než x
• Pravděpodobnost, že náhodná veličina nabude hodnoty
z intervalu (x1, x2) je rovna rozdílu distribučních funkcí horní a
dolní meze intervalu: P(x1 X x2) = P(X x2) - P(X x1) =
= F(x2) – F(x1)

   
Spojitá rozdělení
• Grafickým vyjádřením hustoty pravděpodobnosti f(x) je spojitá
frekvenční křivka
• Plocha pod frekvenční křivkou je rovna číslu 1, protože
pravděpodobnost, že veličina nabude libovolné hodnoty od mínus
nekonečna do plus nekonečna je rovna jistotě (P=1)
• Hustota pravděpodobnosti umožňuje určit pro každý interval
(x1, x2) pravděpodobnost, že náhodná veličina nabude hodnoty z
tohoto intervalu jako plochu vymezenou grafem funkce f(x) nad
tímto intervalem:
p
f(x)
x1 x2 0 x x+Δx x
Spojitá rozdělení
• Při řešení statistických úloh často potřebujeme pro danou
pravděpodobnost p nalézt zpětně z tabulky distribuční funkce
takovou hodnotu xp, pro kterou platí: P(X≤xp) = F(xp) = p
• Tato hodnota se nazývá 100*p%-ním kvantilem.
• Jinak řečeno: 100*p% kvantil rozdělí reálnou osu, na které jsou
rozloženy hodnoty náhodné veličiny x, na dva intervaly.
• V intervalu (-∞, xp) se nachází 100*p% hodnot a v intervalu (xp, ∞)
pak 100*(1 - p)% hodnot náhodné veličiny → 100*p% hodnot je
menších nebo rovno než je hodnota kvantilu, 100*(1 - p)% hodnot
je větších než xp.
• pomocí kvantilů se často vyjadřují kritické hodnoty jednotlivých
rozdělení