Bakalářská práce

Detekce a analýza odlehlých bodů (outliers) v datech klinických registrů

Detection and analysis of outliers in clinical registries

Hana Švihálková, učo 208192
Anotace

Srdeční selhání způsobuje v České republice až 50 % všech úmrtí. Pro jeho výzkum byl zřízen klinický registr AHEAD. Cílem práce je detekovat odlehlá pozorování a chyby v tomto registru a pokusit se ho vyčistit od kontaminantů. Pro detekci odlehlých pozorování byla nejprve zvolena jednorozměrná analýza. Pro každý parametr registru byly vytvořeny základní popisné statistiky a v případě parametrů obsahujících …více

Abstract

Acute heart failure causes 50% of all deaths in the Czech Republic. The clinical trial AHEAD was developed for its research. The aim of this work is to detect outlier observations and errors in this trial and to try to clean it from contaminants. For the first detection of outliers the univariate analysis has been chosen. Every parameter of the trial has its basic describing statistics and for real …více

Zadání práce
Náplní práce bude prostudovat matematické metody a algoritmy detekce odlehlých bodů a vybrané metody prakticky aplikovat na data klinického registru. Zjištěné jednoltivé odchylky budou podrobeny analýze s cílem zjistit jejich původ, odlišit zda se jedná o skutečné extrémní případy, či zda jde o kontaminaci dat. Kontaminanty budou dále rozděleny dle nejpravděpodobnější příčiny vzniku. Výchozím bodem práce jsou jednoduché metody pro detekci odchylek jednotlivých parametrů (odchylky od předpokládaného statistického rozložení) pro všechny základní datové typy, které jsou využívány v klinických registrech. Stěžejní částí práce jsou metody detekce odchylek ve vícerozměrném datovém prostoru. Práce předpokládá zvládnutí matematického aparátu v této oblasti, jeho aplikaci na reálná data a výsledné doporučení nejvhodnějších metod pro oblast klinických dat. Praktickým výsledkem práce bude vyčištění zvoleného registru od kontaminace a sumarizace nejčastějších příčin jejich vzniku.

Literatura:

  • Outliers in Statistical Data (Wiley Series in Probability and Statistics) by Vic Barnett , Toby Lewis
  • Robust Regression and Outlier Detection (Wiley Series in Probability and Statistics) by Peter J. Rousseeuw , Annick M. Leroy
  • Arts, D.G.T., N.F. de Keizer, and G.J. Scheffer, Defining and improving data quality in medical registries: A literature review, case study, and generic framework. Journal of the American Medical Informatics Association, 2002. 9(6): p. 600-611.
Práce zkontrolována:
22. 5. 2009 08:44, RNDr. Daniel Klimeš, Ph.D., učo 11180
Plný text práce
2,3 MB / soubor PDF
Jazyk práce
čeština čeština
Termín obhajoby
17. 6. 2009
Práce byla úspěšně obhájena

Vedoucí

RNDr. Daniel Klimeš, Ph.D., učo 11180
IBA SpolP LF MU

 
Název
Vložil
Vloženo
Práva
  • Přidání souboru

    Soubor nebo složku lze nahrát pomocí tlačítka Přidat.
  • Další operace se soubory

    Podrobnosti lze zjistit označením příslušného řádku.
  • Pohled pro experty

    Pro častou práci je možné zvolit režim Více možností.
  • Vyhledávání souborů

    Vyhledávaný výraz můžete zadat přímo do adresního řádku.
  • Rychlý přístup k souborům

    Pomocí funkce Nedávné je možné se rychle vrátit k právě prohlíženým souborům. Oblíbené soubory je také možné označit Hvězdičkou.