2007
Assessment of Microarray Data Correlation Structure Influence on False Discovery Rate Procedures in R.
PAVLÍK, Tomáš a Michael SCHIMEKZákladní údaje
Originální název
Assessment of Microarray Data Correlation Structure Influence on False Discovery Rate Procedures in R.
Název česky
Hodnocení vlivu korelační struktury expresních dat na FDR procedury v R
Autoři
PAVLÍK, Tomáš a Michael SCHIMEK
Vydání
Lisabon, 56th Session of the International Statistical Institute, s. 1373-1376, 2007
Nakladatel
International statistical institute
Další údaje
Jazyk
angličtina
Typ výsledku
Stať ve sborníku
Obor
10103 Statistics and probability
Stát vydavatele
Česká republika
Utajení
není předmětem státního či obchodního tajemství
Organizační jednotka
Lékařská fakulta
Klíčová slova anglicky
Microarray Data; False Discovery Rate; Correlation Structure
Změněno: 1. 4. 2010 09:32, RNDr. Tomáš Pavlík, Ph.D.
V originále
For significance level 0.05 the EBT procedure is unambiguously outperforming the FDR procedures with respect to the number of correctly identified genes. However, due to the fact that the EBT approach does not take into account the type I error rate the number of correctly identified genes is accompanied with an increased number of false positives. We can conclude that EBT is performing well on data composed of complicated Normal mixtures without correlation structure. The relationship between the FDR and EBT procedures is not so obvious for the significance level of 0.10 (results not shown here). According to the number of correctly called genes both FDR and EBT procedures behave similarly when applied to correlated data models, otherwise EBT seems to be more efficient. Moreover we can see a general tendency of all procedures to perform poorly (i.e. selecting a far too low number of correct genes) in data sets of high complexity.
Česky
Vzhledem k počtu správně identifikovaných genů na hladině významnosti 5% jednoznačně dominuje procedura EBT nad procedurami kontrolujícími FDR. Na druhou stranu, EBT procedura vůbec nebere v potaz celkovou míru chyby I. druhu, což znamená, že správně identifikované geny jsou doprovázeny falešně pozitivními výsledky. EBT proceduru tak lze doporučit pro hodnocení genomických dat bez korelační struktury. Oba typy procedur vykazují velmi podobné výsledky na hladině významnosti 10%, zejména při hodnocení korelovaných dat. Na závěr lze konstatovat, že na datech s vysokou mírou komplexity je schopnost procedur EBT a FDR správně identifikovat rozdílně exprimované geny obecně velmi malá.