Assessment of Microarray Data Correlation Structure Influence
on False Discovery Rate Procedures in R.

D 2007

Assessment of Microarray Data Correlation Structure Influence on False Discovery Rate Procedures in R.

PAVLÍK, Tomáš a Michael SCHIMEK

Základní údaje

Originální název

Assessment of Microarray Data Correlation Structure Influence on False Discovery Rate Procedures in R.

Název česky

Hodnocení vlivu korelační struktury expresních dat na FDR procedury v R

Autoři

PAVLÍK, Tomáš a Michael SCHIMEK

Vydání

Lisabon, 56th Session of the International Statistical Institute, s. 1373-1376, 2007

Nakladatel

International statistical institute

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10103 Statistics and probability

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Organizační jednotka

Lékařská fakulta

Klíčová slova anglicky

Microarray Data; False Discovery Rate; Correlation Structure

Štítky

Correlation Structure, False Discovery Rate, Microarray Data

Změněno: 1. 4. 2010 09:32, RNDr. Tomáš Pavlík, Ph.D.

Anotace

ORIG CZ

V originále

For significance level 0.05 the EBT procedure is unambiguously outperforming the FDR procedures with respect to the number of correctly identified genes. However, due to the fact that the EBT approach does not take into account the type I error rate the number of correctly identified genes is accompanied with an increased number of false positives. We can conclude that EBT is performing well on data composed of complicated Normal mixtures without correlation structure. The relationship between the FDR and EBT procedures is not so obvious for the significance level of 0.10 (results not shown here). According to the number of correctly called genes both FDR and EBT procedures behave similarly when applied to correlated data models, otherwise EBT seems to be more efficient. Moreover we can see a general tendency of all procedures to perform poorly (i.e. selecting a far too low number of correct genes) in data sets of high complexity.

Česky

Vzhledem k počtu správně identifikovaných genů na hladině významnosti 5% jednoznačně dominuje procedura EBT nad procedurami kontrolujícími FDR. Na druhou stranu, EBT procedura vůbec nebere v potaz celkovou míru chyby I. druhu, což znamená, že správně identifikované geny jsou doprovázeny falešně pozitivními výsledky. EBT proceduru tak lze doporučit pro hodnocení genomických dat bez korelační struktury. Oba typy procedur vykazují velmi podobné výsledky na hladině významnosti 10%, zejména při hodnocení korelovaných dat. Na závěr lze konstatovat, že na datech s vysokou mírou komplexity je schopnost procedur EBT a FDR správně identifikovat rozdílně exprimované geny obecně velmi malá.

Přehled o publikaci