D 2006

Estimation Procedures for the False Discovery Rate: A Systematic Comparison for Microarray Data

SCHIMEK, Michael a Tomáš PAVLÍK

Základní údaje

Originální název

Estimation Procedures for the False Discovery Rate: A Systematic Comparison for Microarray Data

Název česky

Procedury pro odhad FDR: studie s použitím dat genové exprese

Autoři

SCHIMEK, Michael (40 Rakousko) a Tomáš PAVLÍK (203 Česká republika, garant)

Vydání

17. vyd. Rome, Italy, COMPSTAT 2006 - Proceedings in Computational Statistics, od s. 67-79, 12 s. 2006

Nakladatel

Springer Verlag

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10103 Statistics and probability

Stát vydavatele

Itálie

Utajení

není předmětem státního či obchodního tajemství

Kód RIV

RIV/00216224:14110/06:00031811

Organizační jednotka

Lékařská fakulta

ISBN

3-7908-1708-2

UT WoS

000242170000006

Klíčová slova anglicky

False Discovery Rate; permutation algorithms; Significance Analysis

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 1. 4. 2010 09:18, RNDr. Tomáš Pavlík, Ph.D.

Anotace

V originále

The microarray technology developed in recent years allows for measuring expression levels of thousands of genes simultaneously. In most microarray experiments the measurements are taken under two experimental conditions. Statistical procedures to identify differentially expressed genes involve a serious multiple comparison problem as we have to carry out as many hypothesis testings as the number of candidate genes in the experiment. If we apply the usual type I error rate alpha in each testing, then the probability to reject any truly null hypothesis will greatly exceed the intended overall alpha level. We focus on the recent error control concept of the false discovery rate FDR for which an increasing number of competing estimates as well as algorithms is available. However, there is little comparative evidence. For parametric as well as nonparametric test statistics relevant FDR procedures and typical parameter settings are discussed, including the use of correcting constants in the estimation of the pooled variance. An in-depth simulation study is performed aiming at the aforementioned points with respect to sound statistical inference for microarray gene expression data. Finally the famous Hedenfalk data set is analyzed in a similar fashion and conclusions are drawn for practical microarray analysis.

Česky

Práce srovnává procedury pro kontrolu FDR v prostředí R na simulovaných datech z DNA mikročipů.