2006
Estimation Procedures for the False Discovery Rate: A Systematic Comparison for Microarray Data
SCHIMEK, Michael a Tomáš PAVLÍKZákladní údaje
Originální název
Estimation Procedures for the False Discovery Rate: A Systematic Comparison for Microarray Data
Název česky
Procedury pro odhad FDR: studie s použitím dat genové exprese
Autoři
SCHIMEK, Michael (40 Rakousko) a Tomáš PAVLÍK (203 Česká republika, garant)
Vydání
17. vyd. Rome, Italy, COMPSTAT 2006 - Proceedings in Computational Statistics, od s. 67-79, 12 s. 2006
Nakladatel
Springer Verlag
Další údaje
Jazyk
angličtina
Typ výsledku
Stať ve sborníku
Obor
10103 Statistics and probability
Stát vydavatele
Itálie
Utajení
není předmětem státního či obchodního tajemství
Kód RIV
RIV/00216224:14110/06:00031811
Organizační jednotka
Lékařská fakulta
ISBN
3-7908-1708-2
UT WoS
000242170000006
Klíčová slova anglicky
False Discovery Rate; permutation algorithms; Significance Analysis
Příznaky
Mezinárodní význam, Recenzováno
Změněno: 1. 4. 2010 09:18, RNDr. Tomáš Pavlík, Ph.D.
V originále
The microarray technology developed in recent years allows for measuring expression levels of thousands of genes simultaneously. In most microarray experiments the measurements are taken under two experimental conditions. Statistical procedures to identify differentially expressed genes involve a serious multiple comparison problem as we have to carry out as many hypothesis testings as the number of candidate genes in the experiment. If we apply the usual type I error rate alpha in each testing, then the probability to reject any truly null hypothesis will greatly exceed the intended overall alpha level. We focus on the recent error control concept of the false discovery rate FDR for which an increasing number of competing estimates as well as algorithms is available. However, there is little comparative evidence. For parametric as well as nonparametric test statistics relevant FDR procedures and typical parameter settings are discussed, including the use of correcting constants in the estimation of the pooled variance. An in-depth simulation study is performed aiming at the aforementioned points with respect to sound statistical inference for microarray gene expression data. Finally the famous Hedenfalk data set is analyzed in a similar fashion and conclusions are drawn for practical microarray analysis.
Česky
Práce srovnává procedury pro kontrolu FDR v prostředí R na simulovaných datech z DNA mikročipů.