J 2009

On boundary correction in kernel estimation of ROC curves

KOLÁČEK, Jan and Rohana J. KARUNAMUNI

Basic information

Original name

On boundary correction in kernel estimation of ROC curves

Name in Czech

Potlačení hraničních efektů při jádrových odhadech ROC křivek

Authors

KOLÁČEK, Jan (203 Czech Republic, guarantor) and Rohana J. KARUNAMUNI (124 Canada)

Edition

Austrian Journal of Statistics, 2009, 1026-597X

Other information

Language

English

Type of outcome

Článek v odborném periodiku

Field of Study

10101 Pure mathematics

Country of publisher

Austria

Confidentiality degree

není předmětem státního či obchodního tajemství

Impact factor

Impact factor: 0.259 in 1999

RIV identification code

RIV/00216224:14310/09:00032296

Organization unit

Faculty of Science

Keywords in English

kernel estimation; reflection; distribution estimation; ROC curve

Tags

International impact, Reviewed
Změněno: 14/2/2009 19:55, doc. Mgr. Jan Koláček, Ph.D.

Abstract

V originále

The Receiver Operating Characteristic (ROC) curve is a statistical tool for evaluating the accuracy of diagnostics tests. The empirical ROC curve is the most commonly used non-parametric estimator for the ROC curve. To derive a smooth estimate for the ROC curve, we use a kernel smoothing method which has better statistical properties than empirical. By this process we need to estimate a distribution function. It is well known now that kernel distribution estimators are not consistent when estimating a distribution function near the boundary of its support. This problem is known as ``boundary effects". To avoid these difficulties we use the technique, which is a kind of generalized reflection method involving reflecting a transformation of the data. The proposed method generates a class of boundary corrected estimators.

In Czech

Analýza ROC křivek má svůj původ v teorii signálů, avšak v současné době má široké využití i v medicíně. ROC křivky se dnes hojně používají především pro vyhodnocení přesnosti a diskriminační síly diagnostických testů nebo statistických modelů. Pro získání hladkých odhadů ROC křivky se používá metoda jádrového vyhlazování. Při tomto procesu odhadujeme distribuční funkci. Je dobře známo, že při odhadování blízko (konečné) hranice definičního oboru distribuční funkce nejsou jádrové odhady konzistentní. Tento fakt je součástí tzv. "hraničních efektů", které se vyskytují při neparametrických odhadech křivek. Pro potlačení těchto efektů používáme techniku, která je jistým druhem zobecněné reflexivní metody a je založená na zrcadlení transformovaných dat.

Links

LC06024, research and development project
Name: Centrum Jaroslava Hájka pro teoretickou a aplikovanou statistiku
Investor: Ministry of Education, Youth and Sports of the CR, Jaroslav Hájek Center for Theoretical and Applied Statistics