D 2002

Automated Selection of Interesting Medical Text Documents by the TEA Text Analyzer

ŽIŽKA, Jan a Aleš BOUREK

Základní údaje

Originální název

Automated Selection of Interesting Medical Text Documents by the TEA Text Analyzer

Autoři

ŽIŽKA, Jan (203 Česká republika, garant) a Aleš BOUREK (203 Česká republika)

Vydání

Berlin, Heidelberg, Germany, Third International Conference on Intelligent Text Processing and Computational Linguistics CICLing-2002 Proceedings, Mexico City, February 2002. s. 402-404, 2002

Nakladatel

Springer-Verlag

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

20200 2.2 Electrical engineering, Electronic engineering, Information engineering

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Kód RIV

RIV/00216224:14330/02:00004820

Organizační jednotka

Fakulta informatiky

ISBN

3-540-43219-1

Klíčová slova anglicky

machine learnig; text-document classification; automated selection; unstructured text; Bayes classification; dictionary modification
Změněno: 15. 5. 2003 11:58, doc. Ing. Jan Žižka, CSc.

Anotace

V originále

The paper briefly describes the experience in the automated selection of interesting medical text documents by the TEA text analyzer based on the naive Bayes classifier. Even if the used type of the classifier provides generally good results, physicians needed certain supporting functions to obtain really interesting medical text documents, for example, from resources like the Internet. The influence of the functions is summarized and discussed. In addition, some remaining problems are mentioned.

Návaznosti

MSM 143300003, záměr
Název: Interakce člověka s počítačem, dialogové systémy a asistivní technologie
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Interakce člověka s počítačem, dialogové systémy a asistivní technologie