C 2012

Classification of Primary Medical Records with RUBRYX-2: First Experience

KRAUROVA, Olga, Mikhail ALEXANDROV a Aleš BOUREK

Základní údaje

Originální název

Classification of Primary Medical Records with RUBRYX-2: First Experience

Název česky

Klasifikace lékařských dokumentů pomocí RUBRYX-2: První zkušenosti

Autoři

KRAUROVA, Olga (643 Rusko), Mikhail ALEXANDROV (643 Rusko) a Aleš BOUREK (203 Česká republika, garant, domácí)

Vydání

1st ed. Rzesow, Sofia, Artificial Intelligence Methods and Techniques for Business and Engineering Aplications. od s. 56-70, 15 s. ITHEA IBS ISC No.:26, 2012

Nakladatel

ITHEA

Další údaje

Jazyk

angličtina

Typ výsledku

Kapitola resp. kapitoly v odborné knize

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Bulharsko

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

elektronická verze "online"

Kód RIV

RIV/00216224:14110/12:00063613

Organizační jednotka

Lékařská fakulta

ISBN

978-954-16-0058-0

Klíčová slova česky

medicína klasifikace strojové učení zpracování přirozeného jazyka

Klíčová slova anglicky

natural language processing medical diagnostics document classification

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 10. 4. 2013 16:15, Ing. Mgr. Věra Pospíšilíková

Anotace

V originále

RUBRYX is a document classifier developed in 2000s for processing large volumes of Web information. RUBRYX uses weighted sum of n-grams (n=1,2,3) extracted from a very limited number of samples (about 5-10) and takes into account their mutual position in a given text. This sophisticated algorithm proves to be very effective in classifying primary medical records presented in a free text form. In the paper we study possibilities of RUBRYX (version 2.2) on a limited document set in Spanish. These documents are medical histories related to stomach diseases. Such area should be considered as a narrow subset of medical records. The high quality of archived results (accuracy 80%-90%) allows us to recommend RUBRYX for similar applications.

Česky

RUBRYX je klasifikátor dokumentů vyvinutý v 2000s pro zpracování velkých objemů webových informací. RUBRYX používá vážený součet n-gramů (n = 1,2,3), získaný z velmi omezeného počtu vzorků (cca 5-10) a bere v úvahu jejich vzájemné pozice v daném textu. Tento sofistikovaný algoritmus se ukázal být velmi účinný při klasifikaci primárních lékařských záznamů prezentováných v formě volného textu. V příspěvku jsme studovali možnosti RUBRYX (verze 2.2) na omezeném množství dokumentů uvedených ve španělštině. Tyto dokumenty byly lékařské záznamy týkající se žaludečních onemocnění. Zjištěná klasifikační spolehlivost (přesnost 80% -90%) nám umožňuje doporučit RUBRYX pro podobné aplikace.