C 2012

Classification of Primary Medical Records with RUBRYX-2: First Experience

KRAUROVA, Olga; Mikhail ALEXANDROV a Aleš BOUREK

Základní údaje

Originální název

Classification of Primary Medical Records with RUBRYX-2: First Experience

Název česky

Klasifikace lékařských dokumentů pomocí RUBRYX-2: První zkušenosti

Autoři

KRAUROVA, Olga; Mikhail ALEXANDROV a Aleš BOUREK

Vydání

1st ed. Rzesow, Sofia, Artificial Intelligence Methods and Techniques for Business and Engineering Aplications. od s. 56-70, 15 s. ITHEA IBS ISC No.:26, 2012

Nakladatel

ITHEA

Další údaje

Jazyk

angličtina

Typ výsledku

Kapitola resp. kapitoly v odborné knize

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Bulharsko

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

elektronická verze "online"

Označené pro přenos do RIV

Ano

Kód RIV

RIV/00216224:14110/12:00063613

Organizační jednotka

Lékařská fakulta

ISBN

978-954-16-0058-0

Klíčová slova česky

medicína klasifikace strojové učení zpracování přirozeného jazyka

Klíčová slova anglicky

natural language processing medical diagnostics document classification

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 10. 4. 2013 16:15, Ing. Mgr. Věra Pospíšilíková

Anotace

V originále

RUBRYX is a document classifier developed in 2000s for processing large volumes of Web information. RUBRYX uses weighted sum of n-grams (n=1,2,3) extracted from a very limited number of samples (about 5-10) and takes into account their mutual position in a given text. This sophisticated algorithm proves to be very effective in classifying primary medical records presented in a free text form. In the paper we study possibilities of RUBRYX (version 2.2) on a limited document set in Spanish. These documents are medical histories related to stomach diseases. Such area should be considered as a narrow subset of medical records. The high quality of archived results (accuracy 80%-90%) allows us to recommend RUBRYX for similar applications.

Česky

RUBRYX je klasifikátor dokumentů vyvinutý v 2000s pro zpracování velkých objemů webových informací. RUBRYX používá vážený součet n-gramů (n = 1,2,3), získaný z velmi omezeného počtu vzorků (cca 5-10) a bere v úvahu jejich vzájemné pozice v daném textu. Tento sofistikovaný algoritmus se ukázal být velmi účinný při klasifikaci primárních lékařských záznamů prezentováných v formě volného textu. V příspěvku jsme studovali možnosti RUBRYX (verze 2.2) na omezeném množství dokumentů uvedených ve španělštině. Tyto dokumenty byly lékařské záznamy týkající se žaludečních onemocnění. Zjištěná klasifikační spolehlivost (přesnost 80% -90%) nám umožňuje doporučit RUBRYX pro podobné aplikace.