2012
Classification of Primary Medical Records with RUBRYX-2: First Experience
KRAUROVA, Olga; Mikhail ALEXANDROV a Aleš BOUREKZákladní údaje
Originální název
Classification of Primary Medical Records with RUBRYX-2: First Experience
Název česky
Klasifikace lékařských dokumentů pomocí RUBRYX-2: První zkušenosti
Autoři
KRAUROVA, Olga; Mikhail ALEXANDROV a Aleš BOUREK
Vydání
1st ed. Rzesow, Sofia, Artificial Intelligence Methods and Techniques for Business and Engineering Aplications. od s. 56-70, 15 s. ITHEA IBS ISC No.:26, 2012
Nakladatel
ITHEA
Další údaje
Jazyk
angličtina
Typ výsledku
Kapitola resp. kapitoly v odborné knize
Obor
10201 Computer sciences, information science, bioinformatics
Stát vydavatele
Bulharsko
Utajení
není předmětem státního či obchodního tajemství
Forma vydání
elektronická verze "online"
Odkazy
Označené pro přenos do RIV
Ano
Kód RIV
RIV/00216224:14110/12:00063613
Organizační jednotka
Lékařská fakulta
ISBN
978-954-16-0058-0
Klíčová slova česky
medicína klasifikace strojové učení zpracování přirozeného jazyka
Klíčová slova anglicky
natural language processing medical diagnostics document classification
Příznaky
Mezinárodní význam, Recenzováno
Změněno: 10. 4. 2013 16:15, Ing. Mgr. Věra Pospíšilíková
V originále
RUBRYX is a document classifier developed in 2000s for processing large volumes of Web information. RUBRYX uses weighted sum of n-grams (n=1,2,3) extracted from a very limited number of samples (about 5-10) and takes into account their mutual position in a given text. This sophisticated algorithm proves to be very effective in classifying primary medical records presented in a free text form. In the paper we study possibilities of RUBRYX (version 2.2) on a limited document set in Spanish. These documents are medical histories related to stomach diseases. Such area should be considered as a narrow subset of medical records. The high quality of archived results (accuracy 80%-90%) allows us to recommend RUBRYX for similar applications.
Česky
RUBRYX je klasifikátor dokumentů vyvinutý v 2000s pro zpracování velkých objemů webových informací. RUBRYX používá vážený součet n-gramů (n = 1,2,3), získaný z velmi omezeného počtu vzorků (cca 5-10) a bere v úvahu jejich vzájemné pozice v daném textu. Tento sofistikovaný algoritmus se ukázal být velmi účinný při klasifikaci primárních lékařských záznamů prezentováných v formě volného textu. V příspěvku jsme studovali možnosti RUBRYX (verze 2.2) na omezeném množství dokumentů uvedených ve španělštině. Tyto dokumenty byly lékařské záznamy týkající se žaludečních onemocnění. Zjištěná klasifikační spolehlivost (přesnost 80% -90%) nám umožňuje doporučit RUBRYX pro podobné aplikace.