2012
Classification of Primary Medical Records with RUBRYX-2: First Experience
KRAUROVA, Olga, Mikhail ALEXANDROV a Aleš BOUREKZákladní údaje
Originální název
Classification of Primary Medical Records with RUBRYX-2: First Experience
Název česky
Klasifikace lékařských dokumentů pomocí RUBRYX-2: První zkušenosti
Autoři
KRAUROVA, Olga (643 Rusko), Mikhail ALEXANDROV (643 Rusko) a Aleš BOUREK (203 Česká republika, garant, domácí)
Vydání
1st ed. Rzesow, Sofia, Artificial Intelligence Methods and Techniques for Business and Engineering Aplications. od s. 56-70, 15 s. ITHEA IBS ISC No.:26, 2012
Nakladatel
ITHEA
Další údaje
Jazyk
angličtina
Typ výsledku
Kapitola resp. kapitoly v odborné knize
Obor
10201 Computer sciences, information science, bioinformatics
Stát vydavatele
Bulharsko
Utajení
není předmětem státního či obchodního tajemství
Forma vydání
elektronická verze "online"
Odkazy
Kód RIV
RIV/00216224:14110/12:00063613
Organizační jednotka
Lékařská fakulta
ISBN
978-954-16-0058-0
Klíčová slova česky
medicína klasifikace strojové učení zpracování přirozeného jazyka
Klíčová slova anglicky
natural language processing medical diagnostics document classification
Příznaky
Mezinárodní význam, Recenzováno
Změněno: 10. 4. 2013 16:15, Ing. Mgr. Věra Pospíšilíková
V originále
RUBRYX is a document classifier developed in 2000s for processing large volumes of Web information. RUBRYX uses weighted sum of n-grams (n=1,2,3) extracted from a very limited number of samples (about 5-10) and takes into account their mutual position in a given text. This sophisticated algorithm proves to be very effective in classifying primary medical records presented in a free text form. In the paper we study possibilities of RUBRYX (version 2.2) on a limited document set in Spanish. These documents are medical histories related to stomach diseases. Such area should be considered as a narrow subset of medical records. The high quality of archived results (accuracy 80%-90%) allows us to recommend RUBRYX for similar applications.
Česky
RUBRYX je klasifikátor dokumentů vyvinutý v 2000s pro zpracování velkých objemů webových informací. RUBRYX používá vážený součet n-gramů (n = 1,2,3), získaný z velmi omezeného počtu vzorků (cca 5-10) a bere v úvahu jejich vzájemné pozice v daném textu. Tento sofistikovaný algoritmus se ukázal být velmi účinný při klasifikaci primárních lékařských záznamů prezentováných v formě volného textu. V příspěvku jsme studovali možnosti RUBRYX (verze 2.2) na omezeném množství dokumentů uvedených ve španělštině. Tyto dokumenty byly lékařské záznamy týkající se žaludečních onemocnění. Zjištěná klasifikační spolehlivost (přesnost 80% -90%) nám umožňuje doporučit RUBRYX pro podobné aplikace.