KRAUROVA, Olga, Mikhail ALEXANDROV and Aleš BOUREK. Classification of Primary Medical Records with RUBRYX-2: First Experience. Online. In Artificial Intelligence Methods and Techniques for Business and Engineering Aplications. 1st ed. Rzesow, Sofia: ITHEA, 2012, p. 56-70. ITHEA IBS ISC No.:26. ISBN 978-954-16-0058-0.
Other formats:   BibTeX LaTeX RIS
Basic information
Original name Classification of Primary Medical Records with RUBRYX-2: First Experience
Name in Czech Klasifikace lékařských dokumentů pomocí RUBRYX-2: První zkušenosti
Authors KRAUROVA, Olga (643 Russian Federation), Mikhail ALEXANDROV (643 Russian Federation) and Aleš BOUREK (203 Czech Republic, guarantor, belonging to the institution).
Edition 1st ed. Rzesow, Sofia, Artificial Intelligence Methods and Techniques for Business and Engineering Aplications. p. 56-70, 15 pp. ITHEA IBS ISC No.:26, 2012.
Publisher ITHEA
Other information
Original language English
Type of outcome Chapter(s) of a specialized book
Field of Study 10201 Computer sciences, information science, bioinformatics
Country of publisher Bulgaria
Confidentiality degree is not subject to a state or trade secret
Publication form electronic version available online
WWW kompletní publikace online
RIV identification code RIV/00216224:14110/12:00063613
Organization unit Faculty of Medicine
ISBN 978-954-16-0058-0
Keywords (in Czech) medicína klasifikace strojové učení zpracování přirozeného jazyka
Keywords in English natural language processing medical diagnostics document classification
Tags International impact, Reviewed
Changed by Changed by: Ing. Mgr. Věra Pospíšilíková, učo 9005. Changed: 10/4/2013 16:15.
Abstract
RUBRYX is a document classifier developed in 2000s for processing large volumes of Web information. RUBRYX uses weighted sum of n-grams (n=1,2,3) extracted from a very limited number of samples (about 5-10) and takes into account their mutual position in a given text. This sophisticated algorithm proves to be very effective in classifying primary medical records presented in a free text form. In the paper we study possibilities of RUBRYX (version 2.2) on a limited document set in Spanish. These documents are medical histories related to stomach diseases. Such area should be considered as a narrow subset of medical records. The high quality of archived results (accuracy 80%-90%) allows us to recommend RUBRYX for similar applications.
Abstract (in Czech)
RUBRYX je klasifikátor dokumentů vyvinutý v 2000s pro zpracování velkých objemů webových informací. RUBRYX používá vážený součet n-gramů (n = 1,2,3), získaný z velmi omezeného počtu vzorků (cca 5-10) a bere v úvahu jejich vzájemné pozice v daném textu. Tento sofistikovaný algoritmus se ukázal být velmi účinný při klasifikaci primárních lékařských záznamů prezentováných v formě volného textu. V příspěvku jsme studovali možnosti RUBRYX (verze 2.2) na omezeném množství dokumentů uvedených ve španělštině. Tyto dokumenty byly lékařské záznamy týkající se žaludečních onemocnění. Zjištěná klasifikační spolehlivost (přesnost 80% -90%) nám umožňuje doporučit RUBRYX pro podobné aplikace.
PrintDisplayed: 15/10/2024 14:44