2011
Vyhledávání a analýza popisujících výjezdy hasičského záchranného sboru
GÉRYK, Jan, Jaroslav BAYER a Lubomír POPELÍNSKÝZákladní údaje
Originální název
Vyhledávání a analýza popisujících výjezdy hasičského záchranného sboru
Název anglicky
Retrieval and analysis of reports on a fire brigade operations
Autoři
GÉRYK, Jan (203 Česká republika, domácí), Jaroslav BAYER (203 Česká republika, domácí) a Lubomír POPELÍNSKÝ (203 Česká republika, garant, domácí)
Vydání
Ostrava, Sborník konference Znalosti 2011, od s. 21-32, 10 s. 2011
Nakladatel
VŠB–Technická univerzita Ostrava
Další údaje
Jazyk
čeština
Typ výsledku
Stať ve sborníku
Obor
10201 Computer sciences, information science, bioinformatics
Stát vydavatele
Česká republika
Utajení
není předmětem státního či obchodního tajemství
Forma vydání
tištěná verze "print"
Kód RIV
RIV/00216224:14330/11:00051703
Organizační jednotka
Fakulta informatiky
ISBN
978-80-248-2369-0
Klíčová slova česky
strojové učení; dolování v textu; hasičský záchranný sbor; klasifikace textů; předzpracování textů; lemmatizace
Klíčová slova anglicky
machine learning; data mining; fireman brigade; text classification; text preprocessing; lemmatization
Příznaky
Mezinárodní význam, Recenzováno
Změněno: 9. 4. 2013 14:22, doc. RNDr. Lubomír Popelínský, Ph.D.
V originále
Článek se zabývá problematikou dohledávání textů na internetu dle informací o výjezdech hasičského záchranného sboru a následnou klasifikací získaných textů do různých kategorií. Databáze výjezdů obsahovala celkem 116 000 záznamů. Vybrali jsme 4110 záznamů podle závažnosti zásahu a pokusili se dohledat odpovídající texty na internetu. Úspěšní jsme byli v 2956 případech. Popisujeme metodu sběru textů a dolování ze získané textové informace. Nejvyšší celková správnost klasifikace textů do tříd dle typů výjezdu dosáhla 84 %, a podle geografického členění do krajů 60 %. Diskutujeme vhodnost různých metod strojového učení a vhodnost či nevhodnost lematizace.
Anglicky
Retrieval and analysis of reports on a fire brigade operations. The article deals with the searching of texts on the internet based on the information obtained from the firemen database. The goal is to classify texts into several categories. We describe the methods of text collection and text mining. The highest overall classification accuracy - by the type of incident and geographic situation - reaches 86 % and 96 %. The given database consists of more than 116,000 records. We have tried to search and download texts describing about 4,000 selected events. We have succeeded in more than 2,900 cases.
Návaznosti
LA09016, projekt VaV |
| ||
MSM0021622418, záměr |
|