D 2011

Vyhledávání a analýza popisujících výjezdy hasičského záchranného sboru

GÉRYK, Jan, Jaroslav BAYER a Lubomír POPELÍNSKÝ

Základní údaje

Originální název

Vyhledávání a analýza popisujících výjezdy hasičského záchranného sboru

Název anglicky

Retrieval and analysis of reports on a fire brigade operations

Autoři

GÉRYK, Jan (203 Česká republika, domácí), Jaroslav BAYER (203 Česká republika, domácí) a Lubomír POPELÍNSKÝ (203 Česká republika, garant, domácí)

Vydání

Ostrava, Sborník konference Znalosti 2011, od s. 21-32, 10 s. 2011

Nakladatel

VŠB–Technická univerzita Ostrava

Další údaje

Jazyk

čeština

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

tištěná verze "print"

Kód RIV

RIV/00216224:14330/11:00051703

Organizační jednotka

Fakulta informatiky

ISBN

978-80-248-2369-0

Klíčová slova česky

strojové učení; dolování v textu; hasičský záchranný sbor; klasifikace textů; předzpracování textů; lemmatizace

Klíčová slova anglicky

machine learning; data mining; fireman brigade; text classification; text preprocessing; lemmatization

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 9. 4. 2013 14:22, doc. RNDr. Lubomír Popelínský, Ph.D.

Anotace

V originále

Článek se zabývá problematikou dohledávání textů na internetu dle informací o výjezdech hasičského záchranného sboru a následnou klasifikací získaných textů do různých kategorií. Databáze výjezdů obsahovala celkem 116 000 záznamů. Vybrali jsme 4110 záznamů podle závažnosti zásahu a pokusili se dohledat odpovídající texty na internetu. Úspěšní jsme byli v 2956 případech. Popisujeme metodu sběru textů a dolování ze získané textové informace. Nejvyšší celková správnost klasifikace textů do tříd dle typů výjezdu dosáhla 84 %, a podle geografického členění do krajů 60 %. Diskutujeme vhodnost různých metod strojového učení a vhodnost či nevhodnost lematizace.

Anglicky

Retrieval and analysis of reports on a fire brigade operations. The article deals with the searching of texts on the internet based on the information obtained from the firemen database. The goal is to classify texts into several categories. We describe the methods of text collection and text mining. The highest overall classification accuracy - by the type of incident and geographic situation - reaches 86 % and 96 %. The given database consists of more than 116,000 records. We have tried to search and download texts describing about 4,000 selected events. We have succeeded in more than 2,900 cases.

Návaznosti

LA09016, projekt VaV
Název: Účast ČR v European Research Consortium for Informatics and Mathematics (ERCIM) (Akronym: ERCIM)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Účast ČR v European Research Consortium for Informatics and Mathematics
MSM0021622418, záměr
Název: DYNAMICKÁ GEOVIZUALIZACE V KRIZOVÉM MANAGEMENTU
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Dynamická geovizualizace v krizovém managementu