GÉRYK, Jan, Jaroslav BAYER a Lubomír POPELÍNSKÝ. Vyhledávání a analýza popisujících výjezdy hasičského záchranného sboru. In Sborník konference Znalosti 2011. Ostrava: VŠB–Technická univerzita Ostrava, 2011, s. 21-32, 10 s. ISBN 978-80-248-2369-0.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Vyhledávání a analýza popisujících výjezdy hasičského záchranného sboru
Název anglicky Retrieval and analysis of reports on a fire brigade operations
Autoři GÉRYK, Jan (203 Česká republika, domácí), Jaroslav BAYER (203 Česká republika, domácí) a Lubomír POPELÍNSKÝ (203 Česká republika, garant, domácí).
Vydání Ostrava, Sborník konference Znalosti 2011, od s. 21-32, 10 s. 2011.
Nakladatel VŠB–Technická univerzita Ostrava
Další údaje
Originální jazyk čeština
Typ výsledku Stať ve sborníku
Obor 10201 Computer sciences, information science, bioinformatics
Stát vydavatele Česká republika
Utajení není předmětem státního či obchodního tajemství
Forma vydání tištěná verze "print"
Kód RIV RIV/00216224:14330/11:00051703
Organizační jednotka Fakulta informatiky
ISBN 978-80-248-2369-0
Klíčová slova česky strojové učení; dolování v textu; hasičský záchranný sbor; klasifikace textů; předzpracování textů; lemmatizace
Klíčová slova anglicky machine learning; data mining; fireman brigade; text classification; text preprocessing; lemmatization
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnil: doc. RNDr. Lubomír Popelínský, Ph.D., učo 1945. Změněno: 9. 4. 2013 14:22.
Anotace
Článek se zabývá problematikou dohledávání textů na internetu dle informací o výjezdech hasičského záchranného sboru a následnou klasifikací získaných textů do různých kategorií. Databáze výjezdů obsahovala celkem 116 000 záznamů. Vybrali jsme 4110 záznamů podle závažnosti zásahu a pokusili se dohledat odpovídající texty na internetu. Úspěšní jsme byli v 2956 případech. Popisujeme metodu sběru textů a dolování ze získané textové informace. Nejvyšší celková správnost klasifikace textů do tříd dle typů výjezdu dosáhla 84 %, a podle geografického členění do krajů 60 %. Diskutujeme vhodnost různých metod strojového učení a vhodnost či nevhodnost lematizace.
Anotace anglicky
Retrieval and analysis of reports on a fire brigade operations. The article deals with the searching of texts on the internet based on the information obtained from the firemen database. The goal is to classify texts into several categories. We describe the methods of text collection and text mining. The highest overall classification accuracy - by the type of incident and geographic situation - reaches 86 % and 96 %. The given database consists of more than 116,000 records. We have tried to search and download texts describing about 4,000 selected events. We have succeeded in more than 2,900 cases.
Návaznosti
LA09016, projekt VaVNázev: Účast ČR v European Research Consortium for Informatics and Mathematics (ERCIM) (Akronym: ERCIM)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Účast ČR v European Research Consortium for Informatics and Mathematics
MSM0021622418, záměrNázev: DYNAMICKÁ GEOVIZUALIZACE V KRIZOVÉM MANAGEMENTU
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Dynamická geovizualizace v krizovém managementu
VytisknoutZobrazeno: 9. 5. 2024 22:31