2006
Mining actions from reports on flood
POPELÍNSKÝ, Lubomír a Jan BLAŤÁKZákladní údaje
Originální název
Mining actions from reports on flood
Název česky
Dobývání akcí ze zpráv o záplavách
Autoři
POPELÍNSKÝ, Lubomír (203 Česká republika, garant) a Jan BLAŤÁK (203 Česká republika)
Vydání
Ljubljana, Proceedings of IS-LTC'06, od s. 35-40, 6 s. 2006
Nakladatel
Jožef Stefan Institute
Další údaje
Jazyk
angličtina
Typ výsledku
Stať ve sborníku
Obor
20200 2.2 Electrical engineering, Electronic engineering, Information engineering
Stát vydavatele
Slovinsko
Utajení
není předmětem státního či obchodního tajemství
Kód RIV
RIV/00216224:14330/06:00018058
Organizační jednotka
Fakulta informatiky
ISSN
Klíčová slova anglicky
text filtering; information extraction; term extraction
Příznaky
Mezinárodní význam, Recenzováno
Změněno: 27. 6. 2008 14:21, doc. RNDr. Lubomír Popelínský, Ph.D.
V originále
This paper focuses on mining in short reports that describe a situation in a given area and actions performed as reaction to that situation. Such texts are frequent in crisis management in situations like earthquake, fire or flood. For further analysis it is necessary to filter the relevant pieces of text. We found that common machine learning algo rithms fail for filtering such sentences. We describe a novel method based on inductive logic programming which yields in high precision and recall. This method has been successfully used for analysis of reports on flood in Central Europe in 2002. We also discuss different domain knowledge and also various natural language processing tools that we used for preprocessing the documents.
Česky
Clanek se osredotoca na rudarjenje po dokumentih, ki opisujejo razmere v dolocenem obmocju in delovanje kot posledico tovrstnih razmer. Taka besedila so pogosta v kriznem menedzmentu, v razmerah, kot so potresi, pozari ali poplave. Za nadaljno analizo je potrebno filtrirati doloceno informacijo. Pri razvrscanju besedil se ponavadi dobro obnesejo algoritmi strojnega ucenja, kot je naivni Bayesov klasifikator. Ugotovili smo, da pri filtriranju stavkov, ki opisujejo delovanje, ti algoritmi niso uspesni. Opisemo novo metodo, ki temelji na induktivnem logicnem programiranju in daje rezultate z visoko tocnostjo in pokritjem. Metoda je bila uspesno uporabljena pri analizi porocil o poplavah v Srednji Evropi l. 2002. Prav tako razpravljamo o razlicnih specializiranih znanjih in orodjih za obdelavo naravnega jezika, ki smo jih uporabili pri procesiranju dokumentov.
Návaznosti
MSM0021622418, záměr |
|