2006
Dolování v geografických textech
BLAŤÁK, Jan, Lubomír POPELÍNSKÝ a Peter KRUTÝZákladní údaje
Originální název
Dolování v geografických textech
Název česky
Dolování v geografických textech
Název anglicky
Mining in geographical texts
Autoři
BLAŤÁK, Jan (203 Česká republika, garant), Lubomír POPELÍNSKÝ (203 Česká republika) a Peter KRUTÝ (703 Slovensko)
Vydání
1. vyd. Brno, Geoinformatika ve veřejné správě, od s. 67-67, 13 s. 2006
Nakladatel
CAGI
Další údaje
Jazyk
čeština
Typ výsledku
Stať ve sborníku
Obor
10201 Computer sciences, information science, bioinformatics
Stát vydavatele
Česká republika
Utajení
není předmětem státního či obchodního tajemství
Kód RIV
RIV/00216224:14330/06:00017158
Organizační jednotka
Fakulta informatiky
ISBN
80-86633-50-0
Klíčová slova anglicky
text filtration; information extraction; term extraction
Změněno: 1. 1. 2007 17:14, doc. RNDr. Lubomír Popelínský, Ph.D.
V originále
Metody dolování v textu, tj. objevování skrytých souvislostí a znalostí, se dnes úspěšně využívají v řadě oblastí informatiky. V tomto příspěvku se zaměříme na možnosti dolování v textech popisující časově-prostorové vztahy. Zaměříme se především na texty o živelných katastrofách. Na příkladu zpráv o povodních popíšeme způsob, jak pomocí metod strojového učení automaticky klasifikovat části textu jako popis situace nebo jako popis prováděných akcí. Navrhneme jak vhodné metody předzpracování textů pomocí metod zpracování přirozeného jazyka tak nejvhodnější algoritmus strojového učení. Popíšeme způsob, jak pomocí získaných výsledků nalézt důležité pojmy (pojmenované entity). Uvedeme i alternativní způsob, tvorbu ontologií. Na závěr navrhneme metodu pro hlubší sémantickou analýzu textů vedoucí k redukované reprezentaci znalostí a umožňující odvozování znalostí nových a také predikci.
Anglicky
This paper describes methods for mining spatio-temporal relation from text data. We will cope with text describing disasters. We will show how machine learning can be utilized for labeling chunks of text related to floods into two classes - situations and performed actions. We will propose appropriate natural language processing methods for data preparation. We introduce a method for extracting important terms based on mined knowledge.
Návaznosti
MSM0021622418, záměr |
|