D 2006

Dolování v geografických textech

BLAŤÁK, Jan, Lubomír POPELÍNSKÝ a Peter KRUTÝ

Základní údaje

Originální název

Dolování v geografických textech

Název česky

Dolování v geografických textech

Název anglicky

Mining in geographical texts

Autoři

BLAŤÁK, Jan (203 Česká republika, garant), Lubomír POPELÍNSKÝ (203 Česká republika) a Peter KRUTÝ (703 Slovensko)

Vydání

1. vyd. Brno, Geoinformatika ve veřejné správě, od s. 67-67, 13 s. 2006

Nakladatel

CAGI

Další údaje

Jazyk

čeština

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Kód RIV

RIV/00216224:14330/06:00017158

Organizační jednotka

Fakulta informatiky

ISBN

80-86633-50-0

Klíčová slova anglicky

text filtration; information extraction; term extraction
Změněno: 1. 1. 2007 17:14, doc. RNDr. Lubomír Popelínský, Ph.D.

Anotace

V originále

Metody dolování v textu, tj. objevování skrytých souvislostí a znalostí, se dnes úspěšně využívají v řadě oblastí informatiky. V tomto příspěvku se zaměříme na možnosti dolování v textech popisující časově-prostorové vztahy. Zaměříme se především na texty o živelných katastrofách. Na příkladu zpráv o povodních popíšeme způsob, jak pomocí metod strojového učení automaticky klasifikovat části textu jako popis situace nebo jako popis prováděných akcí. Navrhneme jak vhodné metody předzpracování textů pomocí metod zpracování přirozeného jazyka tak nejvhodnější algoritmus strojového učení. Popíšeme způsob, jak pomocí získaných výsledků nalézt důležité pojmy (pojmenované entity). Uvedeme i alternativní způsob, tvorbu ontologií. Na závěr navrhneme metodu pro hlubší sémantickou analýzu textů vedoucí k redukované reprezentaci znalostí a umožňující odvozování znalostí nových a také predikci.

Anglicky

This paper describes methods for mining spatio-temporal relation from text data. We will cope with text describing disasters. We will show how machine learning can be utilized for labeling chunks of text related to floods into two classes - situations and performed actions. We will propose appropriate natural language processing methods for data preparation. We introduce a method for extracting important terms based on mined knowledge.

Návaznosti

MSM0021622418, záměr
Název: DYNAMICKÁ GEOVIZUALIZACE V KRIZOVÉM MANAGEMENTU
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Dynamická geovizualizace v krizovém managementu