Geoinformatika II – GIS jako zpracování dat jaro 2020 Petr Kubíček kubicek@geogr.muni.cz Laboratory on Geoinformatics and Cartography (LGC) Institute of Geography Masaryk University Czech Republic Geoinformatika Co je geoinformatika? • Věda o zpracování geografické (prostorové) informace – Geografická informace je soubor poznatků o nějakém jevu (události, předmětu, procesu…) jehož součástí je vymezení tohoto jevu vůči (zemskému) povrchu. • Technologický základ geoinformačních věd – Kartografie, dálkový průzkum Země (DPZ, RS), geodézie (sruveying). Geoinformatika Proč GIS? Rozdílné: •Zdroje •Umístění •Měřítko •Zobrazení •Legenda Půdy Geologie Geoinformatika Co je to GIS? • Co je to informační systém? • Informační systém je soubor hardware a software na získávání, uchovávání, spojování a vyhodnocování informací. • Informační systém se skládá ze zařízení na zpracování dat, systému ukládání dat (báze) a vyhodnocovacích programů. • Co je geografický??  Geoinformatika Co je to GIS? • Geografický informační systém • Je informační systém pracující oproti klasickým informačním systémům navíc i s prostorovou složkou dat. • Také lze říci, že je výkonným nástrojem geověd, tedy že metody těchto věd umožňuje efektivně implementovat v počítačovém prostředí. • Předmět výzkumu geoinformatiky. Geoinformatika Co je to GIS • Několik definic, ale GIS můžeme popsat i výčtem základních otázek, které je možné řešit s pomocí GIS. • GIS nám umožní hledat odpovědi na následující otázky: – Co se nachází na ...? – Kde se nachází ...? – Jaký je počet ...? – Co se změnilo od ...? – Co je příčinou ...? – Co když ...? – DESKRIPCE x PREDIKCE Geoinformatika Členění GIS Podle různých kritérií: • Strukturální komponenty GIS • Funkční komponenty GIS • Koncepční přístupy k GIS Geoinformatika Členění GIS Strukturální komponenty GIS • Hardware • Software • Data • Lidé • Metody Geoinformatika Členění GIS Funkční komponenty GIS • Vstup dat. • Zpracování a uchování dat. • Vykonávání analýz a syntéz z využitím prostorových vztahů - jádro GIS, tedy to co nejvíce odlišuje GIS a jiné IS. • Prezentace výsledků (výstupy grafické mapy, negrafické - zprávy, souhrnné tabulky, statistická vyhodnocení, …). • Interakce s uživatelem (desktop GIS, Web GIS). Geoinformatika GIS životní cyklus dat Geoinformatika Definice GIS(?) • Pro GIS neexistuje jednotná definice, proto si jich uvedeme několik (mezinárodní): • GIS je soubor prostředků pro sběr, ukládání, vyhledávání, transformaci, analyzování a zobrazování prostorových údajů z reálného světa z hlediska: 1. jejich polohy vzhledem k souřadnicovému systému; 2. jejich popisných – atributových vlastností; 3. jejich topologie. (Burrough, 1986) • GIS je organizovaný soubor počítačového hardwaru, softwaru a geografických údajů navržený na efektivní získávání, ukládání, upravování, správu, analyzování a zobrazování všech forem geografických informací. (ESRI) Geoinformatika Definice GIS Národní: • GIS je kolekce počítačového technického vybavení, programového vybavení geografických údajů a personálu, určená k účinnému sběru, ukládání, údržbě, manipulaci, analýze a zobrazování všech forem geograficky vztažené informace (Neumann, 1996). • Geoinformatika je vědecká a technická disciplína, jejímž předmětem jsou prostorové údaje a která se soustřeďuje na jejich sběr, ukládání, manipulaci s nimi a jejich zprostředkování (Neumann, 1996). • Závěry vycházející z definic: GIS netvoří pouze software, ale i ostatní komponenty jako data, hardware, personál a způsob použití. Geoinformatika GIS a okolní svět Vztah GIS a ostatních oborů lidské činnosti Geoinformatika Je GIS přínosný? • Proč vůbec používat GIS? – 80 % dat lze prostorově lokalizovat. • Příklady využití GIS: – mapové portály, služby, – obchod, – ochrana proti pohromám – krizové řízení, – správa inženýrských sítí (distribuční společnosti), – životní prostředí, – veřejná správa (ministerstva, kraje, města), – školství. Historie GIS • V 50. letech 20. století začaly pokusy s automatizovaným mapováním za využití výpočetní techniky. • V roce 1963 zavedl pojem GIS Kanaďan R. F. Tomlinson a označil tak nové technologie pracující s daty a podávajícími informaci o terénu pomocí výpočetní techniky. ??Jak dostat mapu do počítače?? Historie GIS • Pionýrské období (konec 60. let až 1975) hlavně průkopnické práce, univerzity - důraz na digitální kartografii. • 1975- začátek 80. let - ujednocení pokusů s institucemi na lokální úrovni - první LIS. • 1982 - konec 80. let - komercionalizace problematiky – běžně dostupné softwarové systémy pro GIS (ESRI, Intergraph, …), první systémy založené na CAD (systémy před tím měly minimální grafické možnosti). Autocarto, EuroCarto (1987 Brno). • 1986 – P. Burrough - učebnice GIS; Konečný a Rais – GIS v ČR (1985). Historie GIS • NCGIA – National Centre for Geographic Information and Analysis;GI science (USA). Změna pojetí GIS jako nástroje (research with GIS) na přijetí GIS jako výzkumného směru (research about GIS – spatial information theory). • 90. léta - počátky standardizace, uživatelské GIS, Desktop GIS, otevřené systémy (Open GIS), Internet. • Výuka GIS v Č(SS)R – Brno, Ostrava, Olomouc… • AGILE; Conference on Spatial Information Theory (COSIT). • Současnost - vzdálený přístup přes Internet/Intranet/Cloud, webové služby, sociální sítě, geoparticipace (VGI), 3D GIS, strojové učení. • Mobilní GIS ... Komplexní GIS schéma TEORETICKÉ POJETÍ GIS Pohledy na reálný svět Tři základní pohledy - Objektový , Jevový, Procesní Jevový a procesní pohled • Dělení jevů – kvalitativní x kvantitativní; statické x dynamické; kontinuální x diskrétní. • Procesní pohled – vnáší do reálného světa dynamiku a ovlivňuje jak jevy, tak objekty. • Pro modelování jevů a objektů využívá geoinformatika odlišné datové modely. Geoinformatika Modelování geografických objektů • V geoinformatice se nezaobíráme reálnými objekty, ale z důvodu zjednodušené reprezentace - modelem reality. • Modelování - abstrahování týkající se všech součástí geografické informace: – geometrické, – topologické, – tematické – dynamické. Geoinformatika Proces modelování • modelování – je proces abstrakce, při kterém jsou podstatné elementy reálného světa zdůrazněny a nepodstatné eliminovány (s ohledem na cíl, který má toto modelování splnit): – úmyslně – zobrazují se jen ty elementy, které jsou předmětem zkoumání, ostatní se potlačují; – neúmyslně – v dané fázi poznání jsou nedostupné či nepoznatelné. • Principem modelování je snaha o poznání vlastností studované části reality. Geoinformatika GIS jako obraz reálného světa (Rapant) • Reálný svět je pozorován pozorovatelem. Ten vytváří na základě svých vjemů vnitřní (mentální model) tohoto světa. • Mentální model je velmi blízký reálnému světu, ale vždy je tu jisté zjednodušení. • Pro převedení mentálního modelu do GISu je potřeba ji zdigitalizovat. Jednotlivé prostorové prvky (geoprvky) jsou nahrazeny základními geometrickými prvky a ty jsou dále tříděny podle tématu do jednotlivých vrstev. Geoinformatika GIS jako obraz reálného světa Výsledný obraz reálného světa v GISu je: • složen z bodů, linií a polygonů (geometrie) • roztříděných do jednotlivých vrstev (tematika) • dvourozměrný • statický • zjednodušený (chybí mnoho informací) • obsahuje mnoho chyb a nepřesností vzniklých z převodem reality do podoby GIS. Geoinformatika Složky geografických dat • Neprostorová složka (tzv. Atributy) – Čísla – kvantitativní hodnoty – Řetězce znaků – kvalitativní hodnoty – Datum – časové určení – Komplementární atributy – linky, videa, dokumenty … • Časový aspekt odráží změnu jevu v čase (od jednoho záznamu ke druhému) • Prostorová složka (tzv. Geometrie) – tvar – poloha – topologie Všechny měřitelné nebo popsatelné vlastnosti reálných entit spadají do jednoho z aspektů: prostoru (KDE), tématu (CO) nebo času (KDY). Geoinformatika Neprostorová složka - atributy Popisující geografické objekty a jejich vlastnosti Typy atributových dat • poměr - např. procenta • interval - např. celá čísla z intervalu (0,10), desetinná čísla z intervalu (0.5-14.0) • pořadí (ordinální) - řadová číslovka • výčet (nominální) - např. pro typ silnice to může být (dálnice, rychlostní silnice, silnice 1.třídy, silnice 2.třídy, ostatní silnice) Příklad: • Objekt = lesní porost • Atribut = dřevinná skladba, průměrná výška porostu, věková struktura, apod. • Atributy jsou neprostorové (nereprezentují informaci o lokalizaci či o prostorových vztazích), mají vytvořenou vazbu na prostorové prvky atributové hodnoty, reprezentující kvalitu geografického objektu, nelze vždy měřit nebo udávat v jednotném měřítku. • Př. Borovicový porost není nikdy 100% složen pouze z borovice. Při analýzách to nevadí, ale je nutno s touto skutečností počítat (míry kvality). Geoinformatika Časová složka • Čas – dynamický popis – dynamika charakterizuje časovou variabilitu geografických objektů. – tyto změny se mohou týkat geometrie, topologie i tematického popisu. • Modelování dynamických prostorových procesů v rozměrném prostoru vyžaduje složité modely a metody. V praxi se ale používá zjednodušení: • 1. Analýza časové série na jednom měřícím bodě - časová změna. • 2. Prostorová změna atributové hodnoty mezi dvěma body v tom samém čase - prostorová změna. Geoinformatika Prostorová složka - tvar • Dvě chápání prostoru – vektorový a rastrový – Jev –> jeho vymezení -> hranice -> objekty • Kartografický model reality – Bod, Linie, Plocha • Uspořádaný soubor souřadnic - VEKTOR. – Prostor -> jeho rozdělení -> jaký jev je přítomen v dílu • Vzorkování • Různé druhy členění podle charakteru buněk – Pravidelnost, komplexita • Matice hodnot – u pravidelného a jednoduchého členění - RASTR. Geoinformatika Datové modelování – vektorová reprezentace Bod – nemá délku, hloubku ani šířku - bezrozměrný (0D) prvek – je jednotlivý pár souřadnic X, Y, reprezentující geografický prvek – je příliš malý na to, aby byl zobrazen jako linie či plocha. Geoinformatika Typy geometrických objektů - linie Linie – má délku, ale nemá šířku ani hloubku - jednorozměrný (1D) geografický prvek; – je sled orientovaných úseček (hran) definovaných souřadnicemi vrcholů (vertex) mezi dvěma uzly (nodes); – tvar reprezentovaného geografického prvku je příliš úzký na to, aby mohl být zobrazen jako plocha. Geoinformatika Typy geometrických objektů - plocha • Polygon (plocha) – mají délku a šířku, ale nemají hloubku - dvojrozměrný (2D) geografický prvek; – je uzavřený obrazec, jehož hranicí je uzavřená linie. – První a poslední vrchol jsou stejné. Geoinformatika Sítě • systém linií s topologickou strukturou; • je řada vzájemně propojených linií, podél níž probíhá tok informací. Povrchy • je to souvislá entita, pro kterou v každém bodě existuje nějaká hodnota (2,5 D) x,y,z. Objemy • mají všechny rozměry (délku, šířku, hloubku) - trojrozměrné (3D) geografické prvky. Geoinformatika Špagetový datový model • Nejjednodušší – CAD, CAM. • Objekt na mapě se reprezentuje jedním logickým záznamem v souboru a je definovaný jako řetězec x,y souřadnic. •Nevýhody - ačkoli jsou všechny objekty v prostoru definovány, struktura neposkytuje informace o vztazích mezi objekty. •Společná linie je pro každý polygon ukládána dvakrát. •Pro většinu prostorových analýz je tento model nevhodný, protože veškeré potřebné prostorové vztahy musí být spočítány před každou analýzou. Geoinformatika Topologický datový model • V tomto modelu každá linie začíná a končí v bodě nazývaném uzel - node. • Dvě linie se mohou protínat opět jenom v uzlu. Každá část linie je uložena s odkazem na uzly a ty jsou uloženy jako soubor souřadnic x,y. Ve struktuře jsou ještě uloženy identifikátory označující pravý a levý polygon vzhledem k linii. Tímto způsobem jsou zachovány základní prostorové vztahy •Použitelné pro analýzy. Navíc tato topologická informace umožňuje body, linie a polygony uložit v neredundantní podobě (bez opakovaného zápisu). Geoinformatika Geoinformatika Vektorová reprezentace - topologie • Topologie je matematický způsob, jak explicitně vyjádřit prostorové vztahy mezi jednotlivými geometrickými objekty. • Proč vůbec topologie? Má jisté výhody, například: – Umožní ukládat data efektivněji. – Mnoho analýz v GIS využívá pouze topologické a nikoli geometrické vztahy. • Důvod pro využívání topologie (ESRI 1995): • "Topology is useful in GIS because many spatial modeling operations don't require coordinates, only topological information. For example, to find an optimal path between two points requires a list of the arcs that connect to each other and the cost to traverse each arc in each direction. Coordinates are only needed for drawing the path after it is calculated." Geoinformatika Tři základní topologické koncepty • Konektivita – dvě linie se na sebe napojují v uzlech. • Definice plochy – linie, které uzavírají nějakou plochu, definují polygon. • Sousednost - linie mají směr a nesou informaci o objektech nalevo a napravo od nich.