Geoinformatika V - Sběr dat jaro 2020 Petr Kubíček kubicek@geogr.muni.cz Laboratory on Geoinformatics and Cartography (LGC) Institute of Geography Masaryk University Czech Republic Geoinformatika Způsob procházení rastru • A) a B) - alternativy postupného procházení. • C) a D) – prostor vyplňující křivky (space-fill). • B) a D) jsou více efektivní – souvislost s Toblerovým zákonem (First law of Geography, autokorelace). Everything is related with everything else, but near things are more related than distant things. Geoinformatika Quad tree - čtyřstrom • Hierarchické uložení • Dělení kvadrantů až do doby, kdy jsou homogenní. Geoinformatika Hlavička rastru • NCOLS xxx • NROWS xxx • XLLCORNER xxx • YLLCORNER xxx • CELLSIZE xxx • NODATA_VALUE xxx • row 1 • row 2 • . • . • row n Geoinformatika Příklady rastrových formátů Geoinformatika Nepravidelná trojúhelníková síť • Nepravidelné rastrové reprezentace - problémy s tvorbou, analýzou i uložením – prakticky se nepoužívají. • Výjimkou je Nepravidelná trojúhelníková síť (Triangulated Irregular Network) • Reprezentuje povrch jako soubor trojúhelníků (trojúhelníková), které jsou definovány třemi body umístěnými kdekoliv v prostoru (nepravidelná) a pro tyto trojúhelníky uchovává topologické vztahy (síť). • Často se používá pro reprezentaci povrchů, například digitálního modelu reliéfu – DMR. Geoinformatika Reprezentace TIN Geoinformatika TIN - porovnání s rastry • složitost datové struktury a tím i algoritmů s ní pracujících. + • zmenšení objemu uložených údajů při reprezentaci nehomogenních povrchů, • větší přesnost a věrnost pro nehomogenní povrchy • struktura automaticky obsahuje informace o sklonu a směru tohoto sklonu. Geoinformatika Datové modely - shrnutí Vektorová data • geometrie prostorových objektů je vyjádřena za použití geometrických elementů; • základními geometrickými elementy jsou: bod, linie, polygon; • je možné pracovat s jednotlivými objekty jako se samostatnými celky; • atributy prostorových objektů jsou připojeny pomocí tabulky; • vztah mezi prostorovou objekty je zajištěný pomocí topologie; Rastrová data • rovinný prostor je rozdělen pravidelnou mřížkou na jednotlivé dílky, zvané buňky (pixely); • poloha pixelu je dána jeho souřadnicemi (umístění v rastru); • každý pixel má v sobě jedinou hodnotu atributu; • prostorové vztahy mezi objekty jsou obsaženy v rastru. Geoinformatika Kahoot SBĚR DAT Geoinformatika Zdroje prostorových dat pro GIS • Naplňování databáze je v drtivé většině případu jednoznačně nejnáročnějším a nejzdlouhavějším krokem v rámci GIS projektu. • Obecně lze pro vstup použít různé zdroje údajů. • V úvahu přicházejí zvláštně mapy, náčrty v souřadnicovém systému, údaje z geodetických měření, fotogrammetrické snímky a obrazové záznamy DPZ, statistické údaje a další. • Při pořizování dat je ale důležité vybrat vhodný způsob a vhodná technická zařízení, která mi umožní získat data ve vhodné přesnosti a za přijatelnou cenu. • V zásadě je možné zdroje dat rozdělit na primární a sekundární. Geoinformatika Zdroje prostorových dat pro GIS • Primární – přímo měřená data – terestrická (pozemní/geodetická) měření – Globální polohové systémy (GPS, Glonass,…) – Fotogrammetrie – Dálkový průzkum Země (DPZ) – Laserové skenování (LIDAR) • Sekundární – již jednou zpracovaná data – manuální vstup přes klávesnici – digitalizace – skenování a vektorizace Geoinformatika Zdroje prostorových dat pro GIS Geodetická data Geoinformatika Zdroje prostorových dat pro GIS Geoinformatika Zdroje prostorových dat pro GIS - GNSS Global Navigation Satellite Systém (GNSS) – Globální družicový polohový systém • GPS NAVSTAR (Spojené státy americké) • GLONASS (Ruská federace) • Galileo (Evropská unie) • Baidu (Čína) Rádiový dálkoměrný systém Geoinformatika Segmenty GNSS • Uživatelský • Řídící • Vesmírný • GPS přijímač počítá rozdíly mezi vlastním časem a časem uvedeným v signálu družic pro zjištění vzdálenosti a polohy. • Vlivy atmosféry, povrchu, pohybu. Geoinformatika Vliv počtu satelitů na určení polohy • 1 satelit = vzdálenost GNSS – satelit • Minimum 4 satelity Geoinformatika GNSS přesnost – jeden přijímač • navigační +/- 10m (ale až 40) • „GIS“ i submetrová přesnost – geodetická souprava, či geodetická aparatura v síti referenčních stanic – cm/mm • statická metoda (více přijímačů, dlouho, postprocessing) • RTK (Real Time Kinematic) – jeden přijímač, korekce z permanentních referenčních stanic. Geoinformatika Další charakteristiky GNSS dat – Po zpracování jsou GPS data ve tvaru souboru [X,Y,Z] souřadnic a ty většina systémů umožní snadno zpracovat. – GPS se hojně používá pro navigaci, sledování objektů (vozidel, …) v reálném čase a analýzy v GIS na jejich základě. – GPS udává geografické souřadnice v souřadnicovém systému WGS 84, tudíž pro použití v ČR je nutné u získaných dat většinou převést data do jiného souřadnicového systému (S-JTSK). – produkuje vektorová data. Geoinformatika Laserové skenování Lidar • Light Detection and Ranging (LIDAR) • Princip LIDAR je postaven na aktivním senzoru, který vyšle laserový paprsek a zaznamená jeho zpětný odraz. • Odrazů může být několik, první je považován za digitální model povrchu (DMP, DSM – digital surface model). Poslední odraz je pak považován za digitální model reliéfu (DMR, DTM – digital terrain model). • Teprve potom se senzor otočí a zaznamenává další bod! • Existují letecké a pozemní scannery! Geoinformatika Lidar • Digitální model povrchu x model reliéfu Pokryté oblasti DMP DMR Geoinformatika Geoinformatika LLS - problémy Geoinformatika Horizontální skenování Geoinformatika Sekundární zdroje dat • Sekundární zdroje dat jsou již jednou zpracované primární zdroje • => jsou v nich obsaženy chyby získané již během prvního zpracování dat, tudíž nemohou být přesnější než zpracovávané primární zdroje. • Možnosti jejich vstupu do GIS – manuální vstup přes klávesnici (pracné, zdlouhavé) – digitalizace – skenování a vektorizace – import dat. Geoinformatika Manuální digitalizace • Využívá se tablet-digitizér, což je zařízení na snímání souřadnic s různě velkou pracovní plochou (obvykle A3-A0) a různou rozlišovací schopností a přesností . • Je třeba kalkulovat i s měřítkem podkladu! • Princip digitalizace – snímaný podklad se upevní na pracovní plochu a pomocí zaměřovacího kříže (kurzoru) je snímána poloha zaměřovaných bodů a z klávesnice nebo pomocí kurzoru se zadává identifikátor objektu. dvě základní metody digitalizace: – bodová (point) - kliká se na každém vrcholu, který je třeba zaznamenat. – proudová (stream) - počítač automaticky zaznamenává sekvence bodů v zadaném časovém nebo vzdálenostním intervalu. Geoinformatika Skenování a vektorizace • Stále rozšířenějším způsobem převodu dat z analogové do digitální (rastrové) formy. • zařízeních sloužících k optickému snímání dokumentů. • Typy skenerů: – Bubnové – Deskové (stolní) – Posuvné velkoformátové – 3D Geoinformatika Skenery • Nejdůležitějšími hodnotícími ukazateli jsou: – optické rozlišení (body na palec - Dots Per Inch, dpi), – přesnost - souvisí s tím, jak precizně je vyroben snímací senzor, tj. jak pravidelně jsou na něm umístěny snímací prvky, – barevnost či šedotónovost. 300 DPI 600 DPI Geoinformatika Manuální zadávání atributů • Nejběžnější způsob zadávání atributových dat je manuálně, pomocí klávesnice, na což stačí pouze jednoduchý hardware. • Možné problémy s integritou dat – lze kontrolovat. • Atributy se následně navazují na prostorovou část pomocí unikátního identifikátoru, který prostorové prvky již obsahují (vytváří se obvykle již při jejich tvorbě). • Kontrola správnosti zadaných údajů. – Single Key Data Entry - jeden operátor zadává atributová data a druhý operátor již zadaná data kontroluje (porovnává originál s vytištěnými výpisy, …). – Double Key Data Entry - atributová data jsou zadávána dvěma na sobě nezávislými operátory (každý zadává stejná data) a poté se obě varianty v počítači porovnají. Při nalezení rozdílných hodnot se zadaný atribut překontroluje a opraví. Metoda se používá spíše na větší projekty, u kterých velice záleží na správnosti zadaných údajů. Geoinformatika Skenování + rozpoznávání textu • Další možností je scannování textu obsahující žádané atributy a poté jeho automatizované rozpoznávání pomocí nějakého OCR (Optical Character Recognition - nástroje na rozpoznávání písma) software. • Tato metoda, ačkoli relativně velice rychlá, je stále úspěšná jen z části a je možné ji aplikovat většinou pouze na již tištěný text (i z psacího stroje). Po automatickém převodu je navíc nutné vše pečlivě zkontrolovat (podobně jako u manuálního zadání pomocí metody Single Key Data Entry). • Problémy s diakritikou. • Další nevýhodou je obvyklá nutnost ručního navazování atributů na prostorovou část, podobně jako u ručního zadávání dat. Geoinformatika Převod z jiných zdrojů • Kritéria pro volbu vhodnosti či nevhodnosti zdroje: – Formát souboru - mám možnost ho použít/importovat, případně existuje konverzní program? – Přenosové médium - na čem budu data přenášet? (CDROM, disketa, DAT pásek, síť). Toto kritérium je důležité hlavně v případě přenosu dat velkých objemů, například letecké snímky. – Tematický obsah dat - jsou v datech obsaženy všechny prvky co potřebuji? – Měřítko a přesnost - jsou data v požadovaném měřítku a přesnosti ? – Časový interval pořízení - kdy byla data pořízena a k jakému časovému intervalu se vztahují? – Souřadnicový systém - v jakém SS byla data pořizována? Mohu takový souřadnicový systém využít (případně mohu provést transformaci do mnou používaného souřadnicového systému)? – Kompatibilita datových modelů - např. problematika převodu křivek při převodu z CAD do GIS nebo i z GIS do GIS, převod formátu atributů. – Cena - …