Geoinformatika III. Rastrový datový model jaro 2021 Petr Kubíček kubicek@geogr.muni.cz Laboratory on Geoinformatics and Cartography (LGC) Institute of Geography Masaryk University Czech Republic Rastrová reprezentace • Zaměřuje se na lokalitu jako na celek • Používá se pro reprezentaci jevů, které plošně pokrývají celou oblast, případně se i spojitě mění. • Používá se i pro rasterizované vektorové vrstvy, pokud je následná analýza jednodušší nad rastrem. • RAVE - VERA Rastrová reprezentace • Základním stavebním prvkem je u rastrové struktury tzv. buňka (cell, pixel). • Buňky jsou organizovány do mozaiky. • Jednotlivé buňky obsahují hodnoty (values). • Typy tvarů buněk: – čtvercová buňka (lattice, grid) – trojúhelníková buňka, – hexagonální buňka. Typy rastrové reprezentace Rastrovou reprezentaci můžeme rozlišit podle způsobu dělení prostoru na: • pravidelné (regular) - všechny buňky mají stejnou velikost a tvar. – jednodušší pro ukládání a zpracování údajů, zabírají ovšem na disku mnoho místa. • nepravidelné (irregular) - velikost i tvar jednotlivých buněk se liší. – mohou mnohem lépe reprezentovat danou lokalitu (příklad roviny + zvlněná krajina), – zpracovávání je algoritmicky i výpočetně náročné. Hlavně pro DMR. Topologie v rastru • Topologie je v rastrovém modelu definována implicitně (je jasné, kdo je čí soused), tudíž není nutné ji explicitně ukládat jako pro vektorový model! Reprezentace geometrie v rastru • rastrová datová struktura může nést informace o bodech, liniích a plochách. • Odlišné možnosti převodu mezi vektorem a rastrem. Faktory ovlivňující vyjádření v rastru - rozlišení • Vliv velikosti buňky (~ rozlišení) na tvar objektů (+ a -) PRO PROTI PROTI PRO Faktory ovlivňující vyjádření v rastru – datové rozlišení datové rozlišení („barevná hloubka“ rastru) - popisuje počet bitů použitých k popisu určité barvy pixelu v bitmapovém obrázku : • binární rastr (0x1, výskyt x nevýskyt) – záznam 1 bitem. • 8bitový rastr (28 )– 256 různých celočíselných hodnot, záznam 1 bajtem. • 24bitový rastr – 1,6 milionu různých celočíselných hodnot, 3 bajty. • kontinuální rastr – hodnoty v reálných číslech, záznam 4 nebo 6 bajty. Tvorba rastru z vektorového modelu způsob přiřazení hodnot zobrazovaného atributu (kvantitativní data) – při tvorbě modelu: • jako bodová hodnota změřená kdekoli v ploše buňky • jako aritmetický průměr u několika bodových měření • jako vážený aritmetický průměr, kde váhou je plošný rozsah jednotlivých hodnot • jako maximální nebo minimální hodnota atributu v ploše buňky • jako hodnota atributu s největší váhou (i pro kvalitativní). Řešení konfliktů Problém - jedna výsledná buňka obsahuje více různých objektů. Pro řešení této se používají 3 základní metody, z čehož první dvě se používají pro převod bodů, linií i polygonů a zbývající jen pro převod polygonů: • Metoda dominantního typu vychází z principu, že u buňky, do které zasahuje více objektů, se vyjádří podíl její plochy, zabíraný každým z objektů a hodnota objektu s největším podílem je pak buňce přiřazena (u bodů a linií se podíl plochy nahrazuje počtem a příp. délkou objektů, které buňka obsahuje). • Metoda nejdůležitějšího typu buňce přiřadí hodnotu, která je považovaná za nejdůležitější z hlediska aplikace. • Metoda centroidu, buňka má přiřazenou hodnotu definovanou polohou jejího středu při průmětu do vektorové reprezentace. Příklady – pravidla pro rasterizaci bodů v ArcGIS Prázdné buňky • Pokud je hodnota buňky definována jako prázdná (NoData), znamená to, že tato buňka nenese žádnou informaci o prostoru, který reprezentuje. • 0 je validní hodnota! • 999 obvykle použito pro No data Metrika čtvercové mřížky • V geometrii nastává problém metriky (způsob definice vzdálenosti dvou buněk) – odlišná vzdálenost středu čtverců. • Euklidovská metrika Rastrová data výhody a nevýhody výhody • jednoduchost datové struktury • snadné překrývání a kombinace obrazů s různým obsahem • rychlé dotazování • snadná tvorba uživatelských nadstaveb • jednoduchá kombinace s jinými daty rastrové povahy (DPZ) • snadné provádění analytických operací nevýhody • značná paměťová náročnost (velký objem dat) • omezená přesnost, daná rozlišením rastru a orientací rastru (výpočty délek, vzdáleností, ploch ...) • kvalita výstupů závislá na rozlišení rastru (nižší vizuální kvalita rastrových výstupů) • nevhodnost pro síťové analýzy Kompresní techniky pro rastry • Ztrátové – komprimují lépe než neztrátové – dochází ke ztrátě informace => někdy nevhodné! • Neztrátové – Run Length Codes – RLC – Run Length Encoding – RLE – Čtyřstrom – QuadTree – Adaptivní komprese Run Length Codes • Definuje příslušnost buněk rastru k objektu po řádcích nebo sloupcích, přičemž udává jen začátek a konec úseku buněk v řádku či sloupci. • Pro černobílé/binární rastry Run Length Encoding • Využití maticového zápisu dat. • Efektivní při rozsáhlých homogenních oblastech dat 1 1 1 1 5 5 9 9 9 9 9 9 9 2 9 9 9 (4 1)(2 5)(7 9)(1 2)(3 9) • Heterogenní  0 1 0 1 2 3 5 2 1 4 (1 0)(1 1)(1 0)(1 1)(1 2)(1 3)(1 5)(1 2)(1 1)(1 4) Jak zefektivnit kompresi? Způsob procházení rastru • A) a B) - alternativy postupného procházení. • C) a D) – prostor vyplňující křivky (space-fill). • B) a D) jsou více efektivní – souvislost s Toblerovým zákonem (First law of Geography, autokorelace). Everything is related with everything else, but near things are more related than distant things. Quad tree - čtyřstrom • Hierarchické uložení • Dělení kvadrantů až do doby, kdy jsou homogenní. Nepravidelná trojúhelníková síť • Nepravidelné rastrové reprezentace - problémy s tvorbou, analýzou i uložením – prakticky se nepoužívají. • Výjimkou je Nepravidelná trojúhelníková síť TIN (Triangulated Irregular Network). • Reprezentuje povrch jako soubor trojúhelníků (trojúhelníková), které jsou definovány třemi body umístěnými kdekoliv v prostoru. (nepravidelná) a pro tyto trojúhelníky uchovává topologické vztahy (síť). • Často se používá pro reprezentaci povrchů, například digitálního modelu reliéfu – DMR. Principy triangulace • TIN je založen na tzv. Delaunay triangulaci • Pro sadu bodů P platí, že DT je validní, pokud uvnitř kružnice opsané k libovolnému trojúhelníku neleží žádný jiný bod množiny P. Příklad tvorby trojúhleníků α + γ je větší než 180° Nekorektní triangulace Korektní triangulace α + γ je menší než 180° TIN - porovnání s rastry • složitost datové struktury a tím i algoritmů s ní pracujících. + • zmenšení objemu uložených údajů při reprezentaci nehomogenních povrchů, • větší přesnost a věrnost pro nehomogenní povrchy • struktura automaticky obsahuje informace o sklonu a směru tohoto sklonu. • kompatibilita s moderními grafickými kartami .