MODULARIZACE VÝUKY EVOLUČNÍ A EKOLOGICKÉ BIOLOGIE CZ.1.07/2.2.00/15.0204 Bi9000 GIS v botanice a zoologii Datové modely • Vektorový datový model • Rastrový datový model… …a ještě…TIN GISová data - geodata • Atributová data - data prostorově nijak neurčená, v převážné většině případů však prostorově určitelná. • Prostorová data - data obsahující prostorové určení (geometrii) a prostorové vztahy (topologii) objektu (prvku). • Geografická data (geodata) - propojená atributová a prostorová data. Datové modely: Pro prostorová data jsou používány převážně 2 modely jejich reprezentace v digitální podobě. Liší se jak způsobem uložení v databázi, tak charakterem přiřazení tématické (atributové) informace. Jsou to VEKTOROVÁ a RASTROVÁ data. RASTR VEKTOR Vektorový datový model • Základní myšlenkou při použití vektorových dat je snaha vyjádřit geometrické vlastnosti jevů na zemském povrchu pomocí lineárních charakteristik. • Jednotlivé základní geometrické prvky jsou vyjádřeny jednotlivými body, sestavou bodů, body spojených úsečkami • Základními prvky vektorových dat jsou:  BOD (zdroj znečištění, hnízdiště, pramen, památný strom…)  LINIE (řeka, bariéra podél dálnice, polní cesta)  PLOCHA (jezero, povrchový důl, fytogeografický okres, povodí, areál výskytu určitého druhu) BOD...definován dvojicí souřadnic, reprezentuje objekty, které nemají žádný rozměr nebo takové, jejichž rozměr je tak malý, že v měřítku mapy nejsou vyjádřitelné plošně; bod má dimenzi 0 - nelze u něj měřit žádný rozměr LINIE…je sled orientovaných úseček, definovaných souřadnicemi počátečního a koncového bodu, reprezentuje objekty jako řeky, silnice, potrubí, vedení, tedy objekty tak úzké, že je v měřítku mapy není vhodné reprezentovat plochami nebo také objekty, které nemají definovanou šířku (vrstevnice); linie má dimenzi 1 - lze u ní měřit délku jen v jednom rozměru PLOCHA…zvláštní případ linie, jejíž první a poslední bod jsou definovány stejnou dvojicí souřadnic, reprezentuje objekty, jejichž hranice uzavírá nějakou homogenní oblast (například jezera, lesy, zastavěná plocha, …); Plocha má dimenzi 2 - lze na ní měřit ve dvou rozměrech. Vektorový datový model Bod Linie Plocha Pro vektorová data je charakteristický zprostředkovatelský vztah mezi prostorovou a atributovou složkou datového modelu GIS. Prostorová i tematická informace je vázána k identifikátoru objektu, který je základním prvkem vektorových dat. ID lokalita datum teplota pozn. 001 Hrádek 5.5.2005 8 sbíráno metodou dle Smitha 002 Loučka 5.7.2005 15 sbíráno standardní metodou 003 Myslivna 27.11.2005 4 sbíráno standardní metodou X Y ID 56233,2 11474,0 001 56338,1 11421,9 002 56501,5 11388,0 003 Vektorové datové modely • Špagetový - redundantní uložení dat, žádná topologie (sousedé, konektivita) • Topologický - neredundatní, ale neuspořádané záznamy, dlouhé prohledávání • Hierarchický- neredundantní údaje zvlášť o bodech, liniích a polygonech v hierarchické struktuře Špagetový model Topologický model 5 Hierarchický model Rastrový datový model Rastrový datový model • Základem rastrových dat je překrytí zemského povrchu pravidelnou sítí dostatečně malých ploch. Zkoumaný jev na zemském povrchu je pak popsán hodnotami, které jsou vztaženy k plochám této sítě. • Každý plocha sítě má svou jednoznačnou adresu, danou sloupcovým a řádkovým indexem. Rastrový datový model Hodnoty v rastrech • Diskrétní prvky – Tematický rastr Jasně rozlišitelné hranice, rastr může mít atributovou tabulku Hodnoty ukládány jako celé číslo (integer grid) Landuse, fytogeografické celky, typy porostů, rastry vzniklé reklasifikací… • Spojité jevy – Kontinuální rastr Plynule se mění v prostoru, hodnoty sousedních buněk se liší minimálně, rastr nemá atributovou tabulku Hodnoty ukládány jako reálná čísla (float grid) DEM (Digital Elevation Model), klima, koncentrace znečišťujících látek… Uložení atributu v rastru Operace s rastry Typy tvaru buněk  Nejčastěji se používá čtvercová mřížka, protože je kompatibilní s datovými strukturami programovacích jazyků používaných pro tvorbu GIS software, je kompatibilní s mnoha zařízeními pro vstup a výstup dat (monitory, scannery, plottery), je kompatibilní s kartézským souřadnicovým systémem. Pouze buňky tvaru čtverce lze rozdělit na menší čtverce se stejným tvarem a orientací.  Trojúhelníková mozaika (TIN) má tu unikátní vlastnost, že jednotlivé buňky nemají stejnou orientaci, což je výhoda při reprezentování digitálního modelu reliéfu (terénu), kde je každému vrcholu o souřadnicích x,y přiřazena funkční hodnota z (výška z = f (x,y)). Jednotlivé trojúhelníky pak implicitně obsahují údaje o svém sklonu a orientaci tohoto sklonu. Daní za tuto vlastnost mnohem větší složitost všech algoritmů pracujících s tímto modelem.  Hexagonální mozaika má tu výhodu, že středy všech sousedních buněk jsou ekvidistantní (stejně od sebe vzdálené), což je výhodné pro některé analytické funkce (např.: paprskové vyhledávání). Ve čtvercové mřížce je toto nemožné a tato vlastnost se musí kompenzovat nebo se prostě zanedbává. Tento tvar buňky se používá jen velmi zřídka. V rastrovém modelu obecně neexistuje popis jedinečných geoprvků, ležících v zájmové oblasti, ale jen popis rozložení jedinečných atributů v této oblasti. Faktory, ovlivňující kvalitu zobrazení reálného světa v rastru: • způsob přiřazení hodnot atributu jednotlivým buňkám ( aritmetický průměr, vážený průměr, max. nebo min. hodnota…) • velikost základní buňky rastru (čím menší buňka, tím přesnější rastr, ale větší soubor - při zmenšení hrany pixelu na polovinu se zvětší objem dat čtyřnásobně - soubor na obr. vlevo potřebuje 16x více diskového prostoru, než soubor na obr. vpravo) • barevná hloubka (binární, osmibitové, čtyřiadvacetibitové), opět samozřejmě platí, že čím podrobnější, tím větší nároky na paměť počítače velikost pixelu 50m velikost pixelu 200m RASTR – bez komprese ukládání založené na dekompozici původního rastru na úseky se stejnou hodnotou rastru (RLE - Run Length Encoding), vhodné zejména pro práci s binárními rastry, vysoká úspora místa na disku. 901120 6013201110 40432021 20732011 10931011 93101110 73301110 10532012101110 30431210121110 3043301110 3033401110 4023302110 RASTR – RLE komprese postupné pravidelné dělení čtvercové oblasti na kvadranty tak dlouho, až je v celém kvadrantu stejná hodnota, nebo už nelze dále dělit RASTR – quadtree komprese RASTR – quadtree komprese Pyramidy pro rastry Pyramidy jsou sady resamlovaných rastrů Používají se při zoomovaní Zvyšují výkon při překlesování Nepravidelná trojúhelníková síť (Triangulated Irregular Network) TIN • Svou povahou leží na pomezí mezi vektorem a rastrem, a velice často se používá pro reprezentaci povrchů, například digitálního modelu reliéfu - DEM • TIN reprezentuje povrch jako soubor trojúhelníků (odtud trojúhelníková), které jsou definovány třemi body umístěnými kdekoliv v prostoru (odtud nepravidelná) a pro tyto trojúhelníky uchovává topologické vztahy (odtud síť). • Zmenšení objemu uložených údajů při reprezentaci homogenních povrchů, větší přesnost a věrnost pro nehomogenní povrchy, struktura automaticky obsahuje informace o sklonu a směru tohoto sklonu. TIN Princip Delaunay triangulace Uložení TINu Různé formy rastrových dat šikmý letecký snímek ortofotomapa Různé formy rastrových dat družicový snímek vzdálenost od linií přímé sluneční záření Různé formy rastrových dat historická papírová mapa, II. vojenské mapování papírová mapa, 1:50 000 Různé formy rastrových dat radarový snímek - srážky Atributová data • databáze (R)DBMS (Relational) database management system Polohová data • nativní formát • ArcGIS: shapefile *.shp, coverage • Microstation: *.dgn • Topol: bloky *.blk Atributová data • DBMS nebo RDBMS nebo bez atributových souborů Polohová data • speciální formát (většinou komprimovaný) • obecné grafické (tiff, jpeg, bmp) • softwarově specifické (ArcINFO grid, Erdas *.img, Topol *.ras ....) Komplexní formáty ukládají více vrstev různých typů ArcGIS: geodatabase, Geomatica: *.pix Uložení dat RASTRVEKTOR Výhody a nevýhody rastrů • rychlé dotazování • jednoduchost datové struktury • jednoduchá kombinace s jinými daty rastrové povahy (DPZ) • snadné provádění analytických operací • značná paměťová náročnost (velký objem dat) • omezená přesnost, daná rozlišením rastru a orientací rastru (výpočty délek, vzdáleností, ploch ...) • kvalita výstupů závislá na rozlišení rastru • nižší vizuální kvalita rastrových výstupů • nevhodnost pro síťové analýzy • náročná generalizace Výhody a nevýhody vektorů • objektová orientace, s jednotlivými objekty lze pracovat jako se samostatnými celky • menší náročnost na paměť. • dobrá reprezentace jevové struktury dat • kvalitní grafika, přesné kreslení, znázornění blízké mapám • vysoká geometrická přesnost • jednoduché vyhledávání, úpravy a generalizace objektů a jejich atributů • složitější zjišťování odpovědí na polohové dotazy a obtížná tvorba překryvů vektorových vrstev. • problémy při náročných analytických operacích, složitost výpočtů • problémy při tvorbě modelů, komplikované využití pro simulaci jevů Vektor Rastr prezentace jevové struktury dobrá (nelze spojité povrchy) záleží na rozlišení (nevhodné pro liniové) datová struktura složitá jednoduchá kvalita grafiky dobrá záleží na rozlišení topologie ano ne (jen sousednost buněk) objem uložených dat malý velký nároky na software velké malé analýzy složitější ale komplexnější jednodušší ale některé neproveditelné (sítě) a nepřesné (plochy, délky) transformace mezi souř. systémy přesná nepřesná (resampling) RASTRVEKTOR