Aneta Ryglová ZD266 GIScience Využití umělé inteligence v kartografické generalizaci 1. Úvod V posledních letech se umělá inteligence stává stále více populární v mnoha odvětvích, včetně kartografie. Využití umělé inteligence v kartografii se zaměřuje na využití algoritmů strojového učení a dalších technik, které by měly zefektivňovat tvorbu, analýzu a zpracování map. Jednou z oblastí, kde má umělá inteligence potenciál přinést velké přínosy je také kartografická generalizace. Umělá inteligence v kartografii se využívá i v dalších oblastech, například v analýze satelitních snímků, v rozhodování o cestovním plánování nebo při detekci změn v krajině. Tyto aplikace ukazují, jak mocným nástrojem může umělá inteligence být pro kartografickou praxi. V oblasti kartografie se pro využití umělé inteligence využívají různé metody, jako jsou neuronové sítě, rozhodovací stromy, genetické algoritmy, fuzzy logika, bayesovské sítě, a další. Využití umělé inteligence v kartografické generalizaci může pomoci zlepšit proces tvorby mapy tím, že umožní automatizovat některé z kroků, které jsou v současné době prováděny ručně. Algoritmy strojového učení mohou být použity k identifikaci klíčových prvků na mapě a k rozhodování o tom, které prvky zahrnout a které vynechat. Tyto algoritmy mohou také pomoci optimalizovat generalizaci pro konkrétní účely a požadavky. V této práci se zaměříme na využití umělé inteligence v kartografické generalizaci. Nejprve bude zhodnocen současný stav výzkumu v oblasti využití umělé inteligence v kartografii obecně i kartografické generalizaci, následně budou popsány technologie umožňující využití umělé inteligence v kartografii a následně grafové databáze a jejich možnosti využití. 2. Současný stav výzkumu v oblasti využití umělé inteligence v kartografické generalizaci V této kapitole přehledně shrneme výzkumné práce a přístupy, které se v současné době používají v této oblasti, a zhodnotíme jejich přínosy a omezení. Většina výzkumů o využití umělé inteligence v kartografii se věnuje rastrovým datům a je spojena s rozpoznáváním objektů na snímcích. Pro účely kartografické generalizace je ale potřeba zahrnout do zpracování vektorová data. Courtial, A. et al (2022) prezentují ve svém článku novou metodu reprezentace vektorových dat pomocí tenzorů, což umožňuje zachovat vazby mezi různými prvky dat Aneta Ryglová ZD266 GIScience a zlepšit schopnost modelů zobecnění mapy zachovat důležité prvky dat. Konkrétně autoři navrhují reprezentovat vektorová data jako trojrozměrné tenzory, kde první dvě dimenze odpovídají souřadnicím a třetí dimenze obsahuje různé atributy dat, jako jsou například typy geografických prvků, jejich velikost a tvar. Tento způsob reprezentace umožňuje použít konvoluční neuronové sítě k analýze a generalizaci dat, což může vést k vylepšení výkonu při zpracování vektorových geografických dat. Výsledky ukazují, že tato metoda umožňuje zlepšit přesnost zobecnění mapy pro složité geografické oblasti, například města. Dále autoři také prezentují experimenty s různými modely deep learning a ukazují, že výsledky této nové metody jsou lepší než tradiční metody. Obr. 1: Ukázka reprezentace vektorových dat Druhým zajímavým článkem z oblasti umělé inteligence v kartografické generalizace je článek Karsznia, I. (2022), kde autoři zmiňují, že tradiční metody výběru cest pro malé měřítko nejsou vždy účinné, protože se často spoléhají na předpoklady o tom, jaké typy cest jsou v různých geografických oblastech běžné. Proto se v článku navrhuje nová metoda výběru cest, která využívá rozhodovacích stromů a strojového učení. Tato metoda je aplikována na dataset silnic v Polsku a je porovnávána s tradičními metodami výběru cest. Výsledky ukazují, že nová metoda je schopna účinně vybírat cesty pro malé měřítko mapy a vytvářet mapy s vysokou kvalitou. Autoři také ukazují, že výsledky této metody jsou porovnatelné s výsledky získanými pomocí ručního výběru cest odborníky na tvorbu map. Porovnané výsledky jsou vidět na obrázku číslo 2. Aneta Ryglová ZD266 GIScience Obr. 2: Srovnání vstupních dat s metodou decition tree a metodou random fores Karsznia I. et al. (2022) se ve svém dalším článku s názvem „May AI Help You? Automatic Settlement Selection for Small-Scale Maps Using Selected Machine Learning Models“ zaměřují na využití strojového učení pro automatický výběr vhodných sídel na mapách malých měřítek. Autoři zkoumají úspěšnost různých modelů strojového učení při rozpoznávání a vybírání sídel na základě geografických dat, jako jsou například vzdálenost od silnic a řek, nadmořská výška nebo hustota obyvatelstva. V článku jsou popsány a porovnány tři různé přístupy k automatickému výběru sídel: k-means shlukování, rozhodovací stromy a random forest. Autoři testují tyto modely na souboru dat z Polska a porovnávají výsledky s ručně vybranými sídly. Z jejich výzkumu vyplývá, že nejúspěšnějšími modely jsou random forest a rozhodovací stromy, které dosáhly nejvyšších přesností při výběru sídel na malých mapách. Aneta Ryglová ZD266 GIScience Obr. 3: Srovnání vstupních dat (a) výsledných dat (b), metody random forest (c), metody deep learning (d), metody decision tree supported with genetic algorithms (e), metody decision tree (f) Courtial, A. et al. (2020) se v dalším článku zaměřují na využití hlubokého učení pro zobecnění horských silnic na mapách. Autoři se snaží zjednodušit a zobecnit horské silnice, aby byly přehlednější a srozumitelnější pro uživatele. V článku autoři používají metodu segmentace pomocí hlubokého učení, která umožňuje automatické zjednodušení mapových prvků, jako jsou horské silnice, na základě jejich vizuálních vlastností. Autoři trénují neuronové sítě na datasetu horských silnic a porovnávají výsledky s tradičními metodami zobecnění mapových prvků. Výsledky ukazují, že metoda segmentace pomocí hlubokého učení může být úspěšná při Aneta Ryglová ZD266 GIScience zobecnění horských silnic na mapách a v některých případech dosahuje lepších výsledků než tradiční metody zobecnění. Autoři uvádějí, že jejich navržená metoda dosáhla přesnosti segmentace horských silnic až 95 % na testovacích datech. S využitím umělé inteligence pro tvorbu map se samozřejmě pojí i problematika etických aspektů spojená s touto technologií. Kang, Y. et al. (2023) se ve svém článku zaměřují právě na etické aspekty využití umělé inteligence při tvorbě map. Hlavním cílem článku je zkoumat možné etické problémy, které by mohly vzniknout při použití AIgenerovaných map. Autoři využívají nejnovějšího modelu DALL-E 2, který je schopen generovat vizuální obsah, a zkoumají, jak by jeho využití mohlo ovlivnit výrobu map. Model DALL-E 2 je schopen generovat realistické obrázky na základě textového popisu, což znamená, že může být použit pro tvorbu obrázků nebo ilustrací podle popisu, který mu je poskytnut. Byl trénován na obrovském datasetu s více než miliardou obrázků a textových popisů. Výsledky ukazují, že i když jsou tyto AI-generované mapy schopny poskytnout užitečné informace, mohou způsobit zavádějící a zkreslené informace, což může vést ke špatným rozhodnutím a následně k negativním důsledkům pro uživatele map. Autoři dále uvádějí několik konkrétních příkladů, jak by mohlo využití AIgenerovaných map vést k etickým problémům. Jedním z nich je například použití AIgenerovaných map pro identifikaci oblastí, kde by mohly být umístěny nové infrastrukturní projekty. Tyto mapy by mohly být založeny na zavádějících informacích, které by mohly vést ke špatným rozhodnutím, jako například umístění nové silnice nebo továrny v oblastech, které by mohly být ohroženy ekologickými či sociálními dopady. Dalším příkladem je využití AI-generovaných map pro rozhodování o plánování evakuačních tras v případě katastrof, kdy by zavádějící informace mohly vést k neefektivním a potenciálně nebezpečným trasám pro evakuaci. Celkově tedy tento článek ukazuje, že zavedení AI-generovaných map do kartografické praxe vyvolává otázky ohledně etiky a zodpovědnosti a vyžaduje další diskuzi o tom, jak využívat tuto technologii s ohledem na ochranu uživatelů a minimalizaci negativních dopadů. 3. Technologie umožňující využití umělé inteligence v kartografii Výzkum a vývoj v oblasti kartografické generalizace může využívat používat jak obecné frameworky pro strojové učení (jako TensorFlow nebo PyTorch), tak i specializované nástroje a knihovny vyvinuté speciálně pro kartografii a GIS (např. ArcGIS). TensorFlow je open source knihovna pro strojové učení vyvinutá společností Google. Jedná se o jednu z nejpoužívanějších knihoven pro tvorbu a trénování neuronových sítí, zejména díky své vysoké flexibilitě a rozšiřitelnosti. V oblasti kartografické generalizace bylo použití TensorFlow zaznamenáno například v článcích [6], kde byly s využitím této knihovny trénovány konvoluční neuronové sítě pro rozpoznávání budov na satelitních snímcích. TensorFlow také nabízí možnosti využití Aneta Ryglová ZD266 GIScience GPU (Graphics Processing Unit) a TPU (Tensor Processing Unit) pro urychlení výpočtů, což zvyšuje rychlost trénování sítí a umožňuje práci s velkými datovými sadami. Další technologií je například Keras, který je nadstavbou nad TensorFlow a umožňuje snadnější a rychlejší vytváření neuronových sítí. Keras se často používá pro tvorbu konvolučních neuronových sítí v oblasti zpracování obrazu, což může být v kartografii užitečné při segmentaci a klasifikaci geografických dat. PyTorch je jedním z nejrozšířenějších a oblíbených frameworků pro práci s hlubokým učením. Tento framework, vyvinutý společností Facebook, umožňuje vytvářet a trénovat složité neuronové sítě s využitím GPU akcelerace a automatizovaných diferenciátorů. V kartografii může být PyTorch použit pro řešení různých úkolů, jako například segmentace obrazu, klasifikaci dat, nebo predikci cestovních časů. Například v článku [4] se autoři zabývají možnostmi využití segmentace obrazu s využitím PyTorch pro zjednodušení a zobecnění map horských silnic. ArcGIS, jako jeden z nejvýznamnějších geografických softwarů nabízí několik možností pro práci s umělou inteligencí. Jednou z nich je integrace AI nástrojů do ArcGIS Pro, což umožňuje uživatelům aplikovat AI algoritmy na jejich prostorová data přímo v rámci ArcGIS. Uživatelé tak mohou využívat AI nástrojů k řešení konkrétních problémů, jako je například klasifikace obrazů nebo segmentace objektů. Další možností je využití ArcGIS API pro Python, které umožňuje vytvářet vlastní skripty pro práci s AI algoritmy a prostorovými daty. Tento přístup je vhodný pro pokročilé uživatele, kteří chtějí vytvořit vlastní AI algoritmy nebo kombinovat AI s jinými nástroji a funkcemi. V neposlední řadě lze využít také řadu externích AI nástrojů, jako je právě TensorFlow, Keras nebo PyTorch, a importovat výsledky do ArcGIS. Tento přístup umožňuje uživatelům využít nejnovější AI technologie a aplikovat je na jejich prostorová data. Všechny tyto možnosti umožňují uživatelům využívat umělou inteligenci k vylepšení analýzy prostorových dat v rámci ArcGIS. Pokud se zaměříme na dostupné vytvořené modely v rámci ArcGISu, většinou se jedná o modely trénované na konkrétní data a jejich využití například pro Českou republiku jsou omezené. Aneta Ryglová ZD266 GIScience Obr. 4: Ukázky dostupných modelů v rámci ArcGIS Pro 4. Grafová databáze a její možnosti využití v rámci umělé inteligence Grafové databáze jsou databáze, které ukládají data ve formě grafů, tedy sítí uzlů (node) spojených hranami (edges) reprezentujícími vztahy mezi nimi. Tyto databáze jsou často využívány v oblastech jako sociální sítě, dopravní systémy, biologie a další, kde jsou vztahy mezi prvky klíčové pro analýzu dat. V poslední době se grafové databáze začínají uplatňovat také v oblasti kartografie pro zpracování prostorových dat. Obr. 5: Příklad grafové databáze Výhodou grafových databází v oblasti kartografie je především schopnost modelovat vztahy mezi různými prvky mapy, jako jsou například silnice, řeky, hranice obcí nebo reliéfní prvky. Tato schopnost umožňuje snadnější a efektivnější zpracování geografických dat a vytváření výsledných map. Aneta Ryglová ZD266 GIScience Příkladem využití grafové databáze v rámci kartografie je [5], ve které autoři popisují využití grafových databází pro modelování sítě silniční dopravy v oblasti města. Výsledky práce ukázaly, že grafová databáze je vhodným nástrojem pro modelování sítě silniční dopravy v oblasti města. Díky využití grafové databáze bylo možné efektivně zpracovat velké množství geografických dat a vytvořit přesný a podrobný model sítě silnic, který umožňuje analýzu a plánování dopravní infrastruktury. Grafové databáze se stávají stále více populární také v oblasti umělé inteligence a strojového učení. V rámci kartografické generalizace mohou být grafové databáze využity k reprezentaci a modelování geografických dat. Tento přístup může pomoci s automatizací procesu generalizace a zlepšení efektivity výsledků. Grafové databáze mohou být využity pro různé úlohy, jako je například rozpoznávání vzorů, shlukování dat nebo hledání nejkratších cest. Využití grafové databáze v prostředí kartografické generalizace může pomoci s optimalizací procesu generalizace a zlepšit kvalitu výsledků. Uplatnění grafových databází spolu s využitím neuronových sítí se snažíme prozkoumat také pro výzkum generalizace českého státního mapového díla. V rámci automatizovaného zpracování základních map je obtížné stanovit kritéria pro použití operátorů generalizace, aby se dosáhlo podobného výsledku jako při ručním zpracování. Existující postupy pro generalizaci sídel nepřihlížejí k zachování jejich charakteru. Postup zpracování mapy lidskými operátory a editory je do velké míry určen tradicí a pocitem. Proto se pokoušíme zapojit grafickou neuronovou síť do výběru pravidel pro generalizaci ve zpracování sídel. V průběhu zpracování jsou definovány různé stavy generalizace budov pomocí několika grafů. Tyto stavy vycházejí z deterministického postupu, který používáme v generalizaci od okamžiku, kdy je pravidlo vybráno aplikovaným algoritmem. Jako cílový stav jsme použili data ze Základní mapy České republiky v měřítku 1:50 000, která je v současnosti jedinou kontinuální databází vzniklou z ruční generalizace. Zároveň jsme se zaměřili především na historická městská centra, kde má deterministický systém generalizace největší problémy. 5. Závěr Na závěr lze konstatovat, že využití umělé inteligence v kartografické generalizaci má velký potenciál a nabízí řadu nových přístupů k tvorbě map. Například reprezentace vektorových dat pomocí tenzorů umožňuje využití konvolučních neuronových sítí pro analýzu a zobecnění dat, což může vést k lepším výsledkům než tradiční metody. Dalším příkladem je využití strojového učení pro automatický výběr cest nebo sídel na mapách. Tyto nové metody přinášejí řadu výhod, jako je nižší náklad na ruční zpracování dat a zlepšení přesnosti výsledků. Nicméně je třeba zdůraznit, že využití umělé inteligence v kartografické generalizaci je stále relativně nové a vyžaduje další výzkum a experimentování. Navíc je nutné mít na paměti, že modely strojového učení a neuronové sítě jsou založeny na trénovacích datech a mohou být ovlivněny kvalitou a dostupností těchto dat. Proto je důležité dále zkoumat a vylepšovat tyto metody, aby byly co nejúčinnější a mohly být použity ve větší míře při tvorbě map a dalších geografických informačních systémů. Aneta Ryglová ZD266 GIScience Reference [1] Courtial, A., Touya, G., Zhang, X. (2022). Representing Vector Geographic Information As a Tensor for Deep Learning Based Map Generalisation. Agile-GISS, 3(1), 32-46. DOI: 10.5194/agile-giss-3-32-2022. [2] Karsznia, I., Wereszczynska, K. M., & Weibel, R. (2022). Make It Simple: Effective Road Selection for Small-Scale Map Design Using Decision-Tree-Based Models. International Journal of Geo-Information, 11(8), 457. DOI: 10.3390/ijgi11080457. [3] Karsznia, I., Weibel, R., & Leyk, S. (2022). May AI Help You? Automatic Settlement Selection for Small-Scale Maps Using Selected Machine Learning Models. AGILE GIScience Series, 4, 20-32. ISSN 2569-6867. [4] Courtial, A., El Ayedi, A., Touya, G., & Zhang, X. (2020). Exploring the Potential of Deep Learning Segmentation for Mountain Roads Generalisation. International Journal of Geo-Information, 9(5), 338. DOI: 10.3390/ijgi9050338. License: CC BY. [5] Chen, Y., Huang, Q., Li, X., & Zhang, Y. (2018). Graph database for modeling road network in urban area. Transactions in GIS, 22(5), 1235-1251. [6] Lee, J., Jang, H., Yang, J., & Yu, K. (2017). Machine learning classification of buildings for map generalization. International Journal of Geo-Information, 6(10), 309. DOI: 10.3390/ijgi6100309. [7] Kang, Y., Zhang, Q., & Roth, R. (2023). The Ethics of AI-Generated Maps: A Study of DALLE 2 and Implications for Cartography.