1 Vybrané kapitoly z DPZ Současné možnosti DPZ jako metody sběru, analýzy a prezentace prostorově lokalizovaných dat (na příkladu studia města) Environmental Remote Sensing Global Remote Sensing Urban Remote Sensing Quantitative Remote Sensing Úvod, základní pojmy Global Change master directory http://gcmd.gsfc.nasa.gov/ Earth Observatory http://earthobservatory.nasa.gov/ Úvod, základní pojmy http://www.ldeo.columbia.edu/~small/Urban.html http://sedac.ciesin.org/urban_rs/ Urban Remote Sensing Ve vyspělých státech žije ve městech až 75 % populace Malá rozloha zastavěných ploch (5 ­ 7 % plochy souše) Značná koncentrace obyvatelstva Značný podíl na celkové produkci energie (UHI) Dynamický rozvoj suburbánních oblastí Zvyšující se riziko ztrát na lidských životech a velkých materiálních škod v případě přírodních extrémů Konflikt příroda ­ společnost jako obecný problém? Je možné k řešení uvedených problémů využít metod DPZ? Urban Remote Sensing Co umožňuje formování URS? Zlepšování kvality obrazových dat DPZ (jak definovat kvalitu ?) Dostupnost, efektivita využití dat Nové možnosti analýzy (jaké metody, jaké principy?) Formování kvantitativního DPZ (QRS) ...? Existuje odběratel? ...? 2 Urban Remote Sensing Mapování využití ploch Vybrané parametry (biofyzikální) ­ podíl ploch s vegetací, NDVI, ... Mapování a kvantifikace spojitých jevů (polí) Socio-ekonomické parametry?? ??? Nabízí DPZ něco navíc ve srovnání s jinými metodami sběru a analýzy prostorových dat? Jaké vlastnosti (charakteristiky) lze metodami DPZ studovat? Detekce tepelného ostrova města Brna s využitím družicových dat GAČR 205/09/1297 (2009 ­ 2012) Víceúrovňová analýza městského a příměstského klimatu na příkladu středně velkých měst Motivační příklad Klima měst Porovnání jednotlivých členů rovnice energetické bilance ve volné krajině a ve městě (kW h m2 den-1) Klima měst * počet kondenzačních jader 10 x více * Počet pevných částic 10 x více * Trvání slunečního svitu o 5 ­ 15% měně * Množství oblačnosti o 5 ­ 10% měně * četnost výskytu mlhy v zimě o 100% více * množství srážek o 5 ­ 15% více * četnost bouřek o 5 ­ 10% více * průměrná roční teplota o 0,5 ­ 3,0°C vyšší * průměrná minimální teplota v zimě o 1 ­ 2°C vyšší * průměrná maximální teplota v létě o 1 ­ 2°C vyšší * délka topné sezóny o 10% kratší * roční průměrná relativní vlhkost o 6 % nižší * roční průměrná rychlost větru o 20-30% nižší Vybrané charakteristiky klimatu měst v porovnání s venkovskou krajinou (Landsberg 1981) Formování tepleného ostrova města 1. Teplený ostrov města v mezní vrstvě atmosféry (Boundary layer) 2. Tepelný ostrov města přízemní vrstvě atmosféty (Canopy Layer) 3. Tepelný ostrov města aktivních povrchů (Surface UHI) 1 2 3 Tepelný ostrov města (Oke 1976) Možnosti detekce tepelného ostrova města Metody dálkové detekce ,,Kvantitativní" dálkový průzkum DN hodnoty DN = f(T) 3 Obecný postup mapování teploty aktivních povrchů 1. Převod hodnot zaznamenaných družicí (DN) na spektrální hustotu (L) max )min()max()min( )( )( Q QLLL L DN -+ = 2. Výpočet tzv. radiační teploty (Trad) z hodnot spektrální hustoty (L) + = )( 1 2 1ln L K K Trad 3. Převod Trad na teplotu aktivního povrchu (TLS) (land surface temperature) K1 = 666,09 W m-2sr-1 K2 = 1282,7 K = 1,438mK = emisivita ln1 + = rad rad LS T T T Studované území a použitá data * LANDSAT 7 * Snímek ETM+ * Datum pořízení 24. 5. 2001 * Čas snímání v 9:35:02 GMT * Termální pásmo 10,4 ­ 12,5 m * Prostorové rozlišení 60 m Typický radiační chod počasí Synoptická situace NEa Tmin 8,4°C T max 23,3°C T prum 17,6°C T příz. min 5,0°C Postup mapování povrchových teplot ETM+ pásmo 6.1 Spektrální hustota Radiační teplota ETM+ 1,2,3,4 Druhy povrchů Emisivita Teploty aktivního povrchu Sestavení mapy emisivity základních druhů povrchů vodní objekty 0,98 pole bez vegetace 0,97 vegetace 0,94 zástavba 0,925 Teploty aktivních povrchů, Brno a okolí, 24.5.2001 Teploty aktivních povrchů, centrum Brna 24.5.2001 4 Intenzita tepelného ostrova Brna, 24.5.2001 Intenzita tepelného ostrova Brna, 24.5.2001 1 2 3 4 SV kvadrant Shrnutí * Klasifikací snímků byly sestaveny mapy základních druhů povrchů potřebných pro kvantifikaci jejich vyzařovacích schopností (emisivit) * S využitím termálních snímků ETM+ a ASTER byly otestovány různé algoritmy pro výpočet pole teplot aktivních povrchů * Byla odhadnuta intenzita TOM na základě rozdílu mezi teplotou aktivních povrchů ve městě a v okolní krajině * Tato intenzita může ve dnech s radiačním typem počasí přesahovat hodnotu 5°C * Horizontální gradient v průměrných teplotách aktivních povrchů je nejintenzivnější SV směrem od středu města Brna Úkol pro závěrečné hodnocení 1) Podejte přehled kvalitativních i kvantitativních charakteristik, které by bylo možné mapovat metodami DPZ v prostředí města 2) Podejte přehled metod DPZ vhodných pro mapování prostředí města 3) Zvolte si libovolný parametr městského prostředí, který lze studovat s využitím dat a metod DPZ 4) Navrhněte konkrétní postup mapování (zdroje dat,metody, měřítko, způsob prezentace, ... 5) Jakými jinými zdroji data (mino DPZ) by bylo možné zpřesnit současné modely (UHI, NDVI, ...) Urban Remote Sensing Které znaky vhodně resp. nevhodně charakterizují plochy měst? tvar stín velikost barva tón textura struktura poloha Urban Remote Sensing Které znaky vhodně resp. nevhodně charakterizují plochy měst? Které znaky používáme na základě zkušenosti? Které znaky lze vhodně formalizovat pro metody digitálního zpracování obrazu? 5 Specifika městského prostředí ve vztahu k metodám DPZ Specifické druhy povrchů Jak lze charakterizovat povrchy ve městech ? Odlišná radiační, teplená, vodní bilance ­ formování městského klimatu Problém zastíněných ploch Značná dynamika Znečištění životního prostředí ... Urban Remote Sensing Co jsou limity dosavadního rozvoje? http://www.ldeo.columbia.edu/~small/Urban.html The physical properties of the individual components of the urban mosaic control the mass and energy fluxes through the urban environment. These fluxes, in turn, control the aggregate physical characteristics and dynamics of the urban environment thereby impacting the climatic, hydrologic and ecologic processes linking the urban environment to its surrounding environments. Understanding the dynamics of these processes in coupled urban, suburban, and periurban systems is central to our ability to predict, and influence, the behaviour of the systems. The research ... focuses on the use of optical remote sensing to characterize the physical properties of urban and non-urban environments and to understand the relationships between the optical characteristics, physical properties and energy fluxes through the urban system. ,,Standardní" metoda klasifikace ploch z obrazových dat Spektrální příznaky Obrazový prostor (Image space) Spektrální prostor (Spectral space) Příznakový prostor (Feature space) 1 2 3 Klasifikace založená na teorii spektrálního chování je tedy obecně procesem hledání všech spektrálních tříd, které tvoří třídu informační. Řízená klasifikace obrazu ­ obecný postup 1. definování tzv. trénovacích ploch 2. výpočet statistických charakteristik (tzv. spektrálních příznaků) pro trénovací plochy charakterizující jednotlivé třídy, jejich editace a výběr vhodných pásem pro vlastní klasifikaci 3. volba vhodného rozhodovacího pravidla (tzv. klasifikátoru) pro zařazení všech prvků obrazu do jednotlivých tříd 4. zatřídění všech obrazových prvků do vymezených tříd 5. úprava, hodnocení a prezentace výsledků klasifikace 6 1. Výběr trénovacích ploch 2. Testování trénovacích ploch 3. Použití vhodného rozhodovacího pravidla (klasifikátoru) 4 - 6. Zatřídění všech obrazových prvků Sestavení výsledné mapy základních druhů povrchů, verifikace A A A B B A 0 A A B B B 0 0 A A A B B 0 0 A A A B B B 0 A A A A B B B A C C C C B B 0 C C C C B B A ­ voda B ­ les C ­ zastavěná plocha 0 - nezařazeno 90,850,000,000,000,009,1510605holá p. 0,0086,790,000,000,0013,216664ttp 0,000,0092,720,000,007,288933pole 0,000,000,0089,440,0010,5610892les 0,000,000,000,0088,5511,4512231voda 543210počet pixelůkódtřída Průměrná přesnost = 89,67 % Alternativa - neřízená klasifikace Spektrální a informační třídy Agregování tříd Urban Remote Sensing Co je příčinou malé efektivity klasických přístupů k analýze obrazu? * Jak lze charakterizovat ,,klasické" přístupy k analýze obrazu? * Jaké charakteristiky jsou přenositelné do prostředí URS? * Jak by bylo možné specifikovat vlastnosti nově navrhovaných metod? * Mixture pixel ­ hlavní problém při mapování LU/LC klasickými přístupy metodami DPZ. * Composite signatures x např. MAXLIKE ­ předpoklad ,,pure signatures" 7 Možné přístupy ke klasifikaci obrazových dat * klasifikace řízená, neřízená, hybridní * klasifikace per pixel a per-object * klasifikátory parametrické a neparametrické * klasifikátory ,,tvrdé" a ,,měkké" (fuzzy) * sub-pixelové klasifikace * klasifikace založené na strojovém učení (rozhodovací stromy a neuronové sítě) * expertní systémy (knowledge-based, rule-based classification) Urban Remote Sensing Možné přístupy k řešení problému 1. Objektově orientovaná klasifikace, kontextuální 2. Obrazová spektrometrie 3. Spectral mixture analysis 4. Texture analysis, GLCM 5. Strojové učení, neuronové sítě 6. Geostatistické přístupy (prostorová autokorelace) 7. ... (?) Vhodné zdroje obrazových dat? Optická data ­ very high resolution (spatial) Hyperspektrální data Data pořizovaná aktivními metodami ­ RADAR, LIDAR Termální DPZ ??? Alternativní metodické přístupy ke klasifikaci ploch z obrazových dat v prostředí města 1. Objektová (,,per-object") klasifikace Naše rozpoznávání není založeno na postupném skládání celku z jednotlivostí. Je založeno m.j. na: 1. zkušenosti 2. schopnosti hodnotit vztahy Základní východiska * Klasifikace založená na identifikaci jednotlivých obrazových prvků má mnohá omezení. * Vychází z předpokladů, které již a priori vylučují úspěšnou aplikaci těchto přístupů na některé úlohy (zastavěné plochy). * Informace uložená v obraze má často fraktální povahu, hierarchii ­ záleží na měřítku. (Části stromu ­ strom ­ les krajinná mozaika). * Analýza obrazu prozatím málo využívá jiných charakteristik (interpretačních znaků) než spektrálních (např. na radarová data nelze v důsledku značného podílu šumu použít klasický per-pixel přístup). Základní východiska * Objektový přístup ­ základní jednotkou pro klasifikaci není obrazový prvek (pixel), ale skupina prostorově souvisejících pixelů (field, image object primitive, ...). * Tato skupina pixelů je vytvořena procesem segmentace obrazu. Jejím cílem je pospojovat pixely podobných vlastností do skupin. * Nejsou uvažovány jen vlastnosti spektrální, ale například textura, kontext, vlastnosti související s tvarem a velikostí pixelů apod. * Vytvoření skupin pixelů podobných vlastností umožňuje následně definovat vztahy sousedství mezi jednotlivými skupinami 8 Příklad- vytváření objektů v obraze Atributy objektů Každému z objektů přísluší množina atributů, které popisují spektrální vlastnosti, tvar, topologické vazby, texturní znaky, ... Obecný postup objektové klasifikace obrazu 1. Spojování podobných pixelů do homogenních ploch ­ segmentů 2. Testování homogenity segmentů 3. Výpočet atributů pro každý segment 4. Klasifikace segmentů (objektů) Segmentace obrazu Definování základních obrazových objektů je založeno na spojování podobných pixelů. Podobnost či homogenita je posuzována z hlediska těchto tříd informací: * Spektrální informace * Texturální informace * Informace o tvaru objektů * Informace o topologických vztazích (kontextuální) Nastavení parametrů segmentace obrazu ,,Mulitresolution segmentation" Hierarchicky uspořádaný systém vrstev Nejnižší vrstvu tvoří vrstva jednotlivých pixelů, nejvyšší vrstvu pak celý obraz. Mezi těmito dvěma krajními úrovněmi se vytváří další úrovně právě procesem segmentace obrazu. Celá síť má jednoznačně definované topologické vazby. 9 Hierarchické uspořádání klasifikačního schématu - podle dědičnosti (inheritance) - podle sémantiky (významu) Příklad klasifikace Příklad klasifikace Ostrov Les hustý X řídký Les list. X jehl Klasifikační schéma - příklady - binární strom: daná třída je definována vždy jako negace příslušnosti k třídě jiné - příznakový prostor využívající ke klasifikaci topologických vazeb Klasifikace objektů může probíhat dvěma způsoby * jako klasifikace bez uvažování topologických a hierarchických vazeb objektů * jako klasifikace hodnotící též topologické a hierarchické vazby objektů v obraze * Jednotlivé třídy již nemusí představovat land cover, ale mohou být již kategoriemi land use. To je umožněno hodnocením odlišné skupiny atributů při klasifikaci tříd ­ příznakový prostor může být definován různě pro různé kategorie: Vlastní klasifikace může být založena na klasifikátoru nejbližšího souseda (Nearest Neighbor) Trénovací data tvoří vybrané objekty Klasifikátor zařadí všechny ostatní objekty do třídy, ke které má v předem definovaném příznakovém prostoru nejblíže. Klasifikace objektů I. 10 Klasifikace objektů II. Příslušnost jednotlivých objektů ke každé třídě je hodnocena prostřednictvím funkce příslušnosti (membership function) pro každý z uvažovaných atributů. Membership function normalizuje hodnoty jakéhokoliv použitého atributu (např DN hodnot pásma obrazu 0 až 255) do hodnot 0 až 1. Funkce má různý průběh (např. sigmoida). Průběh membership function definuje neostré (fuzzy) hranice a nahrazuje binární logiku (patří - nepatří). Klasifikace založená na principu neostrých množin (fuzzy logic). 2. Hyperspektrální DPZ (obrazová spektrometrie) * Kontinuální záznam odrazových vlastností povrchů v optické části spektra * Možnost podchytit specifika především u povrchů spektrálně ,,čistých" * Identifikace jevů, které v krajině souvisejí se změnami chemického složení * Identifikace a lokalizace tzv. absorpčních pásů * Identifikace antropogeních tvarů a procesů * ..... Příklady konkrétních systémů - družice Družice EO-1 (NASA), skener HYPERION ­ hyperspektrální skener s 242 pásmy v rozsahu 0,4 - 2,5 m s rozlišením 30 metrů a velikostí scény 7,7 x 42 resp. 185 km, časové rozlišení 16 dní AISA Eagle ­ www.usbe.cas.cz 64 spektrálních pásem, prostorové a spektrální rozlišení přibližně 0,4 m a 10 nm * předzpracování dat * kalibrace dat * tvorba spektrálních knihoven * vizualizace hyperspektrálních dat a knihoven spekter * automatické porovnání spekter * definování elementárních povrchů (tzv. endmembers) * analýza a automatická klasifikace heterogenních pixelů Základní etapy analýzy dat obrazové spektrometrie Předzpracování dat * úprava geometrie snímků, odstranění páskování (stripping), potlačení šumu Kalibrace dat (DN hodnoty ­ radiance ­ reflectance) * atmosférické korekce a korekce na vlivy topografie jsou nezbytnou prvotní částí zpracování * cílem je převést naměřená data, která obsahují charakteristiky celkového vyzařování objektů (angl. radiance), na data charakterizující odrazové vlastnosti objektů (angl. reflectance) * Zář (radiance) ­ množství dopadající na plochu čidla (senzoru) * Odrazivost (reflectance) ­ podíl mezi množstvím odražené elektromagnetické energie a množstvím energie dopadající na studovaný povrch 11 Vztah mezi DN, zářivými a odrazovými vlastnostmi povrchů * DN * L - zář [W.m2.sr-1]) (radiance) * - odrazivost (reflectance) L1 : záření rozptýlené atmosférou ,,path radiance" L2 : záření odražené snímaným povrchem L3 : záření odražené a rozptýlené okolními objekty c0, c1 : (offset, gain) ­ kalibrační konstanty Vztah mezi DN, zářivými a odrazovými vlastnostmi povrchů Skutečné odrazové vlastnosti objektů zářivé vlastnosti objektů DN hodnoty Spektrální knihovny a automatické rozpoznávání objektů Příklady záznamů ze spektrální knihovny pro pět vybraných materiálů. Na ose X jsou vlnové délky, na ose Y normalizované hodnoty odrazivosti (R). (1 - smrkové jehličí, 2 - suchý travnatý povrch, 3 - listy vlašského ořechu, 4 - listy javoru, 5 - kaolinit) Spektrální profily vybraných druhů vegetace Spektrální profily vybraných umělých povrchů target spectra - typické příklady (z knihoven) Image spectra ­ reálné povrchy (často smíšené) Spektrální profily 12 Možné přístupy ke klasifikaci * Porovnávání spekter (Spectral matching) * Klasifikace tzv. ,,spektrálním úhlem" * Analýza smíšených pixelů (mixing) * Metody shlukové analýzy, ... * Metody strojového učení, NN * Rozhodovací stromy Porovnávání spekter (simple spectral matching) Porovnávání spekter (simple spectral matching) Porovnávání spekter (simple spectral matching) * Vyžaduje konverzi obrazových spekter na hodnoty odrazivosti * Dobře funguje, pokud jsou v obraze větší plochy spektrálně ,,čistých " povrchů * Z vyhovujících spekter je nutné vybírat to nejvhodnější ­ prahování resp. ,,fuzy" výsledek * Řada povrchů je však smíšených * Někdy vyžaduje i ,,mixed" spektra ve spektrální knihovně * Výsledek ­ ,,material map" ­ mapuje dominantní druh povrchu na ploše každého pixelu. Spektra jako vektory ve spektrálním prostoru Spektrální profily jsou vhodné pro vizualizaci a porovnávání několika málo spekter Pro analýzu a klasifikaci většího počtu spekter ­ N rozměrný spektrální prostor Matematicky lze tento koncept využít i pro hyper ­ rozměrný prostor Není důležitá velikost vektoru, ale jeho orientace Klasifikace tzv. ,,spektrálním úhlem" (Spectral Angle Mapper) Vektor reprezentující spektrum ve 2D spektrálním prostoru 13 Klasifikace tzv. ,,spektrálním úhlem" Algoritmus je založen na výpočtu míry podobnosti mezi testovaným spektrálním profilem ze zpracovávaného obrazu a spektrem z knihovny Jako míry podobnosti je využito tzv. spektrálního úhlu, A - vektor známého spektra (např. z knihovny spekter), B vektor spektra testovaného, - spektrální úhel; data v použitých pásmech jsou korigována na vlivy atmosféry a zastínění 3. Analýza smíšených pixelů ­ ,,linear unmixing" ,,tradiční" přístup - zjednodušující předpoklad, že každý jeden obrazový prvek svoji hodnotou reprezentuje pouze jeden objekt či povrch. Křivka spektrálního chování heterogenního pixelu (mixel - mixture element) je složena z jednotlivých ,,spektrálně čistých" křivek elementárních povrchů tzv. endmembers. Koncept ,,linear mixing" Spektra všech povrchů, které jsou kombinací tří elementárních povrchů A, B, C musí ležet uvnitř prostoru, který tyto povrchy vymezují v spektrálním prostoru Pokud jsme schopni nalézt spektra elementárních povrchů, jsme schopni najít i jejich lineární kombinace Předpoklad ­ v obraze se nachází konečný, relativně malý počet elementárních povrchů a velké množství smíšených pixelů, které jsou jejich lineární kombinací Možné přístupy k analýze smíšených pixelů - linear mixing Vychází z předpokladu, že spektrální informace smíšeného pixelu vzniká lineární kombinací spektrálního chování všech obsažených elementárních povrchů Fyzikální model R = 0,5 A + 0,2 B + 0,3 C Lineární kombinace spekter (linear mixing) * Model lineární kombinace (smíchání) spekter - tzv. mixing předpokládá, že známe spektra jednotlivých elementárních povrchů i jejich procentuální zastoupení v ploše pixelu. * Z těchto informací lze ,,smíchat" výsledné spektrum smíšeného pixelu * Analýza potom spočívá v obráceném procesu označovaném jako tzv. un - mixing, * Známe pouze spektrum výsledné, obrazovou analýzou hledáme spektra jednotlivých elementárních povrchů (endmembers) * Z modelu ,,lineárního smíchání" hledáme procentuální zastoupení jednotlivých elementárních povrchů v analyzovaném obraze. Lineární kombinace spekter (linear mixing) ,,fraction images" 14 Matematický model lineárního smíchání výsledného spektra heterogenního pixelu n - počet elementárních povrchů m - počet zpracovávaných pásem Y - výsledné spektrum X - koeficienty určující zastoupení jednotlivých elementárních povrchů Z - spektrální chování n elementárních povrchů v m intervalech spektra (pásmech) UNMIXING ­ určení procentuálního zastoupení elementárních povrchů Geometrický model lineárního smíchání výsledného spektra heterogenního pixelu 1. Určení počtu elementárních povrchů simplex Geometrický model lineárního smíchání výsledného spektra heterogenního pixelu 2. Určení druhu elementárních povrchů 2.1. Odhad spekter elementárních povrchů 2.2. Jejich porovnání s referenčními spektry (knihovně) Linear unmixing a Urban RS s multispektrálními daty Ridd (1995) V-I-S model (vegetation ­ imervious ­ soil) Urban Remote Sensing Elementární povrchy ve městské zástavbě odvozené ze snímků Landsat ETM+ transformovaných metodou MNF 15 Urban Remote Sensing Urban Remote Sensing Detekce změn 4. Hodnocení a klasifikace textury na snímcích Texturální klasifikátory se snaží popsat typickou proměnlivost spektrálního chování 4. Hodnocení a klasifikace textury na snímcích GLCM (Grey Level Co-occurrence Matrix) 3322 2220 1100 1100 Každý prvek GLCM matice nese informaci, kolikrát se daná kombinace hodnot v okně vyskytuje. Míry textury - vážený průměr buněk GLCM. ( )2 1 0, , jiPKontrast N ji ji -= - = Interpretace: Je-li i a j stejné (na diagonále) váha je 0. Liší li se i a j o 1 váha je 1, liší li se o 2 váha je 4 atd. Váhy exponenciálně rostou. 10003 13002 00201 01220 3210 Příklad ,,texture image" Neuronové sítě * počítačová architektura, která se snaží napodobit procesy probíhající v nervové soustavě * je nezávislá na statistickém rozložení dat * je odolná proti chybám, má schopnost učit se (asociativní učení), dovede abstrahovat i generalizovat * dokáže odhadnout nelineární vztah mezi vstupními a požadovanými výstupními daty * umožňuje v procesu klasifikace kombinovat různé typy vstupních dat. 5. Klasifikace obrazu metodami strojového učení * Neuronové sítě * Rozhodovací stromy 16 Základní pojmy Schematizované uspořádání neuronové sítě A - vstupní vrstva, B - skrytá vrstva, C - výstupní vrstva (multi-layer perceptron) * neuron ­ výkonný prvek NS * synapse ­ spojení neuronů * váhové koeficienty neuronů * adaptivní fáze ­ učící * aktivní fáze ­ vybavovací NN pro klasifikaci multispektrálního snímku Příklad třívrstvé perceptronové sítě se 6 vstupními, 8 skrytými a 11 výstupními uzly (MLP 6-8-11) s příkladem vstupu a výstupu při klasifikaci družicových snímků s vyznačenými aktivacemi zastavěné plochy Model neuronu x1 w1 x2 w2 kde xi - hodnota i-tého vstupu wi - váha i-tého vstupu i i i xwxS =)( Neuron provádí tři akce: * sumuje vstupy z jiných neuronů * provádí prahování * posílá výstup do jiných neuronů Model neuronu * Neurony v síti jsou propojeny tzv. váhovými koeficienty, které zesilují nebo zeslabují signál přicházející z předchozích neuronů. * Suma těchto vážených signálů určuje aktivaci neuronu, která ovlivňuje další výstup z neuronu. * Výstup z neuronu je funkcí této aktivace, kdy výstup je vypočten na základě logistické aktivační funkce - sigmoida. * Výstup z uzlu je realizován pouze překračuje-li určitou prahovou hodnotu. * Váhové koeficienty jsou na počátku náhodnými čísly Příklad aktivační funkce neuronu (sigmoida) Učící - adaptivní fáze * Učení ­ váhy na spojích mezi jednotlivými výkonnými prvky sítě se mění podle určitého tzv. učícího algoritmu. * Použije se trénovací soubor, ve kterém známe správné zařazení pixelů do jednotlivých klasifikačních tříd. * Učící algoritmus ­ předpis, podle kterého se předkládají síti vzory k učení a podle kterého se mění váhy jednotlivých spojení mezi neurony. * Učení se s učitelem ­ analogie řízené klasifikace Algoritmus zpětného šíření (Back propagation) * Učení se bez učitele ­ analogie shlukové analýzy (neřízené klasifikace) ­ samo-organizující se sítě (Self-organizing) Kohonenova síť * Ustálení ­ dosažení stabilního stavu sítě Algoritmus zpětného šíření (Back propagation) * signály nejprve vyšlou směrem dopředu * u výstupních neuronů se porovnají výstupy s požadovanými * zjištěné chyby se použijí ke změně nastavení vah v síti 17 Výstup ze sítě má formu vektoru: Očekávaný výstup (z učící množiny): Aktuální výstup: Hodnocení úspěšnosti učení ­ chyba e: ( )= -= k j jj aoe 12 1 ( )0,0,0,0,1,0=a ( )0,0,1,0,0,0=o * Učení probíhá iteračním způsobem ­ cílem je dosáhnout nulové či minimální akceptovatelné chyby. * Adaptace sítě ­ úprava vah synapsí - probíhá po krocích. * Délka kroku se nazývá learning rate. * Velká délka kroku značí rychlejší, ale méně přesné učení Přednosti neuronových sítí Nedostatky neuronových sítí * nezávislost na statistickém rozdělení * schopnost generalizace * síť je tolerantní k šumu v učících datech * problém návrhu architektury sítě (počet skrytých vrstev a počet neuronů v nich) * dlouhá doba učení * problém lokálního minima (oscilace) * nastavení úvodních (náhodných) vah synapsí Klasifikace Rozhodovacími stromy (Decision Trees) TM3 <= 35 : | TM4 > 99 : polev (12.0) | TM4 <= 99 : | | TM5 > 58 : lesl (30.0/1.0) | | TM5 <= 58 : | | | TM6 <= 12 : lesl (2.0) | | | TM6 > 12 : lesj (8.0) TM3 > 35 : | TM6 <= 23 : voda (17.0) | TM6 > 23 : poleb (26.0) Základní pojmy: * Název atributu - uzel * Aritmetický či logický výraz větev stromu * Název třídy - list stromu * Mohou ale i nemusí být založeny na binárním třídění, jsou neparametrické. * Umožňují testování sousedů - grafy sousednosti a topologických vazeb (meet, contain, overlap, ...) * Umožňují testování atributů různé povahy * Možnost klasifikace po vrstvách ­ hierarchické třídění (,,layered classification") * Problém objektivního hodnocení (,,ground truth") Klasifikace Rozhodovacími stromy Layered classification Klasifikace po vrstvách či hierarchická klasifikace