titl CZ Základy business intelligence Jaroslav Šmarda zahlavi CZ Základy business intelligence * Business intelligence * Datový sklad * On-line Analytical Processing (OLAP) * Kontingenční tabulky v MS Excelu jako příklad OLAP * Dolování dat zahlavi CZ Business intelligence a MIS * Business intelligence: * množina technologií a procesů, které využívají data k porozumění a analýze podnikatelské výkonnosti * Analytika: * podmnožina BI * extenzivní využívání dat, statistické a kvantitativní analýzy, vysvětlovacích a prediktivních modelů k rozhodování a následnému jednání * vstup pro rozhodování: * lidí * plně automatické zahlavi CZ Business intelligence Standardní sestavy Co se stalo? Ad hoc sestavy Kolik, jak často, kde? Dotaz/zavrtání Kde přesně je problém? Upozornění Jakou akci je třeba učinit? Statistická analýza Proč se to stalo? Předpovědi/extrapolace Co se stane, když trend bude pokračovat? Prediktivní modelování Co se stane jako následující? Optimalizace Co nejlepšího by se mělo stát? Stupeň inteligence Business intelligence Reporting zahlavi CZ Nástroje BI * Používané analytické technologie * tabulkové procesory (MS Excel) * OLAP nástroje (On Line Analytical Processing) * statistické a kvantitativní algoritmy * nástroje pro dolování dat * nástroje pro textové dolování (data crawler) * simulační nástroje * zahlavi CZ Ukládání dat * OLTP (On Line Transaction Processing) * velké množství transakčních dat * detailní data z každodenních transakcí v podniku * OLAP (On Line Analytical Processing) * analýzy obvykle historických dat pro hledání trendů potřebných pro strategická rozhodnutí managementu * periodické ukládání dat (detailních nebo agregovaných) zahlavi CZ Datový sklad (Data Warehouse) * předmětově orientované, integrované, časově proměnné kolekce dat určené pro podporu rozhodování * předmětově orientované – prodeje, zákazníci, dodavatelé, produkty * určený pro OLAP * * Pozn.: Na rozdíl od OLAP je OLTP procesně orientované – zpracování mezd, účetnictví, výroba * zahlavi CZ Datový sklad * data integrována z různých OLTP datových zdrojů * není aktualizován v reálném čase (okamžitě) * aktualizován periodicky (např. denně, týdně, měsíčně) * potenciálně konkurenční výhoda * zvyšuje produktivitu managementu při rozhodování * zahlavi CZ Databáze OLTP vs. Datový sklad Databáze OLTP Datový sklad Obsahuje aktuální data Obsahuje historická data Ukládá jen detailní údaje Ukládá detailní data společně s agregovanými Data jsou dynamická Data jsou statická kromě periodického dohrávání dalších období Dotazy jsou rychlé a přistupují k několika řádkům tabulek Dotazy trvají dlouho a přistupují k mnoha řádkům tabulek Řízeny transakcemi, podporují každodenní operace Řízeny analýzami, podporují rozhodování Procesně orientovány Předmětově orientované Slouží velkému množství paralelně pracujících uživatelů Slouží relativně malému počtu manažerů, kteří rozhodují zahlavi CZ Architektura datových skladů * Agregované tabulky * Hvězdicová schémata * zahlavi CZ Datový sklad – agregované tabulky Vysoce agregované tabulky Lehce agregované tabulky Detailní tabulky Tabulky s metadaty (data o datech) Pozn.: Základem úspěchu je navrhnout správné agregované tabulky zahlavi CZ Datový sklad –hvězdicová schémata * Jedna tabulka s detailními daty – tabulka s fakty (fact table) * Obklopená řadou tabulek s dimenzemi (dimension tables) * dimenze nebo také kategorie zahlavi CZ Datový sklad – hvězdicová schémata Tabulka s fakty Tabulka s dimenzí Tabulky s metadaty (data o datech) Tabulka s dimenzí Tabulka s dimenzí Tabulka s dimenzí zahlavi CZ Datový sklad – hvězdicová schémata * Tabulka s fakty v dimenzionálním modelu obsahuje: * metriky a fakta pro podnikatelské procesy * * Pozn.: Základem úspěchu je navrhnout správnou tabulku s fakty se správnými dimenzemi zahlavi CZ Multidimenzionální databáze * Označované jako MOLAP (Multidimensional On Line Analytical Processing) * Výrobci: * Oracle Essbase, MicroStrategy, Cognos PowerPlay zahlavi CZ Multidimenzionální databáze jako datová kostka zahlavi CZ OLAP – interaktivní analýzy dat * OLAP (On Line Analytical Processing) * Například kontingenční tabulky v MS Excelu * Vstup: Datová tabulka * Sloupce obsahují: * Kategorie (tvoří dimenze kontingenční tabulky nebo osy grafu) * Hodnoty (údaje v kontingenční tabulce nebo grafu) zahlavi CZ OLAP – vstupní data zahlavi CZ Datamart * Podmnožina datového skladu pro: * podporu některé organizační složky nebo podnikatelské funkce (např. obchod) * zahlavi CZ Dolování dat * Proces extrahování * validních, * dříve neznámých, * komplexních informací * z rozsáhlých databází a jejich použití pro důležitá podnikatelská rozhodnutí * zahlavi CZ Dolování dat * Strukturovaných dat z relačních databází * Dolování textových dat * Amazon: Ti, co kupují tuto knihu ..., často kupují také tuto knihu ... * Google Analytics * zahlavi CZ Dolování dat ze sociálních sítí * Příklady: * Twitter: Friends/Followers, retweets * Folksonomie (folksonomy) * základním aspektem lidské inteligence je potřeba klasifikace a klasifikační hierarchie * klasifikace pomocí tagů (tags) * např. Twitter: hashtags (začínají #) * Analýza textů přirozených jazyků *