Analýza a vizualizace Plán ● Hejty ● Rest - CSV ● Analýza dat - mapy ● Scrapování webu ● DÚ Hejt: piecharty Hejt: piecharty × Hejt: piecharty × Experiment Vzor? Spekulativní hejt Výsledek Láv Čtěte! Láv ● Vizualizace dat na FB Formáty souborů ● CSV CSV do Excelu, semafory na mapu ● data: semafory.jdem.cz ● Google Fusion Tables Google Maps ● Kde jsou průměrně nejstarší sportovci? ● Data: sochivek.jdem.cz ● Vytvořit z dat Fusion table ● Vyhledat KML s hranicemi: research. google.com/tables ● Spojit obě tabulky OpenRefine ● Čištění překlepů, nekonzistencí, bordelů ● … a všechno ostatní ● Ale vlastní skript, blbě se gůglí ● Offline (stáhněte si) ● Data z registru (stáhněte si) Registr dopravních vozidel ● “ŠTĚPÁN INDIVIDUÁL” ● “PEPA 1” ● “ŠOA SPORT” Scrapování ● “Olizování webu” ● Když existují data a neexistuje dataset ● Naprosto v pořádku u státní správy ● Pozor na soukromé weby Soči ● Strojové procházení webu a vyzobávání dat ● Pochopit strukturu stránky ● Pochopit strukturu webu Jak se to dělá? ● R/Python/ScraperWiki ● Bacha na odpojování DÚ ● Zkusit si scrapovací doplněk pro Chrome ● Číst 538!