Každý z nás je svým způsobem informačně zahlcen. Existuje tolik novinových zpráv, které bychom mohli číst, tolik seriálů, na které se chceme podívat, denně míjíme desítky billboardů, plakátů či rychlých stories na Instagramu. Často se přistihneme, že se v informacích brodíme, vlastně už vůbec nevíme, co je důležité, nebo co je pravda. Může to být frustrující a na místě je otázka, co s tím?
Situace je to jistě náročná a velice komplexní, řešení však máme nasnadě a může být překvapivě krásné. David McCandless, průkopník v oblasti datové žurnalistiky říká, že stačí více zapojit zrak, smysl, kterým vnímáme nejvíce podnětů z okolí. Pokud záplavu dat vizualizujeme, umožní nám to vidět vzory a vztahy, na kterých záleží. Pomocí vizualizace dokážeme uspořádat informace tak, aby nám dávaly více smysl, vyprávěly příběh, nebo nám umožnily soustředit se pouze na to důležité.
Proč vizualizovat data?
Vizualizace dat je nástroj pro převádění alfa-numerických údajů na grafické reprezentace. Motivací, proč vizualizovat je více. Podívejme se na příklad z historie.
Florence Nightingale byla anglická zdravotní sestra, která se v období Krymské války starala o raněné vojáky. Hygienické podmínky v tehdejších nemocnicích, nebyly na příliš vysoké úrovni. Nightingale díky důkladnému pozorování a zaznamenávání statistických údajů o počtech a příčinách úmrtí vojáků zjistila, že drtivá většina z nich umírá na následky infekčních onemocnění, kterým se dá preventivně zabránit (modrá oblast). Podstatně menší část pacientů zemřela na následky zranění z boje (červená oblast), nebo z jiných důvodů (černá oblast).
Nightingale své zjištění nejprve vložila do slov a tabulek, u svých nařízených uspěla až s polárním diagramem, kterým rychle a evidentně ukázala alarmující dominanci úmrtí, kterým by se dalo zabránit zlepšením hygienických podmínek v nemocnici.
Motivací Nightingale bylo zachránit lidské životy, její záměr byl apelativní a podařilo se jí dosáhnout obrovské změny. Pracovala s přesnými a pravdivými daty, nicméně sáhla také k manipulaci, která počítá s percepčním zkreslením. Jednotlivé výseče, na jejichž hranách jsou vyneseny počty mrtvých, se směrem od centra rozšiřují a zabírají větší plochu. Podívejte se blíže na říjen 1854 - červená a modrá hodnota jsou téměř totožné, z percepčního hlediska však modrá hodnota působí jako větší, protože zabírá větší plochu. Kdyby Nightingale změnila pořadí prvků a namapovala by modrou plochu přímo k centru, nedosáhla by kýženého efektu.
Na tomto příkladě vidíme ohromující krásu a především ohromnou sílu, kterou může vizualizace datům propůjčit. Zároveň nám ukazuje její největší riziko - lehký skluz k manipulaci, před kterou bychom se měli mít na pozoru, i v případě, že se nám vyznění vizualizace líbí a souzníme s daným poselstvím.
Bádání, vysvětlování i umění
Vizualizace dat je nástroj, který využívají lidé napříč profesemi, přičemž každý z nich má jiný záměr a jiné publikum. Výběr a práce s vizualizačními prvky je tomu uzpůsobena, proto může být výsledný produkt velice různorodý. Například novinář Nigel Holmes upřednostní vtipnou a zpracováním netradiční formu, aby nalákal čtenáře ke čtení. Naproti tomu vědec, který se řídí doporučeními teoretika Edwarda Tufteho sáhne spíše po minimalistickém grafu, který se co nejadekvátněji hodí k jeho datům a argumentaci.
Vizualizace dat však není pouze krásná kudrlinka navíc - je to proces a často jediný způsob, který nám pomáhá zorientovat se v datech, která jsou pro nás v jiné formě příliš rozsáhlá či těžko srozumitelná. Ukažme si to na příkladu z praxe. Města si typicky sbírají data o dopravních nehodách. Pokud údaje o místě, četnosti či závažnosti nehod přenesou z excelové tabulky do interaktivní mapy - tedy data vizualizují - snadno uvidí úseky, které jsou nejproblematičtější a mohou přijmout opatření, aby se nehodovost na daném místě snížila. Město tedy pomocí vizualizace tedy hledá ve velkých datech efektivní řešení důležitého problému.
Obecně můžeme říci, že při vizualizaci dat pracujeme s dvěma strategiemi, s exploracía/nebo s explanací. V prvním případě, stejně tak jako v příkladu s městem, je náš přístup badatelský. V datech se pokoušíme něco najít - odpověď na naši výzkumnou otázku, potvrzení hypotézy, řešení problému nebo například emergentní vlastnosti, tedy takové vlastnosti, které o části nemusíme předpokládat a ukazují se nám až v interakci ve větším celku. Také v procesu explorace odhalujeme chyby v datech, které mohly vzniknout třeba nesprávným nastavením metodologie či poruchou měřícího přístroje.
S explorační strategií se setkáme především ve vědě. Typicky v rámci oborů, které zpracovávají velké soubory dat - ve statistice, kartografii, scivis (vizualizaci vědeckých informací), infovis (vizualizaci abstraktních informací) či geovis (vizualizaci geografických informací).
Scivis
Infovis
Geovis
Druhý typ, explanatorní vizualizace, nám pomáhá něco vysvětlit, popsat, ilustrovat. Typickým zástupcem této kategorie je infografika, které jsme se věnovali v minulé lekci. Také se s ní můžeme potkat ve vědě, ale i ve vzdělávání například ve formě schématu vysvětlujícího fungování vysoké pece, v datové žurnalistice v článku o dopadech globálního oteplování na české klima, či v rámci politiky a aktivizmu v propagačních letácích, kde se aktéři snaží komunikovat svou agendu. V některých případech se přidává k datové rovině vrstva emoční, přesvědčovací či manipulativní, která posouvá celkové vyznění vizualizace směrem, který si stanovil autor. Podívejte se na pár zdařilých příkladů a několik skutečně odstrašujících.
Speciálním typem vizualizace dat jsou umělecké vizualizace, které se spíše než prozkoumat nebo popsat nějaký problém snaží kreativní formou zpracovat data. Někdy třeba vůbec neberou v úvahu jejich původní význam a „hrají“ si s nimi volně, dle libosti. Zajímavým polem vizualizace dat je také ambientní vizualizace, která se snaží do prostředí člověka vnést užitečné datové prvky - například sprcha svítící různými barvami dle spotřeby vody, která vybízí uživatele k šetrnému využívání zdrojů.
S vizualizacemi se potkáte ve statické, interaktivní i virtuální podobě. Nicméně nejběžnější formou vizualizace, kterou budete ve svém profesním a osobním životě číst a tvořit, je graf. Jaké grafy existují a kdy je využít?
Koláčový graf - Nebo také výsečový diagram se používá pro zobrazení poměru částí k celku (např. podíl živin ve vašem obědě). Doporučuje se rozdělit ho na maximálně pět výsečí, jinak se stává těžce srozumitelným. Dejte pozor na to, aby proporce výseče odpovídaly procentuálnímu podílu části k celku, který musí vždy činit 100%. Části řaďte od největší po nejmenší ve směru hodinových ručiček (od dvanácti hodin). Pokud jsou některé výseče velmi malé, umístěte po směru hodinových ručiček pouze největší část a ostatní sestupně v protisměru.
Sloupcový graf - Využívá výšku sloupců k porovnání hodnot různých kategorií (např. žánry knih ve vaší knihovně). Hodnoty řaďte horizontálně nebo vertikálně, v druhém případě můžete popisky vložit přímo vedle sloupců pro jednodušší orientaci. Pro pohodlnější čtení by mezery mezi sloupci měly být užší, než je šířka sloupců samých. Speciální formou tohto grafu je skládaný sloupcový graf a skupinový sloupcový graf.
Spojnicový graf - Spojuje pomocí linie body, které jsou vyneseny v mřížce grafu. Je dobrý na zaznamenání vývoje v čase, dokáže upozornit na trendy, výkyvy a poklesy (např. ve firemních ziscích). Osa nemusí nutně začínat na nule, například, v případě, že pracujete s údaji v miliardách korun. Pokud začnete jinde, označte to dvěma diagonálními čárkami na osy y - tím odborně řečeno dáte najevo, že je vaše osa podseknutá. Je-li graf užší, působí klesající a stoupající trendy významněji, je-li graf širší, efekt je opačný.
Small multiples - Pokud chcete výše zmíněnými grafy zobrazit velké množství kategorií (zpravidla více než pět), doporučujeme využít tzv. small multiples. Řekněme, že chcete porovnat žánrovou skladbu sedmi osobních knihoven. Můžete všechny hodnoty vložit do jednoho grafu a riskovat, že bude těžce čitelný, nebo je můžete rozložit do více grafů se stejným nastavením os, které uložíte vedle sebe. Posuďte sami na příkladu, která varianta se vám čte lépe?
Skupinový sloupcový graf "Kolik máte v knihovně poezia a kolik prózy?". Autor: Anna Puchovská.
Small multiples "Kolik máte v knihovně poezia a kolik prózy?". Autor: Anna Puchovská.
Jak jsme si už výše ukázali, neexistuje pouze jeden správný přístup k vizualizaci dat - přístupy se různí dle profesí, strategií a záměrů, se kterými k vizualizaci dat přistupujete. Dokážeme si nicméně ukázat některá obecná doporučení a zásady, které vychází z teorie vnímání a praxe vizualizačních expertů. Tipy budou vztaženy především k tvorbě grafů, jelikož se s nimi pravděpodobně potkáte nejčastěji.
Mějte jasno v tom, co a proč chcete ukázat. Od toho se bude odvíjet, jestli si vystačíte s tabulkou (dobře ukáže přesné hodnoty) či slovním sdělením (úplně stačí, pokud máte pouze jednu či dvě hodnoty), nebo potřebujete graf. Ten efektivně a rychle ukáže anomálie, vztahy, trendy a poměry. S výběrem konkrétní formy vám pomůže rozhodovací mapa níže. Pokud si nejste jistí, jestli váš graf říká to, co by měl, ukažte ho někomu nezaujatému a zjistěte, jestli jej dokáže správně přečíst.
Zvýrazněte to, co je důležité. Počítejte s tím, jak funguje lidský mozek. Jako první vnímá podněty z vizuálního okolí, které jsou rušivé (tzv. distraktory) - věci, které se pohybují, nebo mají na rozdíl od ostatních věcí jinou barvu, tvar, polohu či orientaci. Zkuste například v koláčovém grafu barevně zvýraznit výseč, na kterou chcete upozornit a ostatní nechat v odstínech šedi.
Seřaďte svá data s respektem ke zákonům gestaltu. Tvarová psychologie (gestaltismus) mluví o tom, že člověk hledá celky a opakující se vzorce všude, kam se dívá. Věci v blízkosti, stejného tvaru, barvy nebo velikosti vnímá jako související. Dokáže si také domyslet chybějící části do celku, nebo rozlišovat mezi pozadím a figurou. S tím vším je třeba počítat, pokud chcete, aby byla vaše vizualizace správně přečtena. Více o principech gestaltu se dočtete třeba tady nebo v části z Nejen kruhy níže. Dejte si pozor zejména na náhodné vizuální spojení prvků, které nemají být vnímané jako související.
Distraktory a gestaltismus
Popisujte a nemanipulujte. Vizualizace by měla být srozumitelná sama o sobě, bez doprovodného textu. Dejte si tedy záležet na nadpisu a popiscích, které řeknou čtenáři, co graf reprezentuje, v jakých jednotkách pracuje apod. Popisky uvádějte co nejblíže k datům. Svá data komunikujte pravdivě, vždy přiznejte podseknutí osy (tedy začátek jinde, než na nule) a uveďte zdroj, ze kterého čerpáte. To samé platí i pro čtení - graf nestačí pouze přeletět pohledem, začtěte se hlouběji a hledejte případné nesrovnalosti.
Krásně, ale s mírou! Estetická stránka je důležitá, ale není třeba to přehánět. Obecně se doporučuje vyhnout se 3D efektům, které jsou matoucí a nepříliš vkusné. To samé platí pro příliš mnoho vzorů, barev a struktur. S barvou obecně pracujte opatrně. Přemýšlejte nad její symbolikou (např. červená se užívá na označení negativního trendu, zelená působí pozitivně), zkontrolujte, jestli jsou barevné rozdíly viditelné i pro barvoslepé (například tady), nebojte se monochromatických (jednobarevných) škál, které vůbec nejsou nudné, ale spíše pomáhají tomu, aby byl graf přehledný.
Online nástroje
Existuje velké množství volně dostupných i placených nástrojů, ve kterých si můžete vytvořit svou vlastní vizualizaci dat. Pro začátek doporučujeme tyto dva:
Datawrapper je volně dostupná aplikace s intuitivním a jednoduchým rozhraním. Vytvoříte v něm velice vkusné základní i pokročilejší grafy, kterých design si umíte přizpůsobit na míru. Můžete měnit polohu popisků, barevnou škálu (a zjistit, jestli je srozumitelná i pro barvoslepé), zarovnání, velikosti, symboly a mnoho dalšího. Umožňuje export v PNG a publikaci přes link nebo embed.
Excel je pravděpodobně nejběžněji používaný nástroj pro tvorbu vizualizací dat. Jaké má výhody a jaká na vás číhají úskalí? Více na sobotním workshopu!
Co dělat tento týden?
Tento týden úkol není. Místo toho si důkladně prostudujte tento modul a také informace k sobotnímu workshopu. Ptejte se v diskuzním fóru, pokud máte otázku a sledujte email pro nejaktuálnější organizační informace.
Workshop se NEKONÁ v sobotu 14. 3. z důvodu zrušení prezenční výuky na MU. Bude se konat 18. 4. nebo 23. 5. v závislosti od toho, jak se bude situace vyvíjet.
Omlouvám se, buďte prosím trpěliví, opatrní a zaznačte si tyto dvě data do kalendáře. Hned jak budu vědět, kdy bude možné workshop uspořádat (pokud vůbec), budu vás informovat emailem.