Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová Klíčový význam korektního uložení získaných dat Pravidla pro ukládání dat Čištění dat před analýzou I. Příprava dat Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová Anotace — Současná statistická analýza se neobejde bez zpracování dat pomocí statistických software. Předpokladem úspěchu je správné uložení dat ve formě „databázové“ tabulky umožňující jejich zpracování v libovolné aplikaci. — Neméně důležité je věnovat pozornost čištění dat předcházející vlastní analýze. Každá chyba, která vznikne nebo není nalezeno ve fázi přípravy dat se promítne do všech dalších kroků a může zapříčinit neplatnost výsledků a nutnost opakování analýzy. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová Parametry (znaky) Opakování DATA – ukázka uspořádání datového souboru Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová — Správné a přehledné uložení dat je základem jejich pozdější analýzy — Je vhodné rozmyslet si předem jak budou data ukládána — Pro počítačové zpracování dat je nezbytné ukládat data v tabulární formě — Nejvhodnějším způsobem je uložení dat ve formě databázové tabulky ¡ Každý sloupec obsahuje pouze jediný typ dat, identifikovaný hlavičkou sloupce ¡ Každý řádek obsahuje minimální jednotku dat (např. pacient, jedna návštěva pacienta apod.) ¡ Je nepřípustné kombinovat v jednom sloupci číselné a textové hodnoty ¡ Komentáře jsou uloženy v samostatných sloupcích ¡ U textových dat nezbytné kontrolovat překlepy v názvech kategorií ¡ Specifickým typem dat jsou datumy u nichž je nezbytné kontrolovat, zda jsou datumy uloženy v korektním formátu — Takto uspořádaná data je v tabulkových nebo databázových programech možné převést na libovolnou výstupní tabulku — Pro základní uložení a čištění dat menšího rozsahu je možné využít aplikací MS Office Zásady pro ukládání dat Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová Možnosti MS Excel — Správa a práce s tabulárními daty — Řazení dat, výběry z dat, přehledy dat — Formátování a přehledné zobrazení dat — Zobrazení dat ve formě grafů — Různé druhy výpočtů pomocí zabudovaných funkcí — Tvorba tiskových sestav — Makra – zautomatizování častých činností — Tvorba aplikací (Visual Basic for Aplications) Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová Import a export dat — Import dat ¡ Manuální zadávání ¡ import – podpora importu ze starších verzí Excelu, textových souborů, databází apod. ¡ kopírování přes schránku Windows – vkládání z nejrůznějších aplikací – MS Office, Statistica atd. ¡ využití textových souborů jako kompatibilního formátu pro přenos dat mezi různými aplikacemi — Export dat ¡ Ukládáním souborů ve formátech podporovaných jinými SW, časté jsou textové soubory, dbf soubory nebo starší verze Excelu ¡ Přímé kopírování přes schránku Windows — Výběr buněk ¡ CTRL+HOME – přesunutí na levý horní roh tabulky ¡ CTRL+END – přesunutí na pravý dolní roh tabulky ¡ CTRL+A – výběr celého listu ¡ CTRL + klepnutí myší do buňky – výběr jednotlivých buněk ¡ SHIFT + klepnutí myší na jinou buňku – výběr bloku buněk ¡ SHIFT + šipky – výběr sousedních buněk ve směru šipky ¡ SHIFT+CTRL+END (HOME) – výběr do konce (začátku) oblasti dat v listu ¡ SHIFT+CTRL+šipky – výběr souvislého řádku nebo sloupce buněk ¡ SHIFT + klepnutí na objekty – výběr více objektů — Kopírování a vkládání ¡ CTRL+C – zkopírování označené oblasti buněk ¡ CTRL+V – vložení obsahu schránky – oblast buněk, objekt, data z jiné aplikace — Myš a okraje buňky ¡ Chycení myší za okraj umožňuje přesun buňky nebo bloku buněk ¡ Při chycení čtverečku v pravém dolním rohu výběru je tažením možno vyplnit více buněk hodnotami původní buňky (ve vzorcích se mění relativní odkazy, je také možné vyplnění hodnotami ze seznamu – např. po sobě jsoucí názvy měsíců. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová Tipy a triky Ukotvení příček Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová — Umožňuje ukotvení libovolných řádků a sloupců pro pohodlné vkládání a prohlížení dat v tabulce — Umožňuje číst řádky/sloupce ze začátku tabulky i po přesunutí se dále — Záložka „Zobrazení“ → „Ukotvit příčky“ — Nabízené možnosti: o Ukotvit příčky – ukotví řádky nad označenou buňkou a sloupce vlevo od označené buňky o Ukotvit horní řádek o Ukotvit první sloupec o ! Ukotvení zrušíme opětovným odkliknutím možnosti ukotvení příček Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová Databázová struktura dat v Excelu Jednotlivé záznamy (taxon, lokalita, pacient atd.) Sloupce tabulky = parametry záznamů, hlavička udává obsah sloupce – stejný údaj v celém sloupci Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová Automatický zadávací formulář I. — Slouží k usnadnění zadávání dat do databázových tabulek — Načítá automaticky hlavičky sloupců jako zadávané položky Názvy sloupců Obsah dané buňky - editovatelný Nový záznam Vyhledávání Microsoft Office 2003 a starší Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová Automatický zadávací formulář II. — Aplikaci automaticky zadávaného formuláře je nutné aktivovat ¡ „Tlačítko Office“ → „Možnosti aplikace Excel“ ¡ Automatický zadávací formulář spustíme pomocí nové ikonky na panelu nástrojů Rychlý přístup; dále stejné Microsoft Office 2007 Taxon Abundance Lokalita etc. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová Automatické seznamy — Vytváří se z hodnot buněk v daném sloupci a umožňují vložit hodnotu výběrem ze seznamu již zadaných hodnot – usnadnění zadávání Sloupec z nějž je seznam vytvořen a pro který platí Buňka, do níž se vloží vybraná hodnota Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová Automatická kontrola dat — Umožňuje ověřit typ, rozsah nebo povolit pouze určitý seznam hodnot zadávaných do sloupce databázové tabulky Co je povoleno – definiční obory čísel, seznamy, vzorce atd. Rozsahy hodnot, načtení seznamů apod. komunikace s uživatelem Microsoft Office 2007 Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová Seznamy I. — Skupiny hodnot zachovávající logické pořadí, některé jsou zabudované (např. dny v týdnu, měsíce v roce), další je možné uživatelsky vytvořit, slouží pro účely řazení a automatického vyplňování dat Výběr buněk pro nový seznam Načtení nového seznamu Existující seznamy Microsoft Office 2003 a starší Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová Seznamy II. ¡ „Tlačítko Office“ → „Možnosti aplikace Excel“ ¡ Vlastní seznamy dále stejné (viz předchozí slide) Microsoft Office 2007 Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová Řazení dat — Řazení dat je nejjednodušším způsobem jejich zpřehlednění, užitečným hlavně u menších/výsledkových tabulek Zkontrolujte, zda seřazení nezničí vazby mezi buňkami = kontrola oblasti, kterou řadíte. Využít první řádek oblasti jako záhlaví Další možnosti – řazení řádků, řazení podle seznamu Podle čeho řadit Směr řazení – vzestupně, sestupně Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová Automatický filtr — Pomocí automatického filtru je snadné vybírat úseky dat pro další zpracování na základě hodnot ve sloupcích databázové tabulky, výběr je možný i podle více sloupců (např. určitá skupina pacientů) — Funkce automaticky rozezná hlavičky sloupců v souvislé oblasti buněk — U sloupců použitých pro filtraci jsou rozbalovací seznamy zbarveny modře — Výhodné pro čištění dat (vyhledávání překlepů, kombinace textu a čísel) Výběr hodnot pro filtraci Rozbalení seznamu hodnot nalezených ve sloupci Automatické dokončování hodnot buněk Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová — Vhodné pro textová pole; následně není nutné vypisovat celé slovo či slovní spojení, ale jen zvolit nabízené, již dříve použité slovo či slovní spojení — Automatické dokončování hodnot buněk je nutné nastavit ¡ „Tlačítko Office“ → „Možnosti aplikace Excel“