moderní HELMUT SWOBODA S ÚVODEM NOSITELE NOBELOVY CENY PROF. DR. RAGNARA FRISCHE statistika NAKLADATELSTVÍ SVOBODA PRAHA 1977 * 1 OBSAH KNIHOVNA C; 1971 Droemcrsche Vcrlogsanstalt Th. Knaur Nachf. München Zürich Translation (£) doc. Ing. J. Clsaf. CSc, Praha 1974 Úvod nositele Nobelovy ceny prof. dr. Ragnara Frische 1. Co je statistika? 1.1 Od hřbitova čísel k pomůcce při rozhodování 1.2 Od nauky o státu k analytické statistice 1.3 Základní soubor — rozdělení 1.4 Pravděpodobnost a přesnost 2. Řád a zlořád průměrů 2.1 Aritmetický průměr 2.2 Modus a medián 2.3 Harmonický a geometrický průměr 2.4 Statistika ve Zbohatlíkově 2.5 Směrodatná odchylka a rozptyl 2.6 Třídění 2.7 Histogram a polygon četnosti 3. Normální rozdělení 3.1 Znaky a relativní četnosti 3.2 Počet pravděpodobnosti a statistika 3.21 Binomické rozdělení 3.22 Zákon velkých čísel 3.3 Normální rozdělení 3.31 Dějiny normální křivky 3.32 Normované normální rozdělení 3.33 Jak zacházet s tabulkami pravděpodobnosti -kvartily a percentily 3.4 Jiná rozdělení 3.41 Poissonovo rozdělení 3.5 Součtové a koncentrační křivky 3.6 Četnost a hustota 4. Body, procenta, indexy 4.1 Časová řady 4.2 Vyrovnání kalendáře 4.3 Index a koš zboží 4.4 Kouzlo procent 4.5 Míry, podíly, poměrná čísla 17 17 19 24 29 34 34 37 47 45 47 56 57 61 61 63 66 71 73 77 80 83 87 89 92 94 97 97 102 106 123 128 5. Výběry a dotazníky 5.1 Sběr dat, šetření a zpracování 5.2 Dotazníky a dotazování 5.21 Z dějin sčítání lidu 5.3 Reprezentativní průřez obyvatelstvem 5.4 Rozsah výběrových souborů 5.5 Spolehlivost výběrových souborů — intervaly spolehlivosti 5.6 Systematické chyby — „předběžný výpočet" 6. O zacházení s hypotézami 6.1 Pod kontrolou 6.11 Přejímací kontrola 6.12 Kontrolní karty 6.2 Jednoduché testy hypotéz 6.21 Narození chlapců pod normální křivkou 6.22 Pravděpodobnost a hypotézy 6.3 Bayesova věta a její použití 6.4 Nejmenší vzorky 6.41 Studentovo rozdělení t 133 133 137 142 145 150 163 165 169 169 171 178 181 186 189 190 196 197 10.3 Analýza rozptylu 10.31 Rozdělení F 10.4 Testy pořadí 10.41 Wilcoxonúv test dvou výběrů 10.5 Maximální věrohodnost Doslov k českému vydání Pro další informaci Rejstřík 324 330 335 339 342 345 347 349 7. Proč statistiky lžou? 205 7.1 „Statistiky", které nejsou statistikami 205 7.2 Počtárske umění demagogů 210 7.3 Od extrapolace k futurologii 217 7.4 Grafická zobrazení: obraz lže víc než tisíc čísel 229 7.5 Umění výkladu. Statistická interpretace 241 8. Jednotlivec a statistika 245 8.1 Statistika všedního dne 245 8.2 Mikrocensus a hospodářská statistika 248 8.3 Máme se dát pojistit? 255 8.4 Délka lidského života a statistika obyvatelstva 263 8.41 Morální statistika aneb: „Utíkejte! Všechno je prozrazeno!" 270 8.5 Čekání na autobus — teorie hromadné obsluhy 275 9. Post hoc ergo propter hoc 281 9.1 Vztahy, příčiny, účinky 281 9.2 Korelace 286 9.21 Korelační koeficient 294 9.3 Regresní počet 298 9.4 Zdánlivá korelace — logika a statistika 304 10. Hledání jistoty 310 10.1 Hypotézy a kontingence 310 10.2 Test chí kvadrát {/-) 315 » Úvod nositele Nobelovy ceny profesora dr. Ragnara Frische Dr. Helmuc Swoboda vytvořil svou knihou o moderní statistice neobyčejné dílo. Vytkl si za úkol důvěrně seznámit se statistikou lidi. kteří o ní nemají vůbec žádnou představu. Neobyčejnost jeho činu je v tom. že se mu to v tak velké míře podařilo. Přátelsky vede čtenáře krok za krokem dál a dál. A je pochopitelné, že je nesnadné nedůvěřivě se uzavřít upřímným úmyslům laskavého průvodce. Po chvíli však čtenář ke svému úžasu zjistí, že vnikl až do některých nejabstrakt-nějších a nejobtížnějších oblastí statistiky. Nejpodivnější přitom však je. že se čtenář na svého lstivého učitele nemůže vůbec zlobit, neboť teď vidí vlastníma očima celou nádheru divuplné krajiny, do níž ho autor zavedl. A zvlášť vděčný je za to, že byl upozorněn na některá závažná zneužit! statistiky. Podívejme se jen na tento mistrovsky koncipovaný příklad: příběh muže, který zamýšlí koupit ve Zbohatlíkově pozemek. Tento muž dostane různé, zřejmě zcela si odporující údaje o průměrném ročním příjmu obyvatel Zbohatlíkova. Zprostředkovatel uvedl 82 320 tolarů a vysvětloval, že 20% obyvatel prý má průměrný roční příjem 309 400 tolaru. Bankovní ředitel informoval, že více než polovina obyvatel má roční příjem přes 29 000 a nejčastější roční příjem je asi 18 000 tolarů. Místní učitel, velmi zběhlý ve statistice, tvrdil, že většina obyvatel má příjem nižší než 7500 tolaru. A nakonec statistický úřad na dotaz sdělil, že všechny tyto zdánlivě si tak odporující údaje jsou pravdivé. Vysvětlilo se to tím, že v tomto malém místě bydlel milionář a že matematické vlastnosti mediánu, aritmetického průměru, harmonického průměru, geometrického průměru a nejčetnější hodnoty se navzájem podstatně liší. Kdo tento případ promyslí, nikdy nezapomene na podstatu věci. Autor přes zdánlivě tak snadný výklad nikdy neztrácí ze zřetele hlubší logické souvislosti. Jen se například podívejte, jak zdůrazňuje, že statistické ověřování hypotéz podle teorie Jerzy Neymana a E. S. Pearsona není ničím jiným než pokusem hypotézu zamítnout. Takové ověřování nikdy nemůže vést k závěru, že hypotéza je správná. Statistické ověřování hypotéz se skutečně může provádět mnoha způsoby, s větší nebo menší účinností. Při velmi důkladném postupu je dokonce možné představit si celou řadu dílčích ověření. Při každém z nich může být testovaná hypotéza zamítnuta — a v tom případě to znamená její konec. Jestliže ji však nezamítneme, můžeme pouze říci: „Provedeným testem jsme nemohli hypotézu zamítnout." Je možné, že se ji jednou podaří zamítnout některým jiným testem. Podobá se to dostihovému závodu s neomezeným trváním. Na každém skoku může kůň padnout, a tím by byl konec jeho závoděni. Nepadne-li však, zbývá jen jedno — pokračovat v závodě. Často se zlobím na nepřesný způsob vyjadřování, s nímž se můžeme setkat i v přísně vědeckých pracích, že se totiž výraz „nezamítnuto" pokládá za významově stejný s „uznáno správným". Shoduji se s autorem, když tvrdě trvá na logickém rozdílu mezi těmito dvěma tvrzeními. Jestliže se však provádějí stále přesnější ověřování, jejichž výsledkem je stále stejná odpověď: „při tomto zvláštním testu nebyla daná hypotéza zamítnuta", dojdeme nakonec k praktickému závěru, že v případě, kdy bychom byli donuceni jednat, jednali bychom tak, jako kdyby hypotéza byla správná. Avšak to je docela něco jiného než zjištění: „hypotéza je správná". Je nápadné, že autor při svém vysvětlování velmi často používá ilustrací, obrázků mužů, žen a dětí. Dělá to proto, že ilustrace jsou pro většinu lidí velmi působivé. Ale lidé a jejich obliby jsou různé a někteří — třeba já — rozhodně dávají přednost abstraktnímu a systematickému výkladu. Chtěl bych tedy pro ty čtenáře, kteří snad z této knihy a z doplňující literatury v ní uvedené již získali určité znalosti z oblasti statistiky, velmi stručně načrtnout logické základy teorie statistického ověřování hypotéz. Čtenáři, kteří se s prvními základy statistiky teprve seznamují, mohou tuto část klidně přeskočit, rozhodně sejí však nesmějí nechat zastrašit — rozumět jí není vůbec předpokladem pro pochopení této knihy! Následuje tedy poněkud obtížnější část, určená vědecky orientovanému čtenáři. U hypotézy v technickém a statistickém smyslu se soustřeďujeme na charakteristický způsob rozděleni pravděpodobnosti určitého jevu. Je zkrátka třeba určit speciální způsob tohoto rozdělení. Přitom nemusí jít o nějaký nový způsob, o němž se domníváme, že je správný. Někdy to může být i způsob, který pokládáme za nesprávný. Máme však přitom v úmyslu najít právě pomocí tohoto testu něco, co opravňuje daný způsob rozdělení pravděpodobnosti zamítnout. Při statistickém ověřování hypotéz musíme vždy již něco vědět předem, nezačínáme tedy s čistým stolem. Volba ověřované hypotézy nesmí proto být zcela bezplánovitá. Ověřovaná hypotéza musí patřit k určité větší skupině hypotéz, k tzv. přípustným hypotézám, které označme Q. Nejdůležitější je. aby tato přípustná skupina Q byla určena. Z větší skupiny vybereme podskupinu to. To je ověřovaná hypotéza (někdy se označuje jako nulová hypotéza). Tato podskupina to může být zčásti nebo plně specifikována. Zčásti bude specifikována, když způsob odpovídajícího rozdělení pravděpodobnosti obsahuje alespoň 1 parametr, který není číselně přesně stanoven. Význam takové hypotézy je prostě tento: „Je zde přesně definováno rozdělen! pravděpodobnosti, které obsahuje tyto dosud Číselně neurčené parametry." Dodatkem k těmto číselně neurčeným parametrům může zčásti specifikovaná nypotéza. která se má ověřit, obsahovat jeden nebo více Číselně určených parametru Testovaná hypotéza je plně specifikována, když všechny nejisté parametry rozděleni pravděpodobnosti jsou určeny číslem. Ověřovanou hypotézu, popsanou uvedeným způsobem, budeme muset často testovat oproti ,.né alternativní hypotéze uvnitř množiny přípustných hypotéz. Jakmile se dojde ke skutečné konstrukci určité testovací metody, uvidíme, jak 10 je nutné mít na zřeteli kromě testované hypotézy také některé jiné hypotézy, s nimiž se testovaná hypotéza porovná nebo, chcete-li, od nichž by se testovaná hypotéza měla odlišit. To dále ještě vyložím. K provedeni testu musíme použít statistického pozorování, na jehož podkladě se pokusíme určit, zda „testovaná hypotéza se zamítá" nebo zda „testovaná hypotéza se nezamítá". Testovaná hypotéza má někdy určité charakteristické vlastnosti. Nebo obráceně, hypotéza bez zvláštních vlastností může oproti testované hypotéze být hypotézou se zvláštními vlastnostmi. Proto musíme při konstruování metody testování hypotézy rozlišovat mezi dvěma druhy chyb. jichž se můžeme dopustit — chyby zamítnutí a chyby nezamítnutí. Chyby zamítnutí (chyby prvního druhu) jsou chyby, které děláme, když testovanou hypotézu zamítneme v případě, v němž by tato hypotéza zamítnuta být neměla. Chyby nezamítnutí (chyby druhého druhu) jsou chyby, jichž se dopouštíme, když testovanou hypotézu nezamítneme v případě, kdy by tato hypotéza musela být zamítnuta. Stojíme před dvěma problémy. Na jedné straně bychom rádi provedli ověření takovým způsobem, aby vznikla jen nepatrná pravděpodobnost chybného zamítnutí. To znamená, že chceme být „fair" vůči hypotéze, kterou ověřujeme; neprovedeme tedy žádné nepřípustné zamítnutí. Na druhé straně bychom rádi zmenšili i možnost chyby nezamítnutí. To znamená, že nechceme svou slušnost přehánět a upustit od zamítnutí takové hypotézy v případech, v nichž by zamítnuta být měla. Musíme proto velmi uvážlivě kormidlovat mezi Scyllou a Charybdou. Podle druhu postupu, který chceme zvolit na základě ověření a v souladu s materiálními důsledky, které z našeho postupu mohou vyplynout, se někdy budeme nejvíce obávat toho, abychom se nedopustili chyby zamítnutí, jindy zase chyby nezamítnutí. Historicky to byl začátek. Jak tedy najdeme nějaká kvantitativní měřítka, která nám umožní proplout mezi touto Scyllou a Charybdou? Především použijeme pomocně něco, co označíme jako obor zamítnutí (kritický obor). Je to obor v prostoru pozorování, který je uspořádán tak. že testovaná hypotéza se zamítne, pokud vlastní pozorovaná hodnota spadá do tohoto oboru (nebo na jeho hranici). Leží-li však hodnota mimo obor zamítnutí, testovaná hypotéza se nezamítne. Prostor pozorování je prostě n-dimenzni prostor v němž je obsaženo těchto n pozorovaných statistických údajů. Zvláštním případem je. když těchto n údajů jsou pozorováním konkrétně definovane proměnné. Je logické, že konstrukce oboru zamítnutí musí být zpracována drive, než provedeme skutečná statistická pozorování. To je důležité. Druhy naš krok spočívá v tom. že stanovíme malou pravděpodobnost, např. 0,05. 0 02 nebo 0 01. tzv. pravděpodobnost zamítnutí. Je to pravděpodobnost toho. že P°"r°™"° hodnota spadá do kritického oboru s podmínkou, že ověřovaná hypotézaje správná. Je to zřejmě obvyklý způsob, jak udržet na nejnižš.m stupn, pravděpodobnost, že uděláme chybu prvního druhu. nnrnra Je-li např. zpravodajským materiálem aritmetický prumôr n nezav.slyc pozoro vání a testovaná hypotéza zní. že tento průměr má normální rozdělen, s danou 11 střední hodnotou a danou směrodatnou odchylkou, je možno z tabulky normálního rozdělení vyčíst kritický obor, který odpovídá pravděpodobnosti zamítnuti 0,05, 0.02 nebo 0,01. Nikoliv však jednoznačně! Pro každou udanou pravděpodobnost zamítnutí lze zde najít tři možné kritické obory úplně stejně, jako když vzpomeneme na odchylky od střední hodnoty jen směrem nahoru nebo jen směrem dolů anebo na odchylky bez ohledu na znaménka. Tyto tři možnosti konstrukce kritického oboru s proměnnou podle dané pravděpodobnosti zamítnutí jsou jen zcela zvláštním případem všeobecné neurčitosti kritického oboru, k níž dochází, všimáme-li si pouze obvyklým způsobem udané pravděpodobnosti a. Pozorujme nyní neurčitost kritického oboru poněkud blíže v n dimenzích (přičemž n je počet statistických údajů, které určují prostor pozorování). Předpokládejme, že je známa hustota pravděpodobnosti podle testované hypotézy v každém libovolném bodu prostoru pozorování. Když je udána pravděpodobnost zamítnutí (např. 0,05 nebo 0,02 či 0,01), zřejmě to nedostačuje k jednoznačnému určení kritického oboru. Všeobecně bude mnoho oborů toho druhu, kde celková pravděpodobnost oboru se rovná a. Ukazuje se nutnost zavést jinou přípustnou hypotézu, se kterou musíme porovnat hypotézu původní, to však znamená jinou hypotézu, proti níž se musí testovat naše původní hypotéza. To je jádrem moderní teorie statistického ověřování hypotéz. K definování toho, co rozumíme „nejsilnějším" (nejiepším) kritickým oborem, musíme určit jinou hypotézu, která nás nejvíce zajímá, pro srovnání s testovanou hypotézou. Vede to k následujícímu pravidlu: Ze všech oborů v prostoru pozorování, které odpovídají pravděpodobnosti zamítnutí rovné udané hodnotě a podle rozdělení pravděpodobnosti testované hypotézy, vybereme ten obor (nebo ty obory), jenž ukazuje nejvyšší stupeň pravděpodobnosti podle rozdělení pravděpodobnosti jiné hypotézy, s níž testovaná hypotéza má být porovnána. Maximalizovat tuto pravděpodobnost je zřejmě totéž jako udržet na pokud možno nejnižším stupni pravděpodobnost připuštění chyby nezamítnutí. Říkalo se, že ve „středověku" statistiky byl problém „nejsilnějši" metody ověřováni hypotéz diskutován se zřetelem na hypotézu per se. V moderní době se přihlíží ke skutečnosti, že ,,nejsilnějši1' metoda, tj. „nejsilnějši" konstrukce kritického oboru, závisí na jiné přípustné hypotéze, s níž se musí porovnat hypotéza původní. Je několik případů, kdy „nejsilnějši" testovací metoda pro danou hypotézu je táž bez ohledu nato, kterou jinou přípustnoj hypotézu s ní chceme porovnat. To se označuje jako případ, v němž je jeden stejnoměrně nejsilnějši test. Takové případy jsou však vzácné, takže většinou si nusíme zároveň všímat testované hypotézy a jiné přípustné hypotézy, s níž se p vní má porovnat. Souhrnně řečeno: H je testovaná hypotéza, H» je hypotéza, proti níž má H být testována. X budiž obor v prostoru pozorování a x bod v tomto prostoru. Nejsilnějši kritický obor pro H, když se má testovat H proti H* s pravděpodobností zamítnutí, je určen: 12 (1) P{xcX'H*} -> max ! (c znamená „obsaženo v", maximalizovat") (2) za vedlejší podmínky P{xcX H} = x max ! znamená „má se P {xcXH*} v (1) označuje pravděpodobnost toho, že realizace bodu x v X je za předpokladu rozdělení pravděpodobnosti H*. Zamítnout H znamená totéž jako dostat jeden bod x v X. To bychom přirozeně rádi viděli tak často, jak jen možno podle rozdělení pravděpodobnosti H*. Potud pravidlo (1). Neradi bychom to však viděli často podle rozdělení pravděpodobnosti H. Podle tohoto rozdělení pravděpodobnosti bychom se s tím raději setkávali zřídka. Potud pravidlo (2). Jednoduchý přiklad Hustota normálního rozdělení n nezávislých pozorování xv x2,...x„se stejnou střední hodnotou p a stejnou směrodatnou odchylkou a je určena: <3> -4- exp-(-2^2(x'-^" 2 i=1 (2n) a" (4) Q má být libovolné rozdělení pravděpodobnosti tvaru (3) s konečným p a a. Chceme testovat hypotézu p = p0, přičemž p„ je předem udané číslo. A tuto zkoušku chceme testovat proti hypotéze p>p0, přičemža budiž známá konstanta. Nejdříve si všimneme jednoduššího problému testu u = p0 proti,« = pv přičemž ,«! je jiné dané číslopl >pQ. Obě tyto hypotézy jsou plně určeny. Problém (1) až (2) může být proto řešen přímo s použitím Lagrangeova multiplikátoru. Výsledkem je, že (5) x ^ p0 + f, —— Y n je nejsilnějši kritický obor pro hypotézu p = p0, testováno proti hypotéze p = = pv přičemž py > p0. V (5) je f. horní mezí normálního rozdělení podle pravděpodobnosti zamítnutí a. Jinými slovy: vztah mezi f„ a x je dan (6) + co e 2 df = a(í, pozitivní). Tento vztah mezi f, a a lze vyčíst z tabulky normálního rozdělení. V (5) je x prostě nevážený aritmetický průměr pozorování. Pozoruhodné je. že pl se v (5) 13 nevyskytuje. Podle toho je stejný kritický obor nejsilnější, když hypotéza se testuje proti nějaké jiné hypotéze spočívající v tom, že se řekne: střední hodnota budiž větší než //„. V tomto případě máme proto stejnoměrně nejsilnější test pro p = fid, totiž ten, který je určen kritickým oborem (5). Není však žádný stejnoměrně nejsilnější test proti hypotéze /i ^/z0. Funkce sily testu Předpokládejme, že nějakým způsobem byl určen kritický obor X pro hypotézu H. Předpokládejme X jako konstantu. Tu se může objevit zajímavá otázka: Jak ostře oddělující bude tento test pro H s daným X, když se bude testovat H proti libovolně vybrané hypotéze/-/** v Í2> To je dáno funkcí ..síly testu" („silofunkcí"). (7) P{xcXH**}, přičemž H** se může obměňovat se všemi H** v Q. V případě, že různé hypotézy /-/** jsou charakterizovány hodnotou jediného parametru 0, může se psát (7) jako (8) P{xcX<9}. Ideální tvar „silofunkce" (8) je ten, který v (8) je blízko 1 pro všechny hodnoty (9 s výjimkou zvláštní hodnoty 0, jež charakterizuje ověřovanou hypotézu. Pro tuto zvláštní hodnotu 0 má (8) tak rychle, jak jen možno, poklesnout k pravděpodobnosti zamítnutí a. ,,Silofunkce" (7) — nebo její zvláštní případ (8) — se nazývá „nezkresleně", pokud jde o pravděpodobnost, nebo „maximálně pravděpodobný odhad" — když její minimum leží při H** = H. Chceme-li v našem předcházejícím příkladu ověřovat hypotézu /x = fi0 proti hypotéze fi ft0, nemáme — jak jsem se zmínil — žádný stejnoměrně nejostřeji odlišujíc! test. Jestliže však přidáme podmínku, že „silofunkce" má být nezkreslená, tzn. když mezi všemi testy s nezkreslenou „silofunkcí" hledáme ten. který splňuje (1) a (2). zjistíme, že je jeden stejnoměrně nejostřeji odlišující test. totiž ten. který je charakterizován f*oI ;= y- ta . přičemž je určeno vzorcem Uvedené výsledky jsou přirozeně jen některé krajně jednoduché příklady. Další případy s důkazy jsou uvedeny v mých norských přednáškách o ověřování hypotéz (Memorandum z 9. srpna 1952, Universita Oslo, Sociálně ekonomický ústav). Venkovské sídlo v Rcyse, Norsko, svatodušní neděle 1971. i Co je statistika? ÍSÄÄCS t R09nar FrÍSCh' se *W* 3. března 1895 v Oslo; studoval v hodno t pXo a hľ" ľ'ÍK T" ° V ľ0Ce 1931 byl ^" "a univerzitu v Oslo ústavuľnlľrzi" h°ípodarík>'eh ©d rolcu 1932 je ředitelem Sociálne ekonomického JÄJS^^ společnosti, existujíc! od roku 1931. kých akad'emií a sPTcno"i v ľz ^ '^ ™5 d° r" 1955>" Je Členem "tnych ^ nlm dílům pQtřl Maxima Y ™mch a cestny™ doktorem mnoha univerzit. K jeho hlav- které vytyčovaly směr v oblLľi'Iľ™' i ' ° hosPodařske využití." Na základě svých prací, národohospodářem Janem Tinb ' tUry a rústu' dostal " roce 1969 (společně s holandským udělena poprvé. Cena mu b I er^e"em) Nobelovu cenu za ekonomii, která byla v tomto roce procesu. 1 ° udelena *> práce k vývoji modelu pro rozbor hospodářských 1.1 Od hřbitova čísel k pomůcce při rozhodovaní „Jsou tři druhy lží: lži, odsouzeníhodné lži a statistiky." Toto rčení se vyskytuje v různých variantách, jako např. jsou lži, lži z nouze a statistiky, a představuje již asi 100 let nejčastěji citovaný výrok o statistice. Všechny verze uvedeného rčení, ať už jsou vyhroceny jakkoliv, mají jedno společné: naznačují, že statistika je zvlášť rafinovanou formou lži. Je kuriózní, že mezi vědci nikdy nedošlo ke shodě, komu tento zlomyslný výrok připsat. Nejčastěji se autorství připisuje Benjaminu Disraelimu, jindy se jako autor uvádí protivník Disraeliho lord Palmerston. Je pravděpodobné, že jde o zlomyslnou jízlivost některého člena parlamentu, který asi byl statistickými údaji zahnán do úzkých, a když se mu obrana nezdařila jeho vlastními statistikami, bránil se tímto způsobem. Velmi podivné však je, že poznámka, která byla před 100 lety přijata v britském parlamentě s úsměškem, se stále ještě cituje po celém světě. Ještě podivnější je, že se většinou cituje nekriticky, bez nebo téměř bez znalosti toho, co statistika vlastně je. Jestliže se stále opakuje, že statistiky lžou, začne se tomu nakonec věřit tím spíše, že čas od času se vyskytne možnost přesvědčit se, že ta nebo jiná statistika skutečně „lže". Tento obecně rozšířený názor je však podivuhodným způsobem spojen se zce- la opačným postojem, totiž že statistiky se zároveň považují za vrchol nevyvratitelného, neboť mají magické kouzlo matematické přesnosti — a co by mohlo být přesvědčivější než číselný údaj? Proto platí: kdo potřebuje nezvratný důkaz, vyzbrojí se statistickými údaji a rozbory a v rozhodujícím okamžiku je hodí na stůl: zde — statistika dokazuje. Většinou pak proti sobě stojí dvě statistiky, ze kterých se odvozují zcela protichůdná tvrzení a úplně zmatený laik je jen posilován ve svém přesvědčení, že statistiky skutečně lžou. Je-li však v přemýšlivé náladě, pak se ptá, jak je možné, že dochází k tak těsnému a zdánlivě neodlučitelnému propojení matematické přesnosti se zřejmou lží. Statistika se v důsledku toho nakonec stává pro laika téměř tajemnou vědou. To vše by nebylo tak zlé, kdyby šlo o vědu nebo pracovní metodu, s níž se normální občan obyčejně dostane jen zřídkakdy do styku. Se statistikou je to však jinak. Setkáváme se s ní nejen ve zprávách, informacích a poznámkách všeho druhu, ale tvoří zároveň základnu pro plánováni, organizaci a celé moderní soužití. Ačkoliv se ve své moderní podobě zabývá i malými vzorky, poskytuje v zásadě návod k zacházení se soubory a četnostmi, s rozsáhlými číselnými údaji o věcech a lidech. Ve světě plánování a systematické přípravy budoucnosti je základem nesčetných propočtů a nesčetných rozhodnutí. Asi není správné tvrzení, že ze života M. \RXISIviU-LE! [[) 17 1. Co je statistika?__ má více ten, kdo se zabývá statistikou. Jisté však je, že takový člověk ví více o zákonitostech života a že se ř v budoucnu o nich více dozví. Kde však hledat kořeny tohoto zvláštního nerozhodného postoje ke statistice? Mohou za to především dvě skutečnosti: za prvé nedostatečná znalost cílů, metod a možností statistiky a za druhé, že za statistiku se pokládá i to, co je ve skutečnosti pseudosta-tistikou. K prvnímu důvodu jednou Horace Levinson velmi správně poznamenal: „Statistika se těší pochybnému vyznamenán! tím, že je nejvíce nepochopeným vědním oborem. Neznamená to však, že je nejméně známá. Nepochopení nějaké věci totiž předpokládá, že se o ní něco ví nebo přinejmenším se myslí, že se ví... Se statistikou je to však tak, že panuje všeobecné mínění, že z každého, kdo se ve škole naučil trochu počítat, lze bez obtíží udělat statistika prostě tak, jako když se udělí titul." První příčina však přímo vyvolává příčinu druhou. Protože všude vládne mylný názor, že k vypracování statistiky postačují jen obstojné znalosti počtů, stává se statistika velmi lehce rejdištěm amatérů. Výsledek jejich práce se pak posílá do světa jako „statistika", kterou šikovný novinář případně opatří tučným titulkem, jenž se třeba k obsahu ani nehodí, a čtenář pak bere toto pochybné dílo jako vrchol moudrosti nebo jako další důkaz, že statistikové marní svůj čas pošetilostmi neboze pomocí čísel fabrikují lži. Ve středověku a v raném novověku byl všeobecný postoj vůči medicíně velmi podobný tomu, jaký se dnes zaujímá ke statistice, a to ze zcela obdobného důvodu. Pro laika bylo prostě příliš obtížné rozpoznat rozdíl mezi lazeb- 18 níkem a lékařem, mezi mastičkářem a učencem. U statistiky k tomu přistupuje ještě jedna obtížná okolnost. Lékař a pacient jsou zpravidla v osobním důvěrném styku, který se rozkolísá, jakmile vznikne podezření, že lékař je ve službách jiné, „nepřátelské" osoby, jako je tomu např. u odvodního lékaře za války nebo u posudkového lékaře nemocenské pojišťovny. K soukromému statistikovi se zpravidla na konzultaci nechodí, a tak důvěra ke statistikovi, který je v „cizích" službách, kolísá od bezmyšlenkovité víry, pokud nedochází k ohrožení vlastního zájmu, až po bezmocný vztek, když se operuje číselným materiálem, který by mohl vlastním zájmům škodit. Pak statistika nesporně „lže" a je-li zájmová skupina, která se cítí ohrožena, dosti majetná a aktivní, rychle angažuje vlastního statistika, aby mohla jinými čísly prokázat vlastní pravdu. V dalším textu budeme mít ještě dost příležitostí ukázat, proč se zdá, že statistiky tak častou lžou. Nyní jen heslovitě některé hlavní příčiny: nepozorné čtení přesně formulovaných podmínek šetření, neúmyslně nebo úmyslně mylná interpretace jednotlivými instancemi, a last not least (poslední, ne však méně důležitá — angl.) stará moudrost, že každá věc má přinejmenším dvě stránky. Tato kniha sleduje současně dva navzájem zcela slučitelné cíle: Poskytnout kurs první pomoci proti špatným statistikám, tj. ukázat, před kterými chybami, klamnými triky, omyly a úskoky se má uživatel statistik chránit (popř. také jejich zpracovatel, jde-li o statistika amatéra). Dále má kniha poskytnout úvod do myšlenkových základů a rutinních postupů vědy a metody, jejíž význam 1.2 Od nauky o státu k analytické statittice stále roste už i proto, že moderní statistika, jak brzy uvidíme, nemá téměř nic společného s těmi „hřbitovy čísel", které před 100 a snad ještě i před 50 lety byly pro tuto vědu charakteristické. „Statistika je dnes výkonnější než dříve," řekl lapidárně Erwin Kreyszig před několika lety, a jako důvod dodal: „Dříve se musela omezit na prostý empirický popis, dnes může posloužit při posuzování situací, protože byla vhodně rozvinuta její matematická základna." Již na tomto místě lze uvést to, čím se budeme dále zabývat častěji: Moderní statistika klade ve své teoretické i praktické práci hlavní důraz na analýzu výběrových šetření, a ne na hromadná vyčerpávající šetření. Proto je statistika dnes více než kdykoliv jindy ve všech životních situacích a povoláních — od domácnosti až po světovou politiku — především pomoci při rozhodování. Vím něco, ale ne vše — jak se zachovat pokud možno nejra-cionálněji? Wallis a Roberts uvedli svou učebnici „Methoden der Statistik" (Statistické metody) právem větou: .Statistika je soubor metod, které nám umožňují činit rozumná rozhodnuti v případě nejistoty." Je však nepochybné, že moderní statistika tvoří základ teorie rozhodování. Zároveň však nutno dodat, že starší způsoby statistické práce nebyly ještě plně překonány a zatlačeny novými metodami a teoriemi, ale spíše přeformulovány a obohaceny. Statistický rozbor umožňuje např. mnohem rozsáhlejší a zčásti dokonce přesnější odhady s menšími náklady než dřívější způsoby vyčerpávajících hromadných šetření. Ještě poznámku k dvojímu významu pojmu „statistika". Nejen v němčině a v češtině se tímto slovem označuje jak jednotlivé statisticky vyjádřené šetření, tak i věda, která se těmito pracemi zabývá v nejširším smyslu. Je proto nutno rozlišovat mezi „jednou (dílčí) statistikou" a „statistikou", přičemž se samozřejmě ihned ukáže, co jsme právě naznačili: v průběhu staletí, a především v průběhu našeho, dvacátého století se význam statistiky podstatně změnil. 1.2 Od nauky o státu k analytické statistice Před více než 100 lety napsal Gustav Růmelin, že existuje nejméně 63 definic pojmu „statistika". Od té doby jich přibylo daleko více, neboť v Růmelinově době ještě nenastala ona dalekosáhlá přeměna, která úplně změnila strukturu statistiky. Budeme ještě mít příležitost ukázat některé podrobnosti z dějin statistiky. Zde postačí jen stručný náčrt tří etap, na které lze rozdělit její historický vývoj. Nejstarší statistikou je „popis státu", spočívající v zobrazeni daného zeměpisného, hospodářského a politického stavu. „Status" je stav, ale také stát, neboť stát sám je stav, totiž „status rei publicae", stav společenství. Jedno z prvních státovědných děl vyšlo v r. 1562 v Benátkách: FrancescoSansovina, „Del governo et amministratione di diversi regni' (O vládě a správě v různých královstvích). Přesně o 100 let později uveřejnil Veit Ludwig von Seckendorff svou knihu „Teutscher Fürsten-Staat" (Německý knížecí stát), státovědnou příručku, která byla opakovaně vydávána až do 18. století. Ve stejné době měl historik práv a lékař Hermann 19 DEL GOVERNO ET AM M INISTRATION E Dl DIVERSI HEGNI. ET KEPVBUCHE. Coli antichc . come mftVmf, DIM. FRJ.XCtSCO S.1i\'SOr/NO Lir, XX//. Q* i. ser tSí. BBC ■Nŕmíf <-«1— fc». m«j*»». ■ŕ"*' • C 0 P X^l r I L E G I 0. InV«w.Pr««oAliokcCoSjia». M D LXX.X11L Ah Linau ucti Falcu*- m 8 im-* flckých údajů, jako např. délka pranic, počet ostrovů a jejich rozloha, nejvyšší horské vrcholy a místa s nejnižší nadmořskou výškou, délka toků řek, klimatické údaje apod. Zcela jiný okruh statistiky vznikl mezitím v Anglii, a to takzvaná „politická aritmetika", která vycházela z údajů o narozeních a úmrtích a na tomto základě se pokoušela srovnávat a pozorovat číselný vývoj obyvatelstva za delší časové úseky. Graunt a Petty zpracovali v druhé polovině 17. století základní díla, v Německu dosáhl tento směr v tvrdém boji proti Achenwallově — Schlózerově škole prvního rozhodujícího úspěchu velkolepým výkonem Nejstarši statistika ještě ve smyslu učeni o státě je sbírka popisů států „Del governo... di diversi regni" (1562) od Franceska Sansovina. ve které je dokonce popsán ideální stát „Utopie" Thomase Moora. Conring v Lipsku první přednášky o popisné státovědě. První velký teoretik statistiky v německé jazykové oblasti, Gottfried Achen-wall, se již v polovině 18. století výslovně odvolává na etymologický původ slova „status" jako „stav" a jako „stát". Statistika měla ukazovat „skutečné pamětihodnosti měšťanské společnosti" — podle našeho způsobu vyjadřování důležité zvláštnosti státu. Poslední zbytky této nejstarši podoby statistické vědy ještě dnes nalézáme na prvních stránkách statistických ročenek řady států, kde se uvádí řada geogra- ©rúnblidje tnblíttjfťSSífdjrti&img/ na/ SH#n* JSM&flmlm fr SA"**« ■ <«*d. mm» 11111 btn OMttcB—■ ».«.». l8l»«l1«l|nllHl»«iiH./TWnl/ m-Ort. trnut 11! «Ii M ji i/ ottmiSnSiLimiBlS' li. ■■ nu. nl*Meata>l—>1ana(>nJM«MM . «»«l*(MNl«*iMiř»^a«l«iHlfltní'!'|wt»ii» M. DC. ^"^8 ^arfc *" • „Teutscher Fürsten-Staat" (Německý knížecí stát) od Veita Ludwiga von Seckendorřfa představuje předchůdce oněch popisů státu, jimi dali později Achenwall a Schlözer označeni „statistika". 20 1-2 Od nauky o státu k analytické $totut.< 6tAí8i)críafíung t:: !■..i;.:fu mwtanftro e»ropÄif*fn SKfiíc unt ©ólfrr ■ Sr un> t iff e (Rftifrieb «*rnir«ll Utd.r IbdL e»" ťm* wm* '»'illliflln. i- BnU, to, Sto, «.Kim i;ii. W fcl«.to-to. Uto, »" ' 1 1 (-Mto-iMMb n ■ >■»■»■ ílu n _sr »» i. ei.»,,!. . « ••• ' • • ' totoV <3i<»ntv«_a _ ^„ a,, »••": ■->•>>M,»to.Ctototort* ŕ* "*1 *??.*""■" "•"■■»e»«»)»» ft-mot (AantaAJ. Un Amt« tt.c*™» ■ i mi fni«umm» nliVřwrfm aatb Nfcnv*. Ä.«, fnnř. ww »in.», ttiirtaitoo,. etna. MMeiWN^ÉVrhMt sr«srr-s£toiKr COM«, toM toM, m m .n,m j>M«.l». M _ Hr.». IWHiMW.U.to.t*. ■to)» S> M1« baaaa . ač U^lTiľrli Gottfried Achenwall definoval statistiku jako „vědu o státě", jako popis a zobrazeni jednotlivých států, přibližně tak. jak ji dnes poskytuji např. díla. jako je „The Statesman's Year Book". Moderní statistika má naproti tomu s Achenwallovou vědou o státě dnes společné jen jméno. pruského polního kazatele a pozdějšího vrchního konzistorního rady Johanna Petera Süssmilcha. Süssmilch — „meteor, zářící a osamocený", jak ho později označil teolog a morální statistik von Oettingen — napsal své hlavní dílo „Betrachtungen über die göttliche Ordnung in den Veränderungen des menschlichen Geschlechts aus der Geburt, dem Tode und der Fortpflanzung desselben erwiesen" (1741) (Úvahy o božském pořádku v proměnách lidského rodu, dovožených z jeho narození, smrti a rozmnožování), knihu o statistice obyvatelstva, která v prokazovaných zákonitostech doufá nalézt moudrou vůli boží (obr. str. 22). V následujících desetiletích se tato po-litickoaritmetická statistika změnila na světskou statistiku. Matematici a teoretici pravděpodobnosti nacházeli v běhu života lidské společnosti stále více zákonitostí. Co začalo jako velebení boha, stalo se početním příkladem ostrovtlpných matematiků (a astrono- mů). Vzpomenutý vliv základních teoretických koncepcí pravděpodobnosti na statistiku se začal projevovat stále výrazněji. Belgičan Adolphe Quéteiet vypočítal z různorodých lidských jedinců „homme moyen" (průměrného člověka), ideální typ, o který se příroda snaží a který je v podstatě nereálný. Tím vytvořil nejen matematicko-mystickou bájnou bytost, nýbrž i důležitou základnu pro celou budoucí statistiku, totiž koncept normálního rozdíleni, normálni křivky, střední hodnoty a rozptylu. Z četných matematiků a všestranných vědců, kteří v 18. a 19. století vytvořili cenné a pro další rozvoj statistiky fundamentální práce, se zpravidla uvádějí tři Bernoulliové (Jacob. Daniel a Ni-colas). Halley, Lagrange. Euler. dále zejména Lapiace, de Moivre a Gauss a v řadě s nimi i geniální outsider, anglický duchovní Thomas Bayes. Téměř celá statistická činnost v 19. a na začátku 20. století je charakterizována tím. že se statistika zabývá hromadnými 21 I. Co je statistika? ©íř góíŕfidjŕ ľc5 mcflfílíiícii (5/ MM í»cr gcfoirt, $o&, uitô gortpffaii^unii Johann fyífr Siipmil*, í»řrrn_£bnjHan 2Bolffrné. Hnila, 3« int« ta 3. C Spctkt. '-4'. J. P. Siismilch uvedl svým dílem „Göttlicher Ordnung" (Úvahy o božském pořádku) (1741) poprvé do střední Evropy statistiku obyvatelstva. Na podkladě kostelních registrů v Ku-ronsku prokázal Siismilch pravidelnost narozeni a úmrti. jevy. Magické heslo znělo: vyčerpávající šetřeni, to znamená přesně zachytit veškeré obyvatelstvo pomocí pečlivě připraveného sčítání lidu, pokud možno vyčerpávající záznamy o demografických a hospodářských jevech. Heslem bylo: čísla, stále více a stále úplnější. To byla statistika, jak si ji většinou představuje laik ještě dnes. Na přelomu století a zejména pak ve třicátých letech našeho století přichází nová proměna ve vývoji statistiky. Zrodila se moderní statistika, analytická statistika, induktivní statistika. K této charakteristice bude nutné později 22 mnohé doplnit. Zde je třeba zdůraznit jen podstatný rozdíl oproti dřívější statistice: jestliže dříve byla snaha namáhavou a nekonečnou prací zjistit každý jednotlivý detail, nyní se hledají metody, které by umožnily tvořit závěry o celku na základě výběru a dílčích šetření. Heslo moderní statistiky zní: výběr. Tato proměna způsobila úplný převrat ve statistické teorii a praxi. Matematika více než kdy jindy ovládla pole, a to nikoliv pomocí čtyř základních početních úkonů, které postačovaly pro státovědnou statistiku a ještě i pro statistiku hromadných vyčerpávajících šetření. Matematická statistika se vyvinula v samostatný vědní obor vyšil matematiky, s vlastními postupy, jako jsou analýza rozptylu, korelační počet a ověřování hypotéz s četnými pracovními metodami. Základy k tomuto vývoji položili na začátku 20. století Lexis a Bortkiewicz v Německu a Čebyšev, Čuprov, Ljapu-nov a Markov v Rusku. Brzy potom se tato disciplína stala doménou Anglo-američanů a v menší míře také Skandinávců. Po druhé světové válce začínala ve střední Evropě statistika prakticky úplně znovu, i když Oskar Anderson a někteří jiní se snažili již ve třicátých letech o uplatnění nových metod. Ještě v roce 1965 konstatoval Erwin Krey-szig: „Matematická statistika nemá v německé jazykové oblasti stále ještě dostatečný význam a použití." Převažující postavení Angloameričanů je především zásluhou velké osobnosti sira Ronalda A. Fischera, který sám nebo spolu s jinými vytvořil většinu dnes obvyklých pracovních metod statistické analýzy. I když jsou dnes on a „biometrická škola" v mnohých podrobnostech překonáni, jeho historický 1.2 význam pro statistiku je a zůstane ohromný. K nejvýznamnějším statistikům v anglo-americké oblasti patří dále G. U. Yale, Karl Pcarson a Američan polského původu Jerzy Neyman, který společně s Pearsonovým synem E. S. Pearsonem byl otcem teorie výběru. Dnes je vědecky vzdělaný statistik současně také vysoce kvalifikovaným matematikem — i když ne nutně ve všech oborech matematiky. To však nemůže být pro laika důvodem, aby v tom spatřoval potvrzení své nechuti nebo svého odporu ke statistice. Ve všech vědních oborech mohou jen odborníci dosáhnout vysoce kvalifikovaných výsledků. Inteligentní současníci Od nauky o ,,átu fc Qng|yt,ek< ttnti.f„. se však přesto snaží porozumět do určité míry nejvýznamnějším vymoženostem a procesům moderního života, i když netvoři součást jejich vlastního pracovního zaměření. Představy o světě dosažené moderní přírodovědou nebo poznatky sociologie jsou důležité i pro toho, kdo není přírodovědcem nebo sociologem. Stejně je tomu i se statistikou: v době, kdy roste význam statistických metod a informací, je znalost nejdůležitějiich zásad statistiky potřebná pro každého, koho povolání nebo i běžný život přivedou do styku se „statistikami", a to je dnes každý, jehož zájem jde i jen tak daleko, že pravidelně čte svůj denní tisk. jednotlivec Radomír Nováček turista v Itálii majitel vozu příjemce více než 2800, ale méně než 3000 Kčs měsíčně Jak může statistika jako učeni o hromadných jevech vypovídat néco rozumného o jednotlivá. Může a dělá to tlm způsobem, že nezkoumá jednotlivce v individuální mnohost, jeho činnosti, nýbrž jen jako anonymního nositele nékteré činnosti vedle mnoha jiných, napr. jako turistu v Itálii, jako majitele vozu. jako příjemce mzdy určité příjmové skupiny atd. _ 1. Co je statistika? 1.3 Základní soubor — rozdělení Hlavním obsahem této knihy je uvést a vysvětlit nejdůležitější statistické pojmy a metody. Nemělo by proto příliš mnoho smyslu, kdybychom je hned na začátku uvedli vyčerpávajícími definicemi, neboť se mohou stát srozumitelnými teprve ve vzájemných souvislostech. Základní myšlenku, která se jako červená nit vine dalším výkladem, chceme však nastínit hned na samém počátku. Statistika se zabývá i ve své moderní podobě výběrové analýzy zásadně hromadnými jevy. Tím se nevylučuje, že ve výběru nejsou přesně zkoumány jed- notlivé věci nebo osoby, avšak nikoliv proto, aby se zjistila jejich individuálnost, nýbrž proto, aby se zjistila existence nebo neexistence nějakého znaku, 0 němž se domníváme, že se vyskytuje 1 jinde, znaku, který je rozložen v základním souboru. S následujícími dvěma slovy se budeme setkávat často. Jedno zní „základní soubor", druhé „rozdělení". Podívejme se nejdříve krátce na základní soubor. Je to většinou myšlenková konstrukce, která se nevyskytuje v přirozeném stavu, ale je formulována teprve v průběhu statistické činnosti. Takovým základním souborem může být „obyvatelstvo světa" nebo „obyvatelstvo ..Statistická masa". ..základni soubor" může být tvořen podle libosti - musi vsak zahrnovat rtechny ,ednotl.vé prvky souboru: např. všechny ženaté muže v Brně. pacienty městské zubní kl.n.ky v m.nulém roce nebo výrobu cigaret v závodě Y v měsíci dubnu 1-3 Základni soubo, _ rozdelení základní soubor („soubor vyillho řádu") 2 z mnoha možných výběrových souborů (..•oubor niliiho řádu") Je-li nemožné nebo příliš časově náročné, příliš drahé nebo neúčelné zachytit základní soubor všech jeho jednotlivých složkách, používá se výběrového souboru a libovolně se vyjme několik jednotek. Výběrový soubor poskytne pak vice nebo méně spolehlivé závěry o základním souboru a to podle rozsahu základního souboru, rozsahu výběrového souboru a rozdělení zkoumaných znaků. >r ve >nlilr ČSSR k 1. 1. 1972" nebo také „ženatí muži v Plzni" anebo „samostatní zemědělci s ročním příjmem menším než 20 000 DM" či „pacienti městské zubní kliniky v Bordeaux" nebo „vozidla z roku 1970" anebo „cigarety vyrobené v měsíci dubnu závodem X f my Y". Vymezeni základního souboru není vždy docela bez problémů. Často je lákavé pokušení rozšířit jej více, než je zdůvodněno statisticky šetřeným materiálem. Když zkoumáme např. výběr 300 pacientů městské zubní kliniky v Bordeaux podle příjmu, rodinného stavu, počtu zubů, které ještě mají, nebo také podle barvy vlasů anebo tělesné váhy, dostaneme v případě, že výběr vzorku byl proveden statisticky správně, pravděpodobně dobrou představu řekněme o 10 000 pacientech, kteří navštívili tuto kliniku v uplynulém roce. Lze však použít tyto výsledky také pro pacienty zubní kliniky v Marseille nebo Lyonu, či dokonce v Edinburghu nebo Stuttgartu? To bude pravděpodobně nemožné bez dalšího šetření, zejména jde-li o zahraniční kliniku. Teprve když jsme pomocí odpovídajícího výběrového šetření poznali do jisté míry např. základní soubor „pacienti zubní kliniky Stuttgart", budeme moci napříště — stále však ještě s náležitou obezřetností — aplikovat některé závěry šetření v Bordeaux také na Stuttgart. Zásadně však platí, že výběrový soubor (vzorek) vypovídá jen o tom základním souboru, z něhož byl odvozen: dotazníková akce v Mnichově poskytuje informace o názorech a poměrech v Mnichově, nikoliv však v Hamburku a už vůbec ne v Paříži. Výběrové šetřeni o mzdách vyplacených v papírenském průmyslu Hessenska nevypovídá nic o mzdách horníků v Porúří apod. Základní soubor, „soubor vyššího řádu", jak jej nazývá Anderson, je onen základní soubor, v němž každý jednotlivý díl má stejnou naději dostat se do výběrového souboru - ..souboru nižšího řádu". . Co však je v základních souborech nebo ve výběrových souborech rozděleno? Znak. který je předmětem šetřeni rwba 25 1. Co je statistika ? 1.3 Základní soubor — rozděleni Statistické údaje |sou vidy ..události", a proto skutečnosti z minulosti. Jejich projekce do budoucna je vidy zatížena nejistotou i při použiti nejlepších postupu. Včerejší a dnešni čísla dovoluji jen dohady a odhady čísel zitřejších. neumožňuji však jejich přesný výpočet. Ze současné úmrtnosti se může pouze přibližní usuzovat o budoucí, z technických konstrukci minulosti jen přibližné o konstrukcích v budoucnosti. Téměř všechna statistická šetření se zásadně zakládají na pozorováni nebo měřeni znaků v individuálních vyiádřenich: podle toho se zjišťuji četnosti jednotlivých znaků. 25 osob dotázaných na svůj příjem se stane bezprostředně potom úplně neosobními „nositeli znaku" — nositeli, kteří se rozlišují jen více nebo méně četnými vyjádřeními znaku: dva z 25 vydělávoji mezi 1500 a 2500 Kčs. pět z 25 vydělává méně než 800 Kčs — kdo jsou. jak se jmenují, zda maji příbuzné nebo dluhy, jsou nebo nejsou spokojeni, to je pro statistické zkoumáni znaku ..výše příjmu" prozatím bezvýznamné, což samozřejmě nevylučuje, aby v průběhu dalšiho zkoumáni souvislosti mezi příjmem a věkem, příjmem a školním vzděláním, příjmem a velikosti rodiny atd. se uvedené znaky zjišťovaly. pod 500 500 -600 600 -700 700 -800 700 -800 800 -900 800 -900 900 -1000 1000 -1100 1000 -1100 | 1400 ^00 -1500 26 1. Co je statistika ? Přesné známé je sloienl výberového souboru. ,,Promitne-li" se vlak tento dllčl výsledek do neznámého základního souboru, přesnost se nutně ztrácí — zůstává jen odhad, ovšem v přesně propočitatelných mezích pravděpodobnosti a spolehlivosti. výberový soubor neznámý základni přesněji řečeno, četnost, s niž se vyskytují určité charakteristiky znaku. Tak je třebo „rozdělen" důchod mezi pří-jemce'duchodu. Někteří dostávají méně než 500 DM měsičně, jiní mezi 500 a 550, další mezi 551 a 600 atd. až nad 1500 DM, kdy počet příjemců vyšších důchodů výrazně klesá (str. 26—27). „Rozděleny" jsou také četnosti, např. sled barev v ruletě. Velmi charakteristické rozdělení vykazují, jak ještě uvidíme, četná biologická měření, jako třeba tělesná výška nebo objem hrudníku: velmi vysokých a velmi malých lidí je málo, naproti tomu „průměrných" je velký počet. To je takzvané „normální rozděleni", které má ve statistice významnou roli. Vyskytuje se také „rozdělení" řídkých události. Nikdo např. nemůže předvídat, kdo v příštím slosování bude mít 6 správných čísel, avšak docela dobře se dá předpovědět, kolik výherců přibližně bude. Základní myšlenka, která je dnes základem značné části statistické činnosti, je tedy tato: má se propočítat (správ- soubor něji: početním výkonem odhadnout), jaké rozdělení určitého znaku je možno očekávat v základním souboru, jestliže ve výběrovém vzorku jsem našel určité rozdělení. Od průzkumu veřejného mínění ke kontrole výroby a od hospodářské prognózy k laboratornímu výzkumu se prostírá onen bezmála nekonečný prostor, v němž se na základě plánovaných experimentů, vzorků a dílčích poznatků usuzuje z rozdělení jednoho znaku vzorku na rozdělen! stejného znaku v celém souboru. Matematické metody, které vytvářejí početní souvislosti mezi vzorkem a celkem, jsou poněkud obtížné, ale nejdůle-žitější z nich mohou být srozumitelně vyjádřeny alespoň v hlavních rysech. Počtárske umění moderní statistiky, jak čtenář brzy uvidí, tvoři úplně svérázná matematika, spíše rafinovaná hra s pravděpodobnostmi a odhady než přesnost na několik desetinných míst, která se většinou s představou matematiky spojuje. \mk pravděpodobnost a přesnost Základem celé moderní statistiky je počet pravděpodobnosti, a to nikoliv jen z prostého a jasného důvodu, že zájem o údaje z minulosti vzniká především na základě zájmu o budoucnost; dílčí výsledky výběrových šetření mají především poskytnout pomůcku pro budoucí jednání. Jde tedy vždy o odvození zdvěrů z dílčích poznatků, závěrů, které nesmějí nikdy být nesprávně chápány jako nesporné předpovědi, nýbrž jako předpovědi, které jsou vždy obklopeny pojmy jako „pravděpodobnost", „obor spolehlivosti", „maximální věrohodnost", „pravděpodobnostjistoty", „očekávaná hodnota", „rozptyl", „hypotéza" a „odhadovaná hodnota". Jednoznačně poznatelná může být nanejvýš minulost, nikdy budoucnost. „Poznání" (znalost) daného vzorku (výběrového souboru) však opravňuje k výpovědi o základním souboru, z něhož byl výběr proveden jen v přesně určených mezích. K tomu, aby se ze vzorků a podobných dílčích výsledků mohly odvodit závěry, jejichž vypovídací schopnost lze popsat, je nezbytné nutné, aby výběr ze základního souboru byl proveden nahodile, a nikoliv na podkladě záměrné volby. Jen v tomto případě je náhoda ponechána jaksi sama sobě, náhoda, kterou sice počet pravděpodobnosti dovede vymezit a podchytit, která je však falšována a křivena, jakmile se ji snažíme obejít subjektivně provedenou volbou (obr. na str. 31). Z tohoto důvodu tvoří úvod do studia statistiky většinou studium počtu pravděpodobnosti a obráceně. Je velice obtížné vymezit přesnou hranici mezi počtem pravděpodobnosti a moderní statistikou. Neustále se objevují formu- _Pravděpodobnost a přesnost lace, že statistika je koneckonců jen aplikovaný počet pravděpodobnosti. Je možné, že tato formulace není zcela správná, ale nikdo nepopře velmi úzkou souvislost mezi nimi. Leonard Savage, jeden z nevýznamnějších statistiků naší doby — a také, jak později ještě uvidíme, jedna z nej-spornějších osobností — napsal k tomu ve svém díle „The Foundations ofStatis-tics" (Základy statistiky). „Všeobecně se plně souhlasí s tím, že statistika se nějak zakládá na pravděpodobnosti. Co však se má rozumět slovem >>pravdě-podobnost« a jak je spojeno se statistikou, na to se názory tak různí a je tak malá možnost dorozumět se, jak sotva kdy od stavby babylónské věže." V našem výkladu se ovšem nemůžeme podrobně zabývat těmito interními rozpory mezi veleknězi vědecké statistiky. Základní teoretická vysvětlení pravděpodobnosti jsme omezili na minimum, které je nezbytně nutné k porozumění statistické činnosti. Nicméně považujeme za vhodné poukázat již zde na toto úzké sepětí. Propočet pravděpodobnosti, kvantitativní výpovědi o hypotézách, odhady a domněnky, to jsou dnes hlavní úkoly statistiky. Matematicky dokonalé a přesné jsou jen metody, výsledkem jsou však odhady a pravděpodobnosti. Zdánlivá přesnost statistiky klame jen laika. Odborník ví, že statistika je spiše uměni odhadu a ..nauka o odhadu" než počtárska technika. Ernst Wagemann. prezident Říšského statistického uradu ve 20. letech, napsal: „Počtárske umem je jen služkou své mnohem vzdělanější paní, statistického odhadu." Britský statistik M. Y. Moroney koni, svou knihu „Facts from Figures Skutečnost z čísel) d°konce ^m:zizi: •„Ve škole se nám stále nalévá do hlavy. 29 1. Co je statistiko? ýběrové soubor) dílčí výsledky odhady v mezích pravděpodobnosti Ani použitím všemožných pomůcek nelze dosáhnout toho, aby z výsledků výběrových souborů bylo možno učinit nesporné závěry o celkovém souboru. Je však zcela možné přesně zjistit kvalitu odhadu, např. tímto způsobem: ,,S 95% jistotou je tento odhad plus nebo minus dvě procenta správný." že aritmetika je exaktní věda, že všechny úkoly v učebnicích mají svá správná řešení. A pokud slyšíme něco o odhadech, pak vždy s poznámkou, že přitom jde o hrubou přibližnost a že lze samozřejmě nalézt přesné řešení... To je ale žalostná příprava pro budoucí život. Snad až na pokladníka v bance, který počítá peníze jiných, je jinak úplná přesnost aritmetiky k ničemu... Učitelé by prokázali svým žákům velmi cennou službu, kdyby je učili kritickému přístupu k aritmetice. Měli by je učit umění škrtnout 114,72 a místo toho napsat 100..." Pro státovědnou statistiku 18. a 19. století měla pečlivá a přesná zjištění a úzkostlivě exaktní početní operace podstatný význam. Dnešní matematická statistika je naproti tomu převážně uměním určit, za jak nepřesné lze pokládat takové vypočtené údaje, jako je pravděpodobný výsledek, hypotéza či tvrzení. Počátky tohoto poznání sahají daleko do minulosti. Quételet již před více než 100 lety varoval před přehnaným pře- ..Učitelé by se měli naučit uměni škrtnout 114,72 a místo toho napsat 100." říká anglický statistik Moroney a vyjadřuje tím, že v denním životě se mnohem častěji setkáváme s odhady a přibližnými hodnotami než s úplně přesnými údaji. ludem přesnosti. Laici, statističtí amatéři — a zvláště v minulých letech bohužel také statistikové z povolání — vždy znovu podléhali pokušení předstírat přesnost výsledků, která je popravdě prostě nedosažitelná. Oskar Anderson, jeden z prvních, kdo se v německé jazykové oblasti zasazovali o moderní statistiku, napsal ještě před necelými 40 lety na svou obranu toto: ,,Pro mne platí tyto dvě nezvratné zásady: 1. nemá praktický smysl chtít odvažovat fůru sena na chemicky přesných váhách; 2. není nic platné odhadnout vzdálenost mezi dvěma městy zhruba v tisíci krocích a pak k výsledku připočítat tloušťku městských hradeb v milimetrech." (Viz obr. na str. 32.) Uvedená druhá „zásada" není ani dnes všude uznávána. Úcta před přesností aritmetiky, kterou už Moroney tak odsoudil, stále ještě silně působí. A pokud se skutečně někdy uvádí hrubý odhad, pak první, komu padne do ruky, s ním nakládá jako se svátostí. Tak můžeme číst, že 1609 km vysoko ve vesmíru nebo také 1609 km daleko od pobřeží se stalo to nebo ono: odhad ,,1000 námořních mil" byl přepočten s úzkostlivou přesností. Z téhož důvodu se katastrofy stávají často přesně 32 km od Tokia nebo San Franciska — to zase, když se něco stane ve vzdálenosti asi 20 mil. Statistika opovrhuje tímto druhem počtárskeho umění — a právem. Není pochyb o tom, že statistická výpověď může být uvedena přesně až na desetinná místa, ale skutečně dobré statistice nikdy nebude chybět odkaz na to, jak velká je pravděpodobnost pro přibližnou správnost údajů. Jestliže statistik nechce říci: „asi 1600", řekne: „s 95% pravděpodobností ne méně než 1583 a ne více než 1631". Zásadně musí každý jednotlivec mít stejnou šanci být pojat do výběrového souboru; jinak nelze použít postupů počtu pravděpodobnosti. Nemohu se tedy dotazovat jen lidí s klobouky nebo lidí s fotoaparáty, chci-li se dovědět něco o souboru návštěvníků náměstí sv. Marka. A nesmím se také přirozeně dotazovat ve stejnou denní dobu. Předně: návštěvníci náměstí sv. Marka vybraní pro výběrový soubor jsou jen návštěvníci náměstí sv. Marka, a nikoliv „Benátčané" nebo „turisté z Itálie" anebo „návštěvníci italských pamětihodnosti" či „hoteloví hosté v Benátkách". Bylo by nesprávné jen statistice připisovat k tíži takové zdůrazňováni pravděpodobnosti a poukazováni na nepřesnosti. Zde se jen otevřeně vyslovuje to. co nechceme přiznat v dennim životě, v běžném hovoru a často i ve vědě — totiž že i naše ..ano" a „ne", dokonce naše „docela jistě" a „určitě ne" jsou zatížena často nejistotou a snad i zcela nepatrnou pochybnosti. Pro zjedno- 31 1. Co |e stotistlko ?_ dušení a také proto, abychom se vyhnuli nenapravitelnému zmatku, nevšímáme si zpravidla náhod, překvapení a vzniklých nepravděpodobností. Matematická statistika to však činí viditelným, vymezuje hranice pravděpodobnosti a za to platí zpochybněním přesnosti. Znovu však se musíme ptát spolu s Moroneyem: k čemu je toto úsilí po přesnosti? Pro správu železnic může být důležitá znalost počtu cestujících, kteří pojedou v příštím červenci z určitého města do Jugoslávie. K tomu ale plně postačuje znát počet cestujících v minulém roce zaokrouhleně na 1000 osob. Několik stovek více nebo méně už nehraje roli. Ani vyčerpávající šetřeni není totiž bez vad. Nezřídka má větší vady než dobře a svědomitě provedené výběrové šetření. Jak problematickou se např. může stát při bližším pohledu i taková na první pohled prostá otázka, jako je počet cestujících v minulém létě z NSR do Itálie. Léto — co je to léto? Definujme: od začátku června do konce září. Co dál? Máme obejít všechny malé i velké cestovní kanceláře a sečíst záznamy cest do Itálie a prosit celníky na jižní hranici, aby se zeptali každého automobilisty na cil jeho dovolené? Pak chybějí ještě jednotlivci cestující železnicí a ti, kteří jedou přes Francii. Ale cestující v osobních autech s paušální úhradou organizované cesty jsou již počítáni dvakrát. A co s těmi, kteří sice zaplatili let do Říma, ale odtud snad poletí dál do Káhiry nebo Madridu? M Pravděpodobnost a přesnost Mají se mezi cestující do Itálie počítat také ti, kdo stráví dovolenou u Vrb-ského jezera v Korutanech a na tři dny si zajedou do Benátek? Použije-li se údajů o přenocování a o přihláškách v cizině, budou čísla zase jiná, avšak nemusejí být lepší. Kolik majitelů soukromých pokojů raději své hosty nehlásí! Toho, kdo cestuje s obytným přívěsem, nelze skoro vůbec podchytit. Dotazníkovou akcí pomocí výběrového souboru několika tisíc občanů NSR se pravděpodobně dosáhne s mnohem menšími náklady správnějšího výsledku šetření než všemi uvedenými pokusy o vyčerpávající šetření. Ještě většími zdroji chyb jsou údaje o tom, kolik DM nebo dolarů vydal v průměru turista ve španělsku, Rakousku nebo Řecku. Všechny devizy totiž nenajdou cestu do Národní banky a dolary nemusejí vždy pocházet od Američanů a marky od Němců. Jestliže tedy čteme, že západoněmecký občan vydá v Itálii na osobu a den průměrně 3567 lir, je toto číslo především pouze odhadem a správně by mělo být vyjádřeno asi takto: „s 95% jistotou od 3500 do 3630 lir"; za druhé je toto číslo průměrem, který vzniká mechanickým rozdělením všech v Itálii vydaných DM na všechny německé cestující. Nicméně průměry mají ve statistice svůj velký — a často velmi špatně pochopený — význam. Věnujme jim proto pozornost hned na začátku. ___________ M^i^^a^T^00^. mezi dvčma mčstX odhadneme a potom k výsledku připočteme odhadu připočítá přesná míra „.TV*'','. *M právem °skar And«"on. Jestliže se k nějakému pocta přesná míra. neni tlm celkový výsledek přesněji!, nýbrž zůstává nadále odhadem. DNES 9/9/9 ZÍTRA 32 Teorie pravděpodobnosti a statistika zacházejí s pojmy jako "i1**" ^J^háf Vědecký výhled hovorová řeč. Pro budoucnost se nedají dělat žádné „absolutně psu preop* do budoucnosti zná pojem ..s nejvyššl pravděpodobnosti . n.kollv vsak ..jist* . 2 Řád a zlořád průměrů 2.1 Aritmetický průměr Průměr má ve statistice velmi významnou úlohu — a v představách, které o statistice existují, je jeho význam ještě daleko větší. Zatímco laik považuje různé „průměry" za velmi důležité, statistik zná všechny jejich záludnosti a nedostatky. Neodborník si říká: konečně mám koncentrovaný, informací nabitý údaj, který dovede vyjádřit najednou vše. co je jinak skryto v nekonečných a matoucích tabulkách. A tak se průměr až příliš lehce povyšuje na opravdu magické číslo. Průměr jako výsledek hodnocení nepřehledného množství čísel je pro statistika velmi důležitý vzhledem k tomu, že vnáší řád a přehled do tisíců nebo dokonce miliónů jednotlivých informací, a takové přehledné uspořádání je jedním z hlavních úkolů statistiky. Pro odborníka je však průměr jen prostředkem pro zjednodušené zobrazení. Podívejme se však nejdříve podrobněji na onen průměr, který má zpravidla na mysli neodborník, když slyší toto slovo. K tomu je třeba sečíst větší nebo menší počet jednotlivých výsledků měření nebo jiných údajů a tento součet pak dělit počtem sčítanců. Toto „dělení" je etymologicky již opravdu „průměrem", neboť je rozdělováním a jcko početní výsledek poskytuje rozdělení, tj. průměr: jestliže deset dělím pěti, tedy deset jednotek na pět stejných dílů, sestává každý díl ze dvou jednotek. Má-li např. 5000 rodin dohromady měsíční příjem 10 miliónů DM, vydělávají „v průměru" 2000 DM. Nebo, jak praví jedno žertovné úsloví: „Sním-li dvě husy a ty žádnou, pak jsme v průměru snědli každý jednu." Přesto má tento průměr magický účinek, kvůli němuž laik zapomene, že jde jen o jakýsi druh orientační pomůcky v uspořádání veličin, v žádném případě o prognózu pro jednotlivý případ. Očekávaná délka života třicetiletého muže, občana ČSSR, může v průměru činit ještě dalších 40,9 roku, čímž však ještě není řečeno, že všichni dnes třicetiletí muži (nebo i jen jejich značná část) zemřou krátce před dosažením 71. roku. Průměr obecně a aritmetický průměr zvláště slouží k tomu, aby bylo možno sjednotit značně rozdílné údaje. Třicetiletý jednotlivec se může zítra stát obětí dopravní nehody, stejně tak jako se v plné duševní svěžesti dožít roku 2020. Jako součást „obyvatelstva", ve dvojím smyslu slova, jako občan i součást statistického základního souboru, je jeho osobní osud zahrnut do „průměrné délky lidského života", ať už proběhne jakkoliv. Průměrnou délku života lze stanovit pro „velké číslo", jímž je souhrnný počet všech třicetiletých, velmi přesně, protože se zjišťuje z ještě většího čísla a získaných zkušeností; pro jednotlivce má však relativně malý význam. Individuální význam bude nepatrný, zejména tehdy, když „rozptyl" (tento pojem bude později podrobně vysvětlen — viz str. 47) je relativně velký, to znamená, když např. přibližně stejný počet ..Průměr" předstírá často rovnoměrnost nebo normu, která neexistuje. Když v „průměru" každý sní husu, je zcela možné, že někteří lidé snědl dvě, resp. i více, a jiní žádnou. Aritmetický průměr se vypočítá sečtením jednotlivých hodnot a dělením počtem hodnot. Výrobní údaje za 6 měsíců se sečtou (v přikladu se součet rovná 312 000) a pak se dělí 6. únor 47 500 leden 55 500 ^Mtifflltt březen květen 51600 červen 48400 měsíční prumer uplynulého pololetí 52 000 35 2. Řád o zlořád průměrů___ nynějších třicátníků nakonec zemře v šedesáti, v sedmdesáti nebo osmdesáti letech. Čím je naproti tomu rozptyl menší, tím větší vypovídací schopnost má průměr i pro každý konkrétní případ. Kdyby např. statistika dokazovala, že převážná většina lidí umírá mezi sedmdesátým a sedmdesátým druhým rokem věku, pak by bylo rozumné plánovat svůj život tak, jako kdybychom se nedožili více než sedmdesáti dvou let. Avšak to statistika vůbec netvrdí. V nejjednodušším případě vypadá zjišťování „průměru" takto: Firma X vyrobila v lednu 55 500 rozhlasových přijímačů (nebo také zubních párátek), v únoru 47 500, v březnu 53 200, v dubnu 55 800, v květnu 51 600 a v červnu 48 400. K zjištění průměru je nutno těchto šest čísel sečíst, výsledek dělit šesti, a tak dostaneme měsíční průměr 52 000 jednotek vyrobených za první pololetí. Prozkoumáme-li ještě jednou uvedená čísla výroby, zjistíme, že jen v květnu se výroba s 51 600 velmi blíží průměru (52 000), zatímco v lednu, březnu a dubnu bylo vyrobeno značně více a v únoru a červnu podstatně méně. To je zvláštnost všech matematických průměrů včetně průměru aritmetického: vypočítané číslo většinou neodpovídá skutečnosti. Tento fakt vynesl statistice mnoho neoprávněného výsměchu, který je mnohdy přímo vyvoláván tím, že se např. vypočítává průměr 2,2 dítěte nebo 0,36 oběti nehod. Anglický humoristický časopis „Punch" o tom jednou napsal: „Protože počet 2,2 dítěte na dospělou ženu vypadá v jistém ohledu značně podivně, navrhla kterási komise Jejího Veličenstva, aby se středním vrstvám poskytla finanční podpora pro dosažení zaokrouhlenějších a pohlednějších průměrů." Aritmetický průměr nemá většinou žádný odraz ve skutečnosti. Když průměrná rodina má 2,2 dítěte, naštěstí to ještě neznamená takovou pochmurnou grotesku, jakou vidime na obrázku. Podobný aritmetický průměr však může také leccos skrývat. Zjistíme-li např. ve školní třídě s 30 hochy, že průměrná výška činí 1,67 m a průměrná váha 58,3 kg, je především pravděpodobné, že ani jediný z těchto mladých lidí nemá právě tyto míry a že tedy neodpovídá Quételetovu ideálnímu „homme moyen", „průměrnému člověku". Kromě toho třída se může navíc skládat ze dvou extrémních skupin: z více než tuctu těžkých vah a stejného počtu malých útlých hošíků. „Průměr" tuto skutečnost úplně skryje. V počátcích výroby pánské i dámské konfekce podlehli mnozí výrobci podobným klamným závěrům a vyráběli průměrné velikosti, po nichž se stěží nacházela poptávka prostě proto, že „ideální postavy" se vyskytují velmi zřídka. 36 2.2 Modus a medián Jiný příklad: hledáme-li ideální bydliště s příjemnou průměrnou roční teplotou a peníze nehrají žádnou roli, pak bychom v užší volbě mohli vybírat třeba mezi Pekingem, Milánem nebo Quitem, neboť všechna tato tři místa mají „roční průměr" kolem 12°. V Pekingu je však v zimě chladněji než ve Stockholmu a v létě takové vedro jako v horkých měsících v Rio de Janeiru. „Průměr" Pekingu vyplývá ze součtu a dělení extrémů. V Miláně se výkyvy udržují v hranicích obvyklých ve střední Evropě a roční průměr je tedy výsledkem mírně studených zim a mírně teplých letních období. Konečně v Quitu, hlavním městě Ekvádoru, se teplota vzduchu po celý rok téměř nemění. Příčinou je vysoká nadmořská výška, 3000 m nad mořem, a blízkost rovníku. Můžeme si také představit velkou akciovou společnost, třeba „Akciovou společnost pro statistiku a výzkum čísel", jejíž akciový kapitál je rozdělen na 500 000 akcií. Akcie této společnosti vlastní 50 000 osob, a průměrně má tedy každý akcionář deset akcií. Při bližším zkoumání se však docela dobře může ukázat, že jediný majoritní akcionář má 320 000 podílů, další akcionář 30102, sto osob vlastní po 1000 akcií a zbývajících 49 898 akcionářů má jen po jediném podílu ve své hubené peněžence. Jestliže však chci tuto skutečnost skrýt a přitom nemluvit o prostém průměru, mohu také ještě říci, že vlastnictví akcií je „neobyčejně široce rozptýleno" — přes 99 % akcionářů má méně než 500 akcií! (Může se také říci „méně než 50" nebo „méně než 800" — podle toho, která formulace se jeví účelnější.) Ve statistice General Motors Corporation bylo jednou uvedeno, že prý 78 % akcionářů vlastní méně než 50 akcií a jen 8 % více než 100 — v těch- to 8 % by však snadno mohl být ien jediný akcionář s absolutní většinou všech akcií. 2.2 Modus a medián Pošleme-li „průměrného akcionáře" naší akciové společnosti pro statistiku do říše fantazie, musíme místo něj hledat reálnějšího reprezentanta. Mohli bychom se např. zeptat, který je to ten „typický akcionář", vyskytující se nejčastěji. V našem případě lze tuto otázku zodpovědět snadno a jasně. Protože 49 898 z celkového počtu 50 000 akcionářů vlastní jen jediný podíl, je tento typ nejmenšího akcionáře nepochybně nejčastější a z tohoto hlediska „typický". Statistika skutečně uznává tzv. „nej-četnější hodnotu" (nebo „modus") jako důležitou formu průměru, je ovšem jasné, že v příkladu, který jsme uvedli, nás zjištěná nejčetnější hodnota nemůže plně uspokojit, neboť majoritní akcionář se svými milióny se úplně ztratil. „Nejčetnější hodnota" neříká totiž vůbec nic o krajnostech, neprozra-zuje, v kterém směru a jak jsou veliké. Naproti tomu prozradí někdy chybnou statistickou konstrukci: vyskytnou-li se např. v jednom rozdělení dvě různé „nejčetnější" (tedy přibližně stejně četné) hodnoty, byly zde bezpochyby omylem smíšeny dva různé celky. Takové „bimodálni" neboli dvouvrcholové rozdělení se vyskytuje např. u tělesné výšky dospělého obyvatelstva jako celku — jedna nejčetnější hodnota pro ženy a jedna pro muže. Zkusme to však nejdříve s dalším průměrem. K tomu si vybereme abiturientskou třídu určitého ročníku — řekněme 1965 — a dotážeme se ji 37 2. Řdd o zlořád průměrů__ na příjmové poměry. O problematice sběru informaci budeme ještě podrobněji mluvit později; na tomto místě zatím naivně předpokládáme, že poskytnuté údaje jsou správné. Počet dotázaných vydělává vydělávají 1 1 2 3 5 1 12 Pomocí listu papíru a tužky nebo malé kancelářské počítačky rychle zjistíme aritmetický průměr — součet ročních příjmů činí 589 000 DM, průměr je 23 560 DM, tedy zase částka, kterou nikdo z dotazovaných ve skutečnosti nevydělává. Nejčetnější hodnota je od ní velmi vzdálena; představuje ji na konci tabulky oněch dvanáct chudáků s 13000 markami. Co teď? Po krátkém uvažování se nabízí následující řešení: za průměrný příjem by bylo nejvhodnější považovat ten „prostřední" — prostřední podle pořadí v tabulce uspořádané podle výše příjmů. Jinými slovy: mezi uvedenými 25 osobami vyhledáme tu, která vydělává více než dvanáct nejchudších, avšak méně než dvanáct nejbohatších. To je, jak zjistíme z tabulky, muž s 18 000 DM. Statistika již dávno objevila a používá tuto „prostřední hodnotu", „centrální hodnotu" nebo „medián". Má mimo jiné tu výhodu, že ji lze použít také v tzv. „topologických stupnicích" nebo řadách, u nichž výpočet aritmetického průměru nemá žádný smysl. Je možné zjistit „prostředního" žáka — před ním je 15 lepších, za ním 15 horších, zatímco aritmetický průměr ze součtu známek na vysvědčení by spíše mátl. Mimoto lze mediánu použít i v „otevřených stupnicích". Kdybychom třeba řekli, že dva z našich abiturientů vydělávali „přes 50 000 DM", pak by nebylo možno vypočítat aritmetický průměr, medián však zůstane stejný. Z těchto důvodů medián nalézáme např. v rakouské statistice věku uzavírání sňatků, protože věk novomanželů sahá od patnáctého až k devadesátému (a někdy i vyššímu) roku věku a prostřední hodnota je velmi názorná: DM ročně 100 000 60 000 po 40 000 po 25 000 po 20 000 18 000 po 13000 Rodinný stav před uzavřením sňatku Věk íenicha Věk nevěsty Rok svobodný ovdovělý rozvedený celkem svobodná ovdovělá rozvedená celkem 1937 28.3 50.2 38.6 28,9 25.5 42.6 34,0 25.8 1959 25,8 56.7 39,3 27,0 22,3 46,2 35,6 23.3 1969 24.7 58,3 36.5 25.6 21.6 48,8 30.9 22.2 38 Průměry mohou klamat, když se dva extrémy zdánlivě vyrovnávají. ..Průměrem" z vyzóblých dlouhánů a malých tlouštíků je dobře vyvinutá a úměrná střední postava. V počátcích rozvoje textilní konfekce se někdy zhotovovaly oděvy pro „normálni" velikosti, které se ve skutečnosti sotva vyskytují: „průměry" umožnily vznik falešné představy. Jestliže se tedy uvádí, že průměrný sňatkový věk svobodných nevěst činil v roce 1969 21,6 roku, vidíme z toho, že polovině všech až dosud svobodných nevěst bylo méně a polovině více než 21,6 roku; zda v tom byly nebo nebyly i šedesátnice, to medián zamlčuje. Z těchto důvodů jej lze účelně použít tam, kde chybí omezení nahoru nebo dolů, protože se třeba shrnou všechny nízké a všechny vysoké hodnoty pod označení typu „více než...", „méně než...". Přesto má i tato „prostřední hodnota" své nevýhody. Z příkladu našich akcionářů je vidět, že bylo nutno uvést jednoho z 49 898 nejmenších akcionářů jako „prostředního", ačkoliv všichni mají stejně málo. Stejně nevhodný se ukazuje v případě rodin s jedním dítě- tem. Dokonce ani v naši abiturientské třídě nepředstavuje nejlepší řešeni. Co by se stalo, kdyby onen muž s 18 000 DM, náš „prostřední příjemce", vydělával místo toho jen 14 000 nebo naopak 19 000 DM? Medián by jej věrně provázel, zatímco aritmetický průměr by na tuto změnu reagoval jen nepatrně. Jestliže se však prostřední hodnota — medián — může tak značně změnit nahodilým výsledkem, musíme se na něj dívat s určitými pochybnostmi. K tomu je však třeba přičinit dvě poznámky. Především: takové nebezpečí sotva hrozí v rozsáhlé oblasti popisné statistiky — klasické statistiky hromadných jevů; jen u malých výběrových souborů (vzorků) je nutno být nanejvýj opatrný. Čím rozsáhlejší je však číselný materiál získaný šetřením, tím menií 39 2. Rád o zlořdd průměrů___ je nebezpečí, že průměr klame. Kdybychom měli v tabulce např. 2000 výdělečných osob místo 25, pak by jistě, i za předpokladu zcela podobného strukturálního rozdělení, nebyla mezera mezi 14 000 a 19 000, prostřední hodnota by mohla být zjištěna přesně a byla by uchráněna vlivu nahodilých výkyvů. Za druhé, v povaze všech průměrů však je, že něco ponechávají nevyjádřeno. Vždyť průměry vytváříme s ú-myslem zbavit se číselné změti jednot- livých údajů. Proto nemůžeme od průměrů požadovat, aby na první pohled vyjadřovaly podstatné a zároveň odpovídaly na detailní otázky Každý průměr zakrývá a uhlazuje krajnosti a je jimi současně ovlivňován. Vzniknou-li pochybnosti, lze jej použít jen s doplňujícími údaji, např. o rozptylu. V případě pochybností je nutno se vždy ptát, o který z četných průměrů se vlastně jedná. (Nebo správněji: o kterou z mnoha středních hodnot. To proto, že statistika pojmu „průměr" Quito Peking Milán ^StSítSíSS ' ' , l ••Průměrů"" které ""té mýlí. Quito. Peking o Milán éto Staří t o IZ7 llí™ ° V "* Ve'mi ^ * Peki"9u * ""kutí zima a žhavé řtká íe v orůměru ^ " n°h°U n° «>lotně a druh°u "« ledu. pak statistik riKa. ze v průměru je mu příjemně teplo.) 40 modus aritmet. průměr 1,60 1,65 1,70+ 1,75 1,80 1,85 1,90 1,72 moc ráda nepoužívá, a to tím méně, že v teorii množin se tímto pojmem vyjadřuje něco zcela jiného.) Přehled dosud uvedených středních hodnot vypadá takto: 1. aritmetický průměr (jednotlivé hodnoty se sečtou a dělí se jejich počtem), 2. nejčetnější hodnota neboli modus (udává, který jednotlivý výsledek je zastoupen nejčastěji), 3. prostřední hodnota neboli medián, označovaný také jako centrální hodnota (má nad i pod sebou stejný počet jednotlivých měrných hodnot). Při sudém počtu pozorování nebo měření není pochopitelně žádná reálná prostřední hodnota; definuje se pak jako aritmetický průměr z nejvyššího čísla dolní poloviny a nejnižšího čísla horní poloviny údajů uspořádaných podle velikosti. Máme tedý tři střední hodnoty, a přesto nemůžeme žádnou z nich použít, chce-me-li vypočítat něco tak všedního, jako Tři průměry, tři různé hodnoty. „Nejčastější hodnota" (modus) je 1,65, neboť nejvíce osob dosahuje této a nikoliv jiné velikosti. „Střední hodnota" (medián) je reprezentována tlm mužem, který má vedle sebe na jedné straně 7 větších a na druhé straně 7 menších. „Aritmetický průměr", prakticky nejdůležitější střední hodnota, je jen početní veličinou vzniklou ze součtu všech tělesných velikosti a dělený 15. Činí 1,723 m. Měřítko je pro názornost silně zkresleno, což je v tomto případě oprávněné. Později poznáme statistická zobrazení, v nichž taková zkreslení nebezpečně klamou. je průměrná rychlost jízdy auta. Předpokládejme, že jedeme třicet km daleko a prvních deset km jedeme rychlostí 60 km/hod., dalších deset rychlostí 80 km/hod. a posledních deset rychlostí 100 km/hod. Jakou průměrnou rychlostí jsme jeli? Aritmetický průměr odpovídá zdánlivě jednoznačně: 80 km/hod., protože60 + + 80 + 100 = 240 : 3 = 80. Chceme-li u těchto tří čísel určit prostřední hodnotu — medián, uvedený výpočet se jen potvrzuje; nejčetnější hodnotu nemáme. Tedy „průměrně 80 km v hodině". 41 2. Řád a zlořád průměrů Z opatrnosti, kterou jsme získali již při zacházení se středními hodnotami, jsme se při odjezdu a v cíli podívali na hodinky a zjistili jsme, že doba jízdy činila 23 minut 30 sekund. Pak však. po důkladném zamyšlení a opčtovném počítání, vychází průměrná rychlost sotva 77 km hod., přesněji 76,6. Jdou špatně hodinky, nebo je chyba ve statistice? Ani jedno, ani druhé. Jen zprůměrování bylo provedeno špatně. Jestliže začneme posuzovat extrémnější případ, ukáže se daleko jasněji, co se vlastně stalo: polovinu trati (patnáct km) jedeme rychlostí 15 km hod. K tomu potřebujeme celou hodinu. Druhou polovinu pojedeme rychlostí 75 km hod., k tomu potřebujeme jen 12 minut. Celková doba jízdy činí 60 + 12 = 72 minut. Aritmetický průměr nás ošálí výsledkem 15 +75 = = 90 : 2 = 45 km/hod., při kterém bychom k projetí tratě potřebovali 40 minut. K zjištění správného výsledku doby jízdy je nutno pro oba stejné úseky trati vypočítat průměr: 60 minut + 12 minut = 72 minut : 2 = 36 minut pro každý z obou patnáctikilometro-vých úseků trati, což činí 25 km/hod. 2,3 Harmonický a geometrický průměr S rychlostmi však můžeme pracovat přímo, jestliže použijeme tzv. harmonického průměru. Ukážeme si to na našem prvnim příkladu. Nejdříve sečteme reciproké rychlosti, tedy jejich převrácené hodnoty: 1/60 + 1/80 + 1/100 = 47/1200. Toto číslo dosadíme do jmenovatele zlomku, do jehož čitatele jsme dosadili počet měření (3). Výsledek vypadá takto: 3 3600 -766 JÍT == ~47~ - 1200 Tímto způsobem vypočítáme správnou průměrnou rychlost. Stejnou metodou provedeme ještě kontrolu našeho extrémního příkladu: 1/15 + 1/75 = 6/75; dvě měření 2 _ 150 X = T 75 = -t- = 25. A nyní hned uveďme vzorec k tomuto propočtu. Matematické vzorce byly postrachem mnohého z nás ve škole. Jsou-li však užívány v rozumných dávkách, mají svůj význam a výhody, zvláště jako nejjednodušší všeobecné znázornění způsobu propočtu, kterým jsme se právě zabývali. Vzorec k výpočtu harmonického průměru vypadá takto: Vzorec vypadá hůře, než jaký je ve skutečnosti. Velké řecké písmeno sigma (E) je znaménkem součtu; všechno, co je uvedeno za ním, se má sečíst, v tomto případě tedy všechna —, tj. převrácené hodnoty výsledků měření (1/60, 1/80, 1/100). Počet měření je n. Symbol Xh znamená „harmonický průměr", někdy také iH nebo zkráceně H. Poznámka k Xh: používat jen pro stejnoměrně rozdělené jízdní dráhy! Deset km ä 60 km/hod. a šedesát km á 80 km/hod. dává tedy 7 měření po desíti kilometrech. 42 2.3 Harmonický a geometrický průměr Volba nejvýstižnčjší středni hodnoty se většinou přenechává statistikovi, přesto však musí být dodržena uríitá pravidla. Např. z rychlosti jízdy se nedá vypočítat správný aritmetický průměr: kdo ujede polovinu trati rychlosti 15 km/hod. a druhou polovinu 75 km/hod., 36 min. nedosáhl „průměru" 45 km, hod., nýbrž jen 25 km/hod. Proto se musí vypočítat průměr celkové doby jízdy: 30 km ujetých za 72 minut dává v „průměru" 36 minut pro každou polovinu trati po 15 km. Elegantněji se počítá s pomoci „harmonického průměru". A nyní k aritmetickému průměru: _ Ex V čitateli je tedy součet výsledků jednotlivých měření, ve jmenovateli počet měření. Vzpomeňme na firmu, která vyrobila v měsíci lednu až červnu 55.5 — 47,5 — 53,2 — 55.8 — 51,6 a 48,4 tisíce jednotek, což dává aritmetický průměr 52 (součet čísel výroby dělený šesti). xa je aritmetický průměr: vystupuje také jako A, jako a, a zejména jako x (vyslov x s pruhem), často také /i (vyslov mí). Mezi X, x a /i je však ten rozdíl, že řecká písmena /t a a se zpravidla používají při popisu základních souborů. zatímco x a s se používají pro charakteristiku výběrových souborů. To, co jsme vyjádřili jako Ex rx *„ =----nebo také x =- " n se někdy formuluje takto: N 1 n Ifl, a=vZalnebo/t = lf. Princip je samozřejmě stejný. Čtenář však musí počítat s tím, že někdy narazí na jiné (i když smyslem stejné) vzorce, než jakých zde bylo použito. (N místo n je v jednom vzorci proto, že při u jde o základní soubor a míry základního souboru jsou většinou označovány velkými písmeny — u výběrových souboru malými písmeny. Pokud jde o a,, označuje se tím „cokoliv z mnoha a", např. kterákoliv z možných hodnot a,, a., aj, a4 a a,. Součet všech měření se te plše Ea.) Vzorce existují samozřejmě i pro tzv. polohou typické středni hodnoty, tedy 2. Řád a zlořád průměrů medián (prostředni hodnota) a modus (nejčetnější hodnota). Ty nás zde již víc nezajímají. Ze sestavených a uspořádaných tabulek je lze většinou vyčíst „prostým okem", popřípadě vypočítat. Ještě jednu střední hodnotu nutno uvést, a to tzv. geometrický průměr, kterému se většinou přiděluje zvláštní úkol. Předpokládejme např., že rychle rostoucí město mělo v roce 1960 200 000 a v roce 1970 300 000 obyvatel. Z mezidobí nemáme žádné šetření. Přesto bychom rádi věděli, kolik obyvatel mělo město v roce 1965 (za předpokladu stejnoměrného organického růstu, tedy bez náhlého přírůstku třeba v roce 1964 nebo 1967). Aritmetický průměr říká, že 250 000, což na první pohled vypadá zcela věrohodně. Uvažujeme-li však dále, vzniknou určité pochybnosti, zda přírůstek 100 000 obyvatel připadá stejnoměrně na obě pětiletí, nebo zda jde spíše o „populační explozi v malém" s typicky lavinovitým efektem, „exponenciálním růstem", s jeho vždy rychlejším zdvojnásobením. V daném případě se uchýlíme ke geometrickému průměru. Jeho vzorec zní: Někdy se označuje též Xg nebo G. Stanoví se tedy n-tá odmocnina ze součinu n výsledků měření. U našich dvou měření to máme jednoduché: n = 2, a druhou odmocninu ze součinu 200 000 a 300 000, tedy y áOmiliard m 245 000 (ss znamená „přibližně rovné"). Ale jak se stanoví čtvrtá, devátá, dvacátá odmocnina? To není třeba. Místo nich se použije logaritmů. Nemůžeme a také nechceme zde opakovat kurs počítání s logaritmy, mu- 44 síme však zdůraznit, že pro statistiku jsou logaritmy elementárním způsobem počtů s podobným významem, jaký má pro statistika logaritmické pravítko, které představuje jeho nejjednodušší nástroj. Obojí vyhovuje způsobu statistické práce tím více, že provádí automaticky ona zaokrouhlení, která jsou, jak později uvidíme, zcela nevyhnutelná. Nyní však zůstaneme ještě chvíli u průměrů. Především musíme poukázat na podstatný roždí'/ mezi vypočítanými a polohou typickými středními hodnotami, které jsme naznačili již na počátku této kapitoly: matematické průměry (aritmetický, geometrický, harmonický) se vyskytují ve skutečném životě velmi zřídka', a to jen za pomoci fantazie; nemůže přece existovat „průměrná rodina" s 1,7 nebo 2,2 dítěte. Podobně je tomu s dělením „na jednoho obyvatele". Jestliže rovnoměrně rozdělíme spotřebu doutníků, pak kouří i kojenci; rozdělime-li výrobu uměleckých tisků, připadá z toho celá hromada na každou vesnickou chaloupku. Podobné průměry nelze brát doslova, ale jen takové jaké jsou: jako užitečné Při přepočtu „na hlavu obyvatele" vznikají někdy velmi klamné průměry. Potom jsou dokonce i kojenci mimo jiné také spotřebiteli doutníků a whisky. početní pomůcky a srovnávací čísla. Chceme-li však získat průměrné číslo vyskytující se také ve skutečnosti, musíme se uchýlit k polohou typickým průměrům, jako je prostřední nebo nejčetnější hodnota. Ale ani v tomto případě nemusíme být ušetřeni překvapení, nebudeme-li postupovat pečlivě a obezřetně. Tak např. může medián, prostřední hodnota, při nerovnoměrném rozdělení statistického souboru zdůraznit nějaký extrém. Dejme tomu, že z uvedených jedenácti čísel uspořádaných podle velikosti v řadě 10, 10, 9, 9, 8, 3, 3, 3, 3, 2, 2 je mediánem číslo 3. Jestliže tuto řadu jen nepatrně změníme na 10, 10, 9, 9, 8, 8, 3, 3, 3, 2, 2, je prostřední hodnotou číslo 8. (Aritmetický průměr by byl v prvním případě 62/11 = 5,62 a v druhém případě 67/11 = 6,07. Nepatrnost změny by se v něm dobře projevila, ale 6 není obsaženo v žádné z obou řad.) Nejčastější hodnota (modus) může být také výsledkem pouhé náhody a také nemusí nic vypovídat. Utvoříme-li opět řadu z jedenácti čísel, která vypadá např. takto: 10,10,8,7,6,5.4,3, 2,1,0, pak „nejčetnější hodnota" je 10 (jen ta se vyskytuje dvakrát), ale aritmetický průměr je 56/11 = 5,1. Máme-li však stovky nebo tisíce měřených hodnot, stěží dojde k takovému zkreslení; avšak statistika nepracuje vždy jen „s velkými čísly", ale také často s výběrovými soubory, které se tvoří jen z několika málo údajů. Medián a modus mají většinou pouze speciální úkoly, zatímco při možnosti volby se častěji použije aritmetického průměru. Někdy se statistika označuje jako „učení o průměrných hodnotách". I když je to jedna z příliš vyhrocených formulací, nemůže být pochyb o tom, že 2.4 Statistika ve Zbohotllkové střední hodnoty a jejich správná volba mají ve statistice úlohu, kterou lze jen stěží přecenit. 2.4 Statistika ve Zbohatlíkově Pro ilustraci získaných poznatků o průměrech nechť poslouží historka, která se odehrává ve vybájené zemi, kde se počítá na tolary, avšak jinak jsou tamní poměry velmi podobné západoněmec-kým. V této zemi přišel jednou jeden muž do realitní kanceláře a řekl: „Chtěl bych pozemek na venkově, s lesem, loukami, ne příliš daleko od města, v pěkné krajině, za kterou by se člověk nemusel stydět. Samozřejmě že cenově výhodný." Zprostředkovatel chvíli usilovně přemýšlel, pak se rozzářil a pravil: „Zbohatlíkov na Malém Nadutci. To je přesně to, co hledáte. Měl bych tam ještě 20 hektarů nádherných pozemků." Zájemce ohrnul nos: „Nedávno jsem tím hnízdem projížděl, vypadá to tam dost chudě." Zprostředkovatel zavrtěl hlavou: „To se musíte mýlit. Zde mám nejnovější údaje: průměrný příjem ve Zbohatlíkově činí 82 320 tolarů, to je průměr, který tak lehce nenajdete ani ve vilových předměstích." Kupec slíbil, že celou věc ještě promyslí, a navštívil svého starého známého, ředitele banky, aby se zeptal, jestli snad neví něco o Zbohatlíkově. Ten prohrabal své záznamy a pravil: „Mám tu jakousi statistiku, kdepak je. aha tady je výtah. Nuže. roční příjem více než poloviny obyvatel je 29 000 tolarů a více. To je zatím všechno, co mám. ale nechám to zjistit podrobněji." Kupec uvažoval: průměrný příjem činí 82 320 tolarů a více než polovina oby- 45 Z. Kad a zlorao průměru vatel má přes 29 000 tolarů; i když to není bezpodmínečně v rozporu, je to přesto podivné. Pak se rychle rozhodl, sedl do svého mercedesu a odjel směrem na Zbohatlíkov. Pět kilometrů před cílem se zastavil na okresním úřadě a vyžádal si informaci. Zde uslyšel: „Dosti chudé místo, průměrný příjem je kolem 29 000 tolarů. Chcete-li se dovědět něco bližšího, promluvte si s učitelem Počtářem. Ten je ve Zbohatlíkově doma a zcela nedávno se podrobně zabýval místní statistikou. Vidí sice všechno černě, je pesimista, ale je pečlivý a chytrá hlava." Zájemce poděkoval a pak nejprve zavolal svého přítele, ředitele banky, zda nezískal další podklady. „Velmi zajímavý detail," řekl ředitel, „nejsilněji zastoupená příjmová kategorie je od 12 000 do 24 000 tolarů; nejčetnější poměrně přesně 18 000 příjem činí tolarů." Soptě hněvem sedl kupec do svého vozu a odejel k učiteli Počtáři do Zbohatlíkova, který dělal stále stejně chudobný dojem. Na dotaz o příjmové struktuře v místě se učitel hořce zasmál a pravil: „Neutěšená, což je řečeno velmi mírně. Dvě třetiny rodin mají méně než 30000 tolarů. Pokud jde o příjem na hlavu, nemá většina lidí ani 7500 tolarů ročně a 88 % má méně než 25 000. Jen náš pan vesnický milionář si žije skvěle v radovánkách na svém statku, obklopen několika tucty chudých otroků." Na druhý den, když se zájemce o koupi poněkud uklidnil, zavolal konečně jednoho přáteli doporučeného úředníka Statistického úřadu a požádal jej zdvořile o autentický číselný materiál, Ve Zbohatlíkové bydlí vedle převážně chudších lidi také milionář, a to v přepychové vile. Jak ľľľľ i'„PúU j ' Pří'em "ob>rwatd Zbohatlíkova"? Aritmetický průměr, geometrický průměr, nejcetné,si hodnota, medián poskytuji ítyři značně odlišné hodnoty, které jsou však všechny početne zcela ..správné". i6 stručně mu vylíčiv vše, co se mu přihodilo. Úředník slíbil, že materiál obstará. Dva dny nato sděloval: „Okresní úřad vám udal správné číslo, 29 000 tolarů je medián. Také váš přítel z banky vás informoval správně, neboť nejčetnější hodnota je skutečně 18 000 tolarů. Pokud jde o učitele Počtáře, neuvedl jste sice přesné znění jeho vysvětlení, ale znám ho jako nejvýš svědomitého statistika-amatéra a nedovedu si představit, že by vám uvedl nesprávná čísla." „Takže vychází, že vlastně lhal zprostředkovatel se svými 82 320 tolary?" zeptal se vyděšeně zájemce. Úředník však pravil mírně: „Aritmetický průměr není v tomto případě nejvhodnější, ale činí přes 82 320 tolarů. Situaci však lépe vystihuje geometrický průměr, který se pohybuje kolem 32 730 tolarů." Po těchto slovech zájemce bez okolků zavěsil, neboť teď věděl nad veškerou pochybnost, co už dávno tušil: statistikové jsou notoričtí lháři, pravdu překrucují. Po jeho zkušenostech mu toto mínění nemůžeme mít za zlé, vždyť i jinak docela chytří lidé nereagují někdy příliš rozumně, dostanou-li se do styku se statistickými údaji. Byl to například onen britský ministr války, který se zeptal svého hospodářského statistika: „Co teď stojí vlna?" Ten začal vysvětlovat, že jsou velké výkyvy podle kvality a země původu, u koupě za hotové a koupě termínové a..., načež ho lord přerušil a pravil: „Dal jsem vám jednoduchou otázku a chci jednoduchou odpověď." Nuže, naše jednoduchá otázka zněla: „Jak vysoký je průměrný příjem ve Zbohatlíkově?" Chce-li někdo na to mít jednoduchou odpověď, musí riskovat, že nebude jednoznačná. Chcete-li však případ Zbohatlíkov pro- 2.5 Směrodatná odchylka o roxpt počítávat sami ještě dál a přezkoumat uvedené údaje, uvádíme „prvotní záznam" příjmů 25 rodin a (v závorce) počet členů každé rodiny: 60 000 (1) 45 000 (2) 51 000 (3) 42 000 (2) 49 000 (4) 38 000 (4) 20 000 (7) 14 000 (1) 18 000 (3) 13000 (4) 18 000 (8) 11 000 (1) 18 000 (4) 10 000 (2) 16 000 (3) 16 000 (2) 1 200 000 (3) 150 000 (5) 86 000 (4) 37 000 (3) 35 000 (5) 32 000 (3) 29 000 (3) 26 000 (í) 24 000 (4) Hrubé zkreslení aritmetického průměru vzniklo tím, že rodina milionáře svou převahou potlačila jstatních 24 rodin, má větší příjmy než všichni ostatní dohromady. Jak vznikly další údaje, které tak popletly našeho zájemce o pozemky, lze poměrně snadno vypočítat za pomoci toho, co jsme se naučili v této kapitole. Poučení však zní: také ve statistice mnoho záleží na správném kladeni otázek. A nejen to. patří sem i porozumění pro situaci. Neexistuje bezvadný průměr! Gerhard Mackenroth k tomu říká: „Neexistuje ani jedna správná střední hodnota, statistik však musí podle svého materiálu a problému mít možnost rozhodnout, kterou střední hodnotu zvolí." 2.5 Směrodatná odchylka a rozptyl Ze všeho, co jsme se dosud dověděli o průměrech, bylo stále zřetelnější jedno: střední hodnoty (a především tak často používaný aritmetický průměr) potřebuji k správnému zhodnocení svého významu a vypovídací schopnost, ještě jeden rozměr. Takovým nejjednodušším doplněním je. ie se uvede, jak jsou extrémy odhjjj vzdáleny: „Nejnižší příjem ,e 13 uw 2. Řád a zlořád průměrů 2.5 Směrodatná odchylko o rozptyl Deset zásahů dobrého střelce leží blízko středu terče, „rozptyluji" se jen málo. Zásahy špatného střelce leží většinou daleko od středu terče, mají velký rozptyl. marek, nejvyšší 100 000, aritmetický průměr činí 23 560." Toto rozpětí „mezi 13 000 a 100 000" však neříká nic o tom, jak jsou jednotlivé hodnoty rozděleny: leží skoro všechny kolem 23 000 a jen dvě extrémní hodnoty nahoře a dole, anebo mají skoro všichni příjem 13 000 marek a jen dvě osoby 100 000 a pak je tedy aritmetický průměr stejně nesmyslný, jako byl v příkladu o dvou husách: jeden neměl žádnou a ten druhý snědl obě? Statistika zná sice také „rozpětí", vymyslela však lepší míru, která ve spojení s průměrem umožňuje dobrý přehled o rozdělení jednotlivých hodnot shrnutých v průměru. Je to míra rozptylu — tzv. směrodatná odchylka. Vysvětluje se obvykle na příkladu střeleckého terče: je-li na terč vypáleno 50 výstřelů, „rozptýlí se" kolem středu. Leží-li zásahy těsně u středu a střílel-li tedy dobrý střelec, jsou vzdálenosti ke středu skoro všechny malé. Střílel-li však špatný střelec, budou zásahy od sebe značně vzdáleny. Přeneseno na statistiku: jsou-li měřené údaje nebo sledované hodnoty jen velmi málo vzdáleny od aritmetického průměru, je rozptyl velmi malý. Když se však průměrují odlehlá čísla, je rozptyl veliký — tak jako je tomu na obrázku zásahů na levém a pravém terči, mezi nimiž uprostřed leží černý střed. Výpočet „směrodatné odchylky" znázorníme nejdříve na docela jednoduchém příkladu. Aritmetický průměr čísel 7, 8 a 9 je 8, aritmetický průměr čísel 1,10 a 13 je však také 8. Tuto zcela odlišnou situaci je možno vyjádřit naší mírou rozptylu. Začneme u první skupiny čísel (7, 8, 9). Nejprve porovnáme každé číslo s vypočítaným aritmetickým průměrem a zjistíme rozdíl — přeneseno na střelecký terč: u každého zásahu změříme, jak je vzdálen od středu. Tak dostáváme: 7 je od 8 vzdálen —1 8 je od 8 vzdálen 0 9 je od 8 vzdálen 1 V druhém případě: 1 je od 8 vzdálen —7 10 je od 8 vzdálen 2 13 je od 8 vzdálen 5 Tím jsme určili záporné a kladné odchylky, které ovšem nemůžeme vzájemně sečítat. Na kladné je převedeme tak že je umocníme na druhou, a tím zároveň dosáhneme toho, že extrémy ležící daleko od sebe vyniknou zvlášť zřetelně a připomínají nám: opatrně, zde dochází k velkému rozptylu. Počítáme tedy dále: První skupina Odchylka Druhá mocnina odchylky — 1 0 1 Druhá skupina Odchylka Druhá mocnina odchylky Í9 í 25 78 Rozdíl mezi 78 a 2 již skutečně bije do očí. Ale tato čísla ještě klamou: jsou tím větší, čím více jednotlivých měření sečítáme. Aby se přiměřeným způsobem vyjádřil počet měření, děli se získaná čísla počtem měření — v našem případě jsme měli 3 hodnoty — dělíme tedy třemi. Tím získáme jen první míru rozptylu, tzv. „rozptyl" nebo „varianci" (var x nebo a2). V době, která byla ještě ovlivňována Quételetovými pojmy „průměrného člověka" jako ideálního typu, označil americký astronom Simon Newcombe tuto míru rozptylu jako „evil", tj. „zlý duch". Dnes používáme raději neutrálního pojmu „rozptyl" nebo „variance", které v našem případě vypočítáme takto: 2 78 ni var x1 = y = 0,67; var x., = — = 26 Rozptyl se vine celou rozlehlou oblasti statistiky jako příslovečná červená nit. Znovu a znovu jsou umocňovány na druhou odchylky, vzdálenosti — od tohoto elementárního výchozího bodu až do vzdálených výšin analýzy rozptylu. Aritmetický průměr f Průměr ze 7. 8 a 9 činí 8 stejně ,ako průměr z 1.10 a 13. tt 2. Řád a zlořád průměrů Ještě jednou upozorňujeme na důležitost této početní manipulace: za prvé. vylučujeme záporné hodnoty a za druhé, a to zejména, zdůrazňujeme větší odchylky. Máme-li např. absolutní odchylky 0, 0, 0 a 4, pomyslíme nejdříve na „průměrnou" vzdálenost 1. Jestliže 0, 0, 0, 4 umocníme a pak 16/4 odmocníme, dostaneme již 2. tedy míru podstatně charakterističtější, vzpome-neme-li si, že jen jeden ze série čtyř výstřelů byl vzdálen od cíle 4 jednotky. Přesně totéž provedeme s naším příkladem: k získání původního uspořádáni veličin a ke konstatování „v průměru jsou zásahy tak a tak daleko od středu", Jak Ire stanovit rozptyl s poměrně slušnou vypovídací schopnosti pro těchto 7 zásahů v terci? Jeden zásah je ve středu. Ctyri ve vzdálenosti 1. jeden je vzdálen 4 a poslední 6 jednotek. Průměr (0 + 1+1+1+1 + + 4 + 6= 14/7 = 2). znázorněný vpravo nahoře, neukazuje na přilii velkou odchylku. Vzdálenosti se tedy umocni, íimi se extrémy zvýrazni: 0 + 1+1+1 +1 + 16 + 36 = = 56/7 =8 — a tento výsledek se odmocni. Mira variance („směrodatná odchylka") cinl v daném příkladě ,t provedeme odmocnění a tím dostaneme směrodatnou odchylku (s nebo a, neboť se většinou označuje malým řeckým písmenem „sigma"). Měli jsme rozptyl a* = 3 = 0,67 a = 26 Nvn< tedy dostaneme a, = | 0.67 = 0.82; at = = |/26 = 5.1. Ted je zcela zřejmé, jak odlišný smysl má stejný průměr jt = 8 v obou rozděleních. Směrodatná odchylka činí v prvním případě méně než 1. v druhém případě naproti tomu více než 5. Obě tato čísla je třeba číst v souvislosti se střední hodnotou 8; pak vyjadřují v prvním případě toto': většina čísel se odchyluje od střední hodnoty o méně než 1 v obou směrech, leží tedy mezi 7 a 9. Ve druhém případě to znamená: většina čísel se odchyluje od střední hodnoty 8 o více než 5 v obou směrech, leží tedy mezi 3 a 13. Kvůli jednoduchosti jsme zvolili jen tři čísla. Není však obtížné představit si, že při padesáti, stu nebo desetitisíci čísel poskytuje charakteristika pomoci směrodatné odchylky dobrý obrázek, aniž se nejdříve musí zkoumat nebo alespoň přehlížet celé sloupce čísel. Statistik provedl výpočet a nyní už člověku znalému věci postačí jen dva údaje o průměrné hodnotě a o rozptylu, aby poznal, jaká je situace. V našem druhém případě to znamená: jestliže průměr je 8 a směrodatná odchylka činí více než 5, je tento průměr zcela necharakteristický; s největŠí pravděpodobností byly seskupeny úplně nestejnorodé množiny údajů, jako např. v našem dřívějším příkladě s průměrnou velikostí žáků, když se zjišťoval průměr velkých a silných a malých a hubených žáků. Je-li směrodatná odchylka svou absolutní hodnotou závislá na aritmetickém průměru, je možno vyjádřit ji také tak, že se vykazuje jako poměr mezi oběma mírami. Dosadí-li se totiž směrodatná odchylka do zlomku jako čitatel a průměr jako jmenovatel a násobl-li se 100. dostáváme tzv. variační koeficient (V): v našem případě 2.5 Směrodatná odchylko o rozptyl 10.2% 5.1 . 100 = 63.5% Podle velmi hrubého pravidla prozrazuje variační koeficient vyšil než 50 % silnou „nesourodost statistického souboru", a to v takové míře. že použití aritmetického průměru je už stěží oprávněné. Přesně to jsme zjistili u druhé skupiny našich čísel: 1,10 a 13 dávají jen s použitím „násilí" průměrnou hodnotu ft = 8. Průměry jsou tu dále také k tomu, aby zjednodušeně zobrazily rozdílné údaje, měření a pozorování, avšak nějaké minimum podobnosti mezi těmito hodnotami je přece jen žádoucí. Jestliže se zjišťuje tělesná výška 20 žen kmene Pyg-mejů z pralesů Konga a 20 válečníků kmene Masajů ze stepí Tanzánie a na tomto základě se dospěje k závěru, že „Afričané" mají průměrnou výšku 1,65 metru, pak směrodatná odchylka a variační koeficient ihned prozradí, že „obyvatelstvo" bylo vytvořeno z nesourodých prvků (a vzpomeňme si: měli bychom zase dvě typické hodnoty — dominanty, jak tomu bylo u tělesné výšky obyvatelstva na str. 36). Stejným způsobem prozradí velmi brzy míra rozptylu, jak je to s průměrnými teplotami v Pekingu, Miláně a Quitu, o nichž jsme mluvili na začátku této kapitoly. Stačilo by, aby místo ročního průměru bylo za základ výpočtu použito měsíčních průměrů uvedených měst a prozkoumalo se. jak se „rozptylují" od ročního průměru. Pak bychom s určitostí dostali v Pekingu velmi vysoký variační koeficient, v Quitu naproti tomu jen velmi malý rozptyl: tam je totiž soubor (tj. souhrn měsíců) velmi sou-rodý — průměrné teploty v květnu se příliš neliší od teplot v červenci, říjnu nebo únoru. A mohlo by se jít tak daleko _ ačkoliv je to jen neužitečná počtárska hra - že by se vypočítal rozptyl oproti ročnímu průměru z denních 365 průměrů (které zase mohou být průměrem tří měřeni za den!). 51 50 2. ftdd o ilořád průměrů___ Výsledek by byl však v podstatě stejný: nepatrná směrodatná odchylka pro Quito, vyšší pro Milán, velmi vysoká pro Peking. Nyní bychom ještě mohli zkusit vypočítat směrodatnou odchylku v příjmech občanů Zbohatlíkova, ale to by nemělo — jak už víme — moc smyslu. Již jen krátká úvaha ukazuje, že příjem milionáře se částkou vyšší než 1,1 miliónu odchyluje od průměrné hodnoty x = 82 300; to po umocnění na druhou dává skoro 1200 miliard. Rozptyl činí asi 50 miliard (1200 miliard děleno 25 představuje již samo o sobě tuto částku), směrodatná odchylka je tedy asi 230 000 tolarů. Protože však aritmetický průměr činí pouze 82 000, je směrodatná odchylka přibližně třikrát tak velká, tzn. že variační koeficient činí téměř 300 %. Pošetilost takové průměrné hodnoty je z toho jistě zcela zřejmá. Lepší vyhlídky naproti tomu má provedení potřebných početních úkonů s našimi 25 členy abiturientského ročníku 1965. ačkoliv i v tomto případě víme, že jeden zvlášť vysoký příjem způsobuje, že rozdělení je dosti nerovnoměrné. Rozpětí, které se ostatně ve statistických propočtech sotva kdy objevuje, sahá od 13 000 do 100 000 při 25 měřeních. 9136 Pokusme se o štěstí: Příjem (v tisícich) Rozptyl (varx) činí -2^ = 36,6atfm je směrodatná odchylka poněkud vyšší než 6 (6,04); a konečně variační koefi-6 cient V = 100 . ^ = 25 %. Tato vysoká hodnota variačního koeficientu jasně říká, že rozptyl je veliký. Kdyby odpadl špičkový příjemce, byla by situace rázem jiná. Odpadnutí extrémní hodnoty vede vždy k podstatnému zmenšení rozptylu a směrodatné odchylky. Ještě něco je třeba dodat. V dosavadním výkladu jsme už častěji označili průměrnou hodnotu x, směrodatnou odchylku a místo s. Je to poněkud nedůsledné, nikoliv však zcela neoprávněné. Při kontrole jakosti se totiž mezi jiným mluví zcela všeobecně o „pravidlu dvou sigma", i když přitom vůbec nejde o rozdělení souboru. Řecké u se pro střední hodnotu naproti tomu většinou velmi přesně píše jen tehdy, když se jedná o aritmetický průměr základního souboru, zatímco pro výběrový soubor se vždy používá x. V případě směrodatné odchylky výběrového souboru je situace bohužel poněkud složitější. Znaku a pro základní soubor odpovídá sice ve výběrovém souboru znak s, ale toto s se většinou nevypočítává stejným způsobem jako Četn Odchylka od průměru (5 = 23,5) Druhá mocnina odchylky (cca) 100 60 £0 25 20 18 13 1 1 2 3 5 1 12 25" 76,5 36.5 16.5 1,5 — 3.5 — 5.5 —10,5 5850 • 1 = 5850 1330 270 2 12 • 30- 1 = 1330 2 = 540 3 = 6 5 = 60 1 = 30 110 ■ 12 = 1320 9136 naše a, nýbrž tak, že se celkový rozptyl nedělí celkovým počtem měření, ale počtem měření zmenšeným o 1 a teprve potom se odmocňuje. To znamená, že místo bychom psali: . 2ľ(x-x)° n —1 Mnohem později se dozvíme, proč tomu tak je. Prozatím budeme naše výpočty rozptylu provádět nadále podle jednoduchého schématu stanoveného pro a, i když někdy budeme mluvit o s. Důvod rozdílného propočtu je v podstatě ten, že s výběrového souboru se tím poněkud zvětšuje a poskytuje tak správnější měřítko skutečného rozptylu základního souboru. Prozatím jsme však ještě nedošli k teorii výběrových souborů. 2.6 Třídění A nyní se musíme k něčemu přiznat: ve skutečnosti to není tak, že pět z našich abiturientů vydělává přesně 20 000 DM ročně, další tři 25 000 a ostatní rovněž tak pěkně zaokrouhlené částky, které nám ulehčovaly propočet. Dopustili jsme se tedy určitého zjednodušení, za které se dodatečně omlouváme a které můžeme hned zdůvodnit tím, že nás přivedlo k důležitým pojmům, jako jsou prvotní záznam a rozdělení četnosti. Prvotní záznam je sestava všech zjištěných údajů neuspořádaně zaznamenaných nebo — pro přehlednost — seřazených podle velikosti. Uvedených 25 osob při zjišťování svých příjmových průměrů uvedlo následující údaje (se- řazené od nejnižšího k nejvyšší pnjmu): ' 2-6 Třidlnl mu Osoba 1 2 3 4 5 6 7 8 9 10 11 12 13 DM 11 850 12 200 12 342 12 700 12 750 12 917 13 000 13 000 13380 13 500 U0O0 U 439 18 000 Osoba 14 15 16 17 18 19 20 21 22 23 24 25 DM 19100 19 300 20 000 20 300 22 000 24 300 24 950 26 000 38 500 41 000 61 500 105 000 Tato čísla jsme v předchozím textu seřadili do charakteristických skupin: osoby 1 až 12 jsme zařadili do skupiny s příjmem „průměrně 13 000 DM", osobu 13 s příjmem 18 000 DM. osoby 14 až 18 „průměrně 20 000", osoby 19—21 „průměrně 25 000", osoby 22 až 23 „průměrně 40 000". U obou špičkových příjemců jsme částky zaokrouhlili na 60 000 a na 100 000. Byl tento postup nesprávný? Zásadně nikoliv. Musíme si však být vědomi toho, že jsme sem zavedli prvek libovůle. Vždyť jsme stejně dobře mohli osoby 13 až 21 zařadit jako skupinu s „průměrným příjmem 21 000" nebo obráceně: osoby 1 až 6 zařadit jako skupinu s příjmem „méně než 13 000". V tomto případě jsme postupovali podle volného uvážení, které je oprávněné, pokud odpovídá danému číselnému materiálu. Zařazování do skupin je totiž jedním z nejvýznamnějších statistických postupů, protože slouží k tomu. aby se nepřehledné množství jednotlivých údajů přehledně rozčlenilo, členěni základního souboru do skupin (dílčích souborů) podle určitých společných znaků |e hlavním úkolem popisné statistiky. 53 .od a zlořád průměrů 100.000 60.000 Mez., li 10 ve statistice musi být přesné označeny. Zde stojí muž s 20 000 DM bezmocně mezi dvěma skupinami a nepatří k žádné. Kdyby vlevo znamenalo ,.do dvaceti tisíc", bylo by jeho místo vlevo kdyby vpravo znamenalo „dvacet tisíc a více", musel by se zařadit vpravo. pod 20 000 DM Chceme-li uvedených 25 příjmů zařadit do „tříd", musíme nejdříve stanovit stejnoměrné meze tříd. Zkusme to třeba s intervalem 20 000: presne 20 000 DM nad 20 000 DM Zůstaňme však u původně zvolené tabulky a určeme pro další výpočty střed třídy, to znamená: Příjmy od Osoby Interval Střed třídy 0 — 20 000 DM 16 20 001 — 40 000 DM - 6 0 — 20 000 10 000 40 001 — 60 000 DM 1 20 001 — 40 000 30 000 60 001 — 80 000 DM 1 40 001 — 60 000 50 000 80 001 — 100 000 DM 0 60 001 — 80 000 70 000 100 001 — 120 000 DM i 80 001 — 100 000 90 000 100 001 — 120 000 110000 Kdybychom však meze posunuli jen o jednu jedinou marku, nastala by dosti podstatná změna vzhledem k tomu, že první dvě třídy by pak vypadaly následovně: Příjmy od 0 — 19 999 DM 20 000 — 39 999 DM 54 Osoby 15 ..'7 Obsazení (počet osob) 16 6 1 1 0 1 Tento postup spočívá ovšem už na předpokladu, že uvnitř intervalu je rozdělení přibližně symetrické, což však v našem případě není, protože příjmy uvedené v prvním intervalu (0—20 000) jsou vyšší než 10 000. V zájmu jednoduchosti však již na tom nebudeme nic měnit. 2.6 TMděni Další početní postup zjištění průměrného výdělku a směrodatné odchylky probíhá následujícím, již známým způsobem: Střed třídy Počet Střed třídy krát počet 10 000 16 160 000 30 000 6 180 000 50 000 1 50 000 70 000 1 70 000 90 000 0 0 110000 1 110000 6 středů tříd 25 570 000 Aritmetický průměr x: 570000 25 = 22 800 Tento „průměrný příjem" se sice podobá tomu, který jsme již zjistili se zaokrouhlenými čísly (činil 23 560), ale je přece jen o něco nižší. Postupujeme dále v propočtu, abychom zjistili směrodatnou odchylku a variační koeficient: bychom však výslovně dokázali oprávněnost svého postupu. Při výpočtu rozptylu jsme druhou mocninu odchylky vždy „vážili" počtem osob příslušné třídy, tedy např. šestnáctkrát 164, ale pouze jedenkrát 1380. Tímto způsobem jsme získali přesný vážený aritmetický průměr. Předpokládejme nyní toto: našich 25 abiturientů rozložíme do dvou velikých kategorií: a) zaměstnanci, b) samostatně činní. Prvních dvacet osob z našeho prvotního seznamu jsou zaměstnanci, zbývajících pět je samostatně činných. Jestliže vypočítáme průměrný příjem zaměstnanců, dostaneme x, = = 16 200 a u zbývajících x2 = 54 400. Následující argumentace by byla dosti nebezpečná: jestliže průměrný výdělek zaměstnanců činí 16 200 a samostatně činných 54 400, je aritmetický průměr těchto dvou druhů příjmů (16 200 + + 54 400) : 2 = 35 300. To by však byl Střed třidy (v tisících) Počet 10 30 50 70 90 110 Rozptyl var x = 16 6 1 1 0 1 ~25 17 026 25 Odchylka od průměru (x = 22,8) Druhá mocnina odchylky —12,8 + 7.2 +37,2 +57,2 +77.2 +97.2 164 = 2624 52 = 312 1380 = 1380 3260 = 3260 5950 = 0 9450 = 9450 1702Ó = 68.1; v=y68l = 8.25: o^W-^j 36 % I v tomto případě jsou Čísla podobná, ale nejsou stejná jako ta, která jsme získali při původním předpokladu. Každá nová početní metoda (jiné intervaly, jiné středy tříd) by vedla k jiným, nicméně do jisté míry podobným hodnotám. Ještě jsme dlužni další upozornění: opět jsme postupovali zcela správně, aniž chybný, nevážený průměr, s nímž se podrobněji seznámíme později na podkladě příkladu ze začátků statistických indexů (viz str. 113 an.). Střední hodnoty se nemohou sčítat ani opakovaně průměrovat, pokud nejsou k dispozici takové dodatečné informace, které umožňují vážení. 55 2. Řád a zlořád průměrů Mnichovské průmyslové závody podle velikostních tříd Závody i . . . zaměstnanců Závody Zamestnanci Obrat (1000 DM) abs. % abs. % abs. °/o 1—9 1107 56.2 3483 1.8 14 626 1.4 10—19 205 10.4 2 903 1.5 25 936 2.5 20—49 272 13.8 8 594 4.6 42 685 4.0 50—99 1U 7.3 10189 5.4 72167 6.8 100—199 111 5.6 15 594 8.3 67 527 6.4 200—499 75 3.8 23 603 12.5 180 663 17.1 500—999 24 1.2 17 419 9.2 136 924 13.0 1000 a vice 34 1.7 107 021 56.7 514 283 48,8 Celkem 1972 100 188 806 100 1 054 811 100 Jestliže však vím. že se při propočtu použilo za x, 20 (nebo docela obecně m) jednotlivých hodnot a za x, 5 (nebo n) jednotlivých hodnot, je možno vypočítat vážený průměr obou skupin. x = 20 i, + 5*. 25 20 .16 200 + 5 . 54 400 25 324 000 + 272 000 25 nebo obecně: x = = 23 840 mí, + ni, m + n Těchto 23 840 marek jako průměrný příjem (..vážený aritmetický průměr") je mimochodem nejpřesnější z dosud stanovených hodnot, protože byl vypočítán přímo z prvotního záznamu, bez zkreslení vzniklého zaokrouhlováním a třídními intervaly. V souvislosti s tím vzniká otázka, proč se tímto způsobem nepostupuje hned od počátku. Odpověd je jasná: jestliže se jedná — jako v na-Sem jednoduchém případě — o základní soubor v počtu 25 osob (nebo obecně nositelů znaků), nepřijde žádný rozumný člověk na nápad, aby použil statistické metody tohoto druhu. Je však také zřejmé, že je podstatně snazší a přitom dostatečně přesné v případě 250 nebo 2500 či dokonce 25 000 jednotlivých údajů nepracovat s prvotním záznamem, ale použít rozdělení četností v omezeném počtu účelně členěných tříd, které mohou být dále členěny, což potom vypadá tak, jak ukazuje tabulka v záhlaví. V tomto případě se ukázalo také užitečné zvolit různě veliké třídní intervaly: kdyby se kategorie „500 až 999 zaměstnanců" rozdělila na desítkové intervaly, byla by tabulka nekonečná a nepřehledná, a proto by nevyhovovala hlavnímu účelu celé deskriptívni statistiky, tj. zpracovat a přehledně připravit velký počet údajů. Ve všech takových případech, kdy skupiny v tabulce jsou nahoru nebo dolů otevřené, hrozí nebezpečí úmyslného nebo neúmyslného potlačení informací. Vraťme se ještě jednou k našim ablturientúm a rozdělme si je takto: 56 Pfl|em pod 15 000 DM 12 15 001 — 20 000 DM 4 20 001 — 25 000 DM 4 25 001 — 30 000 DM 1 přes 30 000 DM 4 2.7 Histogram o polygon íetnosti Tato sestava je zcela neuspokojivá. Chybí totiž jakýkoliv náznak, jak hluboko pod hranici 15 000 DM leží dvanáct nejnižších příjmů (teoreticky by to mohlo být i jen několik set marek) a stejně tak není jasné, zda 4 pánové ze skupiny „přes 30 000 marek" jsou těsně u této hranice anebo zda tří z nich nemají miliónové příjmy. Výše uvedená podniková statistika uniká tomuto nebezpečí především tím, že se uvádí celkový počet zaměstnanců, takže z údajů může být přibližně odhadnuta kategorie „1000 a více". I bez statistických znalostí je hned vidět, že uvedených 34 podniků vzpomenuté kategorie musí mít nejméně 34 000 zaměstnanců; k rozdělení tedy zbývá ještě 73 021. To znamená: s absolutní jistotou nemůže mít jediný podnik více než 74 021 zaměstnanců (pouze za gro- teskního předpokladu, že zbývajících 33 podniků má přesně po 1000 zaměstnanců), s největší pravděpodobností nebude mít ani jeden podnik byť i jen 50 000 zaměstnanců, ačkoliv by bylo docela možné, že je v této kategorii zahrnuto 33 podniků s počtem 1000— —2000 zaměstnanců vedle jednoho mamutího podniku. 2.7 Histogram a polygon četnosti Četnosti, rozdělení četností — tyto pojmy se táhnou jako červená nit celou statistikou, i když nejsou vždy výslovně uvedeny. Lze je vyjádřit v tabulkách, mohou však být také vyjádřeny graficky. Výhodami i nevýhodami statistických zobrazení se budeme později zabývat ještě podrobněji. Na tomto místě považujeme za nutné představit dvě elementární možnosti zobrazení: histogram a polygon četnosti. Obojí zní hůř, než jaké to ve skutečnosti je. Slovník vycházející z medicíny definuje histogram jako „drobnohledné zobrazeni Histogram výrobních údajů x našeho dřívějšího přikladu. 57 2. Řád a zlořád průměrů v lOOOOt 90 80 - 70 - 60 - 50 - 40 - 30 - 20 - 10 -0 I | na krmeni I | vlastni spotřebě □ prodej Viděn ostatní rakouské země Sloupkový diagram: Použití mléka (v 10 000 t) vyrobeného v rakouských spolkových zemích. Polygon (četnosti) stejných výrobních údajů. 58 tkaniny obvazu"; pro naše potřeby by se to dalo nejlépe přeložit slovy „strukturální obraz". V nejjednodušším případě dané zobrazeni vypadá tak, že různě velké bloky (dvojrozměrně zobrazené, tedy vlastně plochy) jsou zobrazeny vedle sebe tak, aby vypovídaly o vzájemné velikosti nebo četnosti. Histogram půlroční výroby podniku na rozhlasové přijímače, která byla uvedena na počátku tohoto oddílu, ukazuje obrázek na str. 57. Nebo histogram spotřeby mléka v Rakousku — abychom uvedli příklad z úřední statistiky a současně ukázali vnitřní členění uvedených sloupků a ploch. (Jde jen o použití mléka vyrobeného v dané oblasti, tím se vysvětluje ono minimální „použití" v miliónové Vídni, kde je ovšem jen velmi málo krav.) Polygon četnosti, který mnohdy ani není polygonem četnosti, nýbrž jakýmkoliv jiným polygonem, se po jazykovém rozboru jeví jako „mnohoúhelník", úzce spřízněný s pětiúhlým pentagonem a 2.7 Histogram a polygon i. fifinnn - DU UUU i N <;n nnn V i \ _ JU uuu - i i 42000^ 0 Měsíce: 1. 2. 3. b. 5. 6. Histogram — polygon: zde stejné vyjádřeni různými optickými prostředky. Záměnu obou metod znázorněni nelze však vždy účelně provést. trigonometrií, která vychází z trojúhelníku. Při použití tohoto způsobu vyjádření by vypadaly četnosti podnikové výroby tak, jako je tomu na obr. na str. 58. Souvislost mezi histogramem a polygonem je úplně zřejmá, jestliže promítneme obě vyobrazení přes sebe: uprostřed horního konce jednotlivých sloupků histogramu jako by byl fixován bod, a spojíme-li tyto body, vznikne přímka, někdy také křivka. Zobrazení úsečkami, resp. křivkami se s oblibou používá u časových řad, tedy grafického zobrazení hodnot, které byly měřeny v delších časových obdobích. Časový prvek se přitom vždy nanáší na osu x (abscisa). Také k tomu uvádíme příklad z oblasti komunální statistiky (viz obr. vpravo). Mnohá rozdělení četností mají v grafickém znázornění velmi charakteristickou formu. Jednou z nejdůležitějších a také nejproslulejších křivek rozdělení četnosti je tzv. normálni nebo zvonovitá křivka, které chceme pro její značnou důležitost věnovat větší část následujícího oddílu. Cizinci v Mnichově (osoby v Cil.) 130 120 110 100 90 80 70 60 50 40 30 20 10 0 1925 1933 1939 1947 1950 1961 1969 Počet cizinců v Mnichově během posledních 45 let. (Podle grafu mnichovského Úřadu pro statistiku a zpracováni dat.) Nejdříve však ještě jedno upozornění, u některých rozměrových čísel je zcela nemožné provést grafické vytříbení, v jiných případech je naopak možno provádět téměř neomezené tříbeni znaků. Předpokládejme např.. že vyjadřu- 59 2. Řád o zlořád průměrů jeme váhu jednoho miliónu kancelářských spínátek stejného druhu, která může činit v průměru x = 0,5 g. Zde můžeme výkyvy ve váze při výrobě v pozorovaných četnostech vyjádřit mimo jiné v pěti, deseti nebo patnácti třídách. Můžeme však také přesnost vážení dále zvyšovat, až je počet tříd teoreticky neomezený, takže vyjadřujeme rozdělení hustoty pro jednotku „celková produkce". 3 Normální rozdělení 450 460 470 480 490 500 610 620 530 640 550 455 465 476 485 495 506 616 626 635 645 460 500 550 li^TlŽ S"S*-, zák,Qdnlho soub°ru *° "ale většího poetu tříd se stále menším třídním aonu7Jrř„ ř-y, framU PfecházeÍ' Prolne v jemné írafování. zpočátku přímé linie polygonu se mění v kr.vku. četnost se měni v hustotu. 3.1 Znaky a relativní četnosti Statistika se nezabývá jednotlivými čísly, individui, nýbrž vždy množstvím čísel, soubory, „velkými čísly" nebo alespoň výběrovými soubory, které jsou však samy vytvořeny z větších celků a umožňují závěry o ještě větších souborech. Je proto jen přirozené, že při sestavování statistického materiálu nestačí používat jen absolutní čísla, nýbrž že je třeba tato čísla vyjadřovat ve vztahu k souboru; vytvářet tedy relace, vztahy mezi statistickým základním souborem (nebo také výběrovým souborem) a statistickým znakem, a to tak, že se např. řekne: 10,3 % obyvatel Mnichova v r. 1969 byli cizinci a osoby bez státní příslušnosti. Tím se vytváří jasný poměr mezi základním souborem „obyvatelé Mnichova" a podskupinou, která je charakterizována znakem „cizinci a osoby bez státní příslušnosti". U tzv. diskrétních (nespojitých) znaků je vytváření takového vztahu většinou velmi snadné. Diskrétní znaky jsou totiž ty, které lze zcela jednoznačně a jasně rozlišit — alespoň v teorii; např. muži a ženy (ačkoliv ojediněle se vyskytují i hermafroditi), cizinci nebo domácí (přičemž může být problémem dvojí státní příslušnost) atd. Pomocí výběrového souboru nebo celkového šetření lze poměrně jasně určit, kolik procent má znak A, který ostatní části nemají. Nejoblíbenějším způsobem zobrazení této skutečnosti je kruhová výseč („dortové řezy"); plocha kruhu tvoří celek, kruhové výseče podíly (obr. na str. 62). Pouze zdánlivým, nikoliv však skutečným protikladem diskrétních znaků jsou tzv. spojité znaky. Ty měříme („diskrétní" znaky se většinou sečkají) a jejich měření a číselné vymezení závisí koneckonců na přesnosti měřicích přístrojů. Při dotazu na mou váhu odpovídám: „70 kg". Na váze v koupelně mohu zjistit 70,5 kg, na přesnější váze 70 kg 450 g a konečně známe i tak přesné váhy, které zaznamenají i vdech a výdech. V takových případech bude zjišťování spojitého znaku poznamenáno určitou nepřesností v důsledku měřen! a při statistickém zpracování zjištěných údajů bude asi nutno přikročit k třídění tak, jak jsme je načrtli již na konci předchozího oddílu. Jestliže však jsou třídy již vytvořeny, je možno provádět rozdělení četností uvnitř základního souboru stejným způsobem jako u diskrétních znaků. Pak se říká: „8.5% dospělých žen váží mezi 50 a 55 kg" nebo „16 % rodin ve Zbohatlíkově má roční důchod méně než 15 000 tolarů". Zvláštní případ představují znaky, které zpočátku nejsou číselně vůbec zjistitelné. Jak např. rozdělit zaměstnance na spokojené a nespokojené? Je samozřejmě možné se jich — přímo nebo méně přímo — na to zeptat, je možno získat o tom poznatky psychometrickými nebo sociometrickými postupy, nicméně jako propočtová základna zůstanou nakonec přece jen dosti vágní intenzitní 3. Normálni rozděleni znaky (velmi spokojen, spokojen, málo spokojen, nespokojen). Statistik se bude v takových případech snažit (jako každý vědec) dosáhnout přesné kvantifikace pomocí nějakých měřeni nebo testů, jako třeba v případě kvocientu inteligence IQ. Často však nezbývá než nějaká stupnice pořadí nebo preferencí, ze které se snad odvodí „nej-četnější hodnota", případně i ..prostřední hodnota", ale stěží matematická střední hodnota. Na tomto základě se pak zhruba vytvoří třídy a s pohledem na základní soubor se řekne: „32 % všech gymnazistu má ve škole uspokojivé výsledky ve fyzice." Proč takové zdůrazňování relativní četnosti7. Protože na ní je — v daleko větší míře než na absolutních měrných hodnotách — vybudována celá stavba moderní statistiky. Protože standardizací na jednotný vztažný soubor je umožněno strukturální srovnávání, které by se jinak ztratilo ve spoustě čísel rozdílné velikosti. Brzy poznáme normované normální rozdělení, ve kterém jsou všechna měřen! vztažena na jednotný pravděpodobnostní prostor 1 a toto normální rozdělení ovládá teorii výběru a s ní téměř všechny novější statistické postupy. Také pro klasickou statistiku, pro popisnou statistiku vyčerpávajícího šetření a pro sčítání lidu je však propočet procentních podílů — zvláště pro srovnáván! — účelný tehdy, jestliže jsou srovnávané základní soubory různě veliké: strukturální porovnáni s dneškem umožňuje spíše relativní podíl rolníků na obyvatelstvu Skotska v roce 1900 než absolutní hodnota. Stejně tak lze jen pomocí procent porovnat negramotnost v malé Ghaně s negramotností ve velké Brazílii. Nutno však hned po- Kruhové výseíe („dortové řezy") se často používají k zobrazeni podílů jednotlivých skupin na souboru: zde máme ženský svět rozdělen na blondýnky, černovlásky a ruso-vlásky. Kde zůstaly brunetky? Zařadili jsme je do ostatních skupin, abychom neměli tolik „řezů". Libovolné sdružováni skupin není nic neobvyklého, zvláště jedná-li se o značně zjednodušené statistické výpovědi a zobrazeni. znamenat, že je jen velmi málo mezinárodních srovnání, která by byla úplně bez problémů. Přes veškeré snahy 0 jednotný obsah a rozsah pojmů má řada z nich, jako např. „mrtví při nehodách", „nezaměstnaní", „potrestaní" nebo „vysokoškoláci", různý obsah a nevyjadřuje všude přesně totéž. Mezinárodní statistiky se jen hemží odkazy a poukazy na rozdílný obsah pojmů. 1 tam, kde nejde o srovnání mezinárodní nebo s jiným časovým obdobím, se s velkou oblibou, zejména v populární statistice, používají čísla „na jednoho obyvatele", která spíše uvádějí v omyl než pomáhají. Tak např. údaj: „v Rakousku připadá na jednoho obyvatele 150 šilinků nákladů na výzkum", neříká laikovi vůbec nic. Stačí však. aby byl 62 uveden slovy jako „jen" nebo „směšných", a laik bude pokládat uvedenou částku za nízkou. Kdyby dodatek zněl „přece jen" nebo „značná částka", zdálo by se mu stejné číslo mnohem větší. Až se později budeme zabývat demagogickými interpretacemi statistik, vrátíme se i k podobným jemným rozdílům. Nyní je třeba poukázat ještě na jinou poměrnou veličinu. Není to vždy celé obyvatelstvo, na které něco připadá, mohou to také být jen „osoby výdělečně činné" nebo „majitelé osobních aut". Takové poměrné ukazatele mají často mnohem větší statistickou vypovídací schopnost (např. je-li počet porodů vztažen na počet žen v plodném věku, a nikoliv na celé obyvatelstvo). Někdy však jde jen o taškářské triky, s jejichž pomocí má situace vypadat jinak, než jaká je ve skutečnosti. Prozatím se však nemusíme tolik zabývat poměrnými čísly, nýbrž rozdělením znaků v základním nebo výběrovém souboru. Brýlatí stejně jako řidiči mopedů, blondýny stejně jako běžkyně na krátkých tratích i nositelé jiných „znaků" jsou v obyvatelstvu nějak rozděleni, a to stejně jako je číslo 25 „rozděleno" ve sledu tažených čísel loterie nebo ve výsledcích rulety v souboru 49 nebo 37 čísel, stejně jako jsou rozděleny vadné žárovky nebo šrouby bez závitů v pásové výrobě. Svůj zájem však věnujme nejdříve základní struktuře tohoto rozdělení znaků, a tím vlastně elementární teorii pravděpodobnosti. 3.2 Počet pravděpodobnosti a statistika Někdy se říká, že statistika Je užitý počet pravděpodobnosti, a na tomto 3-2 Počet pravděnttH.K^..: „ stotiJtiko tvrzen, je nepochybně něco pravdy pokud se nevezme doslovně. Zde musíme připomenout úvahu z úvodní kapitoly této knihy: statistiku lze rozdělit na statistiku popisnou a induktivní. Popisná (deskriptívni) statistika, která je nejtypičtější pro sčítání lidu a podobná hromadná šetření, se zabývá především tím. jak přehledně uspořádat nepřehledné množství údajů, jak vyjádřit jejich znaky a provést zjednodušení všude tam, kde se tím nezmenší jejich vypovídací schopnost. Až do 20. století se statistika pěstovala převážně v tomto smyslu jako popis veřejného života, politická aritmetika, matematická věda o státě. Stále více však nyní vystupuje do popředí zájmu induktivní statistika, statistická analýza. Ta sice také pracuje s měřením, sčítáním, šetřením, ale nemá k dispozici celkové soubory, často ani větší části těchto celkových souborů, opírá se o vzorky, které představují malé nebo někdy velmi malé podíly z daného základního souboru, jehož struktura a náplň mají být zjištěny a zobrazeny na základě výsledků získaných z výběrových vzorků. Most mezi těmito dvěma hlavními oblastmi statistické práce tvoří teorie pravděpodobnosti. Poskytuje matematický základ pro posuzování spolehlivosti a přesnosti všech výběrových postupů i pro spolehlivost a přesnost metod, jimiž jsou získané vzorky zpracovávány. Skutečnost, že počet pravděpodobnosti je matematickou disciplinou, nás nesmí mýlit v tom. že důraz je na druhém slově - pravděpodobnost, často lze počítat na mnoho desetinných míst. ale pravděpodobnost končí mno-hdy již před desetinnou čárkou!. .Zákony pravdéHoDnosti-jsouprotozakonyzce- la zvláštního druhu _ snašenl.ve. pruž- 63 3. Normálni roidělenl né. nezavrhující pošetilé krajnosti, a přece dlouhodobě spolehlivé, nechybující a důvěryhodné. Proto se musíme alespoň krátce zastavit u některých základních pojmů portu pravděpodobnosti. V4 • • v2 p=1 Celkový prostor vymezující možnosti musi obsahovat vidy viechny alternativy: bude svítit slunce nebo bude priet anebo bude ..proménlivo" ti „zataženo". A jedna mince hozená dvakrát ukáie bud v obou případech orla nebo hlavu, nebo jednou hlavu a jednou orla. 64 Téměř každý výklad pojmu matematické pravděpodobnosti vychází z házeni mincí, a i my zůstaneme této staré tradici věrni. (Autor byl této tradici věrný i ve své knize „Sáhni po štěstí — náhoda, pravděpodobnost, jistota", ve které se počet pravděpodobnosti i oblasti jejího použití — od loterie až k moderní fyzice — probírají podrobněji.) Hodíme-li si mincí, může se, jak známo, po dopadu ukázat buď hlava (H), nebo orel (0). Pro oba tyto jevy je pravděpodobnost a priori stejná, předpoklá-dáme-li ovšem, že mince není falešná. Tato stejná pravděpodobnost se vyjadřuje tak, že se řekne: pH = p0, nebo, jak se rovněž často píše, P(H) = = P(0). V tomto případě platí: P(H) = 0,5, stejně i P(0) = 0,5. neboť každý jednotlivý jev je z poloviny pravděpodobný, stejně jako absolutní jistota, že jeden z obou jevů nastane. Tato jistota, tento celkový prostor všech myslitelných možností se tedy vyjadřuje jednotkou (1). Součet jednotlivých pravděpodobností nemůže proto za žádných okolností být větší než 1. I v hovorové řeči známe ostatně matematickou pravděpodobnost. Hodnoty se násobí dvěma a říká se: „naděje na úspěch je jedna ku jedné". Zde však jsme přesní: P(H) = 0.5, P(0) = 0,5. To jsou pravděpodobnosti pro jedno hození mincí. Házíme-li mincí vícekrát, lze vypočítat pravděpodobnost jednotlivých výsledných kombinaci (H00, HOH, HHH atd.) násobením výchozích pravděpodobnosti (pH = 0,5 atd.), protože tu jde o navzájem zcela nezávislé pokusy, neboť mince ani kostka nejsou ovlivněny dřívějšími výsledky. (Jinak by tomu bylo u předpovědi počasí: je-li dnes pěkně, je též větší pravděpodobnost, že bude pěkně i zítra, než kdyby dnes pršelo — počasí dnes a počasí zítra nejsou navzájem nezávislé.) Pro jev „dvakrát hlava" dostaneme: 0>H - 0.5)' 0>h = 0.5) = pHH = 0,25; stejně p00 = 0,25. K tomu přistupují ještě obě možnosti: pro „jednou hlava, jednou orel", tzn. p0H = 0,25, tedy nejdříve orel, pak hlava, a pH0 = 0,25 (nejdříve hlava, pak orel). Zajímá-li nás celkový výsledek, nikoliv však pořadí, dostaneme při dvojím hodu mincí tyto pravděpodobnosti: pHH = 0,25, p00 (v libovolném pořadí) = 0,5. Podobným způsobem lze vypočítat očekávané četnosti při třech, čtyřech a více hodech mincí a získané rozdělení 3.2 Potet pravdepodobnosti o statistika četnosti zobrazené jako histogram se vyvíjí způsobem uvedeným v obrázku na str. 66 nahoře. Z toho, co jsme uvedli, je zřetelně vidět, že se vytváří velmi charakteristický tvar, který se projeví ještě silněji, jestliže přes histogram promítneme frekvenční polygon, podobně jako jsme to udělali na konci oddílu 2.7, a jestliže počet pokusů ještě zvýšíme (viz oba obrázky na str. 67). Velmi dobrým názorným zobrazením takového rozděleni je také model „římské kašny", kde voda přetékající z jednotlivých mís odtéká stejnoměrně vlevo i vpravo. Další model, znázorňující posloupnost stejných pravděpodobností náhodných jevů, představuje tzv. Galtonovo prkno. Rozděleni pravděpodobnosti při dvo,im hozeni minci. WnjWI t* l» ¥yobraiením o 90stup-dvakrát hlavu, polovina hlavu a orla. čtvrtina dvakrát orla. f«»we'm«' _ 2 o opici, ňů. dostáváme navíc histogram sestávající ze tři sloupku s relativními četnostmi 1. pe 65 3. Normálni rozděleni 3K 2K 1W 1K 2W 3W 2K 1K 3K 2W 3W | 4K 1W 4W -1/8 =3/s -3/8 =1/8 =Vl6 =4/16 =6/l6 = 4/l6 =1/l6 70 50 :ľj: 012345678 počet stran s hlavou 5/l6 3/l6 V,6 0 1 2 3 4 5 6 počet stran s hlavou Pravděpodobnosti výsledku při troj, čtyř, šesti a osminásobném hozeni minci. Relativní četnosti se doplňuji vždy na celek 1 všech možnosti. V grafu osminásobného hozeni jsou naproti tomu uvedeny očekávané absolutní četnosti (celek = 256, relativní pravděpodobnosti se vypočítávají dělením: pravděpodobnost pro 4krát hlava a 4krát orel činí například 70/256). 3.21 Binomické rozdelení Binomické rozděleni zobrazené pomocí modelu římské kašny. které kýčovitě a pseudoelektronicky vyparáděno stále ještě tvoří základní konstrukční princip četných naivních hazardních hracích automatů. Základní myšlenkou přitom je, že koule kutálející se po nakloněném prkně shora dolů narazí na kolíček, od něhož se odrazí vpravo nebo vlevo dolů. Tam narazí do dvou kolíčků, aby se znovu náhodně odrazila a narazila na trojici kolíčků atd. Po libovolném počtu řad kolíčků koule zapadne do přihrádky, nejčastěji uprostřed, do vedlejší přihrádky padne méně často a celkem zřídka padá do krajních přihrádek. 3.21 Binomické rozdělení V uvedených případech je před-námi tzv. binomické rozdělení. Je pro ně charakteristické, že má jen dvě rozdílná vyjádření znaků, která však společně vyplňují celý pravděpodobnostní prostor. Při hodu mincí je to samozřejmé, protože jsou jen dva znaky (hlava nebo orel). Avšak již při tažení hrací karty máme čtyři „barvy". V takových případech, a ty jsou v praxi velmi časté, rozlišuje se prostě „hledaný znak" a „všechny ostatní". Jak velká je pravděpodobnost, že z dobře zamíchaného balíčku karet Galtonovo prkno s kolíčky tvoř. dodnes '^^^t^^ČS^S* kolíčky zasazeny uvedeným způsobem, utvor, se poradí kuhček pod (schéma římské kašny): v našem příkladu: 1 ku 6 ku 15 ku 20 ku Jsou-li Pascalova tro)uh«lniku 67 66 „Galtonovo prkno" je dnes známější než kdykoliv jindy, i když nikoli pod tlmto nazvem. Tento mechanismus náhodného rozdělení odchýlením kuliček na překážkách vpravo nebo vlevo je totiž základním konstrukčním principem hracích automatů. vytáhneme pikovou kartu? Zřejmě jedna čtvrtina, zatímco zbytek — tři čtvrtiny — zůstává pro „nepiky": „žaludy", „srdce" či „kára" nebo jak se jim jinak říká. Proto se často vedle pravděpodobnosti p, že očekávaný „jev" nastane, klade doplňková hodnota (1—p), která se také označuje g. Potom p+q = 1. Proto čím menší je p, tím větší je q a obráceně. Jestliže máme znak „muži", je v každém jen poněkud reprezentativním výběrovém souboru obyvatelstva p jen nepatrně menší než q. Jestliže znakem je „muži přes 40 let, kteří byli v minulém roce v Portugalsku", pak p je velmi malé, protože q tvoří nejen všechny ženy, ale také všichni muži pod 40 let a všichni, kdo nebyli v Portugalsku. Binomické rozdělení tedy udává, jaká je pravděpodobnost pro určitý výsledek vý- 68 pik 1 P-V4 ne-pik 1 3 q=3/4 Pravděpodobnost nějakého jevu se doplňuje pravděpodobnosti „nejevu", a tím se dosáhne jistoty: bud vytáhnu z dobře zamíchaného baličku karet pik, nebo „nepik". 3.21 Binomické rozděleni běrového souboru. Tvoří do jisté míry empirickou základnu pro teorii výběrových souborů. Umožňuje nám z přesně známého základního souboru, např. 52 karet, zjistit pravděpodobnost výsledku pro každé pořadí tahů. V praxi při vytváření výběrových souborů skutečný základní soubor neznáme, avšak víme, jak je pravděpodobné, že výběrové soubory poskytují jeho skutečný nebo zkreslený obraz. Podívejme se např., kolik piků bude „pravděpodobně" taženo, jestliže se z dobře zamíchaného balíčku karet táhne pětkrát za sebou po jedné kartě. (Tažená karta se přitom dá zpět a zamíchá se společně s ostatními; v daném případě máme před sebou model „hyper geometrického rozdělení".) Při jednom jediném tahu platí p = 0,25. Při 5 tazích je tedy početní „očekávaná hodnota" 5 p = 1,25. Není však dosti dobře možné táhnout 1,25 piku; očekávaná hodnota slouží proto v tomto případě (i v mnoha jiných případech) jen jako jistý druh orientační pomůcky. Můžeme již teď předpokládat, že „1 pik mezi 5 kartami" se objeví poměrně často. Nejjednodušší však bude, když vypočítáme nejdříve oba extrémy: 5 piků, případně žádný pik. Protože při tazích jde o navzájem nezávislé náhodné jevy (dali jsme přece taženou kartu vždy zpět a dobře se zamíchalo), platí pravidlo o násobení pravděpodobnosti: p5 piků = (0.25)5. Tento výsledek by bylo možné očekávat jen jednou v 1000 sériích pokusů. Častěji se dá počítat s 5 nepiky: q5 nepiků = (0.75)5. To tedy bychom věděli. Ale co teď? Jak často se vyskytne 1 pik a 4 nepiky? Můžeme vypočítat, kolik je (0,25) . . (0.75)4, avšak k tomuto výsledku lze dojít více než jedním způsobem, nebot 1 pik může být tažen jako první, ale také jako druhá, třetí, čtvrtá nebo dokonce pátá karta. Co lze v daném případě poměrně pohodlně vypočítat, nelze tak lehce zjistit ve složitějších případech (třeba 3 piky z 8). V dané obtížné situaci najdeme pomoc ve zvláštním uspořádání čísel, které je známo jako „Pascalův trojúhelník", ačkoliv celkem neprávem, protože Pascal není ani jeho znovuobjevitelem, nýbrž poznal jej u svého učitele Hérigona. Podobné uspořádání nacházíme však už o 150 let dříve v knize „Arithmetica integra" Michaela Stifela (Norimberk 1544); stejně tak se toto číselné uspořádán! vyskytuje již v perské a čínské literatuře 13. a počátku 14. století, takže by bylo lépe, kdyby bylo označeno neutrálně, např. jako „aritmetický trojúhelník". Jak tedy tato číselná sestava vypadá? 1 1 1 1 2 1 13 3 1 14 6 4 1 1 5 10 10 S 1 1 6 15 20 15 6 1 1 7 21 35 35 21 7 1 Pascalův nebo aritmetický trojúhelník tvoři ja kýsi přechod z číselné magie k teorii pravděpo dobnosti. Z jednotlivých řádků trojúhelníku je možno vyčíst nahodilé pravděpodobnosti jevů všeho druhu. Vrstva jedniček obklopuje trojúhelník, ve kterém je každé číslo složeno ze součtu obou nad ním šikmo, vpravo i vlevo, stojících čísel. To. co nejprve vypadá jako podivná hračka, nabývá rychle na významu, když znovu připomeneme římskou kašnu a necháme vodu stékat ze stupně na stupeň do dvou, tři. čtyř 3. Normálni rozdelený atd. mís. Předpokládáme-li v nejvyšší mise „jednotku" vody, pak v následujícím stupni se dělí na >/, + V* na třetím stupni no '/a + 'U + % v dal" ším na V. + S/8 + S/s + V« atd" )ak je vyznačeno v uvedeném schématu. To přesně odpovídá výsledkům našeho házeni mincí. Při jednom hodu je pravděpodobnost V, k '/i- Při dďším je pravděpodobnost »/, (HH) k »/, (HO, resp. OH) a k '/, (00), při třech hodech V, HHH. »/, HHO. 3/8 H00, % 000 atd. Je pravděpodobné, že tato sestava také vyvolává vzpomínky na polozapome-nutou školní matematiku. V ní byla binomická poučka: (a + b)2 = a- + + 2ab + b\ tzn. rozdělení 1(a2) k 2(ab) k 1(62), stejně jako v Pascalově trojúhelníku, resp. v čitateli zlomků naší římské kašny. V případě (a + b)3 = = a3 + 3a2i> + 3ai>2 + b3 se to také potvrzuje, což obecně znamená, že v Pascalově trojúhelníku jsou přesně a pečlivě uspořádány binomické koeficienty. Pro laika v matematice zpočátku téměř neřešitelný problém, např. (a -f b)5, lze nyní vyřešit skoro bez námahy, prostě přečíst: na pátém řádku čteme 1 — 5 — — 10 — 10—5 — 1, tudíž: (a + 6)5 = = as + 5a4b +10a3b2 +10a2b3 -f 5ab4 + + <>5. Ted už není třeba nic jiného než za a a b dosadit p a q, a můžeme vypočítat pravděpodobnost všech kombinací pěti tahů z balíčku karet. Hledáme především případ pg«, tzn. 1 pik a 4 nepiky. Protože pq1 = (0,25) • (0,75)*, a (0.75)4 = = 0,317, dostaneme pravděpodobnost 0,08, kterou však musíme ještě násobit četností 5, protože v řádku je p'J + ■ ■ ■ + 5 pq* + /6. Protože očekávaná hodnota navzájem nezávislých pokusů se rovná pravděpodobnosti správného hodu (p), násobené počtem pokusů (n), vychází při 6 pokusných hodnotách očekávaná hodnota 1 (6 . >/6). při 300 pokusech je očekávaná hodnota 50 (p = >/6> n = 300). při 9000 je očekávaná hodnota 1500. „Zákon velkých čísel" vůbec neříká, že při 9000 hodech zcela jistě hodím 1500 čtyřek bez ohledu na to, zda mám smůlu nebo štěstí. Především jde o to, že je možno stanovit uvedené číslo při třístovkových, tisícových nebo jiných sériích, jejichž výsledky vyjádřené jako aritmetický průměr se koneckonců neodchýlí od očekávané hodnoty o více než 1 nebo 3 nebo 7 anebo jinou libovolnou hodnotu. V jediné pokusné řadě nemůže být ani řeči o kompenzaci v průběhu řady. To, co nastane — a to jsme měli možnost pozorovat v náznacích již v Pascalově aritmetickém trojúhelníku — je koncentrace četností v blízkosti očekávané hodnoty se současným stále širším celkovým rozptylem. Při dvou hodech mincí vyjde očekávaná hodnota 1 hlava (p = 1/2, n = ?) v polovině pokusné řady, při dvanácti hodech vyjde očekávaná hodnota 6 (p = '/2, n = 12) jen 924 ve 4Q96 = 22.5 %, neboli méně než v l/t všech případů. Souhrn „blízkých" výsledků (totiž 4, 5, 6, 7 a 8 hlav) dává však celkově asi 70% pravděpodobnost, zatímco horní a dolní krajní případy 27. sázkový týden SPORTKY — II. tah 1 • 2 : 3 51 4^ 5.! 6 eř H 817 H 10 ■ 11^ 12 / 13ir \H 15^r 17 19-^ 20^ 21 "i 22^7 23Í7 24 25,: 26,: 27^ 28-^ 29^- 30,; 3i ;.; 32-£ 33: 34-77 35^ 36^r 37^r 38-«- 39^ 48 ^7 41 ^ 42^ 43,,: 44 6i 45 46^- 47^ 48 -~ 49^ 27. sázkový týden SPORTKY — I. toh 1„: 2^ Q 0 83 4 103 «1 106 617 7^ 8777 3 íoo io ;; IItôt 12177 13 no 14737 15 J i6 17 isr 18^- 19 — 13 109 28to7 21-^ 22 „o 23,; 24i£ 25^ 26-5- 27 777 28,: 29 4 " 10» 30,,; 3i: 32 7o7 33^7 34 u7 35 777 36,21 37 Tôi- 38 "57 39 íoo 40 „; 41 i 1Í 104 43„; 44 s 45,: 46^7 47 777 48777 49 i (0. 1, 2, 3 a 9, 10. 11, 12 hlav) nedávají celkem víc než 30 %. Co dělá „zákon velkých čísel" tak důležitým pro statistiku, není jeho užitečnost nebo bezcennost v hráčském kasinu, nýbrž jeho význam při využití výběrových souborů. Protože pokusná řada je prakticky výběrovým souborem, platí i v tomto případě, že očekávanou hodnotu je možno určit (připadne skutečnou hodnotu celkového množství) s libovolnou přesnosti, jestliže jsou vytvořeny dostatečně velké vzorky. V části, kde se budeme zabývat výběry podrobněji, uvidíme, že v praxi se však musí dělat většinou velmi skromné kompromisy. ---3-3 Normální rozděleni Četnost tahů jednotlivých Čísel SPORTKY Pro informaci sázejících je udána četnost tažen. iednotlivých čísel, a to v I. a ve II tahu od počátku roku (za 27 týdnů) a od počátku Sportky (v I. tahu to bylo 841 tažení a ve II. tahu 429). Četnost tahu čísel Sportky ukazuje nahodilé rozdělení. V I. tahu bylo během 841 her taženo 5046 čísel, přičemž každé ze 49 čísel mělo očekávanou hodnotu četnosti taženi rovnou 5046:49= 102,98, tj. 103. Ve II. tahu bylo během 429 her taženo 2574 čísel. Každé ze 49 čísel mělo očekávanou hodnotu četnosti taženi rovnou 52.5. VI. tahu se očekávaná hodnota objevila třikrát: většinou byla jednotlivá čísla tažena v rozmezí 90—110, výjimečné jsou extrémni hodnoty 79 a 121. Podobně tomu bylo i ve II. tahu. kde celá čísla sousedící s očekávanou hodnotou (52,5) se objevuji šestkrát a zároveň se objevuje extrémně nízká četnost tahů u čísla 2 a extrémně vysoká u čísla 19. V horní testi zlomku jsou údoit o com. kolikráe bylo které Clilo sportky taženo Ittoi. spodní test zlomku moíl údaj. kolikrát bylo {(»lo tai«no od zaíátku txistwict sportky. 3.3 Normální rozdělení Jsou-li všichni havrani černí, není třeba vytvářet výběrové soubory a uvažovat o tom. kolik by mohlo být havranů šedých nebo světle modrých. Je-li pravděpodobnost, že havrani jsou černi, p = 1. jde o určitost. Něco jiného je. zkoumám-li např. váhu sta, tisíce nebo ještě většího množství havranů. I když se přitom vyloučí mladota, objeví se uvnitř zkoumaného souboru výkyvy. Podobně se navzájem odlišuje tělesná výška dospělých mužu. kvocient inteligence školních děti. počet slov na plně potištěných stránkach 73 knihy, přesná délka sériově vyráběných věšáků na zea", životnost elektrických žárovek, ba dokonce navzájem nezávislá měření jedné a téže vzdálenosti. Jistě jste si vzpomněli i na rozdělení příjmů našich 25 abiturientů a obyvatel Zbohatlíkova, avšak právě tato rozdělení musíme z našeho pojednání prozatím vyloučit. Naproti tomu se sem velmi dobře hodí úvahy, které jsme rozvíjeli v souvislosti s binomickým rozdělením a zákonem velkých čísel. Výsledky dvaceti hodů mincí stejně jako téměř každého druhu výběrových šetření vykazují totiž také charakteristické znaky tzv. normálního rozdělení, jímž se nyní budeme zabývat. Může být sporné, zda označení „nor-málni rozdělen!" je zvoleno šťastně (kritika někdy uvádí, že slovo „normální" naznačuje jakési souhlasné hodnocení), nicméně ve všech světových jazycích se přesto mluví o „normálním rozděleni", „Normalverteilung", „normál distribution", „distribution normále" — tzn. že statistická terminologie je bez tohoto slova nemyslitelná —, anií l statistika proto napadlo, že jiná rozděleni než normální jsou „abnormální" Nebude také ani požadovat, aby se daná čísla a měřené hodnoty daly ve všech případech úzkostlivě uvést do souladu s ideálním obrazem normálních rozdělení. Normálni rozděleni je jako každé jiné statistické rozděleni především myšlenkovým modelem a početní pomůckou, tedy nikoliv exaktním přírodním zákonem, který by musel být naplněn s malichernou přesností. Jestliže se statistika vždy, kdykoli vystupuje jako induktivní statistika, snaží usuzovat o celku na základě vzorků a dílčích pozorování, a proto může poskytnout jen více nebo méně pravděpodobné odhady, bylo by dvojnásob absurdní, kdyby se předstírala přesnost, která se především ve skutečnosti v takovém stupni nikdy nevyskytuje a která je dále vyloučena samým nahodilým charakterem každého výběrového souboru. Teorie a praxe však již prokázaly správ- 3.3 Normálni rozdílení Normální křivka nebo lépe jedna z normálních křivek vzhledem k tomu. že by ji bylo možno nakreslit strméjií nebo mnohem ploííi. Podstatný je jen vztah výše křivky v bodech, které vymezuji směrodatnou odchylku. Body ležící na křivce ve vzdálenosti + nebo — 2 a směrodatné odchylky se nacházejí v '/« vý*" ky, kterou má křivka normálního rozděleni ve vrcholu (nad průměrem 0). Obvod hrudi skotských vojáků podle O""1"0** málnim rozdělením je až zarážející 0« = 39-8 Palce> nost domněnky, že normální rozdělení platí pro téměř všechny výběry a pro velmi mnohá rozdělení podchytitelných souborů. Normální rozdělení má především velmi příjemnou vlastnost, která lehce vysvětluje jeho oblibu: ať už jde o jakékoliv objekty, úkazy, měření nebo sčítání, jsou vždy jednoznačně určeny střední hodnotou a rozptylem. Pokud jde o „střední hodnotu", má se zpravidla, a nikoliv neprávem, na mysli aritmetický průměr x nebo//, a to platí i v případě normál- statisť.ky. Shoda pozorovaných hodnot ního rozdělení. Avšak stejnou hodnotu jako aritmetický průměr mají i modus a medián (nejčetnější hodnota a prostřední hodnota). Krátká úvaha hned prokáže, že normální rozděleni s nej-větší četností „uprostřed" musí být symetrické. Jak taková normální křivka, která je grafickým znázorněním normálního rozděleni, ve skutečnosti -k.Avait na str. 74». sti normálního rozu«™ - -vypadá, ukazuje obrázek na str 74. JY.. . _ ___mňlního rozděleni vypadá, ukazuje Základem normálního rozdělen, jt noty jsou rozloženy tak. že jeden 3. Normálni rozděleni (p + q)12 p = q=0,5 —•"'"I™ "4096 Binomické rozděleni (p + q)'! dovoluje již jasně poznat podobu normální křivky. sledek měření nebo sčítání je „nejčet-nější" a „na obě strany od něho" jsou výsledky ponenáhlu stále méně četné, až konečně vykazují jen ojedinělou extrémní hodnotu. Jeden z prvních příkladů takového normálního rozdělení podal Quételet na základě měření obvodu prsou 5738 skotských vojáků. Nejčetnější hodnota činila (zaokrouhleno na celé coule) 40 coulů, skoro stejnou četnost vykazovalo 39 coulů, 41 a 38 coulů se vyskytovalo již vzácněji, 42 a 37 byly ještě vzácnější a konečně zjištěných 33, resp. 48 coulů představovalo jen ojedinělé extrémní hodnoty. Podobné uspořádání vykazují i výsledky dalších četných měření, např. váha cigaret vyráběných cigaretovým automatem: v nejčetnějších případech vážily 1.18 až 1,20 g nebo 1,20 až 1,22 g, jen málokteré byly lehčí než 1,08 g nebo těžší než 1,32 g. Podle rozsahu rozptylu i podle měřítka zvoleného pro grafické znázornění vzniká v idealizované formě plošší nebo strmější křivka. Mluví se o „normální křivce", v němčině o „Glockenkurve" (zvonovité křivce) se zřetelem na středně vysokou křivku, která se také uvádí jako model pro normovanou normální křivku, ve Francii o „courbe en chapeau de gendarme" (křivku policejního klobouku) se zřetelem na plošší normální křivku. Jako vědecká označení se také používají názvy „Gaussova křivka rozdělení chyb" a „de Moivrova stochastika" s odvoláním na oba praotce zvonovité křivky. Ať už se zvolí jakékoliv měřítko a ať je rozptyl k průměru v jakémkoliv poměru, normální křivka má vždy některé charakteristické znaky, z nichž uvedeme ty, které jsou pro praxi nejdůležitěji. Jestliže pozorujeme plochu ležící pod „zvonem" jako soubor, leží na obě strc jy od maxima (střední hodnota, nejčttnější hodnota) vždy přesně stejné části této plochy, a to v úseku mezi +a a —o leží 68,26 %, tj. nepatrně více než 2/:1 celkové plochy, v úseku mezi +2a a —2a skoro přesně 95 % a mezi +3o- a —3(T již 99,7 % plochy. Hodnoty za třemi směrodatnými odchylkami se proto berou v úvahu již jen velmi zřídka, ačkoliv normální křivka se teoreticky rozkládá od —oo po +00, tzn. v jisté míře od nekonečna do nekonečna. Tímto postupem do nekonečna a plynulým průběhem se normální křivka liší od binomického rozdělení. Přesto však mezi těmito oběma rozděleními je tak těsná souvislost, že normální rozděleni je možno v téměř všech prakticky důležitých případech pokládat za dostatečně přesné vyjádřeni binomického rozděleni, čímž si lze ušetřit svízelné početní operace, které jsme alespoň v náznaku poznali při našich úvahách o binomickém rozdělení. V historii normální křivky nelze zamlčet její původ z teorie hazardní hry. U její kolébky stál stařešina počtu pravděpodobnosti Abraham de Moivre. Jdl^Hi£L!l£^llnl_kf i v k y 3.31 Dějiny normální křivky Normální křivka oslavila své 250. narozeniny a na rozdíl od jiných vědeckých objevů je lze dokonce přesně zjistit: bylo to 12. listopadu 1733. To je totiž datum uveřejnění malého spisku Abrahama de Moivre, matematika — hugenota vyhnaného z Francie, který se všelijak protloukal v Londýně, mimo jiné také tím, že radil hazardním hráčům. De Moivre započal své úvahy experimenty s házením mincí, které jsme uvedli v části o binomickém rozdělení, a uskutečnil myšlenkový skok od sloupků histogramu k plynulé křivce, až konečně objevil i křivkovou rovnici normální křivky, kterou však zde neuvádíme, protože matematika laika spíše zmate, než by mu něco vysvětlila. De Moivre už také pozoroval stejno- . , u —17 Má-li rozdělení silný rozptyl (o - I). Tri normální rozdělení kolem střední hodnoty /' — ™- '. q soka. Střední kHvkn vy- je křivka plochá a rozložená; je-li rozptyl malý (a = 0,5). je str kazuje proporce „normovaného normálního rozděleni . 77 76 3. Normálni rozděleni___ rodost ploch uvnitř směrodatných odchylek. Pro teorii hazardní hry nebylo však možno z jeho matematických poznatků získat mnoho nového a jiné praktické možnosti použití elegantně zahnutých křivek nebylo v polovině 18. století ještě možno nalézt; křivka i rovnice upadly v zapomenutí. Až když se vynořil praktický problém, přímo prahnoucí po početním zvládnutí, byla normální křivka znovuobjevena jako Gaussova-Laplaceova „křivka chyb". Proč křivka chyb? Na konci 18. a počátku 19. století byli astronomové neustále v nepříjemné situaci, která vznikala tím, že při svých měřeních získávali hodnoty, které se více nebo méně navzájem odlišovaly. Příčina spočívala v nedokonalosti používaných přístrojů, a tak se na věci nedalo prozatím nic měnit. Bylo proto nutné nalézt cesty, jak by se ze spousty měřených dat získala pravděpodobně správná hodnota. Vzpomeneme-li si na obrázek ukazující zásahy kolem černého středu střeleckého terče, lze si trochu představit problém, před kterým stáli astronomové, mezi nimi také Lapiace a Gauss, kteří měli z umístění zásahů pokud možno co nejpřesněji vypočítat polohu cíle. Z množství měření navzájem více nebo méně odchylných, např. vzdáleností stálic, se měla určit hodnota nejvíce se blížící skutečnosti. Gauss se nejdříve domníval, že za takovou správnou hodnotu lze považovat aritmetický průměr všech měření, potom však došel, podobně jako Lapiace, k představě rozdělení četností výsledků měření: zcela nesprávné jsou ojedinělé extrémy, pak následují měření stále více si podobná a zároveň četnější, doslova pak vrcholící ve střední hodnotě a zároveň nejčetnější hodnotě normální křivky. 78 Jak Lapiace, tak i Gauss se museli mimo jiné vypořádat s otázkou, zda nelze nalézt stejné uplatnění pro kladné i záporné výsledky. Je zřejmě nesmyslné, aby chyby v měření +2 a +5 se navzájem prostě zrušily chybami —2 a —5 a přitom se tvrdilo, že per saldo se vlastně žádná chyba nestala. Lapiace postavený před tuto otázku se rozhodl pro absolutní hodnotu chyby tím, že uvažoval asi takto: jestliže dvě více nebo dvě méně, obojí je „dvě špatně". Gauss volil jiné východisko, a sice to, které jsme již poznali při výpočtu směrodatné odchylky: chyby umocnil na druhou, a tak dostal vesměs kladné hodnoty. Vítězné tažení normálního rozdělení zahájil však teprve Adolphe-Lambert Quételet, všestranný belgický vědec, který objevil normální rozdělení pro biometrii, vědu o měření člověka. Quételet byl jedním ze zakladatelů Královské statistické společnosti v Londýně, hlavním povoláním astronom, ze záliby statistik, jehož vášeň přecházela až do rozvernosti — jednou prý spočítal celkovou váhu bruselského obyvatelstva. Quételet, který se často a tak přesně zabýval statistickými tabulkami, během studia zjistil, že překvapivě mnoho výsledků sčítání a měření vykazuje takové rozdělení četnosti, jaké je charakteristické pro „křivku chyb", která mu byla jako astronomovi dobře známa. Provedl proto mnohá měření na vlastní pěst, mezi nimi jako jedno z prvních proslulé měření obvodu prsou skotských vojáků. Na tomto základě dospěl k závěru, že — nepřihlíží-li se k poměru mezi střední hodnotou a rozptylem — uspořádání četností vykazuje při těchto a jiných biometrických měřeních skutečně přesně stejnou strukturu, jaká je v tabulkách chyb měření: křivku normálního rozděleni. A pokud je známo, Quételet byl první, kdo mluvil o „nor-málním" rozdělení. Normální rozdělení podle Quételeta neznamenalo však nic jiného než to, že příroda se snaží vytvořit ideální typ, „homme moyen", avšak v různé míře chybuje. V této souvislosti použil také obrazu se střeleckým terčem — .....hodně smělá metafora", jak kriticky komentoval později logik a teoretik pravděpodobnosti John Venn. (Je to týž Venn, kterému moderní matematika vděčí za Vennovy diagramy pro zobrazení množin.) „Homme moyen" se může doslova přeložit jako „průměrný člověk" nebo „střední člověk", avšak bez onoho znevažujícího spodního tónu, který byl úplně cizí Quételetovu myšlení. Pro něho byl „homme moyen" vznešenou, vysněnou představou, která svědomitému statistikovi umožňovala přesně nahlédnout do dílny přírody a objevovat její nejtajnější cíle. Tato představa narazila na rozhořčený odpor, zároveň 3.31 Dějiny normálni křivky však získal vášnivé a nadšené stoupence. K těmto stoupencům patřila také sociální pracovnice Florence Nigh-tingalová, nadšená amatérská statistička, a biolog, kriminolog a afrika-nista Francis Galton, který s veškerou energií jako jeden z prvních zavedl kvantitativní metody do biologie a mimo jiné navrhl měrné stupnice pro všechny možné tělesné znaky, ba dokonce i pro ženskou krásu. Galton — ačkoliv vlastně nebyl básníkem — se nechal svým nadšením pro normální rozdělení strhnout až k téměř básnickému projevu a mimo jiné napsal: „Stěží znám něco, co může naši fantazii uchvátit tak jako obdivuhodná forma kosmického pořádku, který vyjadřuje »zákon o četnosti chyb*. Kdyby byl znám Řekům, byli by jej personifikovali a uctívali jako božstvo. V nej-divějším zmatku šíří harmonický klid: čím větší anarchie, tím svrchovanější je jeho vláda. Za závojem chaosu se objevuje jeho netušený a nádherný tvar pravidelnosti." THE NORMAL LAW OF ERROR STANDS OUT IN THE EXPERIENCE OF MANKIND AS ONE OF THE BROADEST GENERALIZATIONS OF NATURAL PHILOSOPHY + IT SERVES AS THE GUIDING INSTRUMENT IN RESEARCHES IN THE PHYSICAL AND SOCIAL SCIENCES AND IN MEDICINE AGRICULTURE AND ENGINEERING + IT IS AN INDISPENSABLE TOOL FOR THE ANALYSIS AND THE INTERPRETATION OF THE BASIC DATA OBTAINED BY OBSERVATION AND EXPERIMENT Americký statistik Youden „zanotoval" typografickou pochvalnou piseň na normální rozdělen. Jo „vedoucím nástrojem výzkumů v přírodních a sociálních vědách...". ..nepostradatelným ne-«rojom analýzy a výkladu výsledků pozorováni a pokusů". 3. Normálni rozděleni__ Karl Pearson, otec moderní matematické statistiky, byl rovněž obdivovatelem normální křivky, ačkoliv znal i její nedostatky: stanovil, že v přírodě jsou i nenormálně rozdělené veličiny, a také se pokusil vypracovat specifická schémata rozdělení pro tyto případy. Přitom však zjistil, že z mnohých, na první pohled nenormálních rozdělení se po pečlivém rozboru skutečností vyklubou spletence dvou nebo i více normálních rozdělení. Vášnivé debaty o významu a bezcennosti, oprávněnosti a nesmyslnosti normální křivky utichly až ve 20. století, i když úplně nevymizely. Přijímá se taková, jaká je — jako cenná pomůcka statistické práce. O její filozofické nebo i vědeckoteoretické podstatě se však příliš nemluví. Fyzik Gabriel Lippman prý k tomu jednou zlomyslně poznamenal: „Celý svět pevně věří na normální rozdělení — matematici, protože jsou přesvědčení, že jde o experimentálně dokázanou skutečnost, experimentátoři, protože jsou přesvědčeni, že se jedná o matematickou poučku." Mezi nejoblíbenější „vysvětlení" normální křivky stále ještě patří Gaussovo: nesčetné dílčí vlivy vyvolávají větší nebo menší odchylky od „průměru", který všude nacházíme, a tato náhodná kombinace náhodných vlivů podléhá nakonec „zákonům" hazardní hry, pravidlům binomického rozdělení s téměř nekonečným počtem „pokusů". Tato úvaha nachází matematický výraz v „centrální limitní větě", jíž se na tomto místě nebudeme blíže zabývat. S pomocí této věty však lze ukázat, že vždy se musí dojít alespoň přibližně k normálnímu rozdělení, jestliže je znak určen působením většího počtu navzájem nezávislých vlivů, ať už je každý z těchto jednotlivých faktorů rozdělen jakkoli. 80 S jemnou ironií se dá snad říci, že volná hra náhody je to jediné opravdu normální na tomto světě. Einstein prý jednou řekl: „Bůh nehraje v kostky." Normální rozdělení však nemůže posloužit jako důkaz opaku. Je to koneckonců otázka individuálního postoje, jestliže se v něm spatřuje jen matematický výraz nahodilých kombinací nemajících zdánlivě smyslu nebo pravěký zákon stvoření a důkaz božského řádu v kosmu, jak kdysi soudil de Moivre. 3.32 Normované normální rozdělení I když jsou normální křivky pravidelné, symetrické a stejnorodé, získávají velký praktický význam teprve dalším procesem standardizace (normováni). K tomu, abychom porozuměli procesu standardizace, musíme uvést ještě několik příkladů nestandardizovaného normálního rozdělení. Charakteristické chování křivky je vždy stejné: bod obratu křivky leží vždy ve vzdálenosti +a a—o*, tečna v bodu obratu vždy protíná souřadnici ve vzdálenosti +2a a —2tr, teoreticky je vždy křivka rozložena na obě strany donekonečna, avšak již při +3 (z) a 0,0057 0 (—Z). ' 17 11/ Jak však uvedeme do souladu 0,9953 šroubů lehčích než 1,4 g s číslem 0,991, které je podobné, ale ne stejné? Vzpomínáme si, že toto číslo zahrnuje plochu na obě strany od střední souřadnice — vynechává však extrémní hodnoty na obě strany! Jestliže však je 0,0047 na jedné straně pro těžší šrouby, je 0,0047 na druhé straně pro šrouby lehčí; dvakrát 0,0047 dává 0,0094, zaokrouhleno 0,009, a to se nyní doplňuje s 0,991 opět na celkovou plochu pod křivkou. Zde jsme tedy vlastně dostali odpověď: ,,99,1 % výrobků se neodchyluje o více než 2,6 a od střední hodnoty, zbývajících 0,9% (přesně 9,4%) spadá za hranici tolerance, a to samozřejmě symetricky, vždy polovinou na obou koncích křivky." Tolik o tom, jak zacházet s tabulkami pravděpodobnosti. V případě pochybnosti nikdy neuškodí, když si pozorně přečteme, co je napsáno v záhlaví tabulky (někdy je připojen i vysvětlující nákres normální křivky). S normálním rozdělením souvisí také kvartily, decily a percentily, které se někdy vyskytují v odborné literatuře. Ještě blíže jsou však spřízněny s centrální hodnotou, mediánem. Stejně jako tato hodnota — vzpomínáte si? — udávají, že polovina měrných hodnot leží nahoře a polovina dole, takže kvartily tvoří dělítko mezi čtvrtinami, dec/7y mezi desetinami a percentily mezi setinami. Ale pozor: protože tyto ,,-ily" jsou jen myšlená dělítka, „neobsahují" vůbec nic. Nejsou nejvyšší čtvrtinou nebo poslední desetinou plochy, nýbrž čarou, která odděluje čtvrtinu či desetinu. Jsou proto jen tři a nikoliv čtyři kvartily, jen 9 decilů a jen 99 percen-tilů. Výrazy jako „v devátém centilu" se sice používají, ale jsou nesprávné. 3.4 Jiná rozdíleni 3.4 Jiná rozdělení I když normální rozděleni je na pohled tak pěkné a pro použití tak účelné a může být proto často plným (nebo alespoň značným) právem použito, přesto nemůže zachytit všechny skutečnosti. Je mnoho věcí mezi nebem a zemí. o nichž se normální křivce ani nesní. Velmi jednoduchý a názorný příklad vzniká, je-li nejčetnější hodnota poměrně blízko nuly, avšak nelze přitom předpokládat záporné výsledky: to se stává např. u počtu dětí v rodinách. Rodiny bezdětné, s 1 a 2 dětmi jsou téměř stejně četné; pak však křivka padá na pravou scranu způsobem, který by mohl přibližně odpovídat normálnímu rozdělení: 3 děti jsou méně časté. 4 ještě méně atd., až v úseku 11 a více dětí se dosahuje extrémních hodnot. Co je naproti tomu na ,,/evé" straně křivky? Nic. Žádná žena nemůže mít méně než žádné dítě. Graf švýcarského statistického úřadu to ukazuje velmi názorně (obr. na str. 88). Normální rozdělení se v tomto případě nehodí, protože naráží na nulové hranici na bariéru, která je — obrazně řečeno — zešikmuje. „šikmosť rozdělení je ostatně statistický vědecký termín, kterým se měří horizontální odchylka rozdělení od normálního rozdělení. Doplněk k tomu tvoří „exces", jenž křiví zvonovitý tvar normální křivky ve svislém směru, to znamená, že zvon je příliš strmý nebo příliš plochý. . je-li šikmost tak výrazná, že knvka vykazuje při nejnižších hodnotách nejvyšší četnosti (bylo by tomu tak v při-padě. že bezdětná manželství by byla nejčastější). vzniká takzvaná křivka L O rozděleni L. které se doprava zplošťuje, koluje melancholické rčení, že pry 87 86 3. Normální rozděleni 3.41 Poissonovo rozdělení Vdané ženy podle počtu živě narozených dětí v tisících 300 280 260 240 děti 8 9 10 11 12 13 14 15 Výrazně „strmé" rozdělení ukazuje mimo jiné počet dětí na vdanou ženu (nebo také na rodinu): značné četnosti při 0, 1 a 2 dětech jsou zhruba stejné vysoké a potom se silně snižuji. je charakteristickým rozdělením všech krásných věcí. Téměř každé rozdělení příjmů ukazuje — udává-li se výše příjmů na souřadnici a počet jejich příjemců na pořadnici — řídkost velkých příjmů a četnost příjmů malých. Chce-li někdo např. považovat vysoký věk za žádoucí příjemnost, udává grafické znázornění úmrtnosti rovněž klesající křivku. Cokoli je zvlášť cenné, vyskytuje se jen u mála osob. Kdyby se měl graficky znázornit počet barokních soch, případně počet knih připadajících na jednu domácnost, zase by vzniklo rozdělení L, rozdělení krásných věcí. Výrazné křivky J jsou vzácnější, protože neomezená možnost rozšíření vpravo vede přece jen dříve nebo později ke zploštění. Mohou vzniknout pouze tam, kde je také vpravo pevná hranice, která vlevo je většinou na nule. Konečně existuje kombinace křivky J a křivky L; výsledkem je dvouvrcholové rozděleni U, pro které mimo jiné uvádí Haseloff charakteristický příklad: 326 pokusných osob je dotázáno, za jak pravděpodobné pokládají, že lidé někdy navštíví vzdálené hvězdy Mléčné dráhy. 34 % dotázaných odpovědělo „určitě", 15 % „pravděpodobně", 7 % „možná", 8 % „nevím", 4 % „asi ne", 9 % „jistě 88 nikdy" a 23 % „to není možné". Polarizace názorů dává v grafickém znázornění rozdělení U. 3.41 Poissonovo rozdělení Jednoho rozdělení si však musíme všimnout podrobněji, a to takzvaného Poissonovo rozdělení, které dostalo název podle francouzského matematika z počátku 19. století. Pokládá se za „speciální rozdělení" pro nepatrné pravděpodobnosti, za početní schéma pro řídké události. Již v binomickém rozdělení existují řídké jevy — např. výskyt určitého sledu čísel v ruletě nebo ve Sportce. Pro binomické rozdělení je charakteristické doplňování jevu a nejevu. Když p = 0,2, pak (1—p) = q = 0,8; ptáme-li se po počtu piků, platí všechno ostatní jako nepiky. Zkrátka vždy byla nějaká protihodnota k hledané pravděpodobnosti nebo četnosti. Mnohé procesy však pomocí uvedeného binomického schématu vyjádřit nelze. Jestliže je na 10 cm dlouhém obrobku jedno vadné místo— kolik míst není vadných? Naro-dí-li se v době od 10 do 12 hodin 4 děti — kolik se jich v té době nenarodilo? Jestliže během jedné bouřky jsme napočítali 10 blesků, kolik blesků nebylo? Nejzřetelněji, i když velmi podivně, je povaha problému charakteristického pro Poissonovo rozdělení vyjádřena v tabulce, kterou sestavil německý statistik Bortkiewicz na počátku našeho století. Zjišťoval po deset let ve dvaceti německých armádních sborech (podle jiné verze: v deseti armádních sborech, po dvacet let) počet vojenských osob zabitých úderem koňského kopyta a zjistil, že u 109 ukazatelů „armádní sbor/rok" nebyl žádný smrtelný úraz, 65krát byl jeden mrtvý, procento dotázaných A Budou lidé cestovat až ke hvězdám Mléčné dráhy? Odpověd na tuto otázku poskytlo „U -rozdělení". K vytvořeni oceňovací stupnice byla odpověd „určitě" dosazena jako -f 100. „pravděpodobně" jako + 75, odpověd „není možné" jako —100. Mezní hodnoty měly nej-vyššl podíl: 34% dotázaných odpovědělo „určitě", 23 % „to není možné". 22krát dva mrtví, 3krát tři mrtví, jedenkrát dokonce čtyři. Celkový počet smrtelných případů byl 122 = (65 -f + 44 + 9 -|- 4), „očekávaná hodnota" smrtelných případů na rok a armádní sbor činí tedy 0,61. Vyjdeme-li z této očekávané hodnoty, můžeme porovnat, zda tyto nehody mohou být přibližně správně zachyceny Poissonovým rozdělením. Nejdříve prokážeme pomocí vzorce, že tomu tak skutečně je, a teprve potom pojednáme blíže o struktuře Poissonovo rozděleni. Přitom platí: / = očekávaná hodnota, x = počet hledaných jevů. 89 3. Normálni rozdělení 3.41 Poissonovo rozdíleni Očekávanou hodnotu / známe: 0,61. Hledejme tedy nejdříve pravděpodobnost, že jev (smrt po úderu koňským kopytem) nastane nulkrát (x = 0). Dostaneme: Po = - e-°-6l.(0.61)" 0! Číslo e má hodnotu 2,718, jeho vznik si načrtneme. Každé číslo umocněné nulou dává 1; 0!, jak již víme, je definicí určen jako 0! = 1. Vzpomínka na středoškolskou matematiku: 1 to je v našem případě: e-*M = _ ; eM» = 1,841. tedy 1 Ärfn , e-o.6i_ = 0,543; to je souhrnně 1,841 0,543 .1 Po =-i-= 0,543. Z celého pole pravděpodobnosti p = 1 je tedy více než polovina zaplněna nulovými jevy. Podle Poissonova rozdělení by měl jev „žádný mrtvý úderem kopyta" nastat v 543 z 1000 ukazatelů „armádní sbor/rok", respektive ve 109 z 200 pozorování. Další krok: x = 1, jak často nastane případ úmrtí? e-0-"1 . (0,61)' 0,543.0,61 pl =-u-=-i-= = 0,331 Odpověď: v 331 z 1000 případů, tj. asi 66 z 200. Otázka po 2 mrtvých (x = 2): «*-°-« . (0,61 )* 0,543 . 0,372 2 ! P-2=- = 0,101 Odpověď: ve 101 z 1000 případů, tedy 20 z 200. 90 Tímto způsobem dostaneme konečně p3 = 0,021 (4 případy ze 200); p ~ = 0,003 (0,6 případu ze 200). Porovnejme nyní skutečné hodnoty a čísla vypočítaná podle Poissonova rozdělení: Skutečnost Propočet 0 mrtvý 109 109 1 mrtvý 65 66 2 mrtví 22 20 3 mrtvi 3 4 4 mrtví 1 0,6 Jen stěží si lze představit dokonalejší důkaz, že Poissonovo rozdělení výstižně zobrazuje stav věcí. Dříve než podáme další důkazy o schopnostech Poissonova rozdělení, podívejme se krátce na pozoruhodné číslo e, které je také známo jako „základ přirozených logaritmů". Toto e je souhrnem nekonečné řady a zároveň „mezní hodnotou". Totiž e lze zároveň pokládat za extrémní výsledek výpočtu úroků z úroků. Částka, např. 1000 korun, se má ročně zúročit 100 %. To by při placení na konci roku činilo 2000 korun. Jestliže se však úroky připisují půlročně, úročí se od začátku července nikoliv 1000, ale 1500 korun a na konci roku je tedy v bance 2550 korun. Jestliže se úrok počítá čtvrtletně, úročí se od 1. dubna 1250 korun, od 1. července a 1. října odpovídající vyšší částky, a na konci roku je to již 2440 korun. Výpočet úroků z úroků lze teoreticky stále více zužovat: měsíčně, týdně, denně, hodinově. Částka připadající na konec roku tak bude stále vzrůstat, nikoli však donekonečna, nýbrž ke konci ve stále menších krocích tak, jak se budeme blížit k hranici — více než 2718 korun 28 haléřů to v žádném případě nemůže být: našich původních 1000 korun násobených číslem e. Číslo e lze také vyjádřit jiným způsobem, a sice touto exponenciální řadou: 1 1 1 1 1 1 e = ÓÍ + Í! + 2! +3! +4! + 5! + '"• = 2,7183... Při této příležitosti se znovu setkáváme s čísly s vykřičníkem (vyslov: „fakto-riál"), které jsme poznali u binomického rozdělení a o nichž už víme: 0! = 1; 1! = 1; 2! = 2.1 = 2; 3! = = 3.2.1 = 6; 4! = 4.3.2.1 = 24 atd. Na tomto místě nechceme popisovat matematické odvození Poissonova rozdělení z binomického, ale pouze poukázat na základní myšlenky. Rozložíme našich 200 ukazatelů „acmádní sbor/ rok" na 200.365 = 73 000 jednotlivých dnů (nebo zhruba 1,8 mil. hodin atd.), takže v takovém časovém úseku nastane nejvýše jeden jev. Máme tu jakousi „karetní hru" složenou ze 73 000 dnů, ve které je 122 dní se smrtí úderem kopyta. Z takové karetní hry pak mohou být zásadně zjištěny pravděpodobnosti tahu jako při tahu 1 piku z normální karetní hry, ovšem s mnohem vyššími čísly. Takové téměř nekonečné další dělení časového úseku je vyjádřeno v čísle e, k jehož vysvětlení jsme rovněž použili nekonečného postupného členění časového úseku. Pro naše úvahy v této knize není ani tak důležitá souvislost Poissonova rozdělení s binomickým, jako spíše skutečnost, že — na rozdíl od normálního rozdělení — je určováno jedinou proměnnou ?.. Zatímco pro stanovení normálního rozdělení potřebujeme jak střední hodnotu, tak rozptyl, v tomto případě postačuje zjištěná průměrná četnost jevů, pravděpodobnost zásahů, která vstupuje do vzorce. Tato skutečnost umožňuje při použití Poissonova rozdělení další zjednodušení. Protože prakticky záleží jen na mé libovůli, na kterou základní veličinu chci četnost jevů vztáhnout, mohu dosadit /. = 1 (nebo přibližně rovno 1), z čehož vyplývá zjednodušený vzorec: 1 1 Při tomto zjednodušení vyjdou však někdy pozoruhodné poměrné veličiny. V případě obětí úderem kopyta by bylo nutno při ?. = 1 zkoumat četnost smrtelných případů pro armádní sbor v průběhu 19 měsíců. Pak by vyšlo: p0= 1 = 0.368 Pro jeden smrtelný případ bychom rovněž dostali stejnou pravděpodobnost: 1 p. = - = 0.368 ri e Prodloužením časového úseku se totiž zvýšila pravděpodobnost pro více než jednu takovou nehodu: 1 1 P2=7-2-! = 0-184 p=l 1 = 1 = 0.061 pa e 3! 6e A nyní pokračuje zajímavá řada: p4 je čtvrtinou výsledku p3; ps je pětina pt atd.. jak už bylo p, polovinou p, a p3 třetinou p... Předpokladem pro použitelnost Poissonova rozdělení je vždy závislost náhody na h Počet předmětů nalezených a odevzdaných denně v obchodním domě např. zřetelně ukazuje Poissonovo rozdělení. Typickými příklady jsou dale počet telefonních hovorů v urč.tem 91 3. Normálni rozdělení časovém úseku (srovnej k tomu později „teorii front" v osmé kapitole) nebo počet úrazů na dělníka za rok. Mnohý problém binomického rozdělení lze podstatně rychleji vyřešit Poissonovým vzorcem — např. otázku po jednom piku při 5 tazích, kdy je ovšem třeba velké opatrnosti, protože pravděpodobnost p = 0,25 je vlastně příliš velká. Bude však docela zajímavé, jestliže to zkusíme a zjistíme rozdíl. Očekávaná hodnota je — jak už víme — 1,25 a tu nyní označíme /.. A hned můžeme dosazovat do vzorce: Pi pik = !-«■» . (1.25)1 1 1.25 3,5 = 0,36 Při tomto výpočtu dostáváme tedy p = 0,36 proti p = 0,40 při binomickém rozdělení. Ostatně jsme varovali, že v tomto případě není Poissonovo rozdělení nejvhodnější, protože nejde o „řídký" jev. K tomu však přistupuje ještě něco jiného: Poissonovo rozdělen! mlčky předpokládá, že n je velké, a proto se toto n ve vzorci vůbec nevyskytuje. Počtársky je tedy možno tímto vzorcem vypočítat pravděpodobnost tahu šesti piku při pěti tazích: 1 (1,25)« Pii pik — »1.25 6! Dostáváme jen asi tisícinu, a to je přece zcela nemožné! Nedokazuje to však, že Poissonovo rozdělení je nesmyslné, nýbrž jen, že musíme vážit a vědět, kdy a jak se má použít. A znovu to dokazuje, že přesnými početními postupy lze dospět k velmi působivým číslům, která však při své kráse mají jen tu malou chybu, že nemají žádný význam. Statistika bez použiti rozumu dává nesmysly — a to neplatí jen o statistice. Teď ještě několik slov o zvláštní formě rozdělení a jeho zobrazení — o součtových křivkách. 3.5 Součtové a koncentrační křivky V tabulkách k normálnímu rozdělení je ke každé hodnotě na souřadnici (osa x) uveden odpovídající podíl plochy pod normální křivkou — a to, jak už víme podle tabulky nejdřív podíl od záporného konce až po x, pak podíl od x až ke kladnému konci křivky — a vše ostatní, co jsme se o této hře naučili. Celková plocha pod křivkou je tedy dohodnuta na 1, a všechny její díly se udávají v promile nebo v částkách menších než 1. Na vrcholu křivky se dosahuje přesně podílu 0,5. Na základě těchto tabulek můžeme dát normální křivce zcela jinou podobu tím, že ji změníme na součtovou křivku. Jednice 1 se dosadí za rovných 100%, což je podle smyslu totéž, a vynese se na pořadnici; proti obvyklému znázornění normální křivky se abscisa vůbec nemění a sahá asi od —3a až po asi + 3o\ Nyní vyhledáme pro některé charakteristické hodnoty x v tabulkách podíl ploch a naneseme je na osu y. K tomu účelu nejdříve použijeme tabulky, která udává pro průměr fi = 0 hodnotu 0,5. Pak např. dostaneme: naneseme podii plochy na osu y y mm 3.5 Součtové a koncentročnl křivky x = 3 x = 2,5 x = 2 x = 1.5 x = 1 x = 0,5 x = 0 0.0013 0,0062 0,0228 0.0668 0,1587 0,3085 0.5 0.1 0.6 2.2 6.6 15.8 30.8 50,0 Na pravé polovině křivky odečteme levé" hodnoty od celku 1 a tak dostaneme: x = 0.5 x = 1 x = 1.5 x = 2 x = 2.5 x = 3 0,6915 0.8413 0.9332 0.9772 0,9938 0.9987 69.2 84,1 93.3 97,7 99.4 99.9 Při pečlivém provedení na milimetrovém papíře může taková křivka v určité míře dokonce nahradit tabulku. Tam, kde 25%, resp. 75% čára protíná křivku, jsou na ose x hodnoty kvartilů, přibližně +, resp. —0,675 a. Součtová křivka je především užitečná tam, kde se chceme na první pohled přesvědčit, jak se určitá naměřená hodnota umístila v celkovém obraze četností. (K tomu je ovšem účelnější nanést na osu x hrubé měrné hodnoty po výpočtu standardních odchylek, a nikoliv standardizované hodnoty —3, —2 atd.) Naneseme-li uvedeným způsobem z jed- Ze součtové křivky normálního rozděleni (černá křivka, levá stupnice) lze vyčíst, kolik procent plochy pod normální křivkou (modrá křivka) „se spo- 80% třebuje" až po každý daný bod standardní odchylky. K — 1 je to např. 60% 16%, k + 1 asi 84%. Čísla stupnice vpravo udávají relativní hustotu 40% normálního rozdělení: ať už normálni křivka bude strmá nebo plochá, tyto 20% číselné poměry musí být v každém případě dodrženy. Tak je křivka např. 0 v bodě + 1,2 a —1,2 .3 yždy poloviční ve vztahu k vrcholu nad bodem 0. noho našeho dřívějšího případu výsledky měření kvocientu inteligence ({i = 112, a = 6), okamžitě vidíme, kolik procent pokusných osob má IQ pod 100, pod 110, nad 120 atd. Je však ještě jiný druh součtové křivky, která by se vlastně měla jmenovat „součtová přímka". Nemá nic společného s normálním rozdělením ve statistickém slova smyslu, ale velmi mnoho s normálním rozdělením ve smyslu přesného rozdělení spravedlnosti. Když totiž každý má stejně — ať už peněz, pozemků nebo radiopřijímačů — pak v případě každé nově zahrnuté osoby rovnoměrně stoupne celkový počet peněz, pozemků i radiopřijímačů. Musí však přitom jít o částky nebo věci, které se mohou sečítat. Nemohu např. říci: A má kvocient inteligence 100, B a C také, tzn. že všichni tři mají tedy IQ 300. Protože však pozemské statky nejsou skoro nikdy tak rovnoměrně rozděleny. -2 -1 +1 +2 *3 3. Normální rozděleni 100% 50-'. 84% 80*. — 80* 0,1 •* _J_ 2% 1 99,9», Zobrazení samotné součtové křivky. Změnou měřítka vypada proti předchozímu vyobrazeni ploHI. Ale také normální křivka by byla relativně plošJI. 3.6 Četnost a hustota -2c -lo ♦ la *2a +3o nevzniká zpravidla žádná přímka, ale pozoruhodná, propadlá křivka, kterou lze nejsnáze porovnat s rozdělením J. (V tomto případě může vzniknout pravá křivka J, protože na pravé straně se po dosaženi 100% táhne uzavírací čára.) Tyto křivky měří ..koncentraci" s: g 80 It. \ 60 st E 50 « 40 2 30 \» £ 10 z z z t 2 10 20 30 40 50 60 70 80 90 pozemky v procentech Kdyby každý majitel pozemků vlastnil stejný rozsah půdy. vyjadřovala by diagonála toto „ideální rozdělení". Egyptská statistika umožňuje ukázat jak krajně nespravedlivé rozdělení půdy v roce 1952 (pravá křivka — 10 % majitelů pozemků vlastnilo 70 % půdy), tak důsledky opatření zemědělské reformy uskutečněné do roku 1965 (střední křivka), které přece jen podstatně přiblížilo skutečnost k ideálu. Tento způsob zobrazení se nazývá koncentrační nebo Lorenzova křivka. peněz, pozemků atd., a proto se nazývají „koncentrační křivky"; nejzná-mější je tzv. Lorenzova křivka. Na příkladu z egyptské statistiky lze zcela jasně vidět princip takové Lorenzovy křivky. Na souřadnici je procentní sazba pozemkového vlastnictví, na pořadnici procentní sazba majitelů pozemků. Obě křivky udávají hodnoty z let 1952, resp. 1965, a výrazně ukazují úspěch pozemkové reformy v Egyptě. Na první pohled snadno zjišťujeme, že v roce 1952 10 % majitelů pozemků vlastnilo 70 % půdy (v roce 1965 jim patřilo již jen 50 %). 3.6 Četnost a hustota Na začátku tohoto oddílu jsme mluvili o diskrétních a spojitých znacích a pak jsme ukázali, jak z diskrétního rozdělení při rostoucím počtu pozorování a možných výsledků ponenáhlu vzniká spojité rozdělení, které lze vyjádřit normálni křivkou. K určitému bodu normálního rozdělení nelze již přiřadit žádnou četnost, je možno již jen určit podíly Četnosti, které leží mezi dvěma body. Je to zcela logické, protože mezi +3a a —3rr je nekonečně mnoho bodů. V každém z těchto bodů jsou sice 2 křivky a (z tabulek) Letáky shozené nad krajinou mohou být na některých místech i hustě na sobě. lze je však vždv spočítat. ' zřejmá „hustota", ale již žádná četnost. Rozdíl lze objasnit na následujícím příkladu. Jestliže letadlo shazuje bomby, je možno později říci: nad osadou A spadlo 20 bomb, mezi A a B 48, nad B 65, mezi B a C 30, nad C 22, mezi C a D 8 a nad D 2. Pro získání porovnávací základny nezávislé na velikosti osad by bylo možno shození bomb určovat také na čtvereční kilometr. Zřejmě jde o jednoznačně diskrétní (chceme-li mluvit v souvislosti s bombami o „diskrétním") rozdělení spočitatelných četností. Jestliže letadla — naštěstí — místo bomb shazují letáky, je možno zjistit ještě toto: nad A bylo shozeno 360, mezi A a B 500, nad B 1200 letáků atd. Lze si však také představit krajinu souvisle pokrytou letáky: v tomto případě leží rozsypané jednotlivě, někde ye velkém počtu, dál od sebe nebo na sobě — rozdělení přechází z „diskrét-nlno" do „spojitého", jež je zjistitelné Jen odhadem. Pokročme ještě dál do mírových podmínek. Teď již nepadají letáky, ale kroupy. Mezi B a C leží na polích v centimetrové vrstvě, neboť zde byly srážky nejprudší; odtud na obě strany se četnost krup (což se nyní nazývá „hustota vrstvy krup") zmenšuje. Teoreticky bych mohl jít ještě na určitý lán pole mezi osadami B a C a říci: na čtverečním decimetru, který tvoří nejzazší severozápadní kousek repného pole, leží přesně 598 krup, na čtverečním decimetru vlevo vedle dokonce 634. Mohl bych v této pošetilé hře pokračovat až podle čtverečních centimetrů pozemku. Ale teď ať sněží — a skončeme s diskrétním rozdělením, vítězí hustota. V každém jednotlivém bodě krajiny mohu bez námahy zjistit: zde leží sníh 5 cm, 18 cm nebo 38 cm vysoko. Ale v každém bodě nemohu říci: nad touto špendlíkovou hlavičkou leží přesně 325 852 sněhových vloček. Mohu však říci: mezi tímto bodem a bodem druhým leží tisícina nebo osmina nebo sedma- 94 95 3. Normálni rozděleni k Body, procenta, indexy B c I hustota v bodě x. Sněhové vločky, které spadnou nad krajinou, nelze v žádném bodě už spočítat, je možno pouze změřit výíku (hustotu) sněhové pokrývky. Podíl na délkovém rozděleni sněhu lze určit -pouze v okruhu mezi dvěma místy měřeni. třicetina celkového množství sněhu. V dalším průběhu našeho pojednání se pojmu „hustota" úplně vzdáme. Protože však normální rozdělení, přísně matematicky řečeno, je funkcí hustoty a protože čtenář možná někdy v nějaké učebnici na pojem „hustota" narazí. chtěli jsme závěrem této kapitoly ještě ukázat, jak se četnost mění v hustotu a proč nelze nikdy v jednotlivém bodě normálního rozdělení zjistit podílovou četnost, nýbrž vždy jen četnost mezi dvěma body tím, že se vyříznou více nebo méně úzké díly z celkové četnosti. 4.1 Časové řady „Prouděním života, vichrem dění, / vzhůru a dolů a sem a tam / vám a tkám / zrození — hrob — / věčný oceán, / ohnivé vání, / kolotání a proměňování./ Tak času jsem tkadlec, tak hrčí můj stav." Další řádek pak pokračuje: „a tkám — tkám božstva živoucí háv" (překlad O. Fischera podle vydání SNKLHU. Praha 1955) — málem bychom se začali domnívat, že Duch z „Fausta" začne zpívat hymnus na časové řady, které jsou opravdovým tkaním hávů životních procesů, neboť graficky a v tabulkách zachycují veškeré kolotání a proměňování mezi zrozením a hrobem. Jsou to především časové řady, s nimiž se občan setkává často jak v denním tisku, tak i v odborných časopisech, více nebo méně originální — s podivnými figurkami, které šplhají nahoru nebo zase zděšeně sviští po nějaké křivce do hlubin. Časová řada je také to, co bývá v kreslených vtipech na pozadí ředitelských kanceláří a zasedacích síní — většinou prudce klesá a některý z přítomných, zpravidla zachmuřených pánů k tomu chce podotknout něco velmi kousavého. Jestliže tento druh statistiky tak „nadprůměrně" vystupuje do popředí, není to samozřejmě bez důvodu, časová řada vnáší totiž do statistiky dynamický prvek. Nejenže umožňuje poznat vzorek utkaný na tkalcovském stavu času, ale přímo vyzývá pozorovatele, aby s pohledem do budoucnosti kreslil nové vzory. I když časové řady nemají u pozorovatele vyvolat futurologické vize plné fantazie, upoutávají však více než poměrná čísla nebo nehybná rozdělení četností, protože uvádějí do hry dimenzi času, ukazují několika čarami nebo čísly vývoj, nepředpokládaný nebo skličující, který jsme většinou zpravidla jen nejasně tušili. Přesto není zásadní rozdíl mezi časovou řadou a jednotlivými statistickými výběry nebo vyčerpávajícím šetřením. Stejně jako se film skládá z jednotlivých nehybných obrázků, je i časová řada složena z takových jednotlivých snímků, a chceme-li zůstat u filmového obrázku a pomyslíme na rozsáhlá časová období, která jsou v časových řadách překlenuta, můžeme bezmála mluvit o metodě časové nenásytnosti. Časové řady v zásadě vytvářejí spojeni mezi stejnorodými údaji (zjištěními, výpověďmi) z různých dob, avšak stejného věcného obsahu. Může jít nejen o plynulá porovnávání, jako je tomu v případě sledování ročních dovozu a vývozů za posledních patnáct let (str. 101), ale i o porovnání jednotlivých vybraných údajů, jako např. porovnáni struktury povolání ve švýcarsku v letech 1888, 1920. 1940 a 1960 (str. 98). Plynulá porovnání nejsou však často vůbec možná. Časová řada z výsledků hromadných sčítání lidu nejenže přeskakuje desetiletá období, nýbrž poskytuje mimoto jen bodové údaje rozhodného okamžiku — zjištěné hodnoty, které přísně vzato platily pouze jediný 97 4. Body. procento, indexy Zaměstnaní podle hospodářských odvětví od roku 1888 0/00 1000 - 900 -800 -700 -600 -500 -400 -300 -200 -100 -0 - služby zemědělství hornictví 1888 1900 1910 1920 1930 1941 1950 1960 průmysl Grafické zobrazení časových řad ulehčuje poznání vývoje, jako v tomto příkladu ze švýcarské statistiky. Procentní podíl zaměstnaných v „sekundárním sektoru" (průmysl, zpracovatelské závody) od roku 1868 poněkud vzrostl — s nepatrným kolísáním, zatímco „v primárním sektoru" (prvovýroba) lze pozorovat stálý pokles a „v terciárním sektoru" (služby apod.) plynulý vzestup. Při tomto způsobu srovnáni časových řad se ukazuji relativní četnosti, tedy nikoliv absolutní hodnoty — sloupky pro každý rok jsou stejně vysoké („1000 promile"). To znamená, ic neni vidět, zda bylo v roce 1960 více nebo méně zaměstnaných než v roce 1930 nebo 1900. To by se dalo vyjádřit různou výškou sloupků, pak by však byl obtížně vidět trend struktury zaměstnanosti. den. Tím jsme se dostali k rozdílu, který si laik zřídkakdy uvědomuje: jsou soubory stálé a soubory pohyblivé. Stálé soubory (nazývané také prostorové soubory) jsou soubory, jejichž jednotky mají určitou dobu trvání. Nejjednodušším příkladem je obyvatelstvo nějaké-země — jednotlivci se rodí a umírají: celek obyvatelstva je tím z dlouhodobého hlediska dotčen jen tehdy, když trvá zřejmá převaha narození nebo úmrtí. Každá jednotka Obr. vpravo nahoře: Stálé soubory mohou být zjišťovány (alespoň teoreticky) ke zcela určitému časovému bodu — jako třeba obyvatelstvo země v den sčítáni lidu. Pohyblivé soubory (jako narozeni nebo úmrtí) se zjišťují jen uvnitř časových intervalů („v průběhu včerejšího dne...", „během minulého roku..."). Obr. vpravo dole: Příjezd, pobyt na dovolené a odjezd se podobají narození, životu a smrti. Proto přijíždějící a odjíždějící tvoří „pohyblivé soubory", prázdninoví hosté jsou však „stálým souborem", ačkoliv se v osobni skladbě denně mění. 98 4.1 Časové řady pohyblivé soubory narození 4* stálý soubor „obyvatelstvo' v rozhodující den 0°° uveden v plném počtu měří se jen uvnitř časových intervalů "ar Hotel „U dobré pohody" \ pohyblivé soubory úmrtí y ft přijíždějící : pohyblivý soubor doba pobytu průměrně dva týdny prázdninoví hosté = stálý soubor odjíždějící = pohyblivý soubor 4. Body, procento, indexy___ uvedených souborů má určitou „dobu setrváni" — u lidí je to individuální délka života, u klikové hřídele doba uložení ve skladu dílny a u hosta na dovolené doba pobytu v prázdninovém hotelu. (Obr. na str. 99.) Pohyblivé soubory jsou soubory událostí. Vznikající události se dají měřit jen tím způsobem, že se sčítají jevy vzniklé během daného období. Oběti kopnutí koněm, které jsme mohli politovat při Poissonově rozdělení, jsou krajním případem řídkých jevů — stěží v průměru jeden ročně. Jsou však také velmi pohyblivé soubory, jako např. sňatky. Také oba jevy, které vymezují dobu setrvání, lze pokládat za pohyblivé soubory; narození a smrt, případně příjem do skladu a výdej ze skladu. Stálé soubory lze zjišťovat k určitému rozhodnému dni: v den posledního hromadného sčítání obyvatelstva v ČSSR r. 1970 bylo tolik a tolik mužů a žen, tolik a tolik rodin, nezletilých dětí nebo také televizorů a praček. Pohyblivé soubory musí být naproti tomu zjišťovány a srovnávány za určité období. Počet všech televizorů v soukromých domácnostech může být — alespoň teoreticky — zjištěn k určitému rozhodnému okamžiku: pozítří v poledne úderem 12. hodiny. Tři hodiny před tímto termínem bude asi v zemi o několik přístrojů méně, tři hodiny později naopak o několik přístrojů více, ale v rozhodném okamžiku „dvanácti hodin" bude zjištěn přesný obraz zjišťované situace. Počítání pohyblivého souboru, např. sňatky ke stejnému rozhodnému okamžiku (pozítří úderem dvanácté), by poskytlo pravděpodobně nulu, ledaže by někde připadla oddávací formule přesně na dvanáctou hodinu. Časový interval „pozítří od 6 hodin ráno do 100 20 hodin večer" dovoluje naproti tomu uzavřít přes 1000 sňatků a poskytuje alespoň rozumnou srovnávací hodnotu pro „sňatky za den". Jaký je tedy hlubší smysl časových řad? Jde o zbytečnou hru málo zaměstnaných statistiků nebo za tím vězí něco víc? Ihned se vnucuje odpověď, že taková časová řada ukazuje většinou „vývoj" — vývojovou linii, která může směřovat nahoru nebo dolů, případně vykazovat jakýsi vlnovitý pohyb. Je samozřejmé, že se takový vývoj nesmí přijímat nekriticky, i když se jeví jako sebevíce výrazný. Porovnejme např. výsledky obratu obchodního domu. Budou asi již celá léta vykazovat stoupající tendenci, ale to ještě nemusí mnoho znamenat. Je přece zcela dobře myslitelné, že růst obratu bude výsledkem plíživé inflace, která vyvolává představu plynulého zvyšování, zatímco „reálný" obrat (při jeho propočtu se přihlíží k poklesu kupní síly měny) stagnuje nebo dokonce mírně klesá. V daném případě by takové zobrazení nebylo „relevantní" — nevypovídalo by to, co by vypovídat mělo: neukazovalo by vývoj obratu podniku, nýbrž spíše rozsah inflace. Z těchto důvodů je nutno údaje o obratu „očistit" od tohoto rušivého faktoru. Avšak takové roční porovnání může nejen nadhodit, ale i zakrýt některé další problémy. Zatímco křivka celkových ročních výsledků směřuje plynule — jak jsme se domnívali — „nahoru", změní se tento obraz velmi rychle, když rok rozdělíme na čtvrtletí nebo dokonce na měsíce: z původně hladké, klidné čáry se stane hektické cikcak. Začnou se totiž projevovat všechny vlivy, které jsou pro obraty obchodních domů zpravidla typické: mdlá kupní nálada na začátku roku, oživení ob- 4.1 Časové řady mld Kčs 30 28 26 24 22 20 18 16 14 12 10 Dovoz a vývoz ČSSR w VÝ VO N t \ D )VC i_ •z A Á sald k 0 o jeho d n; bila ICC m - J. ot J o t- cm » •« m í*> ia v.- w ^stará množství^^ 5,» ?,*> v,- w nové ceny ws fít> Vi tt» iso nové ceny ..... M-i nová množství fc» 4» 3.* 9.* 6o staré ceny J ľ f * * staré ceny ^stará množstvífm wnová množství ^m Laspeyres Paasche Mezi četnými cenovými indexy nabyly zvláštního významu dva: Lospeyresův index (porovnán, c«n na základě původně spotřebovaného množství) a Paascheho index (porovnaní cen na mkmm nové spotřeby). 114 115 V prvním případě to vypadá takto: nové ceny x stará množství staré ceny x staré množství 60 + 56 + 130 "» TO + 64 + 120 =1°5'1- Ve druhém případě: nové ceny x nová množství staré ceny x nová množství 48 + 70 + 130 tedy 40 + 80 + 120 = 103,3. Výsledek je tedy značně rozdílný. Kdo chce v daném případě „statisticky dokázat", že životní náklady poměrně značně stouply, zvolí metodu, podle které vychází index 105,1. Kdo má opačný zájem, zvolí metodu druhou. Správné jsou obě. První (stará množství jako základna) se jmenuje Laspey-resův index, druhá (nová množství) index Paascheho. Paasche a Laspeyres byli němečtí národohospodáři z konce 19. století. (V ČSSR se index maloobchodních cen počítá podle Laspeyresova vzorce jako vážený aritmetický průměr individuálních indexů cen zboží — reprezentantu, přičemž vahami jsou podíly jednotlivých skupin zboží na maloobchodním obratu roku 1968 a základem je cenová hladina z ledna 1968. Kromě toho se v ročním intervalu počítá i index Paascheho, a to jako vážený harmonický průměr týchž individuálních indexů cen zboží — reprezentantů, přičemž vahami jsou odpovídající údaje o struktuře maloobchodního obratu v běžném roce.) Vědecky neudržitelný je naproti tomu „index laiku", který však byl ještě v minulém století prosazován se vší vážnosti i vědci a který zní: nové ceny x nová množství staré ceny x stará množství ' tedy 48 + 70 + 130 248 50 + 64 + 120 234 = 105,9. Na tento index se instinktivně odvolává většina hospodyň, když si stěžují, že „všechno podražilo", že již nevyjdou s penězi na domácnost a vůbec, co povídat. Porovnávají měsíční výdaje před třemi nebo pěti roky s tím, co vydávají dnes — a přitom snadno zapomínají, že to není jen zvýšení cen, které se projevuje ve zvýšených výdajích, nýbrž také větší požadavky, o jejichž vznik se postará čilá reklama. Jak silné mohou být takové změny spotřeby za delší dobu, hned ještě uslyšíme od Jeana Fourastié. Nejdříve ještě několik slov k Laspeyre-sovu a Paascheho indexům. Nejsou zdaleka jediné, které věda zná, avšak jsou nejčastěji používány. Americký národohospodář Irving Fischer navrhl jejich spojení do „ideálního indexu", který měl vypadat takto: /ř=]/jp./t Z Paascheho indexu a Laspeyresova indexu měl být získán geometrický průměr — Fisherův index. Většinou se však zůstává u obou „klasických" indexů, přičemž je třeba ještě dodat, že Laspeyresův index téměř vždy dosahuje vyšších hodnot než index Paascheho vzhledem k tomu, že při neproporcionálním zdražení jednotlivých druhů zboží spotřebitel většinou přechází na jiné, lacinější druhy, takže „nová množství" zachytí část zdražení. To zní poněkud rozporně, vzpomene-me-li na právě kritizovaný „index 116 laiků" a na zjištění, že se dnes častěji kupují dražší věci než před několika lety. Především je nutno rozlišovat záměnu zboží, které již tu vždy bylo (např. třešně za meruňky atd.), a výdaje za zboží, které se nově objevilo ve spotřebním koši. Za druhé — a to nejen ve statistice a ekonomické vědě — není při bližším pohledu vždy všechno tak zcela jasné a nesporné, jak bychom si přáli. Od vzorců Laspeyresova a Paascheho indexů vede jen krátká cesta do houštin národního hospodářství, k teorii hodnoty, psychologického uspokojování potřeb, k teorii mezního užitku atd. Nemůžeme jít touto cestou, protože by nás zavedla příliš daleko od našeho hlavního tématu. Chtěli jsme však naznačit, o co jde. Své potřeby mohu v jistých mezích zaměnit, aniž bych pociťoval ztrátu. Např. jím rád jablka, ale ta jsou právě velmi drahá, zatímco broskve jsou velmi laciné. Protože vlastně jím rád i broskve, koupím raději 1 kg broskví za 2 DM než »/2 kg jablek za 2,30 DM. Mám stejný „užitek", a přesto jsem 30 feniků ušetřil. Proti indexům se někdy argumentuje takto: Jsou reálné proto, že v koši mají stále stejné zboží, i když každý jen trochu rozumný spotřebitel přechází při zvýšení ceny na jiné zboží. Předpokládejme, že v mém indexovém spotřebním koši je v měsících květnu až červenci po 1,5 kg třešní na týden; pak ale přijde neúroda, která vyžene ceny třešní na dvojnásobek: můj index stoupá, zatímco spotřebitel pravděpodobně přejde na dovážené pomeranče nebo banány anebo jiný druh ovoce. Ragnar Frisch popsal celou problematiku životních nákladů a jejich propočtu lehce srozumitelnou formou v článku *-3 Index a kot zboli publikovaném v časopise ..Econometn-ca . Uvádí tam mimo jiné. že všechny indexové vzorce se nedají uvést do souladu s jinými koncepty hospodářské teorie, protože jsou příliš „mechanis-tické" — ani s oním základním principem, že se změnou cen se mění i struktura spotřeby. Také se tam zabývá potížemi, které se vyskytují při mezinárodních srovnáváních cen životních potřeb. Ideální řešení se dosud nenašlo. Praxe indexového propočtu se úzkostlivě brání pojetí pružné spotřeby, a to z toho pádného důvodu, že by pak byla nehybná a solidní základna spotřebního koše vydána napospas kdejaké libovůli. Jestliže se chce manipulovat spotřebním košem, musí se na to jit jinak. Stát, který má silný vliv na tvorbu cen, může to dělat třeba tak, že intervenuje to zboží, které je ve spotřebním koši. Zůstaňme u našeho příkladu. Je-li málo třešní, mohou být ve velkém množství dováženy v zájmu udrženi nízké ceny, a domácímu zemědělství se současně zaručí absolutní zákaz dovozu jablek, meruněk, hrušek a veškerého dalšího domácího ovoce, které ve spotřebním koši není. To je poměrně snadné tehdy, když oficiální „spotřební koš" úřední statistiky obsahuje jen málo položek — úsilí se pak může soustředit na udržení nízké úrovně relativně malého množství cen. Naopak je velmi nemilé, jestliže se nešťastnou náhodou zdraži právě to zboží, které má v indexu významnou váhu. Tak např. na podzim roku 1969 rakouská vláda zoufale bojovala o maloobchodní cenu určitého modelu „brouka" (Volkswagenu), protože ovlivňovala index. Kupujici a spotřebitel může a bude zpravidla mén.t nákupní zvyklosti, jestliže se některá 117 Struktura výdajů jednotlivých domdcností v ČSSR (v 'I») _ Výdaje domácnosti Celkem Výživa Maso a masné výrobky Mléko a mléčné výrobky Vejce Tuky Mlýnské, pekárenské a těstárenské výrobky Brambory, ovoce, zelenina a výrobky z nich Cukr, cukrovinky a cukrářské výrobky Ostatní potraviny Jídla ve veřejném stravování Nápoje a kuřivo Nealkoholické nápoje Pivo Víno Lihoviny Kuřivo a kuřácké potřeby Průmyslové zboii Odívání Ostatní textilní zboží Obuv Galantérie Zařízení a potřeby pro domácnost Kulturní zařízení a potřeby Osobni dopr. prostředky a sportovní potřeby Drogistické a zdravotnické zboží Paliva Stavební potřeby Služby Nájemné a komunální služby Doprava a spoje Osobní služby Opravy a zakázkové práce Vzdělání, kultura, zábava Rekreace, léčebná péče. dětská zařízeni Ostatní služby dělníků a zaměstnanců 1.000,0 425,3 116.5 40,0 16.2 49.8 53.0 42.1 29.7 26,7 51.3 58,0 6,0 13.3 6.8 10.9 21,0 349.6 109.6 23.7 25.8 3.9 45.5 37/ 53.3 24.6 10.0 15,8 167,1 54.4 33.1 13,3 28.8 11.3 21.4 4.8 družstevních rolníků 1.000,0 334.4 77,1 30,9 2.1 34,6 71.6 28.1 35,9 25.7 28,4 69.6 7.0 22.1 6.8 17.1 16.6 459,0 133,8 28.2 28,9 2.9 74,4 32.7 58.2 24.3 17.7 57,9 137.0 19,6 25.0 9.3 55.9 9.1 11.2 6,9 důchodců 1.000,0 583,0 162,3 65,2 25,6 78.1 89.2 64.2 40.3 36.1 22,0 56,0 8.0 16,0 7.0 8.0 17,0 207.0 64.6 15.8 25.0 2.6 13.0 19.3 1.5 32,5 29.2 3.5 154.0 69,5 31.4 15,0 24,2 5.0 4.0 4.9 Váhy ve spotřebních koších indexů životních nákladů jsou pro domácnosti jednotlivých výdajových skupin stanoveny na podkladě statistiky rodinných účtů za rok 1968. Pramen: Jan Mach. Revize indexů maloobchodních cen a indexů životních nákladů, čas. Statistika, 1972, č. 7—8. značka nepoměrně zdraží. Statistika však musi setrvat na zvolených položkách — většinou tomu u velkého počtu položek bývá tak, že nadprůměrné a podprůměrné změny cen se navzájem přibližně vyrovnají, takže index nako- 118 nec zcela dobře plní svůj úkol ukazatele všeobecného vývoje. K jakým podstatným změnám spotřebních zvyklostí za delší dobu dochází, i když se omezíme jen na potraviny a zcela zanedbáme výskyt nových technických přístrojů, ukázal mimo jiné francouzský futurolog Jean Fourastié. Zjistil, že ve Francii v 18. století pozůstávala výživa nejširších vrstev obyvatelstva ze tří čtvrtin z chleba, zbytek připadal na mléčné výrobky, trochu zeleniny, zatímco masité jídlo bylo jednou týdně. Průměrná roční spotřeba vína činila asi 20 litrů, roční spotřeba cukru asi 2 kg — a spotřeba masa nebyla za celý rok větší než 5 kg. Indexy se však nevypočítávají a neuveřejňují vždy pravidelně. Často se jich používá jen pro určitý účel. Předpokládejme třeba, že by šlo o otázku, jak se vyvíjely mzdy (např. dělníků v mlékárnách) v poměru k čistým ziskům (např. v mlékárenském průmyslu). Vycházíme z předpokladu, že by to vypadalo takto: Index Rok mezd zisku 1956 (= 100) 100 100 1957 103 109 1958 107 124 1959 120 123 1960 122 130 1961 127 132 1962 130 141 1963 134 152 1964 146 154 1965 149 151 1966 157 150 1967 158 157 1968 160 160 Posuzováno z hlediska základního roku 1956 je situace zcela jasná: mzdy i zisky vzrostly v letech 1956 až 1968 o 60 %. ----*-3 Index g kol zbotl Neexistuje však ani právní, ani matematický, ani logický důvod, který by nás nutil k tomu. aby rok 1956 byl zvolen za základ. Dojde-li k jednán! o nové kolektivní smlouvě, mohou zaměstnanci argumentovat např. takto: „V posledních třech letech vzrostly mzdy o necelé 2 %, ale zisky o téměř 7 %." Je to pravda? Toto zdůvodnění vychází z volby roku 1966 jako základního roku a tabulka vypadá takto: Rok Index mezd zisku 1966 (= 100) 1967 1968 100 100.8 101.9 100 104,7 106.6 Skutečně, mlékárenští dělníci byli poškozeni ve srovnání s podnikateli. Opravdu? Podnikatelé to popírají a uvádějí: „Vývoj je nutno posuzovat z hlediska delší doby. Během posledních šesti let mzdy přímo vyskočily, zatímco zisky zaostaly." A položí na stůl následující údaje: Index Rok mezd zisku 1963 (= 100) 100 100 1964 109 101.2 1965 111 99.5 1966 117 96.7 1967 118 103.3 1968 119.5 105.2 Skutečně, zisky podnikatelů velmi zaostaly v poměru ke mzdám. Statistika znovu „dokázala" zcela opačné tvrzeni. Je to však jen rozdílná volba základního roku, která vede k tomuto domnělému rozporu. Jestliže se základní rok stanov, až »o- 119 i. Body. procento, indexy ryby a rybí konzervy 1968 17 425 Hi Ala máslo, tuky 49 227 moučné výrobky, i_ 135 503 rýie 118920 zelenina a zeleninové konzervy 134 630 151076 MM maso a masné výrobky 161988 mléko a mléčné výrobky 157872 Dru íii Dory 162 359 ovoce a ovocné 202 739 konzervy 217487 I v průběhu několika málo let se může spotřební schéma podstatně změnit, jak ukazují tato čísla ze západního Berlína. Především je nápadné, že brambory v letech 1962—1968 musely postoupit první místo ovoci a ovocným konzervám. Také spotřeba mléčných a moučných výrobků poklesla, zeleniny a zeleninových konzerv a masa a masných výrobků se zvýšila. sledně, je to vždy podezřelé. Základni rok však může klamat i jinak. Srovnávají-li se indexy akcií půl tuctu zemí, dojde se — pokud není znám základní rok indexu — k úplně nesmyslným výsledkům. Tak např. koncem března 1971 dosáhl americký Dow-Jonesúv index 913, švýcarský SKA-index 234, vídeňský CA-index 63, tokijský Dow-Jonesúv index 2365; Frankfurt (Commerzbank) hlásil 726, Paříž naproti tomu 105 a Milán 58. Mezinárodní porovnání indexů je však sotva možné i tam, kde byl zvolen stejný základní rok, neboť faktory podmiňující výpočet indexu jsou většinou navzájem tak rozdílné, že porovnání způsobuje víc zmatku než užitku. Když se do přepočtu ještě zahrne oficiální měnový kurs volně nesměnitelné měny, je chaos úplný. Někdy existují pokusy provádět mezinárodní srovnání na základě propočtů, jaké množství mléka, chleba nebo cukru 120 4.3 lnd«» a kol .■-,-,) Aby bylo možno provést mezinárodni porovnáni životní úrovně, vztahuje se někdy kupní síla mzdy na určité spotřební zboží. Toto porovnání není na mezinárodní úrovni bez problémů. V jedné zemi, jako v tomto případě ve Švýcarsku, je naproti tomu dosti přesvědčivé. Kupní síla mzdy v roce 1939 a 1965 K tomu. aby bylo možno koupit následující potraviny, musel dospělý dělník pracovat .... minut: hodinový výdělek fo o o / v, ° °y 1 I plnotučného mléka ifrs 5.19 1 kg chleba 1 kg těstovin V, kg čokolády g3S V, kg vepřového si může průměrný dělník koupit za průměrný hodinový výdělek. To může v jisté míře poskytnout orientační hodnoty, které však o životní úrovni vypovídají velmi málo. Zpravidla lze říci, že index ztrácí svou platnost na státní hranici — a to platí i pro mnohé další statistické údaje, u kterých mezinárodní normování nedosáhlo dosud žádného povzbuzujícího pokroku. Populárním druhem indexu je doložka ceny chleba nebo zlatá doložka, kterých se používá v některých letech (zvláště v poválečných a inflačních) legálně nebo ilegálně ve smlouvách. Oba případy nelze označit za šťastnou volbu, protože právě chléb a zlato jsou příkladem manipulovaného zboží, poskytujícího při- rozeně ochranu proti cválající inflaci — pokud jejich použití není zakázáno, a tím také soudní ochrana bezpředmětná. Modernější formou doložky než cena chleba je mzdová a důchodová dynamika, která je většinou vázána na index životních nákladů. (Zda tato dynamika nevyvolává také zvýšenou dynamiku mzdové a cenové spirály, tím se zde naštěstí nemusíme zabývat.) Ještě na jednu okolnost je nutno u indexu poukázat. V tomto případě, stejně jako u všech slovních výkladů statistických údajů, není opatrnosti nikdy nazbyt. Vzpomeňte s. na náš fiktivní příklad ze začátku 16. století: ve třech po sobě jdoucích letech stouply živocim náklady ze 100 (základni rok) na 102.1 1» 4. Body, procento, indexy a 105,5. Z druhého na třetí rok výdaje tedy stouply o 3,3 %, ale o 3,4 body. Tento rozdíl je prakticky bezvýznamný. Co ale s tím, když index stoupne např. z 502 na 505? Stoupne o 0,6 % nebo o 3 body? Nuže, chceme-li, aby vzestup vypadal větši, mluvíme raději o bodech. (Jestliže laik myslí, že jde o procenta, je to jeho vina.) Má-li vypadat menši, mluvíme o zlomcích procent. Klesne-li index ze 70 na 63, klesl o 10 % nebo o 7 bodů atd. To jsou hříčky se slovy a čísly, které někdy vznikají náhodou a neúmyslně, ale někdy i velmi vědomě a plánovitě. A ještě něco je třeba uvážit: každá měna — i legendární švýcarský frank — trpí plíživou inflací; jedna více, druhá méně. Jestliže chceme měřit „reálné" životni náklady, je nutno přihlédnout také k poklesu hodnoty peněz a s ním ruku v ruce jdoucímu zvyšování příjmů. Cenový index životních nákladů se např. v NSR v letech 1962 až 1969 zvýšil o 19,5. ale index průměrného hrubého týdenního výdělku průmyslového dělníka ve stejném období o 58 %. U všech skupin povolání není ovšem tak snadné zjistit hrubé a zejména čisté mzdy, jako je tomu u dělníků a zaměstnanců. Čisté příjmy např. samostatně činných osob je možno zjistit jen pomocí povinně přiznaného příjmu pro důchodovou daň. Značné zdroje příjmů některých povolání, jako je spropitné a příjmy z „melouchů", nelze odhadnout vůbec. Jestliže pomyslíme na tyto potíže,z nichž všechny nebyly ani zdaleka uvedeny, pak je skoro zázrak, že indexy úřední statistiky jsou nakonec přece jen tak překvapivě blízko pravdě. Jak blízko, nelze ovšem vždy určit, neboť stoupne-li např. index z jednoho měsíce na druhý ze 108,6 na 108.8, neříká to nic víc než toto: pravděpodobnost, že hodnoty, které jsou základem propočtu, stouply je nepatrně větší než pravděpodobnost! že se nezměnily nebo poklesly. V následující kapitole budeme ještě blíže zkoumat otázku přesnosti. Zde bychom chtěli především zdůraznit, že i když předpokládáme směrodatnou odchylku přesnosti jen ve výši 3°/ (a to je při pečlivé práci nereálně málo), musíme říci: údaj 108,6, který jsme uvedli za předchozí měsíc, leží s 95°/ pravděpodobností mezi 108,0 a 109,2 (dvojnásobná směrodatná odchylka dává 95 % pravděpodobnosti, „pravidlo 2cr"); údaj 108,8, který byl určen za nový měsíc, leží mezi 108,2 a 109,4. Není tedy vůbec vyloučeno, že správný index za předchozí měsíc je 108,8 a za nový měsíc jen 108.5, nebo také že oba jsou si přesně rovny. Jestliže však naproti tomu delší řada takových indexů vykazuje stejný vývoj, stává se správnost pozorování stále pravděpodobnější. Následují-li např. za 108,6 a 108,8 jako další čísla 109,1 a 109,5, můžeme právem — nikoliv však s absolutní jistotou — předpokládat, že vývoj indexu za dané 4 měsíce vyjadřuje skutečně existující vzestupný vývoj. Žádný index není zcela přesný, a jestliže tomu tak je, pak jen náhodou. To však není argument proti indexu nebo proti jakémukoliv jinému statistickému šetření. Není-li možno získat žádnou dokonalou informaci, musíme se spokojit s pokud možno nej-přesnějšími odhady. A nejpřesnější odhad je stále jen odhad — ale přece nepoměrně cennější než nevědomost, prázdná domněnka nebo odhad „podle oka". Každý koš zboží je konec konců jen výběrový soubor a už v samé podstatě výběru je, že nemůže zprostřed- 122 *■* Kouslo procent kovat absolutní jistotu o celém sou- U.U Kouzlo procent boru. Potřebujeme však vždy výpočty na zlomky procent? Naše myšlení je většinou příliš ovládáno utkvělou představou, že číslo vypočítané až na poslední jednotkové nebo desetinné místo je vrcholem přesnosti a pravdivosti. Ve skutečnosti je tomu často naopak. Jestliže při sčítání lidu v roce 1970 bylo v New Yorku zjištěno 7 771 730 obyvatel, pak přinejmenším poslední tři místa jsou absolutně bezvýznamná. Uvedené číslo ve skutečnosti znamená: „s nej-větší pravděpodobností těsně 7,8 miliónu." Proti domnělým chybám při sčítání lidu protestovali nejen starostové a městští radní v Americe, ale bylo veřejným tajemstvím mezi statistiky, že zvláště ve věkové skupině 20—30letých černochů mužského pohlaví se „ztratilo" až 10%, protože nebyli při sčítání lidu zastiženi. Úplně groteskně vypadá, když se v nějaké příručce říká, že počet obyvatel Madrásu činil 1 833 504 a toto číslo se pak doplněním (+) vykazuje jako odhad! Zde se dá realisticky říci jen toto: „bezpochyby téměř necelé dva milióny." Avšak víra v magii přesných čísel je tak veliká, že jí proti svému lepšímu vědomí a svědomí platí daň dokonce i statistikové. Všeobecně platí: Žádný strach před zaokrouhlenými čísly, neboť jsou málokdy méně nesprávná než čísla údajně přesná a nic nepředstírají. Jen zřídkakdy je možno na otázku „kolik je hodin?", odpovědět („gong oznámí") „15 hodin 32 minuty 40 vteřin". Stejně užitečná a méně lživá je odpověď: „půl čtvrté". Jak působivě zní. jestliže se dozvíme, že 14,28% všech dotázaných ještě nikdy nepilo červené víno nebo nejedlo mandarínky! Každý laik však může získat bez zvláštních nákladů stejně přesný výsledek — stačí, aby se zeptal 7 osob. zda už někdy jedly mandarínky. Řekne-li jedna z nich „ne", je to 14,28% dotázaných. (Při dvou „ne" je to 28,55 °/ — také impozantní výsledek.) Pomocí procentuálních údajů se lze případně vyhnout trapné otázce, jak vlastně velká byla základna výpočtu, jak velký byl rozsah výběrového souboru: jeden ze sedmi je 14,28% stejně jako 500 ze 3500 nebo 1998 ze 13 990; s tím malým rozdílem, že výsledek, který se zakládá na sedmi údajích měření nebo výsledcích dotazů, je většinou bezcenný. Nemusí to vždy být zlý úmysl, který předvádí procenta místo absolutních čísel. Někdy to může být náhoda, hloupost, bezmyšlenkovitost nebo naivní radost z velkých procent. Tak v roce 1967 bylo možno číst v jednom americkém motoristickém časopise, že rozsah prodeje jednotlivých značek zahraničních motorových vozidel se v roce 1966 proti roku 1965 velmi značně změnil. Volkswagen např. měl přírůstek 7 %. Opel 84 %, MG dovezl jen o 3 % více. a naproti tomu Toyota o 751 % více. Jen uvažte — zatímco Volkswagen mohl zvýšit svůj vývoz do Ameriky pouze o 7%. zaznamenal japonský podnik ve stejné době zvýšení o 751 %. tedy sedmiapůlnásobek (= na osmia-půlnásobek). Naštěstí jsou však uvedeny absolutní údaje, a tak může i laik při bl.žš.m pohledu brzy pochopit zprvu nepocho- 123 i. Body. procenta, indexy pitelné; statistik by se již na první pohled dohadoval, co se vlastně stalo. U Toyoty byli se senzačním rozmachem jistě velmi spokojeni. Ale je zcela dobře myslitelné, že ve Wolfsburgu (sídle zá-padoněmecké firmy Volkswagen) byli také spokojeni: bud jak bud, export VW do USA stoupl v absolutních číslech o téměř 30 000 vozů, vývoz japonského podniku naproti tomu o sotva 18 000. Díváme-li se však na procentuální přírůstek, vznikne klamný dojem, jako by proti „raketovému" vzestupu japonského závodu se méně než skromně plazil Volkswagen. Procenta vycházejí ze základny předchozího roku a tehdy to bylo tak, že VW prodal v roce 1965 na americkém trhu 380 000 vozů, zatímco Toyota teprve s prodejem začínala a zmohla se jen na prodej 2800 vozů. Je ovšem jasné, že podnik, který již tak hluboko pronikl na trh, může dosáhnout z roku na rok jen poměrně malých zvýšení, zatímco firma, která přijde na trh nově, může v následujícím roce prodat i pěti, deseti, ba dokonce padesátinásobek. To lze zjistit i z údajů o počtu nově přihlášených osobních vozů ve Švýcarsku, kde např. Mazda v roce 1970 dosáhla padesátinásobku odbytu z roku 1967, zatímco naproti tomu Fiat jen 1,3násobku. V absolutních číslech se však prodej Mazdy zvýšil z 32 (!) o 1764 na 1796, Fiatu ze 17070 o 5465 na 22 535. Kdo tedy chce získat přesný a přehledný obraz o situaci, musí se vždy podívat nejen na procenta, ale také na absolutní údaje. Jestliže se mu tato čísla neposkytnou, pak je nejvyšší čas, aby se stal nedůvěřivým. Kdo měří svůj růst jen v procentech, ten pravděpodobně začal z velmi malého základu a je malý ještě i dnes. To nemusí být vždy špatné, protože koneckonců každý začínal jako malý, ale schovávat se vytrvale za procenta není moc dobré znamení. Přitom je třeba uvážit ještě další okolnost. Vezmeme-li si k ruce tabulku složitého úrokování, můžeme z ní mimo jiné zjistit, že 1000 DM zúročených na 3 % vzroste za 20 let na 1806 DM; jsou-li však zúročeny 6 %, zvětší se na 400 000 300 000 200 000 Vysokých procent přírůstku lze dosáhnout tím snadněji, čím nižší je výchozí základna. V letech 1965—1966 stouply v USA dovozy automobilů Toyota na osminásobek, u Volkswagenu iooooo naproti tomu ani ne o 10 %. Ale absolutní přírůstek obratu (vle- 500q0 vo) byl u VW přesto mnohem vyšší. Opci •Toyota 800 700 600 500 400 300 200 1965 =100 Toyo.u ppjilii I ■ lilii Opol -—f VW 124 3207 DM, při 8 % dokonce na 4661 DM. je.|j tedy výchozí základna stejná (1000 DM), znamenají vyšší úroky a úroky z úroků stále rostoucí náskok. Ale co se stane, když někdo uloží 10 000 DM na 3% a druhý 1000 DM na 6 %? Bohatší má dnes o 9000 DM více — ale jak tomu bude za 20 let? Bohatší bude mít 18 061 DM a chudší přes vyšší zúročení jen 3027 DM — rozdíl se tedy zvýší na téměř 15 000 DM. K tomu je nutno přihlížet vždy, když se navzájem srovnávají přírůstky. Zároveň však chceme již na tomto místě varovat před dalším zneužíváním statistiky, kterým se budeme později ještě více zabývat — před přehnaným „extrapolováním", promítáním čísel z minulosti do budoucnosti. Omezíme se tedy jen na to, že ještě jednou se vším důrazem konstatujeme, že procenta sama o sobě říkají málo nebo nic. Kdo zamlčuje absolutní čísla a dělá poplach s procenty, chce zřejmě něco skrýt — to se potvrzuje všude tam, kde se mohutně zdůrazňuje plnění a překračování plánovaných úkolů v procentech, aniž se cokoliv bližšího řekne o plánu a plánovaných úkolech samých. Slovo „skrýt" neznamená nezbytně, že se chtějí zastírat neúspěchy, nýbrž docela jednoduše to, že určité údaje mají zůstat utajeny — a pro utajení skutečností se procenta opravdu výborně hodí. Tato h ra se dá hrát i obráceně, a to tehdy, když je snaha imponovat absolutními čísly, protože poměrná čísla vypadají příliš nepříznivě. Vyvolávat dojem absolutními čísly není těžké potud, pokud ochotný čtenář statistiky pozoruje věci ze své osobní perspektivy. V takovém případě jsou pak přirozeně všechna miliónová a miliardová čísla náramně Působivá. Za první světové války za- »■* Kouzlo procent vládlo jednou mezi hladovějícím obyvatelstvem velké vzrušení, když se proslechlo. že 50 000 tun brambor se pry zkazilo nedbalostí železniční správy — jen pomyslete: 50 000 tun brambor! Zemědělští experti vyslovili sice politování nad nesprávným dispono-ván.m, nicméně pokrčili rameny; při roční sklizni 50 miliónů tun a normálním „úbytku" 10% neznamená uvedených 50 000 tun prakticky vůbec nic. Jiný „optický klam" s poměrnými a absolutními hodnotami je znám každému pozornému burziánovi: absolutní vzestup (nebo pokles) kursů nějaké akcie vede při zběžném pohledu velmi často k omylu o mnohem důležitějším relativním burzovním zisku nebo ztrátě. To je zvlášť důležité na těch burzách, kde jsou různě „těžké" hodnoty. Jestliže v New Yorku např. stoupne Pan American ze 13 l/8 na 157/s- rovná se tento vzestup o 2,75 dolaru kursovnímu zisku o zhruba 20 %. Stoupne-li naproti tomu IBM z 273 na 302, znamená kurs zvýšený o 29 dolarů přírůstek ani ne jedenáctiprocentní. Dokonce i grafické znázornění ve stejném měřítku pro oba druhy akcií vyvolalo nesprávný dojem. Chceme-li opticky porovnat relativní růst, hodí se k tomu mnohem lépe logaritmická stupnice. Logaritmické, semilogaritmické a jiné nekonvenční stupnice jsou ovšem většinou poněkud podezřelé tehdy, když se předkládají laickému publiku, které je neumí správně číst. Těmito, ale i jinými klamnými grafickými manévry se budeme zabývat ještě v dalším oddílu (viz str. 233). Nyní chceme ukázat na jiném příkladu manipulaci s absolutními a poměrnými čísly, která nemá demagogický záměr, ale je přesto značně matoucí. V roce 1966 sdělilo vídeňské letiště: „Mez. 125 4. Body. procento, indexy VĚKOVÁ STRUKTURA USEDLÉHO ŠVÝCARSKÉHO OBYVATELSTVA □ Švýcaři □ Cizinci 19Í0 (absolutní íisla) víkové skupiny muíi muži 70 - 74 65 - 69 60-64 55 - 59 SO - 54 45 - 49 40-44 BS - 39 30-34 25 - 29 20 - 24 15-19 10 - 14 5 - 9 0 - 4 _l_--1 1960 v promilích (celkem za pohlaví 1000) věkové skupiny 90-94 8S - 89 80 - 84 vek 70 - 74 ženy ženy 4.4 Kouzlo procent Narození a úmrtí podle domovské příslušnosti 194«—1966 - živě narozeni ŠVÝCAŘI zemřeli přebytek narozených - živě narozeni CIZINCI zemřelí přebytek narozených v tisících ^^^^^^^ _1_1_1_ —i-1—i—i— _i_i_i—i— ,, 111 v tisících Věková struktura usedlého švýcarského obyvatelstva zřetelně ukazuje, proí jsou počty narozených cizinců relativně vyšší než švýcarských občanů: ve věkových třídách od 20 do 34 let je podíl cizinců zvlášť vysoký — právě tato věková skupina zahrnuje ženy v plodném věku a mladé manžele. (Graf: Švýcarský statistický úřad.) 37 západoevropskými letišti se Vídeň řadí... sice ještě mezi menší letiště, pokud však jde o přírůstky dopravy, je Vídeň již na čtvrtém místě. V roce 1964 bylo při 22 818 startech odbaveno 725 049 cestujících... V nejsilnějších dnech je registrováno až 5000 cestujících." Zde je v několika slovech obsaženo téměř všechno, na co je nutno brát zřetel, chceme-li se naučit zacházet se statistikami. Jádro výpovědi („řadí se mezi menší") je odsunuto stranou slovem „sice" a pak se vynáší trumf: již na čtvrtém místě v přírůstcích. Toto „již" je však zcela nemístné, protože přírůstky jsou vysoké téměř vždy, jestliže je výchozí základna malá. Pak následují absolutní čísla určená pro laika, který nemá možnost porovnání: 22 818 letů, 725 049 cestujících — to je přece ohromné! Absolutně ano, relativně nikoliv. Letiště Rýn — Mohan odbavilo téměř 4 milióny cestujících, západní Berlín 2,7 miliónu, Hamburk, Düsseldorf a Mnichov po 1,4 miliónu, nemluvě ani o amerických letištích, o Paříži a Londýně. A nakonec ještě jako zvláštní pozoruhodnost poukaz na nejsilnější dny a v nich dosahované absolutní nejvyšší hodnoty („až"). Věcně je jistě úplně správné, že v jednom takovém „nej-silnějším dnu" bylo jednou registrováno až 5000 cestujících, protože se však současně neuvádí žádný denní průměr, utkví čtenáři v paměti představa: „denně 5000 cestujících". To tam není výslovně řečeno — ne, zcela určitě ne. ale už je to tak, že se čteni statistik nestalo ještě všeobecně ovládaným uměním. Statistikou vídeňského letiště se tak podrobně nezabýváme proto, že by byla obzvlášť rafinovaná, záludná nebo demagogická, nýbrž proto, že umožňuje zřetelně ukázat, čeho je nutno se při čtení nějaké statistiky vyvarovat. A tu platí za prvé. za druhé 126 127 i. Body. procento, indexy a za třetí: vyčíst více než je uvedeno. „V nejsilnější dny až..." neznamená „denně". Pokud jde o poněkud nejasnou formulaci „mezi 37 západoevropskými letišti...", chceme v daném případě s důvěrou předpokládat, že je to těch 37 nevýznamnějších. Je však zcela dobře možné, že se za touto formulací skrývá lstivý předchozí výběr: Stuttgart může být například co do velikosti docela dobře pátým z deseti západoevropských velkoměst. Postačí, aby těch deset bylo vhodně vybráno! Absolutní čísla mohou klamat také jiným způsobem: když se např. předstírá porovnání, které ve skutečnosti není namístě. Tak v jedněch novinách bylo uvedeno, že „v první polovině roku 1966 činil přebytek porodů u Švýcarů 15 261, u cizinců však již 12 652, takže se my, Švýcaři, podílíme na celkovém přebytku porodnosti jen 54,7 %". To je strašné: cizí dělníci přivádějí na svět skoro stejně tolik dětí jako domácí obyvatelstvo. Nebo přece ne? Ne, protože jde o přebytek porodů, tedy o rozdíl mezi narozenými a zemřelými. Pro přebytek porodů je však směrodatná věková struktura: čím větší je podíl mladých lidí (a v tom žen v plodném věku), čím menši je podíl starých lidí, tím více je porodů, tím méně úmrtí a tím vyšší pak přebytek porodů. Cizí dělníci jsou však zpravidla mladí a zdraví, poměrně řídká úmrtí vyplývají spíše z pracovních úrazů než ze stařecké slabosti. V daném případě to pisatel také správně poznal — jedna z chvályhodných výjimek — neboť nakonec lapidárně konstatoval : „Je zřejmé, že naprosto chybějí předpoklady k porovnání údajů o narozených mezi cizinci a Švýcary. Tato čísla lze však zneužít." 128 Téměř všechna čísla — a proto i všechny statistiky — je možno zneužít. Kdo nechce padnout za oběť takovému zneužití, kdo se nechce nechat od demagogů nebo přehorlivých novinářů vehnat do úzkých, bude se vždy s pochybností ptát: Co se s čim porovnává? Má toto porovnání smysl a je oprávněné? A především: netvrdí se v průvodním textu vice, než dovoluji čísla sama poznat? A konečně nikdy nemůže škodit, jestliže se zeptáme jako u soudu: Cui bono? Komu to slouží? Kdo se pomocí těchto čísel jeví ve vzlášť příznivém světle? Demagogické zneužití i chyby z nedbalého výkladu jsou tak důležité, že se jimi budeme později ještě podrobně zabývat (viz str. 229). Prozatím však tento oddíl ukončíme doplňujícím přehledem o poměrných číslech. 4.5 Míry, podíly, poměrná čísla V tomto oddíle, stejně jako i na začátku předchozího oddílu, jsme několikrát mluvili o relativní četnosti, procentech a indexech, a proto ted chceme jako shrnutí a doplnění uvést několik slov o poměrných (relativních) číslech. Statistika rozlišuje podíly, míry a poměrná čísla a toto rozlišení je víc než pouhá hra se slovy, protože každý druh poměrných čísel má svá vlastní omezení a podléhá vlastním zákonitostem. Podíly jsou ještě relativně nejméně problematické. Při nich jde o to, že se měří díly nějakého celku: 12 % všech vysokoškoláků je krátkozrakých, 30 % evropské produkce piva pochází z NSR, 63 % osobních příjmů ve Velké Británii připadá na mzdy a platy atd. Celková čísla vysokoškoláků, evropské produkce piva a britských osobních příjmů 4.5 Míry, podíly, poměrná {Isla Věková struktura usedlého obyvatelstva 1969 rocnik narozeni 1880 1969 60 000 40.000 20.000 osoby 0 0 20.000 40.000 60.000 osoby ovdovělí rozvedeni íenatl (vdané) svobodní a) padlí v I. světové válce b) padli ve II. světové válce c) úbytek porodů (narozených) během I. světové války a po ní d) úbytek porodů (narozených) během hospodářské krize 30.let 1969 e) úbytek porodů (narozených) na konci II. světové války Anatomie stromu života: kombinované zobrazeni stavu obyvatelstva a jednotlivých ročníků narození. (Pramen: Statistisches Handbuch für die Republik Österreich. 1970.) se kladou do poměru jako odlišitelná složka z celkového souboru. Na začátku třetí kapitoly jsme dali do vzájemného poměru veškeré v Mnichově bydlící obyvatelstvo v roce 1960 s podskupinou „cizinci a osoby bez státní příslušnosti v základním souboru mnichovského bydlícího obyvatelstva" a v této souvislosti jsme mluvili také o tom, že kruhové výseče (dortové řezy) se zvlášť dobře hodí pro grafické zobrazení takových skutečností. U měr, které jsou velmi příbuzné s podíly, se veličiny stejného druhu vztahuji k jedné z nich (nebo k průměru všech) jako k základu. Produkce piva v NSR činila v roce 1967 71,3 miliónu hektolitrů, ve Francii 20,6 miliónu hektolitrů. Zde máme k výběru dvě míry: a) produkce piva v NSR činí 345 % produkce Francie; b) produkce Francie činí 29% produkce NSR. Celkové množství lze členit na dílčí množství, které může být dále členěno. 129 4. Body, procento, indexy Produkce připadající na: pracovní hodinu .dělníka hodinu zaměstnanců aměstnance Téměř každou situaci, každou skutečnost je možno zobrazit různým způsobem. Nejen proto se zdá, že statistiky tak často ..lžou". Na tomto grafu Spolkového statistického úřadu (NSR) je možno zjistit, že se „produktivita" od roku 1962 do roku 1969 zvýšila ze 100 na 148, na 152. na 157 nebo na 161—podle toho. na které osoby nebo výkony se tento index vztáhne. Díváme-li se na dílčí množství nezávisle na jejich absolutní velikosti jako na stoprocentní dílčí soubory, je porovnání struktury zvlášť zřetelné. Jeden švýcarský statistik to velmi pěkně dokumentuje na příkladu řeči usedlého švýcarského obyvatelstva: asi 75 % švýcarských občanů mluví německy, asi 20 % francouzsky, zbývajících 5 % připadá převážně na italštinu, kromě malého počtu mluvících rétorománsky. Z cizinců však mluví téměř 55 % italsky, jen asi čtvrtina německy a 10% jinými jazyky, převážně asi španělsky. Miry někdy porovnávají v jisté míře jen své vlastni hodnoty. Je tomu tak v případě, zvolíme-li určitý rok jako základní a zároveň vztažný bod časové řady. Základní rok se zpravidla stanoví jako 100, takže všechny následující hodnoty vyjadřují dosažené procento. To je postup, který již dobře známe z indexů. Index se však liší od jednoduché míry především tím, že váženým výběrem více veličin charakterizuje celou kategorii četností, událostí nebo hodnot, zatímco míra se vztahuje na jednotlivé nebo nečetné objekty. Poměrná čísla je třeba používat s větší opatrností než míry nebo podíly. Vyjadřují vztahy, které statistik teprve hledá, a jejich oprávněnost může být tudíž sporná. U podílů je samozřejmé, že celkové množství a dílčí množství jsou v přímém a těsném vztahu; také u měr tato souvislost téměř vždy existuje. Poměrná čísla závisejí však na dobré vůli a rozumu toho, kdo je vypočítává. Zde se totiž vytváří vztah mezi zcela rozdílnými veličinami, o kterých Kruhové výseče („dortové řezy") udávají sice jen relativní četnosti (podíly na souboru), mohou se však použít také k porovnání veličin jako v tomto grafu Statistického spolkového úřadu (NSR): celkový stav bytů v jednotlivých zemích se vyjadřuje velikostí kruhové plochy. 4.5 Míry, podily. poměrná čilla BYTY PODLE STÁftí VÝSTAVBY K 25.10.1968 Vystavěno -^do r. 1900 .0^1901—191 919—19 STAT.Bti.Ot SAMT 7Bř» ^\1949 ■^-'a později Velikost kruhu odpovídá počtu bytů v jednotlivých zemích_ se předpokládá (nebo tvrdí, nebo se lze domnívat), že jsou v určité souvislosti. Nejznámější případ poměrných čísel jsou čísla ,,na jednoho obyvatele", o nichž jsme již mluvili v předchozím oddíle. V daném případě můžeme dospět ke „kojenci, který kouří doutníky". Chceme-li se něčemu podobnému vyhnout, vzniká otázka, od kterého roku věku určit „schopnost kouření". Pat- náctiletí by neměli kouřit, ale mnozí kouří — kde má vést věková hranice? Jak je to s údaji o sňatcích a úmrtích? V západním Berlíně jsou sňatky podstatně vzácnější a úmrtnost o polovinu vyšší než v NSR. jestliže je vztáhneme na 100 000 obyvatel. Ano, úmrtnost v západním Berlíně je téměř třikrát větší než ve Venezuele. Proč? Věková struktura obyvatelstva je jiná. 130 131 i. Body. procento, indexy Rozvojové země s populační explozí „explodují" v základně stromu života obyvatelstva, podíl dětí je příliš vysoký, tak vysoký, že v důsledku velkého podílu osob neschopných výdělku se snižuje životní úroveň všeho obyvatelstva. Za dnešních hygienických a zdravotnických poměrů je úmrtnost dětí a mladých ročníků malá (i když stále ještě o něco vyšší než ve střední Evropě); vymírají tedy v prvé řadě přestárlí obyvatelé, kteří žili již na přelomu století v tehdy řídce obydlené Venezuele. V západním Berlíně (a v jiných evropských velkoměstech v mírnější podobě) je obyvatelstvo přestárlé, žije tam mnoho starých lidí a poměrně málo dětí. Porovnání jen na základě počtu obyvatelstva říká tedy vlastně až příliš mnoho — neboť zahrnuje porovnání celého stromu života. Kdyby se však měla na tomto základě zjistit hygienická situace a lékařská péče, bylo by asi nutno porovnávat úmrtnost podle generací. Kolik osob věkové skupiny 50—60 let umírá ročně v západním Berlíně a kolik ve Venezuele — v obou případech vztaženo na 100 000 osob této věkové skupiny?! Přesné statistiky neporovnávají proto také porodnost obvykle s celkovým počtem obyvatelstva, nýbrž s počtem žen v plodném věku. Stejně jako kojenci nekouří doutníky, muži nerodí děti. Volba vztahu není vždy zcela snadná. Jaké je „správné" porovnávací měřítko pro dopravní nehody? Počet vozidel, počet ujetých kilometrů, počet osobo-kilometrů (který je možno přirozeně odhadnout jen z výběrových souborů), počet obyvatel, hustota provozu? Každou alternativu je možno zdůvodnit i zamítnout ve prospěch jiné. Tolik k poměrným číslům. Ted si však chceme všimnout hesla, které právě padlo a které je ústředním problémem moderní statistiky. Toto heslo zní: Výběrový soubor. 5 Výběry a dotazníky 5.1 Sběr dat, šetření a zpracování Dosud jsme se pohybovali v pohádkové zemi blahobytu statistiky: když jsme potřebovali jakákoliv data, pozorování, měření, sčítání a jiné výpočetní podklady, měli jsme je po ruce, ať již šlo o průměrnou roční teplotu v Quitu, o příjem obyvatel Zbohatlíkova, o ceny olivového oleje v době hraběte Carliho nebo o oběti úderů kopyty v pruské armádě. Nyní se však musíme zamyslet nad tím, jak se statistik dostane ke všem těmto údajům a číslům, z nichž pak sestavuje tabulky, které klade do vzájemného vztahu, zkoumá z hlediska hodnoty výpovědi a přetváří více nebo méně složitými matematickými postupy. Při statistické práci se většinou rozlišují tři stupně: za prvé šetření, za druhé zpracováni, za třetí vyhodnocení. Daleko nejdůležitější částí práce se zdá být vyhodnocení (tím se zpravidla zabývají všechny učebnice statistiky nejpodrobněji), nesmíme však přitom zapomenout na elementární pravdu: žádná statistika není lepší než její surovina. Tak jako nemůže být správný úsudek, jsou-li nesprávné předpoklady, stejně tak nejsou k ničemu nejobtížnější početní operace, když číselný materiál je hned od počátku nesprávný nebo nedostačující. A co je ještě horší — početní chyby lze opravit, nevhodné metody zpracování mohou být nahrazeny lepšími, avšak je-li prvotní záznam údajů chybný, nezbývá než uvést jako moto tato Schillerova slova: „To právě je kletbou zlého činu, že množením se musí stále rodit zlo." Co tedy může statistik učinit, aby této kletbě předešel, aby na počátek své práce nepostavil „zlý", nýbrž dobrý čin? První otázkou je, zda ví, co chce. Není tomu tak vždy, neboť mnohé statistické údaje úřady shromažďují v očekávání, že později mohou posloužit jako cenné podklady, aniž se v daném okamžiku dá přesně říci, co se vlastně hledá. Tak pruské armádní sbory rok co rok poctivě zaznamenávaly příčiny úmrtí svých vojáků — a jednoho dne z nich statistik vylovil zabité úderem kopyta a dokázal použitelnost Poisso-nova rozdělení. Mnohem horší však je, když sice víme. čeho se chce dosáhnout, ale zvolíme k tomu nevhodnou cestu. Tak se např. jednou zkoušela odolnost gumových člunů. Byly podrobeny zatěžkávací zkoušce, a když obstály, pokládaly se za použitelné. Později se ukázalo, že právě tyto zkoušené čluny v provozu poměrně často praskaly. Proč? Tvrdou zatěžkávací zkouškou byly totiž i dobré čluny tak narušeny, že část z nich nebylo již možno označit jako nezávadné. Wallis a Roberts. z jejichž knihy „Statistické metody" jsme tento příklad převzali, dělají následující závěr: „Údaje se tedy vztahují na počet výrobků, které obstály v určité zkoušce, nikoliv však na to, že tyto výrobky vydrží skutečné zatížení.-' Někdy jsou údaje potřebné pro staus- 133 5. Výbery a dotazníky tické zkoumání po ruce a je pouze třeba uspořádat je z jiného hlediska. Je tomu tak v případě, kdy je možno použít bohatého materiálu úředních statistik. V tomto případě mluvíme o sestaveni druhotné statistiky. Protikladem k tomu je zhotoveni prvotní statistiky, kde musíme nejprve prvotní údaje získat zjišťováním a provést jejich členění a kdy se nepoužívá údajů, které jsou k dispozici. Pokud jde o rozsah zjišťování, je třeba rozlišovat mezi výběrem a vyčerpávajícím zjišťováním, při němž se zkoumá, měří, počítá nebo jiným způsobem zjišťuje celý v úvahu přicházející základní soubor (statistický soubor, populace). Vyčerpávající zjišťování se provádí zpravidla jen tehdy, když základní soubor je poměrně malý. Obsáhlé zjišťování a dotazování veškerého obyvatelstva země si může dovolit jen stát — a i ten jen jednou za deset let. Avšak ať již jde o výběr nebo vyčerpávajíc! zjišťování, postupy se omezují v obou případech na několik málo základních metod. Nejjednodušší metodou je pozorováni: děj se pozorně sle- duje a — pokud možno — číselně zachycuje. Tak např. pohraniční orgány počítají osoby odjíždějící ze země a současně zaznamenávají, jaké předkládají pasy. Nebo na výpadové silnici stoji dva lidé, kteří pozorují provoz, a za každý vůz jedoucí do města nebo z města si udělají čárku, anebo pověřený pracovník hlásí denně vedeni závodu, kolik vagónů černého uhlí bylo předchozího dne naloženo apod. Taková pozorování se týkají „pravých" dějů; při experimentech se naproti tomu děje a situace plánovitě aranžují, často podle přesného „plánu vzorků". Tak např. z výrobního pásu se vezme každá pětistá žárovka a zkouší se, jaké vydrží zatížení a jakou má dobu životnosti. Prostředky na ochranu rostlin se zkoušejí na pokusných polích a jejich účinek se měří a srovnává podle sklizně. Jestliže se nejedná ani tak o věci jako o lidi, o jejich názory, úmysly, přání a reakce, má dotazování nejdůležitější úlohu, jíž se proto ted budeme zabývat podrobněji. Nejdříve je však třeba říci několik slov k druhému kroku statistické práce — zpracováno opatření materiálu pro druhotnou statistiku Tři stupni popisné statistiky: materiál se nejdříve opatři šetřením nebo ziská z prvotních stotistik. které jsou již k dispozici. Potom se zpracuje (členi, uspořádá) a nakonec se vyhodnocuje a interpretuje. 134 ke zpracováni. Zde jde o shrnutí a uspořádání prvotních údajů (jeden příklad jsme již poznali, když jsme popisovali zavádění třídních intervalů a zobrazení četností — viz str. 53). Toto stadium statistické práce charakterizuje především sestavování tabulek. V nejjednodušší formě zaznamenává tabulka jen rozdělen! četností jednoho znaku — např. příjmové poměry abiturientů (viz str. 38). Mnohem častěji však vzniká 5.1 Sběr dot. šetřeni a zpracování matice z řádků a sloupců, které mohou být dále členěny. Členění řádků ukazuje např. výňatek z demografické ročenky otištěné ve „Statistické příručce pro Rakouskou republiku" (viz tabulku dole). Členění je provedeno nejen podle zemí, ale v jejich rámci i za dvě šetřená období, kde jsou zase zvlášť uvedeni „muži" a „ženy". Členění sloupců ukazuje jiná tabulka z téže příručky (str. 136). Střední očekávaná délka života Státy Ůmrtnostní > a Střední očekávaná délka života osob ve věku tabulky z let Pohl 0 10 20 30 40 50 60 70 80 Evropské státy Belgie 1891—1900 m 45,4 50,3 41,8 34,2 26.7 19,7 13,4 8.1 4.6 ž 48,8 52,8 44.4 37,0 29.5 21,9 14,8 8.9 4.9 1959—1963 m 67,7 59.9 50,3 40.9 31,7 22.9 15.5 9,7 5,3 í 73.5 65.3 55.5 45.9 36.3 27.2 18.7 11.4 6,1 Dánsko 1901—1905 m 52,9 54,0 45,4 37,4 29,4 21,8 15,0 9.2 5,0 ž 56,2 55,8 47.5 39.6 31.7 23.8 16.3 10.0 5.5 1965—1966 m 70.1 62.1 52.5 42.9 33.5 24,5 16.6 10.3 5.6 ž 74,7 66,2 56,4 46.6 37.1 28,0 19.4 11.9 6.3 Německo 1901—1910 m 44.8 51.2 42.6 34.6 26.6 19.4 13.1 8.0 4.4 ž 48,3 53.4 44.8 36.9 29.2 21.4 14.2 8.5 4.7 1965—1967 m 67.6 59,9 50.4 41.1 31.9 23.1 15.4 9.6 5.4 ž 73.6 65,5 55.7 46.1 36.6 27.5 18.9 11,5 6.1 Anglie a Wales 1910—1912 m 51.5 53,1 44.2 35.8 27.7 20.3 13.8 8,5 4.9 ž 55.4 55,9 47.1 38,5 30.3 22.5 15.5 9,6 5,5 1965—1967 m 68.7 60.5 50.9 41.4 31.9 23.0 15.3 9.5 5.5 ž 74.9 66,4 56,6 46.9 37.3 28.2 19.8 12,4 6.9 Finsko 1901—1910 m 45,3 49,9 42.2 34,9 27.4 20,0 13.6 8.3 4.6 ž 48,1 51.7 44,5 37.3 29.9 22,3 15.1 9,0 4.9 1961—1965 m 65.4 57.3 47.8 38.5 29,5 21,2 14.3 8.9 4.9 í 72,6 64.2 54.4 44.7 35.2 26.0 17.5 10,3 5.3 Francie 1898—1903 m 45.3 49,3 41.0 33,9 26,7 19,8 13.3 7.9 4.4 ž 48,7 51,5 43.6 36.4 29.1 21.6 14,6 8.7 4.9 1966 m 68,2 60.0 50.4 41.1 32.0 23.5 16.1 10.2 5.8 ž 75,4 66,9 57.1 47.5 38.0 29.0 20.5 12.8 7.0 Tato statistická tabulka ukazuje mnohonásobné členění. V řádcích je provedeno členěni podle zemi a v jejich rámci za dvě časová období a ještě zvlášť vždy podle pohlaví. Ve sloupech ,. není podle věku. 135 5. Výbčry a dotazníky Obyvatelstvo podle pohlaví, věku a povolání ze 100 obyvatel 1 Země bylo ve věku.. . byli činni o >* méně 15 až 30 až 45 až 65 a a> u o > • +4 než 15 30 45 65 více > muži ženy celkem Evropské země: Belgie Bulharsko Dánsko NSR NDR Finsko Francie Řecko Velká Británie Irsko Itálie Jugoslávie Lucembursko Holandsko Norsko Rakousko Polsko Portugalsko Rumunsko Švédsko Švýcarsko Španělsko Československo Madarsko 1966 51 24 20 21 23 12 1968 56 24 40 1967 50 23 23 23 22 9 1965 58 46 52 1966 50 24 23 18 23 12 1960 64 28 46 1966 52 23 22 20 23 12 1967 60 30 45 1967 54 23 21 18 23 15 1964 60 40 49 1965 52 27 25 19 21 8 1960 58 35 46 1966 51 24 22 20 21 13 1967 57 26 41 1967 51 25 23 22 21 9 1961 60 28 43 1968 51 23 21 18 25 13 1966 63 33 47 1966 50 31 21 16 21 11 1966 57 20 39 1966 51 24 23 22 21 10 1968 56 20 37 1966 51 29 24 23 17 7 1961 60 31 45 1967 51 23 20 21 24 12 1966 58 21 39 1967 50 28 24 18 20 10 1960 57 16 36 1966 50 25 21 18 24 12 1968 58 19 38 1969 53 24 21 18 23 14 1961 61 36 48 1967 51 29 24 21 19 7 1960 55 40 47 1967 52 29 22 19 21 9 1960 66 13 39 1967 51 26 23 23 20 8 1966 61 46 54 1967 50 21 22 18 26 13 1965 59 30 44 1967 51 23 25 19 22 11 1965 63 26 46 1960 52 27 23 21 20 9 1968 60 17 38 1967 51 25 23 20 22 10 1963 52 39 45 1967 52 22 23 21 23 11 1963 63 33 48 Mnohonásobné procentní členěni obyvatelstva podle tři hledisek (která jsou ještě dále členěna) ve sloupcích a v řádcích podle zemi. Protože jde o korektní statistiku (z mezinárodní částí rakouské statistické ročenky), uvádějí se vždy i léta, ke kterým se údaje vztahují, s cílem zabránit mylným porovnáním. V záhlaví tabulky, které uvádí obsah sloupců, je mimo jiné procento zaměstnaných rozděleno ještě na „muže" a „ženy". V těchto dvou případech jde vlastně o tzv. kombinační tabulky, které jsou pro použit! již přehledně členěny. Tabulky, v nichž jsou prvotní údaje čle- 136 něny do všech podrobností, se naproti tomu jmenují „prosté tabulky". Tabulka operující s procenty (podílové rozdělení) bude vždy „výslednou tabulkou", protože „prosté tabulky" obsahují vždy jen absolutní četnosti. Tečka (.) v tabulce znamená, že pro tento údaj čísla nejsou nebo jsou ne- použitelná. „Nula" (0) neznamená vždy „absolutní nulu", nýbrž „nepatrný podíl" anebo „nepatrné číslo" (menší číslo než polovina v tabulce ještě uvedených číselných řádů): používá-li se v tabulce např. jako jednotka tuna --5-2 Dotazníky a dotazováni a uvádí se až do prvního desetinného místa, znamená 0 „méně než 50 kg". Hodnotu „přesně nula" označujeme spíše pomlčkou (—), někdy však rovněž pomocí nuly. Vysvětlení značek používaných ve Statistické ročence ČSSR — znamená, že jev se nevyskytoval 0, 0.0, 0.00 značí více než nulu, ale méně než nejmenší jednotku vyjádřitelnou v tabulce údaj není k dispozici nebo je nespolehlivý X zapiš není možný z logických důvodů + (před číslicí) — jídaj je odhad * (před číslicí) — předběžný údaj [] údaj se vztahuje na předválečné území příslušného státu Není-li v hlavičce tabulky nebo v její legendě uveden místní údaj (země, kraj), týkají se data celého území Československé socialistické republiky (v datech za předválečná léta bez Podkarpatské Rusi, není-li uvedeno jinak). Ukazatele vyjádřené v peněžních jednotkách za období 1948—1953 byly kromě zahraničního obchodu přepočteny v poměru 1 : 5, v zahraničním obchodě v poměru 1 : 6,94. 5.2 Dotazníky a dotazování Pozorováním, sčítáním a měřením mohou statistikové získat jen zlomek číselného materiálu. Stále znovu se ukazuje jako nezbytné použít anketního šetření. Pro rozlehlé oblasti průzkumu trhu a veřejného mínění je to samozřejmé, neboť trh se skládá z více nebo méně koupěchtivých lidí, jejichž ochota kupovat se má prozkoumat, a mínění je zcela subjektivní představa, poněkud měřitelná jen tehdy, když se projeví určitou akcí (např. odevzdáním hlasu při volbách). Staré vtipné úsloví říká, že člověku byl dán dar řeči proto, aby mohl skrýt své myšlenky — a při dotazování se toto rčení potvrzuje více, než je zúčastně- ným osobám milé. Nejdříve svou zvědavost maskují tazatelé pokud možno bezelstně znějícími otázkami a pak někdy na své rafinovaně vychytralé formulace dostávají nejasné, nesprávné nebo vědomě nepravdivé odpovědi. K tomu vedou rozmanité pohnutky, kterými se na tomto místě nemůžeme podrobně zabývat. Chceme jen naznačit typické reakce: je to nedůvěřivá obrana jednak proti oficiálním úředním dotazům: „z toho určitě nekouká nic dobrého", jednak vůči soukromým průzkumům míněni: „co je jim do toho?" Je proto až dojemně nesmyslné, když všechny statistické úřady s oprávněným přesvědčením ujišťují, že prý údaje nebudou nikomu přístupné: rád bych viděl toho obchodníka, který do statistického dotazníku uvede vyšš. obrat nebo zisk. než jaký uvedl v daňovém 137 přiznání. Pro občana je úřad jako úřad a ani žádný statistický úřad není výjimkou. Ovšem — úřadu je nutno odpovědět, třeba i nesprávně. Odpovídat se nemusí při soukromých průzkumech — a přece se většinou odpovídá. A někdy se šidí z tisíce a jednoho důvodu a jindy zcela bezdůvodně. O tom pěkně napsala jedna švýcarská novinářka: „Předevčírem jsem překvapila naši nejmladší, když vyplňovala dotazník o laku na vlasy. Zuzce je 12 let... má velmi pěkné vlasy, které vůbec nepotřebují zpevnit pomocí laku... Zuzana uvedla, že prý je mladá dívka na zkušené v cizí rodině a potřebuje lak na vlasy především večer, když jde za zábavou... Musela jsem se smát, neboť jsem si vzpomněla na testy, kterých jsem se zúčastnila jako mladá hospodyně: »Kupujete punčochy za 2—3 franky, za 3—4 atd.?« Pro slav- 138 Tazatel s dotazníkem je stále jeitě překvapující, ne vsak vždy vítanou návštěvou. Ale odpo-vědi. které přinese pořadatelům průzkumu, jsou většinou přece jen důležitou pomoci a — pfej nízký počet dotazovaných — většinou velmi charakteristické pro základní soubor, z něhož se vytvořil výběrový soubor dotazovaných. 5.2 Dotazníky a dotazován nostní příležitosti jsem kupovala punčochy za 5,90 Fr. To jsem také uvedla do dotazníku. Že jsem kupovala na všední den punčochy za 1.90 Fr, jsem stydlivě zamlčela, protože jsem se domnívala, že se to pro ženu mého postavení nehodí." Velký počet dotazovaných má sklon odpovídat podle domnělé normy, jiní se uchyluji do extrémů. Jeden důchodce si libuje v líčení své chudoby ve zvlášť křiklavém světle, jiný se ji snaží zastřít. Jeden obchodník vystupuje skromně, jiný, se stejným příjmem, fantazíruje o svém bohatství atd. Tím se také stává, že třeba údaje získané o výdajích na péči o tělo a hygienu daleko přesahují skutečnost: toaletní mýdlo se spotřebovává v takovém množství, o kterém výrobci mýdla mohou jen snít. V mnoha případech jsou odpovědi nepravdivé nejen proto, že dotázaný se chce ukázat v lepším světle, ale často také z nevědomosti spojené s upřímnou ochotou k spolupráci: mladý, příjemný muž tu stojí s tužkou a dotazníkem a klade jednoduchou otázku — v takovém případě se přece musí něco odpovědět, nechce-li člověk vypadat hloupě nebo nezdvořile. Tak se např. ptá: „Kolik kousků mýdla kupujete měsíčně?" — nebo: „Jak často chodíte v průměru do divadla?" — nebo: „Jste pro pomoc rozvojovým zemím?" — nebo: „Jste spokojen(a) s výsledky svých dětí ve škole?" U mýdla přece není možno odpovědět „nevím". Tak se řekne dva, ne raději čtyři: ano, tak čtyři kousky. Do divadla? Posledně jsme byli — kdy jen to bylo? Nahlížíte do dotazníku, kde je též rubrika „jednou měsíčně". Ano, jednou měsíčně. Pro pomoc rozvojovým zemím? Na to se ovšem nedá tak lehce odpovědět, ale zásadně není přece možno nechat ty chudáky umřít hladem: ano, jsem pro. Výsledky dětí ve škole? Copak to znamená „spokojen"? Trošku pilnější by být mohly, ale pak to bude vypadat, jako by děti byly hloupé. Tedy: ano, spokojen. Spokojeně odchází také tazatel s nesprávnými, neúplnými nebo mylnými odpověďmi, které pak dostane trpělivý zpracovatel údajů. Někdy záleží přímo na tazateli, jaké odpovědi dostane, i když mu dá jeho ústav příkaz ne-odchylovat se od určitého znění otázek a vyhnout se každému nápadnému zdůrazňování nebo reagování. Tak během druhé světové války bylo provedeno mezi americkými černochy šetření, zda se domnívají, že vítězství Japonců nebo Němců by zhoršilo postavení amerických černochů. Jestliže tuto otázku kladli bílí tazatelé, byli téměř všichni černoši přesvědčeni. Že by vítězství mocností Osy bylo velkým neštěstím. Byl-li však tazatelem černoch, podstatně větší podíl barevných odpověděl: „nezměněn", „lepší" nebo „nevím". Osobni vliv tazatele se zpravidla projeví tak, že se dotazovaný cítí volněji a odpovídá ochotněji, případně je nevrlýa chce mít rozhovor co nejdříve za sebou. Tazatel je jinak relativně bezvýznamný prostředník, vlastně „lidský dotazník". 0 hodnotě nebo bezcennosti šetření se proto zpravidla rozhoduje většinou již při vypracovdvdm dotazníku: složité, špatně pochopitelné nebo nedůvěru budící otázky, dotěrné znění nebo rozvláčné formulace mohou šetření již předem odsoudit k neúspěchu. Avšak 1 příliš přímé kladení otázek může vést k chybným závěrům, zejména jde-li o téma, kterým se většina dotazovaných doposud pravděpodobně nezabývala. V takovém případě se doporučuje dané téma vhodnými předchozími otázkami „uvést" — avšak pokud možno bez ovlivňování. Toto „pokud možno bez ovlivňováni" platí přirozeně jen tehdy, sleduje-li se dosažení pokud možná vědecky co nepřesnějšího výsledku. Jsou-li potřebné jen číselné podklady „k provedení důkazu", existují nesčetné možnosti, jak dosáhnout žádoucího výsledku. Pro ilustraci malý příklad, který rozhodně nepatří mezi extrémy a lze jej v jisté míře pochopit a omluvit. Velká letecká společnost uveřejnila ve své reklamě větu: „Tyto četné výhody vysvětluji, proč 97.5 % našich pasažérů vyslovuje svou spokojenost." Nutno však s uspokojením zdůraznit, že k tomuto konstatování byla př,po|ena tato poznámka: „Na základě šetřen., které provedl profesor X {jméno je 139 5. Výběry a dotazníky uvedeno), prohlásilo 97.5% z 1500 cestujících, že jsou spokojeni nebo velmi spokojeni; jen 2,5 % projevilo nespokojenost." Nuže, jestliže jste přistáli na místě určení jen poněkud přesně, stěží řeknete, že jste nespokojen, nýbrž rozhodnete se pro střední z nabízených možnost! (velmi spokojen — spokojen — nespokojen), ledaže by vám letuška vylila kávu na šaty. Ostatně by se mohlo také říci: „V posledních týdnech si nikoli méně než 375 cestujících stěžovalo na servis." Studie o technice zjišťování a psychologii dotazování mohou zaplnit celé svazky (a také už mnoho svazků bylo o tom popsáno). Kdo se mimořádně zajímá o tento speciální obor, může použít bohatou odbornou literaturu. Na závěr chceme jen uvést, že dotazováni je spojeno s určitým prvkem nejistoty, který nelze přesně zachytit ani pomocí počtu pravděpodobnosti, ani jinými matematickými metodami. Jak velké může být rozpětí, ukazuje mimo jiné příklad uváděný Elizabeth Noello-vou-Neumanovou, která jistě nemá dotázaní "4 : 3 odpovědi předběžný výpočet z odpovědí d^Sinýľh'S^lďrnSTnT nt?právnjé inf°™°« "lajte tehdy, jestl.žc určitá skupina zjednodušeném schématu ^ÍTJTŽ ^tľ °dP°V,dá Ve,m' ^ T kem. Jestliže se tento do™ "'J ■ ' °'e ie" leden 1 pŽti mUÍŮ $ m0ty který vůbec neodpovídá skutečnost! propočítá na základní soubor, vznikne obrat. HO 5.2 Dotazníky a dotazováni zájem na tom, aby průzkum mínění byl postaven do nesprávného světla.1 Na otázku, zda by všichni dělníci v podniku měli být v odborech, odpovědělo „ne" jednou 20 %, zatímco v druhém případě 70%; obě skupiny byly stejnorodé, avšak pojetí otázky bylo různé. V prvním případě otázka zněla: „Myslíte si, že všichni dělníci v podniku by měli být v odborech?" V druhém případě byla však rozšířena takto: „...nebo se musí každému ponechat k rozhodnutí, zda chce být v odborech nebo ne?" Druhou otázkou se téměř sugestivně vyvolává problém osobní volnosti, který v kratším znění otázky vůbec nezaznívá, a tak došlo k uvedenému výraznému rozdílu (tento příklad je charakteristický i pro „zkušební dotazováni", jež se provádí při přípravě dotazníků, aby se našla pokud možno jasná a věcná formulace). Pokud jde o dotazníky, slouží při šetření pomocí tazatelů především jako „texty", z nichž se může klidně a plynně předčítat. Jinou metodou dotazování je rozesílání dotazníků s prosbou o jejich vrácení (poštovné platí příjemce). Proti tomuto způsobu dotazování se útočí pádným argumentem, že zkušenosti ukazují, že většina těchto dotazníků bud z nepozornosti, nebo lhostejnosti putuje do koše na papír. Odpoví-li však jen zlomek dotázaných, není již výběrový soubor dostatečně reprezentativní. Pak není možno dělat závěry pro základní soubor nebo dokonce pro celé obyvatelstvo. Přesto může být akce s dotazníky ve skutečnosti užitečná. Dá se totiž předpokládat, že lidé, kteří si dali práci s vyplněním a vrácením dotazníku, se 1 E. Noellová, Výzkum veřejného míněni, Svoboda. Praha 1968. o dané téma opravdově zajímají. Dostali otázky, jimiž se už zřejmě sami zabývali a ke kterým chtějí říci svůj názor právě proto, že je živě zajimaji nebo že jsou dobře informováni. Dovíme se tedy sice málo nebo téměř nic od „mlčenlivě většiny", avšak velmi mnoho o mínění „opinion leaders". neformálních tvůrců veřejného mínění. Z podobných důvodů ztrácí také no závažnosti argument, že při vyplňováni dotazníku spolupůsobí radou celá rodina, čímž nevzniká hledané mínění jednotlivce, nýbrž shodný anebo kompromisní názor celé rodiny. Právě tím se však odpověď koneckonců dodatečně přibližuje skutečnosti: kdo se o dotazníku radí s rodinou, udělá to pravděpodobně i v případě, bude-li muset stejnou otázku řešit v denním životě. Přesto je nutno s veškerým důrazem opakovat: opravdu reprezentativní šetřeni pomocí rozeslaných dotazníků se skoro nikdy nepodaří. Zmiňme se ještě o posledním způsobu zjišťování údajů, o tzv. běžném zjišťováni. Spočívá v tom, že hromadná šetření, např. sčítání lidu, jsou stále doplňována běžným hlášením. Tak je stálý soubor „obyvatelstvo" doplňován ..běžnými zápisy", a to tak. že se běžně zjišťují údaje pohyblivých souborů „narození" a „úmrtí". Během času jsou však ..běžné záznamy" stále méně přesné (zejména zůstala-li v nich skryta systematická chyba), přesto však po značnou dobu poskytuji spolehlivé odhadové hodnoty. Mechanismus „běžných zjišťováni" byl dokonce povýšen na pamětihodnost: ve Washingtonu se na prosvícené tabuli promítají ve dne v noci „běžné záznamy" o počtu obyvatel USA tok, že za určitý počet vteřin se počet obyvatelstva zvyšuje o )edn.čku. Vypadá to velmi pěkně, avšak dříve nebo 141 5. Výběry o dotozniky 5.21 Z dějin scitdni lid* * mRTMENT ČT CX>v1M£RCl BUREAU O T HE CENSUS CURRENT POPULATION of the UNITED STATES t?ioo oooi opn i \ ADornawL.\meric.\.\e\ ehyHBseconds An Imniiunmi Plynulé „běžné záznamy" obyvatelstva ukazuji (kalendárni, digitální) hodiny v „cenzovním úřadu" ve Washingtonu. Každé H»/i sekundy poskočí o 1 a zaznamenají tlm přírůstek obyvatelstva. Obrázek zachycuje „historický okamžik", kdy bylo zaznamenáno 200 miliónů obyvatel a je ovšem, jako každé jiné uváděné číslo, konec konců jen optickým gagem. Ani v den sčítání lidu nelze udat počet obyvatelstva s přesností na 10 000, nemluvě už vůbec o „běžných záznamech", založených na odhadech a vývojových tendencích minulosti. později jsou údaje nesprávné řádově o desetitisíce — a každých deset let po hromadném sčítání lidu se musí tyto hodiny s „běžnými záznamy" obyvatelstva postrčit nazpět nebo dopředu. 5.21 Z dějin sčítání lidu Při slově „statistika" se člověku může vybavit všelicos — samozřejmě čísla, vzorce, normální křivka, rčení o statistice jako nejhorší formě lži. průměry, index, spotřební koš nebo dotazníky. 142 Na jedno se však jistě nevzpomene, ačkoliv by to bylo velmi oprávněné: na vánoce. Zalistujeme-li v Lukášově Evangeliu, můžeme se dočíst, jak se stalo, že se Kristus narodil v Betlémě ve stáji: „I stalo se v těch dnech, vyšlo poručení od císaře Augusta, aby byl popsán všechen svět... I šli všichni, aby zapsáni byli, jeden každý do města svého. Vstoupil pak i Josef od Galilee... do města Davidova, kteréž slove Betlém (proto že byl z domu a z čeledi Davidovy), aby zapsán byl s Marií, zasnoubenou sobě manžel- kou, těhotnou. I stalo se, když tam byli, naplnili se dnové, aby porodila." (2, 2-6-) Nařízení o sčítání lidu pro celou říši římskou za císaře Augusta, při němž měl být každý sčítán ve svém domovském místě, nebylo však ani první v říši římské, ani první, o kterém je zmínka v bibli — a už vůbec ne první v dějinách lidstva. Již v 6. stol. př. n. I. pamatovala ústava krále Servia Tullia na periodické sčítání všech občanů pro jejich zařazení do příslušných daňových skupin. Také v Helladě bylo členění do cenzovnich třid zcela obvyklé. (Postupně došlo k posunutí významu slova cenzus, které dnes, zejména v angloamerické oblasti, označuje „sčítání lidu" a jeho původní fiskální akcent není již patrný.) Sčítání lidu má v bibli tak významnou úlohu, že čtvrtá kniha Mojžíšova se jmenuje „Numeri", protože se v ní od samého začátku podrobně mluví o „přehlídce národa". Jsou v ní dokonce jména prvních cenzovnich úředníků: Elisur, Salamiel, Názon atd., po jednom příslušníku dvanácti kmenů izraelských pod vrchním vedením Mojžíše a Arona: „A shromáždili všecko množství prvního dne měsíce druhého, kteříž přiznávali se k rodům svým, po čeledech svých, po domích otců svých, a vedle počtu jmen, od dvadcíti-letých a výše po osobách svých." (IV. Mojžíš, 1, 18.) Jestliže bylo toto sčítání lidu právem nařízeno od samého Boha, nechal se král David později svést satanem, aby nařídil z vlastní pravomoci sčítání lidu, jehož vylíčení najdeme ve 2. Knize Samuelově a v 1. Knize Paralipomenon. Když se ovšem porovnají tyto údaje navzájem, ukáže se již zřetelně, že na tomto sčítání byla kletba (která někdy vrhá svůj stín až do naší přítomnosti) — čísla navzájem nesouhlasí. Jestliže se v druhé Knize Samuelově říká: „I dal Joáb počet sečteného lidu králi. Bylo pak lidu Izraelského osmkrát sto tisíc mužů silných, kteříž mohli vytrhnouti meč k bitvě. Mužů také Judských bylo pětkrát sto tisíc", v první Knize Paralipomenon se uvádí: „A bylo všeho lidu Izraelského jedenáctekrát sto tisíc mužů bojovných, lidu pak Judského čtyřikrát sto tisíc, a sedmdesáte tisíc mužů bojovných." Tak ale na tomto sčítání ležela kletba a Bůh dal Davidovi na vybranou bud sedm let hladomoru, nebo tři měsíce útěku před nepřáteli, anebo tři dny moru. David se rozhodl pro mor: .....a padlo jich z Izraele sedmdesáte tisíc mužů." (I. Paralipomenon 21. 14.) Toto biblické varování jako by určilo poměr ke statistickému zjišťování až do nové doby. Byla to nepochybně trestuhodná zvědavost a všetečná opo-vážlivost pokoušet se nahlížet pomocí sčítání lidu nebo dokonce soustavným pozorováním narození, nemocí a úmrtí do nevyzpytatelných záměru božích. Ve středověku se proto šetření omezují téměř výlučně jen na soupisy majetku. Tak Karel Veliký (nebo Ludvík Němec) v „Capitulare de villis" nařídil přesné zjištění stavu královských domén a velkých soukromých statků a o 250 let později dal Vilém Dobyvatel sestavit „Domesday Book". kterou je možno označit za první pozemkový katastr v západních zemích. Její jméno, odvozené od anglosaského „domes daeg". znamená „soudný den" nebo také „den posledního soudu" (v tomto významu používá angličtina ještě dnes slovo „doomsday"). Výklad se různi. První význam by ukazoval na nepodplatitel-nou přesnost knihy při projednáváni 143 5. Výbery o dotoznlky_ hraničních sporů, druhý na ničím nepřekonaný smysl pro spravedlnost, který z něho vyplývá. A je to opět Anglie, kde se na počátku 16. století začíná na příkaz lorda kancléře Thomase Cromwella (vzdáleného příbuzného Olivera Cromwella) soustavně zaznamenávat narození a úmrtí v církevních matrikách — a opět vzniká pokušení pomyslit na působení staré kletby, protože Thomas Cromwell byl obviněn z velezrady a popraven. (Protože však Jindřich VIII. nechával s oblibou popravovat své ministry a své manželky, není toto úmrtí nijak nápadné.) V 17. století začal konečně anglický obchodník se suknem John Graunt jako první porovnávat matriky narozených a zemřelých. Počet těchto matrik byl již tehdy velký, i když mnohé byly značně neúplné. V roce 1622 vyšla jeho práce ..Natural and Political Observations upon the Bills of Mortality" (Přirozená a politická pozorování o seznamech zemřelých v městě Londýně), první dílo o statistice obyvatelstva. Věk začínajícího merkantilismu a osvíceného absolutismu urychlil další zkoumání o struktuře obyvatelstva proto, že rychlý růst obyvatelstva byl pokládán za záruku vzkvétajícího hospodářství. Toto spojení teorie o státě, dříve hospodářské vědy a matematiky, je charakteristické pro počátky dějin statistiky. Vysvětluje i označení „politická aritmetika", které se od konce 17. století vždy znovu používá — poprvé je v roce 1687 použil anglický národohospodář sir William Petty v práci „F/ve Essays on Political Arithmetic" (Pět esejů o politické aritmetice). Mezitím byly také v kontinentální Evropě shromážděny podklady pro statistiku obyvatelstva. Poprvé je vyhod- 144 notil rovněž Angličan, proslulý astronom Halley, přítel de Moivra. Halley napsal v roce 1693 knihu „An Estimate of the Degrees of Mortality of Mankind, drawn from curious Tables of the Births and Funerals at the City of Breslau, with an Attempt to ascertain the Price of Annuities upon Lives" (Zjišťování stupňů pravděpodobnosti úmrtí lidí, sestavené podle tabulek narozeni a úmrtí města Vratislavi, spojené s pokusem zjistit výši pojistného pro životní pojištění). Tímto matematicko-pojistným dílčím hlediskem počátků statistiky se budeme ještě zabývat na jiném místě. V německy mluvící oblasti to byl konečně pruský polní kazatel Johann Peter Süssmilch, který pomohl statistice obyvatelstva k vítězství a zároveň našel cestu k odstranění biblické kletby tímto výkladem: „Takové údaje dovolují zvlášť zřetelně poznat moudrý pořádek, kterým Bůh uspořádal pozemské záležitosti." Proto také jeho kniha — první dílo o statistice obyvatelstva v němčině — nese název „Die göttliche Ordnung in den Veränderungen des menschlichen Geschlechts aus der Geburt, dem Tode und der Fortpflanzung desselben erwiesen" (Božský pořádek o proměnách lidského rodu prokázaný z jeho narození, smrti a rozmnožování) (z roku 1741, později často znovu vydávaná). Také Sůssmilchovo dílo je založeno na údajích církevních matrik, které mu pastoři asi tisíce kuronských obcí dali k dispozici. Ale již za několik let později začala své vítězné tažení i úřední statistika. V roce 1741 byla ve švédsku zřízena „tabu/ková komise", jejímž úkolem bylo sestavovat podklady pro statistiku obyvatelstva. Biblická kletba byla překonána, zvědavosti státu nestálo již nic v cestě. Spojené státy provádějí jako první země na světě již od svého založení pravidelná sčítání lidu. Již v roce 1790, rok po zvolení Washingtona prvním prezidentem mladého státu, se konalo první z těchto sčítání. Byly zjištěny sotva 4 milióny obyvatel v tehdy 17 státech Unie. Rytmus sčítání v zaokrouhlených desetiletích se prosadil i mezinárodně. Naposledy se konalo hromadné sčítání obyvatelstva v roce 1970. 5.3 Reprezentativní průřez obyvatelstvem Chceme-li vědět, jak chutná víno uložené v hektolitrovém sudu, nemusíme hned vypít celý sud — již malý doušek 5.3 Reprezentativní průřez obyvotelstvm stačí k jeho posouzení. Chceme-li zjistit, zda náklad ořechů v nákladním autě |e z velké části zkažený, postačí, když vezmeme pár ořechů z různých míst nákladu a rozloupneme je. Na základě určitého rozsahu vzorku je možno dělat použitelné závěry o jakosti celého nákladu. Ale jak tomu je, když maji být dotazováni, testováni a zařazováni lidé? Neděl! se přece jako ořechy jen na dobré a špatné: lidé zabydluji svět jako čtyři miliardy individui, navzájem lehce rozlišitelných, většinou již zevnějškem (pravých dvojníků je málo), ale daleko více diferencovaných vnitřně a způsobem myšlení. Cožpak je možné odvážit se převést je na společného jmenovatele rusovlasý s brýlemi i >ativec hraje na klavír aid. dovolenú r. 1970 otec dvou dětí v Po,tugalsku m státní úředník předseda spolku otd. kuželkářů Každý ílověk má mnoho „úloh", je nositelem mnoha znaků. Statiitika muže porno, ™lyc vírových souborů vypovídat o četnosti znaků a jejich kombinací, ačkoliv všechny o.totn znaky J«* Pro toto šetření vůbec potřebné. Abychom se dověděli, kol.k státních úředníku no.1 b*t Jlme se jich dotazovat na barvu vlasů, na cil dovolené nebo na číslo bot. 145 5. Výbery a dotazníky I když je „základni soubor" ještě mnohem větší než tato masa lidí na stadiónu, musí mít každý jednotlivec stejnou možnost být zahrnut do vzorku, neboť jen tak se může skutečně počítat s ná-noaou. a vtěsnat do společného schématu? Z takových úvah o osobnosti a individualitě vycházejí mnohá pochybovačná tvrzení o statistice všeobecně a o průzkumu mínění zvlášť. Sčítání obyvatelstva — budiž, ale není to domýšlivé a pošetilé strkat desetitisíce individuí do jednoho pytle, spočítat je pomocí jednoho dotazníku? A pak se jeden nahodile vytáhne a pokládá se za „mluvčího", který zastupuje stovky nebo tisíce jiných lidí, s nimiž možná nemá společného nic jiného než lidskou postavu! Jak může být zjištěno mé míněni, mé chováni dotazováním úplně cizího člověka? 146 Domnělý rozpor mezi růzností lidské přirozenosti a radikálními rovnostář-skými machinacemi statistiky se začne rozplývat, jakmile porovnáme např známky na vysvědčeních se zjišťováním kvality ořechů. Žádný učitel, žádný vychovatel a ani rodiče nepochybují o tom, že každé dítě je samostatná osobnost — a přece nikomu nevadí, že chování, znalost angličtiny nebo nadání pro ruční práce těchto jednotlivých individuí se paušálně zařazují do stupňů „výborný" až „nedostatečný". Podobně se mohou vyskytnout ženy se svérázným přirozeným odstínem vlasů, celkem však nikdo nebude mít námitky proti tomu, jestliže vytvoříme čtyři nebo pět skupin: blondýny, brunety, černovlasé, rusovlasé a případně šedovlasé. Sociologie pokládá člověka za nositele řady rolí — má např. úlohu „otce", „příslušníka určitého národa", „úředníka", „sportovního rybáře", „katolíka" atd. Jejich vyjmenováním se vytvoří celková osobnost. Pro potřeby statistiky však tento „rozkladný proces" pokračuje dál — dokonce tak daleko, že člověk zcela zmizí: objevuje se jen v jednotlivých případech jako nositel znaků: jako příjemce 25 000 až 30 000 Kčs ročního příjmu, jako návštěvník sportovních stadiónů, jako televizní divák, jako stoupenec trestu smrti, jako rekreant v Jugoslávii, jako oběť nakažlivé nemoci. Vše ostatní, čím ještě je, není zajímavé, jeho anonymita zůstává zachována nejen z ohleduplnosti, ale hlavně z důvodů účelnosti a nutnosti. Statistická šetření jsou složitá, časově náročná a dosti nákladná, i když se soustředí na nej-důležitější. Proč tedy ještě přidávat statisíce činitelů, které ve svém celku tvoří individuum? Právě proto na tom není nic ponižujícího ani metodicky nepřípustného, jestliže se jednotlivé osobnosti přece jen hodí do jednoho pytle — totiž jako nositelé několika málo z těch 10 000 a více znaků, které mají. K tomu, abychom se dověděli o způsobech pití vína nebo zvyklostech o dovolené, o oblíbených jídlech nebo koníčcích celého národa, zpravidla postačí, jestliže se zeptáme tří až čtyř tisíc lidí. Tyto osoby musí ovšem vyhovovat jediné podmínce: musí být určeny zcela náhodně nebo přinejmenším za rozhodujícího spolupůsobení náhody. 5.3 Reprezentatívni průřez obyvatelstvem „Náhoda" v tomto případě znamená: každá jednotka základního souboru musí mít stejnou naději dostat se do výběrového souboru. Má-li být dotazováno bydlící obyvatelstvo Paříže, pak musí mít domovnice ve staré postranní uličce v Belleville stejnou naději, že jí budou kladeny otázky, jako student z Madagaskaru ve svém pokojíku za Pantheonem nebo jako penzionovaný bankovní úředník na kraji bouloňského lesa. Jestliže všichni němečtí vinaři tvoří základní soubor, který má být dotazován, nestačí zajet do údolí Mo-sely a tam se zeptat deseti vinařů, které náhodou zastihnu doma. Jde-li o míněni švýcarských dělníků, nestačí počkat u vrat továrny v Basileji a po skončení pracovní doby pohovořit s hrstkou lidí. kteří jsou ochotni odpovídat. Stejné tak mínění rakouského obyvatelstva nezjistím na schodišti vídeňského Burg-theatru. K plnému uplatnění náhody by bylo nutné, aby existoval úplný seznam souboru, který má být dotazován a z kterého by se pak nějakým nahodilým způsobem „vylosovalo" určité procento nebo promile. Takto vybrané osoby (a jen tyto) by musely být dotázány — a to bez výjimky. V praxi je takový postup zpravidla neproveditelný, protože nejsou k dispozici uvedené seznamy a také proto, že náklady takové dotazníkové akce by byly příliš vysoké. Používají se tedy smíšené náhodné systémy, např. dvoustupňový výběr. V daném případě se „nelosují" jednotlivé osoby, ale skupiny osob: do vzorku se nezahrnuje např. 2000 švýcarských dělníků jako jednotlivců, nýbrž 100 švýcarských továren a závodů, ve kterých je pak — opět náhodným výběrem — dotazován potřebný celkový počet 2000 dělníků. Vzorek je možno dál 147 Plánek přiložený k pokynům pro tazatele, určujici postup oblastního výběru. Ukazuje, jak použit při postupu od výchozího bodu A základního pravidla pro výběr domů („zahnout střídavě vpravo a jit po pravé straně ulice a pak zahnout vlevo a jit po levé straně ulice") v případě, že zelené plochy, slepé uliíky atd. vyvolávají potiže. Druhé pravidlo tohoto postupu zni: „navštivit každou třetí domácnost na této trase"; „počítat od přízemi nahoru až do nejvyššlho obývaného poschodí a — je-li v tomtéž poschodí více nájemníků — zleva doprava". (Z pokynů pro tazatele Ústavu pro demoskopii v Allenbachu.) „rozvrstvit", abychom se ubezpečili, že jsou zastoupeny všechny dílčí jednotky. Jestliže např. máme zjišťovat investiční záměry „podniků", měly by velké koncerny, na jejichž investičních záměrech zálež! především, při čistě náhodném výběru pouze stejnou naději na vylosování jako každá malá obuvnická dílna nebo zmrzlinářský stánek. Utvoříme tedy tři nebo více „vrstev": a) velké podniky, b) střední podniky, c) malé podniky, a na tomto základě zajistíme, aby byli dotazováni reprezentanti všech skupin. Přitom bude dotázáno, bude-li to třeba, všech 20 velkých podniků, 50 ze středních podniků a 100 ze 400 malých podniků. Jak budou jejich odpovědi „váženy", závisí už na pojetí otázky. Při průzkumu veřejného mínění se používá tzv. kvótni výběr (quota samp-ling), který má s výše uvedeným systémem mnoho společného, i když nejsou vůbec totožné. V daném případě se obyvatelstvo „rozvrstvuje" podle několika standardních znaků a tazatel dostane např. tento příkaz: „Dotazujte se 20 lidí starších 16 let, z toho 11 žen a 9 mužů, pěti mladších 30 let, deseti ve věku 30"—60 let a pěti starších. Čtyři osoby mají být samostatně činné, ostatní z poloviny zaměstnanci, případně mimo výdělečnou činnost." Tyto „rozvrstvovací" příkazy se mohou měnit v závislosti na tématu dané otázky. Téměř čistý náhodný výběr (random sampling) spočívá v tom, že se náhodně určí domy ve dvou tuctech míst, kam se vyšlou tazatelé s předepsaným směrem cesty, který vypadá jako itinerář rallye „lov na lišku": „Pravá strana ulice, druhý dům, první patro vlevo, dotázat se dospělé ženy; potom čtyři domy dál, druhé patro, třetí dveře vpravo, dotázat se hlavy domácnosti, potom nej-bližší příčná ulice vlevo..." atd. Možnými zdroji chyb při použití těchto metod se nebudeme dále zabývat. S výjimkou rozvrstveného náhodného vzorku jsou všechny méně spolehlivé než čistý 5.3 Reprezentativní průřez obyvotelitvem náhodný výběr, podle zkušeností však stále ještě dostačují k tomu, aby se získaly použitelné výsledky. Proč se vůbec přistupuje k vrstvení a tak namáhavě se konstruuje náhodný výběr, když ještě na počátku této kapitoly jsme tvrdili, že jde jen o jednotlivé znaky, a nikoliv o individua? Proč se přesto provádí rozdělení na muže a ženy, na mladé a staré, na samostatně činné a zaměstnance, a je-li třeba dokonce na katolíky a protestanty? Ještě jednou připomínáme: Teoreticky nejlepší výběrovou metodou je čistý náhodný výběr, který toto rozdělení nezná. Rozdělení se používá proto, aby další dobré metody mohly proběhnout v jisté míře pod vlivem náhody, aby náhoda byla jaksi synteticky vytvořena. Bez uvedených pokynů by bylo tazateli ponecháno na vůli, zda se přece jen nepostaví k vratům továrny nebo na stanici pouliční dráhy a tam se bude dotazovat tak dlouho, dokud nesplní předepsaný kontingent. Všichni penzisté v parku by unisono volali: „Ne, beat nemáme rádi." A tazatel by po pravdě poznamenal: „Všichni dotazovaní beat rozhodně odmítají." Proč ale vůbec takové křečovité úsilí o skutečnou nebo alespoň podle pravdy věrně napodobenou náhodu? Protože tehdy a jen tehdy platí zákony počtu pravděpodobnosti, které jsme v nej-hrubších obrysech poznali. Je jen otázkou počtů, aby se zjistilo, jaké bude uspořádání, když se vytáhne 5 karet ze hry o 52 kartách, což bylo vysvětleno pomocí příkladů. Je možno lehce určit, jaká je mezi těmito tahy pravděpodobnost vytažení např. kon-binace „tři piky a dvě srdce", neboť 148 Teorie pravděpodobnosti ukazuje, jak lze ze známého základního souboru opadnout složen, neznámého vzorku: např. jaká je pravděpodobnost, že mezi piti kartami jsou přesné dv* Mm. (obrázek vlevo)? Teorie výběrových šetřeni ukazuje na základe známého vzorku MM základní soubor: např. jaká je pravděpodobnost, že v této karetní hře neznámeho složen, ,. M dva ierných. ale |en dvacet červených karet (obrázek vpravo)? 149 5. Výbory a dotazníky známe skutečné rozdělení základního souboru. V praxi statistiky a výběrových souborů se však musí postupovat obráceně: pět karet (případně vícekrát tažených) má podat zprávu o složení „balíčku karet", jehož skutečné složení neznáme a který může sestávat z 20 piků, 15 srdcí, 10 křížů a 7 kár. Mají-li v těchto případech platit zákony o pravděpodobnosti poměrů výběrových souborů, musí — jako při tažení z uvedeného balíčku karet — rozhodovat jedině náhoda. Kdybych naproti tomu nechtěl mít ve výběrovém souboru žádnou kartu s ohnutými, případně nalomenými rohy, již to by mohlo — snad — vytvořit zkreslený obraz. V určitých případech může být účelnější zeptat se na mínění 5 odborníků než 500 laiků. Vše záleží na tom, co chci vlastně zjistit. Jestliže chci vědět, zda je Mars obydlen, zeptám se pěti odborníků na kosmický prostor a astronomů. Chci-li vědět, zda obyvatelstvo věří, že na Marsu žijí lidé, musím vytvořit náhodný výběrový soubor z celého obyvatelstva. Jestliže chci vědět, zda chlapci ve věku mezi 10 a 15 lety věří, že Mars je obydlen, musím vytvořit náhodný výběrový soubor z této věkové skupiny a bylo by zde zcela nesprávné ptát se dětí tří známých a tuctu dětí ze sousedství — výsledek by mohl být zkreslen úrovní vzdělání mých známých, prostředím mého okolí a řadou dalších faktorů. Každý osobní výběr vnáší subjektivní prvek, který si mnohdy ani neuvědomujeme, který však přesto více nebo méně vyřadí nebo přehluší zákonitosti náhody, na nichž se mají zakládat další výpočty. SA Rozsah výběrových souborů V jedné staré anekdotě se vypráví, že jeden Angličan cestoval kdysi kočárem z Holandska do Belgie a rozhodl se přenocovat v Cáchách. Jeho věrný sluha mu našel nocleh v hostinci, a když onen Angličan ráno hodlal pokračovat v cestě, pomáhal místní zrzavý podo-mek nosit jeho zavazadla do kočáru. Angličan mu pak vtiskl do ruky minci a vlídně se ho zeptal na jméno. „Bedřich," řekl podomek a uklonil se. Angličan kývl hlavou, nasedl do kočáru, zatáhl záclonky a jel dál směrem na Lutych. Do svého zápisníku si však poznamenal: „Němci se jmenují Bedřich a mají zrzavé vousy." Něco podobného se může stát, jestliže se z velmi malého výběrového souboru ukvapeně usuzuje o základním souboru. I když uvedený malý příběh působí bizarně, život často ukazuje tento všední případ: přede mnou stojí pytlík ořechů; sáhnu dovnitř, vytáhnu ořech, rozlousknu jej a je prázdný. Co z toho mohu usoudit? Optimista řekne: „No tohle, jediný prázdný ořech, a právě ten musím vytáhnout — no budiž, aspoň jsme se ho zbavili." Pesimista řekne: „Toho jsem se obával, v pytlíku je plno zkažených ořechů." A co řekne statistik? Nejdříve přizná, že pravdu by mohl mít jak optimista, tak pesimista. Prokázáno je totiž, že v pytlíku byl jeden prázdný ořech. Mohl být jediný, mohl být jeden z několika, jeden z mnoha, jeden ze všech. (Viz obr. na str. 151.) K získání poměrně rozumného úsudku vytvoří statistik větší vzorek — řekněme dvacet ořechů z asi tisíce, které jsou podle odhadu v pytlíku. Ořechy předtím dobře promíchá a jeden vezme shora, jeden zespodu, jeden z pravé 5.4 Rozsah výběrových souborů Vlevo: V tomto pytli jsou velmi dobře zamíchány dobré (světlé) a {patné (tmavé) ořechy. Výběrové soubory přesto poskytuji značně rozdílné výsledky. Dole: Jestliže se odebrané výběry nevracej! nazpátek, pak při dalšim postupném odběru se základní soubor pomalu vyčerpá a výběr se nakonec stane vyčerpávajícím šetřením (nahoře). Zpravidla se však utvoří ze základního souboru více náhodných vzorků. Je bezvýznamné, že některé jednotky jsou zachyceny vícekrát a jiné vůbec ne. Průměr 7 vzorků z našeho přikladu bude základní soubor charakterizovat dostatečné výstižně a bude méně nákladný než vyčerpávající šetřeni. J mi j-[ zahrnuto vícekrát nezahrnuto ani po 7 výběrech 151 150 5. Výběry a dotazníky strany, jeden z levé a jeden z prostřed-ka, až má před sebou dvacet ořechů. Z celkového souboru o N jednotkách vzal vzorek n; v našem případě je N = 1000, n = 20. Nyní výběr prozkoumá a zjisti, že 15 ořechů je dobrých a 5 špatných. Soustředím-li se na znak „špatný" a nositele znaku ve výběru označím m, dostanu m = 5, proto n — m (= ne špatné ořechy) = 15, a m/n = s/2n = = To je můj první odhad. Ze vzorku jsem zjistil podíl špatných ořechů, a to může platit jako první odhadnutá veličina za předpokladu, že pM, totiž dílčí pravděpodobnost špatných ořechů v základním souboru (M), by také mohla být přibližně l/4. (Viz obr. na str. 151 dole.) Vzorek o rozsahu n == 200 by snad ukázal m = 42, a tím odhad pro pM = = 42/200 = 0,21, který se opírá o větší rozsah výběru. Rozsah vzorku by bylo možno dál zvětšovat, až by konečně obsáhl celý základní soubor. Teprve tehdy — a ne dříve! — bychom měli absolutní jistotu o stavu všech ořechů v pytlíku. Jinak je možno podíl jen odhadovat se stále rostoucí přesností. Musíme však zavčas přestat, protože přece nemůže být úkolem zkoumání vzorků prozkoumat celý základní soubor. Míru dostatečného rozsahu výběru určuje koneckonců naše snaha o přesnost. Spokojíme-li se s obstojně spolehlivým odhadem „ne víc než čtvrtina a ne méně než pětina", může být vzorek menší, než chceme-li docílit s téměř absolutní spolehlivostí rozptyl prognózy na pouze ±2%. A ještě jednou: absolutní jistotu o rozdělení, o střední hodnotě nebo o směrodatné odchylce základního souboru neposkytne žádný vzorek. Dříve než začneme zkoumat, jak se navzájem chovají rozsah výběru, přesnost odhadu a základní soubor, podívejme se ještě na druhý příklad V případě ořechů šlo o podíl jednoho (nebo více) nositelů znaků v jednom vzorku, případně základním souboru. Věda v tomto případě mluví o „stejno-značném kladeni otázek". Vedle toho známe „různoznačné kladeni otdzek" které se zabývá výběrovým souborem pro zjištění střední hodnoty a rozptylu kvantitativních znaků. Příklad: obvod prsou Quételetových vojáků. Nebo chceme odhadnout, jak vysoké jsou v průměru úspory samostatných rolníků v Bavorsku. Z našeho výběrového souboru (řekněme: rozsah n = 500) nevycházejí procenta, nýbrž 500 údajů o výši úspor — a protože se zde nezabýváme teorií a kritikou zjišťování, předpokládáme, že údaje jsou správné. (I kdyby nebyly, je to náš jediný výchozí materiál.) 500 dotázaných by mohlo jako celkovou částku úspor uvést 240 000 DM. Jako střední hodnotu vzorku dostaneme: x = 480 DM. Mimoto získáme potřebné údaje, abychom mohli vypočítat rozptyl, a předpokládáme, že směrodatná odchylka výběru by činila 60 DM. Tuto směrodatnou odchylku výběrového vzorku označíme s, podobně jako jsme označili střední hodnotu výběrového vzorku x; fi a a zůstávají jako obvykle vyhrazeny základnímu souboru. Předpokládejme dále, že výše úspor by měla přibližně normální rozdělení. Tento předpoklad je ovšem — a to musíme dodat — velmi smělý. Jsou to totiž zpravidla úspory (a v ještě větší míře šekové knížky), které nemají obvykle normální rozdělení: jednotlivé velmi vysoké účty zkreslují rozdělení téměř tak, jak tomu bylo u boháče ve Zbohatlíkově. Kromě toho mnoho do- 152 5.4 Rozsah výběrových souborů Vyjmemc-li z velkého souboru jednotlivé exempláře, maji velký rozptyl (červená křivka). Vytvořl-ll se vzorky po čtyřech exemplářích (oranžová křivka), po devíti (zelená křivka) nebo po pětadvaceti (modrá křivka), mají průměry těchto výběrů vždy menší rozptyl od skutečného průměru. (Čísla nejsou směrodatnými odchylkami, nýbrž znázorňuj! jen tvary křivek. Směrodatná odchylka průměru výběrového souboru o pětadvaceti jednotkách činí jen 1 /V25 = '/, dílčího rozptylu.) -5 -4 -3 -2 -1 0 +1 +2 +3 +4 +5 tazovaných rolníků odpoví asi „nula" nebo „nic", takže rozdělení bude „šikmé" (rozdělení L krásných věcí, vzpo-mínáte-li si). Protože nám však jde především o ukázku početního postupu, zůstaneme u tohoto příkladu a uvedených předpokladů. Předpokládejme ještě základní soubor „samostatní rolníci v Bavorsku" N = 250 000, a tlm máme všechny údaje potřebné pro výpočet. Vzniká otázka — a tea" již můžeme mluvit docela všeobecně a bez ohledu na náš poněkud „šikmý" obraz — jak dalece střední hodnota x = 480 (s = = 60), vypočítaná ze vzorku o rozsahu n = 500, odpovídá skutečné střední hodnotě. Nutno totiž uvážit, že i nepatrné rozdíly v náhodném výběru by také mohly docela dobře vést ke střední hodnotě 463, 485 nebo I 502. Protože neznáme složení základního souboru (na rozdíl od baličku karet, ze kterého jsme táhli 5 karet), nebudeme nikdy s to zjistit skutečné ft. Můžeme však vypočítat, s jakou pravděpodobností se nachází uvnitř relativně úzké míry rozptylu kolem x. (Stejně je tomu u ořechů, kde P se musí odhadnout z p.) Střední hodnoty výběrových souborů mají však normální rozdělení i tehdy, jestliže základní soubor normální rozdělení nemá. To by bylo možno matematicky dokázat v teoreticko-pravděpodobnostní exkurzi, ale zavedlo by nás to příliš daleko do oblasti, kam si netroufáme. Mimoděk jsme se totiž dotkli „centrálni limitní věty", která má pro matematickou statistiku základní teoretický význam, jehož nastínění se však můžeme s dobrým svědomím zříci. Je jen nutno ještě jednou zopakovat a zdůraznit rozhodující tezi této centrální limitní věty: ať je rozdělení základního souboru jakékoliv, rozděleni střední hodnoty výběrového souboru 153 5. Výběry a dotazníky (i rozptyl výběrového souboru) bude vždy normální, jestliže rozsah výběrového souboru dosáhne alespoň určité minimální velikosti. (Viz obr. nastr. 153). Za nejmenší rozsah výběru — jde-li pouze o zjištění skutečné střední hodnoty základního souboru, můžeme pokládat asi n = 30. K tomu. abychom získali možnost vypočítat i rozptyl základního souboru, musí rozsah výběru činit přinejmenším 100. Jestliže tyto úvahy přeneseme na náš případ, dostaneme tuto ilustraci centrální limitní věty: kdybych chtěl šetření mezi rolníky opakovat např. třicetkrát — vždy se stejným rozsahem vzorku — dalo by těchto 30 vzorků jistě střední hodnoty xv St..J(n, které jsou kolem skutečné střední hodnoty fi „normálně rozděleny". Předpokládali jsme x, = = 480; dalších 29 výsledků by leželo téměř bez výjimky rovněž mezi 475 a 485. Představa, že by se měl výběr o rozsahu n = 500 opakovat třicetkrát, je již teoreticky velmi podivná a v praxi úplně absurdní. Nevyžaduje příliš mnoho fantazie představit si úvodní vzorek o rozsahu n = 500 jako množství vzorků. Každý z 500 výsledků měření je možno pokládat za vzorek o rozsahu 1 (anebo, trochu opovážlivěji, za střední hodnotu fiktivního vzorku o rozsahu 2 nebo více). Tím se nemění nic na principu centrální limitní věty: střední hodnoty výběrových souborů (a tím i výsledky jednotlivých výběrů) mají normální rozdělení kolem skutečné střední hodnoty základního souboru, pokud je rozsah výběrového souboru dostatečně velký. Přesnost výpovědi o této skutečné střední hodnotě závisi na dvou faktorech: předně na rozptylu celkového souboru a za druhé na rozsahu výběru. Matematicky se vyjadřuje tato tzv. směrodatná chyba vzorcem Jsou v něm obsaženy obě rozhodující hodnoty: směrodatná odchylka základního souboru a počet jednotek zahrnutých do výběrového souboru. Ted sice známe rozsah výběrového souboru, nikoliv však a, směrodatnou odchylku u základního souboru, nýbrž jen s, směrodatnou odchylku u výběrového souboru. Je-li však výběrový soubor dostatečně velký, a to znamená např. n větší než 30, je možno s dobrým svědomím a nahradit s jako „odhad" za a. Měli jsme n = 500. můžeme proto klidně použit s místo a a dostaneme směrodatnou chybu: 60 I 500 Ve shodě se zákonitostmi normálního rozdělení jde při této hodnotě směrodatné chyby o směrodatnou odchylku. To znamená: ve dvou třetinách (68,2 %) všech případů bude střední hodnota výběrového souboru v rozmezí ±2,7 skutečné střední hodnoty. Protože však A je od 8 přesně stejně daleko jako 8 od A, mohu říci obráceně: ve dvou třetinách všech případů nebude naše střední hodnota výběrového souboru (v našem případě to bylo i, = 480) více než ± 2,7 vzdálena od skutečné střední hodnoty. Dvě třetiny případů je však neuspokojivě málo. Budeme se snažit z důvodů účelnosti dosáhnout asi 95% jistoty, 154 5.4 Rozsah výběrových souborů Průměry výběrových souborů, i když pocházejí z nenormálního rozdělení, jsou normálně rozděleny. Čtrnáct průměrů výběrových souborů od x, do x„ se v prostoru pod normální křivkou pohodlně rozdělí. Tento úkaz je matematicky vyjádřen v centrální limitní větě. a proto vypočítáme dvojitou směrodatnou odchylku: dvakrát ±2,7 dává však ±5,4. Usuzujeme proto z našeho x = 480, že skutečná střední hodnota je někde mezi 474,6 a 485,4. Tento postup je však nepoužitelný při malých výběrových souborech (pod 30), protože rozptyl s výběrového souboru je zde příliš nespolehlivý a protože existuje — při pěti nebo deseti výsledcích z velkého základního souboru — příliš velká pravděpodobnost, že dostaneme náhodou necharakteristické výsledky, a tím i příliš nesprávnou střední hodnotu. Takové malé výběrové soubory vyžadují speciální matematické postupy, s nimiž se ještě seznámíme (str. 196). Nejdříve se však ještě jednou zblízka podíváme na vzorec pro výpočet směrodatné chyby — a tu nás napadne něco překvapivého. Nacházíme v něm sice n, rozsah výběrového souboru, nikoliv však N, rozsah základního souboru. To ale znamená, že vzorec pro přesnost měření závisí pouze na rozsahu výběrového souboru, nikoli však na jeho poměru k základnímu souboru! Je to možné? Zdravý selský rozum řekne rozhodně „ne", a zase jednou nemá principiálně pravdu. Matematik si prohlédne vzorec podrobněji a pak řekne „ano" — a přirozeně má zase jednou pravdu. Matematik ovšem k tomuto tvrzení připojí omezeni: „Ano. když je základní soubor nekonečně velký." Našich 250 000 rolníků je sice hodně veliký, nikoliv však nekonečně veliký základní soubor. Podívejme se. co se stane, vezme-ll se hypotetický případ, že bychom výběrový soubor neustále rozšiřovali, až by nakonec obsáhl celé obyvatelstvo. Pak dostaneme — jak protismyslné! — stále ještě směrodatnou chybu střední hodnoty. 155 5. Výbery a dotazníky 60 I 250 000 = 0.12. Ovšem že je jen velmi malá, 0,12 v poměru ku 480 (o kterých předpokládáme, že tvoří také hodnotu), ale přece to není nula, jak by tomu muselo vlastně být, když už není žádná náhodná chyba myslitelná. Je ovšem pošetilé chtít vypočítat směrodatnou chybu střední hodnoty tam, kde už žádná nemůže být. V daném případě, stejně jako i v jiných, nesmí vzorec nahradit logické myšlení. Náhodná chyba 0,12, která je bezpodmínečně příliš velká, by vznikla, kdybychom se sice nedotazovali všech 250 000, ale jen 249 990 osob. Musíme tedy použít opravného koeficientu, který redukuje 0,12 téměř na nulu. Později se k němu ještě vrátíme (viz str. 160). Již teď je ale zřejmé, že při velkém rozsahu základního souboru závisí přesnost výběru skutečně jen na rozsahu výběrového souboru n a nikoliv na N. To však neznamená nic více a nic méně. než že rozsah výběrového souboru může být prakticky stejný, ať už se základní soubor skládá ze 60 miliónů obyvatel NSR, 10 miliónů obyvatel Bavorska, z půldruhého miliónů Mnichovanů nebo z 500 000 Mnichovanek. Přitom samozřejmě platí, jako při každém náhodném výběru, že každá jednotka základního souboru musí mít stejnou naději být zahrnuta do výběru. V jednom případě budeme tedy muset hledat našich řekněme 3000 osob vzorku na celém území NSR, v jiném případě jen na území Mnichova. To proto, že výběrový soubor z Mnichovanek nejen neřekne nic o mužích z Hamburku, ale ani nic o „Bavorácích", výběrový soubor z Bavorska pak nic o „občanech NSR". Jak je to v případě těch výběrových souborů, kde nejde o střední hodnotu, nýbrž o rozdělení znaků („kladení otázek stejného významu")? Zkoumejme situaci našich ořechů. Tam jsme měli N = 1000 a v prvním malém výběrovém souboru o rozsahu n = 20 hodnoty m = 5. a tedy p=r-/20= »/4. Zde je nutno upozornit na klamnou dvojznačnost uvedeného p. Známe p (nebo také P) jako zkratku „pravděpodobnosti" (lat. probabilitas) a víme např. z příkladu házení mincí, že pravděpodobnost pro „dvakrát za sebou hlava" se udává jako p = '/4- Stejně je p = >/4 za: „ze hry karet táhnout jeden pik". Tím přenášíme nám známou úměrnost piků v celém balíčku karet zcela logicky na pravděpodobnost vytáhnutí jednoho piku: je-li v balíčku pikových karet, je pravděpodobnost vytažení jedné z nich také právě Poměr P určuje tedy pravděpodobnost p (nebo P). Mluvíme-li však o výběrových souborech, vzniká jistý posun významu. Vždyť známe jen proporci uvnitř výběrového souboru (označujeme ji p) a používáme ji jako odhad pro domnělou proporci v souboru, kterou označujeme P. Když jsme tedy mluvili o tom, že v našem výběrovém souboru bylo p = '/.,• znamená to pouze, že poměr souboru k nositeli znaku (n : m) byl ve výběrovém souboru 1 :4. V daném případě však nemáme co činit s výpovědí o pravděpodobnosti. V dalším výkladu brzy uvidíme, že skutečná hodnota (pravděpodobnost správnosti domněnky) se zjišťuje docela jinak a nemá s velikostí podílu znaků téměř nic společného. Chceme-li se vyhnout nedorozuměním, může jako východisko posloužit to, že se napíše místo proporce výběrového souboru p raději m/n, místo proporce P v celkovém souboru raději M/N. Ve druhém, větším výběrovém souboru 156 5.* Rozsah výberových souborů m=3 H n 3 1+1+0+0+0+1+0+0+0= 3 x 5 i 9~3 Podílovou četnost lze vyjádřit jako aritmetický průměr. V binomickém rozděleni velký - mal, je možno třetinový podíl velkých na základním souboru vyjádřit také tim, že se jednomu znaku přidělí charakteristická veličina 0, druhému 1. jsme měli n = 200, m = 42. p = 0,21. Protože jak N, tak n jsou dostatečně velké, aby se mohlo místo binomického rozdělení použít rozdělení normálního (a protože p je pro Poissonovo rozdělení příliš veliké), budeme v našich dalších úvahách a propočtech používat normálního rozdělení. Normální rozdělení je určeno svým aritmetickým průměrem a rozptylem a2, případně směrodatnou odchylkou a. Průměr však odpovídá v případě četnosti znaků skutečnému podílu M na N, je tedy M/N = P. Rozptyl ale dává hodnotu: P (1 — P). Tomu, jak je to zde napsáno, nutno věřit. Bylo by však možné dokázat to matematicky přesně. Zvolíme střední cestu a pokusíme se o důkaz poněkud jednodušší. Kvalitativní rozdělení znaků (dobrý — špatný, velký — malý, světlý — tmavý atd.) totiž můžeme změnit na kvantitativní tím, že např. stanovíme: všechny špatné ořechy mají charakteristickou hodnotu 1, všechny dobré 0. Nestanovíme tedy už „podíl", poměr, nýbrž sčítáme: 1 + 0 + 0 + + 0 + 1 +... V případě našeho většího výběrového souboru (s rozsahem n = = 200 a m = 42) dostáváme celkem 42. a tím aritmetický průměr x = 0,21, což ie přesně poměr m/n, proporce výběro- vého souboru. A tento průměr i se má k průměru stejně jako poměr výběrového souboru m/n (nebo p) k proporci základního souboru M/N (nebo P). Chybu relativní četnosti můžeme proto pokládat za zvláštní případ směrodatné chyby (nebo také obráceně) a použít stejného vzorce jako dříve — jen místo a; píšeme nyní ap: a Tím ovšem opět vzniká otázka, odkud máme vzít al Přinejmenším je můžeme vypočítat jako rozptyl výběrového souboru s, stejným způsobem jako kdysi ve Zbohatlíkově, když jsme se seznamovali se směrodatnou odchylkou. Tehdy musela být každá odchylka od průměru i nejdříve umocněna na druhou, abychom dostali rozptyl, jehož odmocnina byla směrodatnou odchylkou. V našem nynějším případě je to zvlóit snadné potud, že nemusíme umocňovat bezpočet (resp. ani tucet) různých odchylek. Vždyť máme jen dvě jednoduchá čísla, charakteristické hodnoty 0 a 1 — a samozřejmě průměr x = 0.21. Jsou tedy jen dvě možné odchylky od tohoto průměru. Buď máme před sebou cha- 157 5. Výběry g dotazníky rakteristickou hodnotu 1 a pak platí (x —x)2 = (1 — 0,21 )2, anebo charakteristickou hodnotu 0 a pak platí: (x — x)2 = (0 — 0,21 )2. V prvním případě je tedy (1 —p) v závorce a umocňuje se. V druhém případě, protože záporné znaménka se při umocňování stejně ztrácejí, je výraz rovný p2. Charakteristická hodnota 1 se vyskytuje ve výběrovém souboru "mkrát (m = 42), charakteristická 0 podle toho (n — m) krát (n — m) =158. Souhrn čtvercových odchylek, jak jej potřebujeme pro výpočet rozptylu (srovnej oddíl 2.6), činí tedy: 42krát (0,79)2 + 158krát (0,21 )2. Abychom tento rozptyl obdrželi, dělíme uvedený výběrový soubor celkovým počtem měření a dostáváme: 2_ 42.(0,79)a + 158.(0,21)2 S ~ 200 26,25 + 6,95 200 = 0,166, z toho kořen s = Fo.lóó = 0,41. Stejné hodnoty však můžeme získat jednodušším způsobem, když dosadíme: s2 = p(1 — p) a s = |'P(1 — p). Spočítáme, že s2 = 0,166. X 20 50 100 150 200 300 500 0 0— U5 0— 71 0— 36 0— 24 0— 18 0— 12 0— 7 1 5— 223 1— 107 1— 54 0— 37 0— 28 0— 18 0— 11 2 25— 293 7— 137 4— 70 2— 47 2— 36 1— 24 1— 14 3 53— 356 17— 166 8— 85 5% 57 4— 43 3— 29 2- 17 5 116— 474 40— 218 20— 113 13— 76 10— 57 7— 38 4— 23 10 289— 711 100— 338 49— 176 31— 119 24— 90 16— 60 10— 36 20 855—1000 264— 548 126— 292 83— 199 62— 151 41—101 25— 61 50 929—1000 398— 602 259— 415 191— 316 126—215 75—130 100 964—1000 585— 741 429— 571 280—395 165—238 150 976—1000 684— 809 443—557 259—341 200 982—1000 605—720 355—446 250 785—874 456—544 Jak jsou intervaly spolehlivosti vzdáleny ještě u výběrů středního rozsahu, lze poznat z této ta bulky, ve které je nahoře uveden rozsah výběru n, vlevo četnost znaku k, nalezená v tomto výběru Jestliže se např. ve výběru o rozsahu n = 150 hledaný znak najde pětkrát (tedy k = 5), činí inter val spolehlivosti (uvádi se v promilích) 13 až 76. Protože tabulka vychází z 95% pravděpodobnost, jistoty, znamená to, že na základě tohoto výsledku mohu předpokládat, že v tomto velmi velikém až nekonečném — základním souboru činí četnost znaku nejméně 13°/;0. Takto mohu odpovědět s 95% jistotou. Zůstává pak ještě pravděpodobnost omylu ve výši 5 %, tzn. že četnost je menší než 13 B/o0 nebo větší než 76 °/00. 158 Směrodatnou odchylku získanou z výběrového souboru dosadíme do již známého vzorce pro směrodatnou chybu relativní četnosti a dostáváme: S hodnotami z našeho příkladu vypočítáme náhodnou chybu: 0,41 '-1Í2=°-029- Chyba relativní četnosti činí v tomto výběrovém souboru ± 2,9%. To však znamená za prvé: ze všech teoreticky možných výběrových souborů tohoto rozsahu (n = 200) dávají dvě třetiny podílové hodnoty mezi 18,1 (= 21 — 2,9) a 23,9 (= 21 + 2,9). Dvě třetiny proto, že jde o prostou směrodatnou odchylku. To pak za druhé znamená, že dostaneme-li takový výsledek výběrového souboru, můžeme s pravděpodobností (přesně) 68,3 % soudit, že skutečný podíl celkového množství je v těchto mezích. Přejeme-li si, jak je většinou obvyklé, 95 % jistoty, použije se dvojité směrodatné odchylky: jestliže výběrový soubor o rozsahu n = 200 dává četnost podílu 21 %, je skutečná hodnota podílu s 95% jistotou mezi 15,2 a 26,8 %. Znovu se vynořuje otázka, zda skutečně na velikosti základního souboru vůbec nezáleží. Protože jde v podstatě o stejné závěry, které jsme již rozvíjeli, dojdeme i v tomto případě ke stejnému výsledku. Pro nekonečně velké základní soubory vzorec souhlasí, pro velmi veliké základní soubory souhlasí do té míry, že může být bez připomínek použit. Jiná situace vznikne, jestliže základní _5.4 Rozsah výběrových souborů soubor není příliš velký, avšak výběr ve srovnání s ním velký je. Přesně tento případ jsme měli v našem druhém příkladu výběrového souboru ořechů: N = 1000 není moc veliký základní soubor, n = 200 je v poměru k tomu veliký výběrový soubor. V těchto případech se ke vzorci připojuje opravný koeficient, který přihlíží k tomu, že základní soubor je výběrovým souborem do značné míry „spotřebován". Tento doplňkový opravný koeficient — konečnostní násobitel — je stejný jak pro náhodnou chybu četnosti, tak pro náhodnou chybu střední hodnoty: N—n —-- .nebojednodušeaskorostejně: 1 — Pro příklad rolníků (N = 250 000, n = = 500) dostaneme tento opravný koeficient: 500 250 000 1/499 Ten se téměř rovná 1 a neovlivňuje to tedy náš původní výsledek. Jinak je tomu v přikladu s ořechy, kde N = 1000 a n = 200. Zde již dostaneme: 200 1/^-5 = Vo.8 = 0,894. 1000 Náš výsledek byl a„ = 0,029 a správně bychom jej měli ještě násobit tímto faktorem. Pak dostáváme: a? = (0,029) x x (0,894) = 0,026. Náš odhad je proto dokonce přesnější než původní předpoklad, což je pochopitelné vzhledem k tomu, že jsme 159 5. Výběry o dotazníky vzorkem zachytili pětinu základního souboru. Nyní můžeme naši původní výpověď upřesnit tak, že řekneme: s jistotou 95 % je podíl prázdných ořechů mezi 15,8 a 26,2 %. Nyní uvedeme právě rozvinuté myšlenkové pochody o spolehlivosti výběrů a o náhodných chybách průměrů a četnosti v jiné souvislosti. Dosud jsme vycházeli z toho, že máme určitý výběr o rozsahu n = 200 nebo n = 500 anebo n = 20 a zkoumali jsme, jaké závěry a s jakou pravděpodobností je z nich možno udělat pro základní soubor. Nyní úvahu obrátime a ptáme se: Jak velký výběr musím zvolit za předpokladu, že chci dosáhnout 95% spolehlivosti? Tato otázka stojí vždy znovu před statistiky a těmi, kdo zkoumají veřejné mínění. Abychom mohli nalézt odpověď, podívejme se ještě jednou na 10000 i 5000 112 1 Nejmenší rozsah výběrového souboru závisí na podílu znaku. Toto vyobrazeni — podle náčrtku u Pfanzagla — ukazuje žádaný rozsah výběrového souboru při požadované četnosti ±1 % a při pravděpodobnosti 95 %. Činl-li četnost znaků např. '/, (J>= 0,5), musi být rozsah výběrového souboru bezmála 10 000. Při mnohem nižší nebo mnohem vyiši četnosti znaků může klesnout pod 1000. oba již uvedené vzorce. Především je to směrodatná chyba průměru: Pak je to směrodatná chyba četnosti: Tuto směrodatnou chybu mohu stanovit libovolně. Vyplývá ze spolehlivosti, které chci dosáhnout: chci dosáhnout 95 %. 99 % nebo 999 "/„,? Čím má být odhad přesnější, tím větší musí být výběrový soubor. Na první pohled je však jasné, že v důsledku úzkého spojení směrodatné chyby s odmocninou rozsahu výběrového souboru se dvojnásobná přesnost vykupuje čtyřnásobným rozsahem výběrového souboru. Nemá proto smysl žádat větší přesnost, než je nezbytně nutné. Kromě toho potřebujeme p a q (= 1 — — p), resp. v případě „kladení různorodých otázek" směrodatnou odchylku a. Jestliže pro ně mám směrné hodnoty z dřívějších šetření, z literatury nebo z odhadů expertů, mohu je dosadit. Nemám-li vůbec nic. musím z opatrnosti předpokládat to nejméně příznivé — při rozptylu a nezná můj pesimismus téměř hranic. Při rozdělení četnosti je rovnoměrná pravděpodobnost p = q. jak hned uvidíme, tím nejméně příznivým případem. Vezměme znovu náš pytel ořechů (N = = 1000) a ptejme se: jak velký musí být vzorek, mám-li na jeho základě s 95% jistotou vědět, že podíl prázdných ořechů se neodchyluje o více než ±4 % od četnosti zvoleného výběrového souboru? Hledáme tedy n (rozsah výběrového souboru). Nejdříve upravíme pro naše účely rovnici vztahující se na náhodnou chybu četnosti a dostaneme: n = <>p)2 ' Dvojitá chyba četnosti má činit nejvýše ± 4 %, jednoduchá tedy ± 2 %.Tím je dán jmenovatel zlomku. O domnělém rozdělení nevím zatím vůbec nic, možná že je zkaženo půl pytle. Tedy p = q = = 0,5. Protože však chyba četnosti je vyjádřena v procentech, musíme je upravit na 0,02 (nebo: p = q = 50 %, ap = 2 %. Dostaneme tedy: 0.5 . 0,5 0.25 (0.02)2 0,0004 = 625. Museli bychom testovat více než půl pytle, abychom dosáhli takové přesnosti! Je účelné spokojit se s menší přesností: ±6%, ale nadále při 95% pravděpodobnosti. 0,25 0,25 (0.03)- 0.0009 = 278. Stále ještě příliš mnoho. Několik ořechů by jistě odpadlo, kdybychom použili opravného ^koeficientu pro malé základní soubory — pohodlnější by však bylo, kdyby v čitateli byla menší hodnota. Jak by tomu ale bylo v případě této úvahy: pytel ořechů nám darovali dobří přátelé, kteří tam jistě podle svých možností dali dobré ořechy, neboť koneckonců znají své ořešáky. Je-li 20% špatných, je to už jistě mnoho. Ted tedy p = 0,2. q = 0,8, přesně na 6% a °5 % spolehlivosti: (0,03)» 0,16 0,0009 5-* Rozsah výběrových souborů interval spolehlivosti nejméně 2 % jvýše 6 % nejvýše 37 % = 178. nejméně 33 % Interval spolehlivosti ve výši 4 % má různou váhu u malých a velkých podílů. Jestliže podii vzorku čini např. 4%. sahá interval spolehlivosti od 2 do 6 %. tedy až do trojnásobku. Čini-li podíl vzorku naproti tomu 35%. ie rozpětí ..mezi 33 a 37 %" dostatečné mforma-tivnl a přesné: 37 % je totiž jen asi o deset.nu větši než 33 %. 160 161 5. Výběry a dotazníky I to se může stále jcštč zdát nepříjemně mnoho k tomu, abychom zjistili kvalitu ořechu v pytli, ale nesmíme pominout všeobecnou platnost těchto a také již dříve zjištěných údajů. V daném případě nejde jen o ořechy, ale o toto zjištění: má-li být z velmi velikého základního souboru zjištěn s 95% spolehlivostí určitý znak, který se podle odhadu vyskytuje v pětině základního souboru, pak posťačí výběrový soubor o rozsahu n = 178, aby byl vypočítán podíl s přesností ±6%. Jestliže se tedy domníváme, že asi l/i až l/e všech občanů NSR bydlí ještě v domech, které byly postaveny před rokem 1900, postačí, abych se zeptal 178 náhodně vybraných osob na stáří domu, ve kterém bydlí. Odpověď bude na 95 % spolehlivá. Docílená přesnost však zdaleka nebude uspokojivá. Do-sáhneme-li výsledku asi p = 21 %, nevíme nic víc, než že nejméně 15 % (21 - 6 %) a nejvýše 27 % (21 + 6 %) osob bydlí ve starých domech. Tento interval spolehlivosti, 15 až 27 %, je nepochybně příliš veliký, přesto však může pro některé účely postačovat. V každém případě je ale třeba všimnout si, žé náhodná chyba četnosti (v našem případě rrp = 3 %) je tím závažnější, čím menší je relativní četnost znaků. Právě jsme viděli, že při p = 21 % interval spolehlivosti dvojnásobné směrodatné odchylky (pravděpodobnost jistoty 95 ze 100) činí vždy v obou směrech dvojnásobek a že proto docházíme k širokému intervalu 15 až 27 %. Jestliže je určitý znak velmi četný, nemusí se 12% rozpětí jevit jako přehnané: p = 52 % dává pak interval spolehlivosti právě od 46 do 58%. Je-li však podíl malý, dostaneme dokonce zcela nesmyslné výsledky. Předpokládejme například, že bychom dostali p = 7 %. 162 Tento výsledek by se musel vykládat takto: „s největši pravděpodobností mezi 1 % a 13%" — nepřihlížíme-li navíc k tomu, že intervaly spolehlivosti směrem k nule nejsou již symetrické. Kdyby tedy např. volební prognóza měla náhodnou chybu četnosti jen ve výši ±2%, znamenalo by to v případě velkých politických stran, které mají zhruba stejný počet hlasů, velkou nejistotu, a naopak u malých stran může rozpětí 4 % znamenat: „nejméně 3 a nejvýše 7 %" (ať žije malý rozdíl!). Ukázali jsme již, že rozsah výběrového souboru musí být největši tehdy, když p = q, tzn. při domněle rovnoměrném rozložení znaku a neznaku (po 50 %). To se však vztahovalo jen na absolutní rozpětí intervalu spolehlivosti. Musím prohlédnout 278 ořechů, abych mohl s ± 6 % vymezit okruh 50 %, ale postačí 178 pro ± 6% v oblasti kolem 20%. V oblasti kolem 10% by stačilo ještě méně ořechů. Relativní přesnost při 50% je přirozeně mnohem větší (interval spolehlivosti 44—56 %) než při 20 % nebo dokonce 10 % (interval spolehlivosti je 4—16 %). Podívejte se nyní, jak velký musí být rozsah výběrového souboru, aby se četnost odhadovaná jen na 4% zachytila s přesnosti ± 1 %■ což stále ještě znamená relativně široký interval spolehlivosti — „s největši pravděpodobností mezi 3 až 5 %". Protože se snažíme docílit pravděpodobnosti ve výši 95 %, odpovídá přípustnému rozsahu kolísání ve výši ± 1 % a„ v poloviční výši. Obdržíme tedy: (0.03) . (0.97) 0.029 (0.005)'- 0.000025 = 1160. Ano. rozsah výběrového souboru n — = 1160 by snad mohl být přijatelný. ^Spolehlivost výběrových .ouborů - intervaly .pol.M.vo,-. nebo pohodlněji počítáno s procenty: 40.60 Může nám však zaručit stejnou přesnost i při silně rozloženém znaku? Předpokládejme, že se má hledat znak s odhadovanou četností p = 0,4 (tj. asi 40 % souboru). Vypočítáme střední chybu četnosti pro tento případ a s nepříjemným překvapením zjistíme, že 1/(0,4). (0,6) - = 0.0143. Již jednoduchá směrodatná odchylka dává v tomto případě ± 1,43. požadovaná 95% pravděpodobnost dokonce dvojnásobek, tedy ± 2,86. Jestliže však zůstaneme při našem původním požadavku ± 1 % z 95% pravděpodobnosti, musíme rozsah výběrového souboru podstatně zvětšit, neboť: (0.4). (0.6) n = v = 9600. (0.005)3 Museli bychom se tedy dotázat alespoň 9600 osob, chceme-li pracovat s uvedenou přesností a spolehlivostí. To je však takový rozsah výběrového souboru, který se při dotazování téměř nikdy nepoužívá. Zpravidla je rozsah výběrového souboru mezi 2000 a 3000 dotazovaných, velmi zřídka větší, často ještě menší. Jakou přesnost bychom mohli na naši poslední otázku (odhadovaná četnost znaků p = 0,4) očekávat od výběrového souboru o rozsahu n = 2500 osob, jestliže se opět snažíme docílit 95% pravděpodobnosti? Dosadíme-li n = 2500 a p = 0,4 do známého vzorce, dostaneme: = 0.0098. 2500 = \ 0.96 = 0.98 Dvojnásobek 0.98 dává 1.96 nebo zaokrouhleně 2% a na tomto základě můžeme říci. že výběrový soubor o rozsahu n = 2500 může určit znak obsažený v základním souboru asi čtyřmi desetinami s přesností na ±2 %. a to s 95% pravděpodobnosti. Nic více nelze z výběrového souboru vyčíst. Přitom vycházíme vždy z přesvědčení, že před sebou máme ideálně náhodný výběr, tzn. výběrový soubor nezkreslený systematickou chybou a v důsledku toho ještě daleko méně přesný! Tak je také třeba číst výsledek šetřeni: „41.3% dotázaných" ve skutečnosti znamená: „s největši pravděpodobností ne méně než 39.3 % a ne více než 43.3 %". 5.5 Spolehlivost výběrových souborů — intervaly spolehlivosti Pravděpodobnost jistoty, spolehlivost, vypovídací schopnost, přesnost, interval spolehlivosti — je to vše totožné? Pokusíme se ještě zřetelněji ukázat souvislosti a rozdíly a především se nad těmito pojmy poněkud zamyslíme. Co je například spolehlivost'. Zpravidla jsme tím mysleli onu spolehlivost, která říká, že výpověď je z 90 nebo 95 % správná. To je pravděpodobnost jistoty, která vymezuje také interval spolehlivosti a kterou se budeme ještě zabývat podrobněji. „Spolehlivost" se však může vztahovat také na všeobecnou kvalitu statistické výpovědi. V tomto smyslu např. systematická chyba narušuje spolehlivost. 163 5. Výběry a dotazníky Další otázkou je, zda vytvářeni výběrových souborů je vůbec spolehlivou vědeckou metodou. Kromě toho experiment musí být zásadně opakovatelný. Specifikem statistických experimentů však je, že nelze téměř nikdy docílit přesně stejných výsledků, nýbrž jen velmi podobných. Zkoumání výběrových souborů má být opakovatelné, jeho výsledky však mohou být pouze navzájem porovnatelné, nikoli totožné. Další požadavek, který se klade na všechny vědecké pokusy, je požadavek významnosti, vypovídací schopnosti a důležitosti: musí se skutečně dokázat to, co má být dokázáno, nikoliv jen něco podobného. Vraťme se však zpět k 95% pravděpodobnosti jistoty, ke stupni jistoty. Co si pod tím máme představit? Můžeme opět pomyslit na rozdělení četnosti pod normální křivkou a předpokládat soubor všech možných výběrových souborů v rozsahu n jako normálně rozdělený. Pak 95% pravděpodobnost znamená, že výběrový soubor, který jsme právě náhodně vytvořili, je právě v toleranci 95 %, které dávají střední hodnotu x, ležící maximálně 2a od skutečného průměru [t. Zda postačí 95 % jistoty nebo nikoliv, nelze říci všeobecně. O tom je třeba rozhodnout v každém jednotlivém případě samostatně. Jestliže se nemá vydat moc peněz a postačí-li přibližný přehled (jako např. u mnohých otázek průzkumu trhu), je postačující 90% nebo ještě nižší jistota. Jde-li o zvlášť významné, velmi závažné rozhodnutí, bude snaha dosáhnout 99% nebo ještě vyšší pravděpodobnosti. Za postačující se však zpravidla pokládá 95% pravděpodobnost. Jestliže chceme dosáhnout vyšší spolehlivosti, je nutno zkoumat větší výběro- 164 vé soubory. Není-li to z nějakých důvodů možné, pak také nelze dosáhnout žádaného stupně jistoty — a dost! Nepomohou žádné početní triky řj okliky a ani jiné komplikované kejkle neposkytnou východisko. Rozsah výběrového souboru a spolehlivost výsledku výběrového souboru jsou také v nejužší logické a matematické souvislosti s úkazem, který jsme pozorovali při prvním výkladu binomického rozdělení a Pascalova trojúhelníku: v protikladu k naivní představě o „zákonu velkých čísel" neexistuje sice přesné ustálení výkyvů na očekávané hodnotě, přesto však při rostoucím rozsahu výběrového souboru se budou proporce výběrového souboru relativně (ne absolutně!) méně odchylovat od skutečné proporce souboru základního. V ruletě to například znamená: je zcela dobře myslitelné, že ve „výběrovém souboru" dvaceti po sobě jdoucích her je 16 červených a jen čtyři černé, to znamená odchylka o 6 od očekávané hodnoty 10. Naproti tomu je zcela vyloučeno, aby z 2000 her bylo 1600 červených a jen 400 černých. I poměr 1100 ku 900 by byl velmi nepravděpodobný. S rostoucím rozsahem výběrového souboru bude tedy stále přesněji zaměřován skutečný průměr základního souboru (který v případě rulety známe). Při rozsahu výběrového souboru n = = 20 se mohu velice zklamat (např. jako u neuvěřitelného výsledku 16 červených, 4 černé), při n = 200 se však mohu spolehnout, že neskončím příliš daleko od pravdy. To je „zákon velkých čísel" v teorii a praxi výběrových souborů. Pravděpodobnost výběrového souboru mohu také definovat ze záporného hlediska a obdržím „riziko chyb"; 95% pravděpodobnost znamená 5% riziko 5.6 Syste chyb. Máme-li pro „pozitivní" a „negativní" dva různé výrazy, stane se situace ještě zmatenější, když se začne mluvit o „hladině významnosti". Není to zvlášť šťastně zvolený výraz, ale přesto je velmi rozšířen. „Významnost" je prakticky totéž co pravděpodobnost: výsledek je „statisticky významný na úrovni 5 %", protože by jen čirou náhodou nenastal v 95 % případů. Celá rozsáhlá oblast testování hypotéz (viz kap. 6), která nás bude ještě velmi zaměstnávat, se zakládá na takovýchto úvahách a výpočtech: je nebo není dosažený výsledek slučitelný s tou nebo onou hypotézou? „Významnost" není tedy nic jiného než dohoda mezi těmi, kdo statistické metody používají. A zcela stejně jako u pravděpodobnosti lze různě posuzovat úroveň významnosti v závislosti na kladení otázek. Zpravidla se všeobecně pokládá úroveň 5 % (nazývaná také často úroveň 95 %) za „významné", úroveň f % (99 %) za „vysoce významné". Pravděpodobností jistoty je také zároveň určen interval spolehlivosti. Tento interval se měří jako směrodatná odchylka normovar.^lio normálního rozdělení nebo také i v absolutních hodnotách. Měli jsme již příklady pro oba způsoby vyjádření: Úspory mají rozptyl s = 60 kolem průměru x = 480, interval spolehlivosti (95 %) sahá od 360 do 600 DM, totiž od (480 — 2a) až do (480 + 2a). Mám 95 % jistoty, že náhodně vybraný rolník má více než 360 a méně než 600 DM úspor. Poznámka: Pozor na záměnu pravděpodobnost jevu a pravděpodobnost statistického rozboru. Pravděpodobnost četnosti nějakého znaku zjištěná ve vzorku (proporce výběrového souboru p) je nezávislá na pravděpodobnosti jistoty matické chyby - „předběžný výpoc«ť- tohoto vzorku. Mohu vytvořit tři vzorky o rozsahu n, = 20, n, = 100 a n, = 500. které (náhodou) všechny mají četnost výběrového souboru p = 0.7 (tedy 70 %) znaku. Avšak kvalita, vypovídací schopnost, pravděpodobnost jistoty malého výběrového souboru budou podstatně nižší než u většího souboru. Nyní představíme zcela krátce ještě dva zvláštní případy praxe výběrových souborů — výběrové soubory poskytující přesnější výsledky než vyčerpávající šetření, a to výběrové soubory, na kterých je založen „předběžný výpočet". 5.6 Systematické chyby — „předběžný výpočet" V článku německého odborného časopisu „Wirtschaft und Statistik" bylo se zřetelem na sčítání lidu z května 1970 řečeno mimo jiné: „Teprve při sčítání lidu v roce 1970 se důsledně sledovalo omezení vyčerpávajícího sčítání na ony znaky, pro které jsou potřebné pokud možno přesné výsledky regionálně vymezených malých jednotek: všechny ostatní znaky je však třeba zjistit jen za reprezentativní rozsah 10% domácností, protože tyto výsledky... reprezentují skutečnost dostatečně přesně a... systematická chyba je jistě menší než při jejich začlenění do vyčerpávajícího zjišťování." Poslední část věty je nutno pozorně přečíst ještě jednou, abychom zcela pochopili, co se vlastně říká: Celá řada otázek byla úmyslně dána jen 10% domácností NSR, a nikoliv všem domácnostem, protože „systematická chyba je jistě menši než při jejich začlenění (takových znaků) do vyčerpávajícího zjišťováni". Výběr je přesnější než vyčerpávající zjišťování, část dáva lepši 165 5. Výběry a dotazníky informace o celku než celek sám?! Zbláznil se někdo? Neodporuje to zcela tomu, co jsme se dověděli o pravděpodobnosti výběru? Domnělý rozpor se rozplyne, jakmile upozorníme na výraz „systematická". Náhodná chyba výběru je vždy větší než náhodná chyba základního souboru, neboť u celkového souboru není žádná náhodná chyba; náhoda je nahrazena jistotou, odhad úplnou a celou skutečnosti. U systematické chyby je tomu jinak. Vezměme jednu z otázek, které byly kladeny jen při výběru. Otázka 27: „Jste — mistr v průmyslu, dílenský mistr nebo podobně? (Vedoucí čety, předák nebo podobně? Vedoucí, obchodní vedoucí, člen představenstva nebo podobně? Činný ve vedení nebo v dozoru?)" Nad těmito otázkami se ještě uvádí: „Pro osoby ve vedoucím nebo dozorčím postavení (bez samostatně činných)." Předpokládejme nyní. že tento znak nějakého vedoucího postavení je vhodný pro 14% základního souboru i výběru. Mnozí z dotazovaných si však mysli, že musí k této otázce něco uvést, anebo snad chtějí imponovat sami sobě či statistickému úřadu a vyplní „předák nebo podobně". Jestliže z těch 86% ve skutečnosti ,.ne vedoucích" se jen malý zlomek tomuto impulsu poddá, posune se procento údajně „vedoucích" ze 14 nc. řekněme, 17%. A teď uvažujme. Jestliže se výběr zakládá na přesnosti ± 3 % (při jedné desetině všech domácnosti je ovšem ještě podstatně přesnější), je výsledek tento: „Podíl osob ve vedoucím postaveni je s 95% jistotou mezi 14 a 20 %." Přes značnou systematickou chybu vzniklou nesprávným zodpovězením otázky se přece jen objeví správný po- 166 díl 14%, tvořící krajní mez intervalu spolehlivosti. Dostaneme-li 17% na základě vyčer-pávajiciho zjišťování, pak v tomto výsledku již není náhodná chyba a vý-poveď musí znít: „Podíl osob ve vedoucím postavení činí 17 %." Tato výpověď je méně správná a více matoucí než výsledek výběru, přesto nebo právě proto, že byl zahrnut celý základní soubor. To. co vidíme v tomto zvláštním úkazu, není nic jiného než pliživý průnik nepoznané systematické chyby, která je ve výběrovém souboru skryta pod širokým pláštěm velkorysé náhodné chyby, potom však neustále sílí, až nakonec zcela pohltí náhodu, avšak systematická chyba sama zůstane nezlomena, nezakryta a také nepoznána. Nakonec několik slov o módním výrazu „předběžný výpočet" (Hochrechnung), který přešel z oboru zpracování dat výpočetní technikou do slovníku všedního dne. Zásadou „předběžného výpočtu" je úsudek z časti na celek: Mám zlomkovité výsledky a vypočítám z nich domnělý celkový výsledek. To je v podstatě stejný postup jako při vyhodnocování výběrových souborů a někdy se ve výrazu „předběžný výpočet" pro tento postup opravdu používá. Např. Haseloff uvádí ve své „Malé učebnici statistiky" tuto definici: „^Předběžný výpočet* označuje transformaci výběrového souboru do velikostních dimenzi základního souboru." Nejpopulárnější případ „předběžného výpočtu" poskytuje předpověď celkového volebního výsledku po obdrženi prvních dílčích výsledků, což již několik let provádějí rozhlasové a televizní stanice krátce po uzavření volebních místností, a to pomocí počítačů s odpovídajícím programem. HOCHGER. ,969 WAHLERGEBNIS ■H I965 sílí v.H. SITZE v.H. CDU-CSU 45. 2 248 47.6 SPD 4I . 6 2 I9 39. 3 FDP 5. 5 29 9. 5 NPD 4. 5 --- 2.0 iMMMto I G E J UHU IM6 Předběžný výpočet (Hochrechnung) volebního výsledku z dílčích výsledků je velmi podobný rozboru výběrových souborů, nikoliv však totožný. Někdy se takto vypočítávají i docela jiné údaje, a proto je nutno upozornit na skryté významové rozdíly. Jestliže se např. „předběžný výpočet" výsledku šetřeni provádí tři týdny před volbami, kdy nejsou k dispozici žádné skutečně odevzdané hlasy voličů, žádné spočítané volební lístky, ale existuje jen průzkum mínění, napadnutelný již v samých svých základech, dovoluje to pouze tuto výpověď: „Na základě výsledků šetření se může předpokládat, že v den šetření (!) by se voliči rozhodli tak a tak. Tento odhad je s 95% pravděpodobností přesný na ± 2 %." Jiným extrémem „předběžného výpoč- tu" je, když se např. na základě měrných údajů rakety letící na Mars pomoci počítače „předběžné vypočítává" celková doba letu. V daném případě se dávají velmi rychle do vzájemných vztahů matematické a fyzikální skutečnosti a nejde již o odhad nebo pravděpodobnost, ale o přísně logické početní závěry: „Jsou-li dány A, B a C a tisíc a jedna jiných měrných hodnot, trvá let přesně 4 měsíce 3 dny 8 hodin a (budiž) asi 10 vteřin až do přistání na Marsu." Takový „předběžný výpočet" není v zásadě nic jiného než závěr tohoto typu: když 3 — 2 = 1. pak 3000 — 2000 = 1000. 167 5. Výběry o dotazníky Proto nebudeme z opatrnosti používat mnohoznačný výraz „předběžný výpočet", který ani nepochází ze statistiky. Navíc jej vůbec nepotřebujeme. To nás ovšem vede (na základě zásady „z opatrnosti nepoužívat") k jinému slovu, které se v moderní statistice velmi často vyskytuje, a to „parametr". Kdybychom porovnali definice, kterých se používá, vyšlo by najevo, že nejsou zcela prosty rozporů. Všeobecně však jde o něco takového jako „charakteristické hodnoty": například normální rozdělení vyznačuje parametr střední hodnoty a rozptylu. Také medián a š/kmost rozděleni jsou takovými parametry. William B. Bean, šéfredaktor jednoho amerického časopisu, napsal správně v článku proti přehánění při módním používání cizích slov: „Jsou zvučně znějící slova, jako např. »parametr«, avšak z padesáti lidí, kteří toto slovo používají, jeho skutečný význam možná nezná ani jediný." SlyŠíte-li tedy nebo čtete slovo parametr, nenechte se jím zastrašit a nehledejte v něm bůhvíco. Pomyslete na charakteristickou hodnotu, to postačí. V této knize se obejdeme bez parametrů. I tak to jde. Jen tenkrát je nutno při slově „parametr" napnout pozornost, a to když se mluví o „neparametrickém testu". Jsou to testy zabývající se testováním výběru bez ohledu na rozdělení základ- ního souboru — mimo jiné proto, že o tomto rozdělení není nic známo nebo že je důvod k domněnce, že není ani normální, ani binomické. Některé testy se proto také nazývají „testy nezávislé na rozdělení"; jsou to především tzv. „testy pořadí", o kterých budeme ještě mluvit v desáté kapitole (viz str. 335). Výraz „neparametrický" se vztahuje na dohodu, že se „parametr" ponechá jen pro základní soubor: např. pan jsou parametry, x nebo s však nikoliv. Jiné dnes velmi často používané slovo je „stochastický" — a také v tomto případě je člověk v pokušení vzpomenout na Beánovu kousavou poznámku o módě cizích slov. Toto slovo pochází z rané doby počtu pravděpodobnosti (razil je už jeden z bratří Bernoulliů), znovu je objevil na počátku našeho století Bort-kiewicz z příkladu o úderech kopyt, ale teprve po druhé světové válce se stalo módním vědeckým výrazem. Neznamená koneckonců nic jiného než „náhodný", „podřízený pouze zákonům náhody". Náhodná rozdělení jako rozdělení normální, Poissonovo a binomické jsou příkladem stochastických rozdělení. Gůnter Menges uvádí ve svém díle „Základy statistiky" lapidárně toto: „Všechno, co je vybudováno na počtu pravděpodobnosti nebo s ním má cokoli společného, se označuje jako »stochastika«." 6 O zacházení s hypotézami 6.1 Pod kontrolou O pytli s tisícem ořechů, jímž jsme se zabývali již několikrát, jsme předpokládali, že je to dar dobrých přátel. Vlastně jsme z něho neměli ani brát výběrové soubory, protože darovanému koni na zuby nehleď. (To „nehleď na zuby" je také jakýsi druh výběrového souboru: podle stavu zubů se odhaduje stav a stáří „základního souboru" — koně.) Mnohem častěji však půjde o to, abychom se přesvědčili o kvalitě zboží, za které musíme zaplatit hotově. Tím se stává namátkový výběrový soubor přesně dojednanou přejímací kontrolou. Kupující upozorňuje předem prodávajícího: převezmu zboží jen tehdy, jestliže ve výběru určitého rozsahu nepřekročí počet špatných kusů určitý počet. Prodávající by naproti tomu měl předem vědět, na jaký druh přejímací kontroly může přistoupit a v kterém případě se má lákavé objednávky raději vzdát: měl by totiž na základě běžné výrobní kontroly být schopen posoudit, do jaké míry asi jeho zboží odpovídá požadavkům kupujícího. Přejímací kontrola — výrobní kontrola: na první pohled se zdá, že jde o totéž. Vytvoří se výběrový soubor odpovídajícího rozsahu a na tomto základě se stanoví, jaké množství z daného souboru je bezpochyby příliš lehké nebo příliš malé, příliš těžké nebo příliš velké, příliš křehké nebo příliš nečisté. Přesto jde o dva sice podobné, nicméně zároveň zcela odlišné postupy. Výrobní kontrola se provádí běžně a má umožnit včas poznat a odstranit vyskytující se výrobní závady — např. seřízením určitého stroje nebo vyřazením zvlášť nepozorného pracovníka z výrobního procesu. Odběratelská kontrola se naproti tomu týká kvality těch výrobků, které již prošly sítem výrobní kontroly a o kterých se výrobce domnívá, že plně odpovídají jeho normám kvality. Při výrobní kontrole je dále nutno si všímat přesně odchylek na obě strany, protože zatímco kupující může např. pozastavit jen zboží s nižší váhou, nemá výrobce zájem dávat zákazníkovi dary prostřednictvím zboží nad váhu. Ve výrobní kontrole je heslem: výrobní proces je „pod kontrolou". To nemusí bezpodmínečně znamenat, že každý kupující bude spokojen a každá přejímací kontrola uspokojivá. Proces je totiž „pod kontrolou" tehdy, jestliže nevykazuje žádné abnormální výkyvy, ale může se stát, že pro některé zájemce jsou normální, v podniku obvyklé výkyvy již příliš velké. Pak je sice výrobní proces statisticky „pod kontrolou", ale při přejímací kontrole vznikají neustále potíže. Podívejme se třeba na tento příklad: Stroj vyrábí kovové rámy. které mají mít světlou výšku nejméně 82.5 a nejvýše 83.5 cm. Z první výrobní série se odebere 100 kusů. přesně se změří a zjisti se. že průměr výběrového souboru je x = 83.02 a směrodatná odchylka j -= 0,11. Protože jde o normálni rozdělení, vyskytnou se odchylky za trolle* 6. O zacházení s hypotézami dolní mez tolerance horní mez tolerance Jestliže stroj pracuje s menším rozptylem, než jaké jsou meze tolerance odběratele, nemůže ani extrémní odchylka narušit strojní výrobu. Jestliže výrobky daného stroje mají již od počátku tak velký rozptyl, že se meze tolerance stále porušují, může snad být výrobní proces tohoto stroje statisticky „pod kontrolou", ale jakost výrobků není vyhovující. 1— nevyhnutelné zmetky násobkem směrodatné odchylky jen dvakrát až třikrát při tisíci pozorováních. Bude-li proces probíhat dále tak jako na začátku, můžeme předpokládat s 99% jistotou, že se nevyskytne žádný výsledek měření nad ± 0,33 cm. Jestliže se však při pozdějších výběrových souborech ukáže, že se podobné výsledky vyskytnou častěji, není již výrobní proces statisticky „pod kontrolou". A co se má stát teď? Především je třeba klidně rozvážit, co to znamená v praxi podniku. Je katastrofa, že každý stý rám měří např. méně než 82,69 cm (tzn. 83,02 — 0,33)? Jistě ne, protože dokonce ještě do 82,5 cm plní svůj úkol. Vyrábí se proto klidně dál jako dosud. Nanejvýš se budou brát výběrové sou- bory poněkud častěji než dosud, aby se zjistilo, zda stroj „nejede podle svého" a nevyrábí ze dne na den stále menší (nebo prostě nepravidelnější) rámy. Mnohem horší je druhý případ: nechť je pro daný účel použití i nadále trpěna tolerance ± 0,5 cm, ale stroj dává produkci o průměru x = ± 83,2 a s = = 0,25. To však znamená, že horní hranice tolerance bylo již dosaženo při 1,2 cr a pohledem do tabulky normálního rozdělení zjistíme, že celých 11,5 % výroby je nepoužitelných. (Při dolní hranici tolerance není situace tak zlá: od 83,2 do 82,5 cm jsou téměř 3 a.) V daném případě je tedy výroba zcela „pod kontrolou", tzn. má normální rozptyl kolem střední hodnoty — a 170 gjl Přejímací kontrola přesto musí být téměř 12% produkce vyhozeno, sešrotováno nebo roztaveno. Snad by bylo možno pomocí velmi přesné úpravy dojít k žádoucímu ii = 83,0, ale i potom by část výroby byla mimo hranice tolerance 82,5 až 83,5 cm: v tomto nejlepšim případě by bylo asi 4,5 % zmetků. Stroj již zřejmě není pro požadovanou přesnost dostatečně dobrý, neboť rozptyl je příliš velký. Musí se použít jiný, lepší stroj, neboť stroj, který nepracuje dostatečně přesně, nelze okouzlit ani nejzvučnějšími statistickými formulemi. 6.11 Přejímací kontrola Odběrateli je zcela lhostejné, co se děje při výrobní kontrole. Pro něho je rozhodující přejímací zkouška, i když někdy se může dohodnout o předání záznamů výrobní kontroly, aby se zjednodušila přejímací kontrola. Je třeba, aby se na podkladě vzorku nalezlo měřítko pro složení celé partie zboží. Na první pohled se zdá, že ideální je případ, kdy průměrná výrobní kvalita výrobce A přesně odpovídá požadavkům odběratele B. Předpokládejme, že výroba v průměru vykazuje 1 % vadných výrobků a odběratel je ochoten toto 1 % trpět. Má být dodáno 1000 kusů a dohodne se rozsah výběrového souboru n = 100. Odběratel je ochoten převzít zásilku i tehdy, jestliže se v tomto výběrovém souboru najde jeden vadný kus. Přesto by byl tento postup pro obě strany nanejvýš nepříjemný. Co se stane? Poissonovo rozdělení udává pro výskyt „řídkého jevu: zmetek" tyto pravděpodobnosti: žádný zmetek ve výběru: p0 = - = 0,37 1 jeden zmetek: pt = — . 1 = 0,37 dva nebo více zmetků: Psa.íc. = 1 —(0-37 + 0.37) = 0,26. Ve více než jedné třetině případů bude zboží s 1 % vad vypadat jako odpovídající, ve čtvrtině případů bude odmítnuto, protože výběrový soubor bude obsahovat dva nebo více zmetku. Přitom je nutno zdůraznit, že odběratel je stejně neuvěřitelně tolerantní nebo naivní, když je ochoten souhlasit s 1 % závad ve vzorku, neboť se musí právem obávat, že celková četnost bude vyšší než ve výběrovém souboru. Na základě zásady „výrobní jakost přesně odpovídající požadované jakosti" se na delší dobu nevytvoří prospěšný obchodní styk. Skutečná četnost chyb ve výrobě musí být spíše nižší než ta, kterou akceptuje odběratel. Jen tehdy se vytvoří ono mezi-pásmo, ve kterém hra náhody (náhodný vzorek) může působit, aniž dojde k nadměrnému poškození zájmů některého z obou partnerů. Snadné je to tehdy, když je výroba mnohem lepší, než je naprosto nutné. Zcela bez problémů je ideální případ absolutně bezvadných sérií, protože není-li v základním souboru ani jediný závadný kus, nemůže se objevit ani ve vzorku. S takovým ideálním případem nelze ovšem vůbec počítat. Spíše je nutno vycházet z realistického předpokladu, že veškeré vyráběné zboži nemůže být opravdu dokonalé, a proto se hledá způsob, jak nalézt takový zkušební postup, který by vyhovoval jak odběrateli, tak dodavateli a především nebyl příliš nákladný. Jinými slovy: je 6. O zacházeni s hypotézami dohodnutá kontrolní mez pro odbytovou kontrolu 12% 14% neznámý soubor (jakost uspokojivá) 16% rozdělení, které nevyhovuje odběrateli (jakost neuspokojivá) Při Setřeni výběrových souborů se mohou stát dvě chyby. Výběrový soubor může zcela náhodou vypadat mnohem hůře, než jaký je skutečně celkový soubor — je to takzvaná „chyba alfa" nebo „chyba prvního druhu" (graf nahoře — dobré nebo správné se tím odmítá). Výběrový soubor však může být náhodou také mnohem lepší než základní soubor — „chyba beta" nebo „chyba druhého druhu" (graf dole — špatné, nesprávné, závadné se přijímá). dohodnuté kontrolní meze rozdělení, které odběratel očekává neznámý základní soubor (jakost neuspokojivá) 6-11 Přejímací kontrola libovolně stanovená mez alternativní hypotéza nulová hypotéza nulová hypotéza se zamítá nulová hypotéza se nezamítá I testy hypotéz jsou stále ohrožovány chybami alfa a beta. Nulová hypotéza může být zamítnuta, ačkoliv je správná, nebo také nezamítnuta, ačkoliv je nesprávná. třeba vytvořit přejímací kontrolu, která při pokud možno malém výběrovém souboru poskytne záruku, že odběratel — pokud dodrží svůj výrobní standard (obr. na str. 172) — dostane s největší pravděpodobností uspokojivou jakost a prodávající vysokou pravděpodobnost přejímky bez závad. Oba, odběratel i dodavatel, musí podstoupit jediné riziko: odběrateli se může stát, že náhodný vzorek je podstatně lepší než skutečná jakost celé dodávky. Výrobci se může přihodit, že sice vyrobil zcela dobré zboží, ale že téměř všechny vadné exempláře proklouznou do výběrového souboru. Předpokládejme např., že odběratel by byl ochoten akceptovat 2 % zmetků, zatímco výrobce ví, že jeho výroba jich má asi 1 %. V celkovém množství 1000 kusů je tedy jen asi 10 vadných. Vzorek o rozsahu n = 100 byl stanoven dohodou. Může klidně očekávat přejímací zkoušku? Ne zcela. Je dobře možné, že ve vzorku jsou tři vadné kusy: Šest ze stovky uskutečněných výběrů tedy bude obsahovat tři kusy zmetků, přinejmenším jeden z dalších dokonce čtyři nebo více. A k tomu ještě toto: žádný odběratel nebude souhlasit se stokusovým výběrovým souborem se dvěma vadnými kusy, když chce mít jistotu, že v celkovém množství není víc než dvě procenta zmetku. Dříve než se budeme v krátkosti zabý- 173 6. O zacházeni s hypotézami vat početními postupy, které byly vymyšleny k dosažení vzájemně přijatelného rozložení rizika, musíme ještě objasnit povahu těchto rizik. Brzy totiž uvidíme, že v daném případě nejde jen o čistě obchodní vztahy mezi odběratelem a dodavatelem, nýbrž že celá oblast výběrové analýzy je ovládána a doslova zastiňována tématem rizika. Výběr poskytuje — to již konečně víme — jen upozornění, nikoliv však závazné výpovědi o celkovém souboru. Nevykazuje zpravidla přesně stejné proporce chyb nebo zcela správnou střední hodnotu základního souboru. To jsme přesně prokázali i v jednotlivostech u ořechů. Jestliže je tedy odběratel např. ochoten souhlasit s 15 % špatných ořechů a výběrový soubor vykáže 13 %, podstupuje stále ještě jisté vypo-čitatelné riziko, že bude mít v celkové dodávce přece jen více než 16 % vadného zboží. Zcela opačný případ nastává, když vzorek vykazuje 16% zmetků a odběratel právem dodávku odmítne, ačkoli by další zkouška ukázala, že skutečný podíl špatných ořechů činí dokonce jen 12%. Tento případ odmítnutí dobrého, správného nebo odpovídajícího na základě nesprávného vzorku se označuje jako výskyt „chyb prvního druhu", někdy také nazývaných „chyby alfa". Opačný případ, tj. přijetí špatného, nesprávného nebo neodpovídajícího na základě příznivého vzoru, je takzvaná „chyba druhého druhu" nebo „chyba beta". Představují jakousi Scyllu a Charybdu analýzy výběrových souborů. Jak se jim lze vyhnout? (Viz obr. na str. 173.) Jednu známou pravdu jsme již uvedli: neni-li žádný exemplář vadný, nemůže se objevit ani ve výběrovém souboru. To je případ nejlepšího žáka: ať padne Každá zkouška je výběrovou analýzou. Z „bedny" mozku jsou taženy „kuličky" vědomosti nebo nevědomosti a z toho se usuzuje na celkový stav vědomostí v mozku. při zkoušce jakákoliv otázka, může na ni odpovědět. (Protože každá zkouška je přirozeně vzorkem — výběrem ze zásob znalostí zkoušeného.) Druhý extrémní případ jsme již naznačili. Jestliže je kupující ochoten převzít 6 % špatného zboží (nebo uzná-li toleranci ± 1 cm), zatímco výrobce má jen 1 % zmetků (případně výrobní toleranci ± 0,3 cm), bude mít přejímací zkouška skoro vždy dobrý průběh. Třetí extrémní případ jsme již také načrtli. Jestliže zákazník žádá jako minimální kvalitu to, co je výrobce schopen dodávat jako průměrnou jakost, bude výběr skoro vždy uvádět v omyl a uspokojivý obchodní styk bude prakticky nemožný. Realita všedního dne a hospodářského života sotva zná tyto extrémy. Abso- 174 6-11 Přejímací kontrola Plánovaná křivka zkoušky, operační charakteristika podle zobrazeni Wallise — Robertse. Dodavatel věří, že nevyrábí více než 5 % zmetků, odběratel je ochoten převzít maximálně 15% zmetků. Rozsah výběrového souboru je 40 a smějí v něm být nanejvýš tři vadné kusy. Při této přejímací kontrole jsou rizika odběratele a dodavatele přibližně stejně velká (v obou případech něco přes 10%). 1,0- | riziko dodavatele 0,05 0,10 0,15 0,20 0,25 podii zmetků v základním souboru 0,30 lutně bezvadná sériová výroba zůstává zbožným přáním. Kupující, který převezme zboží ze 6 % špatné (a podle toho zaplatí), nepůjde k výrobci, který vyrábí nepoměrně lépe (a podle toho si dá zaplatit). Kdo musí odmítnout každou druhou dodávku pro nedostačující jakost výběrového souboru, bude si muset hledat velmi brzy jiného dodavatele. Skutečnost leží mezi těmito dvěma extrémy a v této oblasti se rozvíjí teorie a praxe přejímací kontroly. Podívejme se pro lepší pochopení na tento případ Hanse Kellerera: Celková dodávka má rozsah N = 10 000. Výrobce je přesvědčen, že jen 1 % je vadné (M = 100, M/N = P = 0,01): odběratel je ochoten souhlasit se 4 % zmetků. Dojedná se výběrový soubor o rozsahu n = 200 a ještě přijatelný podíl chyb m/n = 0,2, tedy maximálně 4 špatné z 200. V tomto případě se vypočítává „chyba prvního druhu" (výrobcovo nebezpečí odmítnutí) ve výši 5 %, „chyba druhého druhu" (riziko odběratele při nejisté kvalitě celkového souboru zboží) ve výši asi 10 %. Nechceme se v podrobnostech zabývat vzorci pro výpočet těchto hodnot. Na rozdíl od normální křivky neexistuje postačující jednoduchá tabulka, ze které by bylo možno vyčíst odpovídající údaje pro všechny rozsahy výběrových souborů a možného rizika. Pro každý jednotlivý případ musí být vypracována specifická „plánovaná křivka zkoušky", která může mít velmi rozdílnou podobu. Tato „operační charakteristika" (0C-křivka) vyjadřuje graficky, jaká je pravděpodobnost chyb prvního, resp. druhého druhu při zvolené metodě náhodného výběru. V každém jednotlivém případě jsou možné četné (až nesčetné) plánované křivky zkoušky. Při N = 10 000 jsme již určili vzorek n = 200 a v něm jsme pokládali m = 4 za nejvýš přijatelnou hodnotu s tím výsledkem, že prodávající nese riziko ve výši 5 % a kupující ve výši 10 %. Místo toho bychom mohli zvolit n -= 230 (a ponechat m = 4); z toho by vyplynula poněkud změněná křivka — s větším rizikem pro výrobce a menším pro kupujícího. Mohli bychom zvolit 175 6. O zacházení s hypotézami 6.11 Přejímací kontrola menší rozsah výběru, což by znamenalo pro oba partnery nižší náklady, ale větší nejistotu. Mohli bychom dosadit n = 1000 a m = 19, což by vedlo k velmi „citlivé", ale také nákladné zkušební metodě. Mezi tím jsou však možné všechny rozsahy výběrových souborů. Jde-li o „nespojité znaky" (také v obecně alternativní formě „dobrý — špatný"), nesmí se zvolit příliš malý rozsah výběrového souboru zvláště tehdy, když se má dosáhnout jen velmi malého podílu pravděpodobnost převzetí (Wa) podíl v % vadných exemplářů. Jestliže kupující akceptuje nejvýš 1 % zmetků, nebude asi výběr v rozsahu n = 100 uspokojivý, protože i když je v takovém výběru jen jediný vadný kus, má kupující již velké přejímací riziko. Prakticky může převzít zboží jen na základě úplně bezvadného vzorku, a to je zase velká nevýhoda pro výrobce. V běžné praxi přejímací kontroly nejde ovšem ani tak o to najít postup, který by se choval přesně stejně ke kupujícímu i k prodávajícímu a který by 100 T 1,0 Wa, 80- -0,8 60- -0,6 40- -0,4 20- -0,2 0- -0 \l \ 9 cínovaná 1 = 10000 křivka z n = 200; couiky c = 4) \ ^^^^ Pí 0,01 0,02 0,03 • Pj vadné ku*y v základním souboru 0,04 0,05 0,06 0,07 podíl (P) 1 Operační charakteristika (plánovaná křivka zkoušky) pro výběrový soubor n = 200, ve kterém smějí být aí čtyři (e = 4) vadné kusy. Levá stupnice udává pravděpodobnost převzetí výběru. Jestliže skutečný podii vadných exemplářů je jen 1 %, vypočítá dodavatel své 6 7 procenta (100 P) riziko (pomocí chyby alfa) na 5 %• Pro odběratele je riziko (chyba beta) asi 10 %. protože v souboru jsou 4 nebo více procent vadnycn exemplářů, ačkoliv vzorek udával jen l/o (totiž 4 mezi 200). (Podle vyobrazení H. Keii -rera.) přesně rozdělil riziko, ale přistupují k tomu faktory nematematické povahy. V závislosti na pozici, z níž se vyjednává (stav na trhu atd.), dosáhne někdy jeden, jindy druhý obchodní partner příznivějších přejímacích podmínek. Pro oba je ovšem důležité, aby přesně znali operační charakteristiku dohodnutého postupu zkoušení: co se na první pohled jeví jako fair, ukáže se při bližším zkoumání jako značně unfair, jak jsme již konečně viděli. Někdy se také dohodnou „sekvenční výběry" (česky se též ne zcela přesně říká „postupný výběr"), protože se tak dosáhne zmenšení rozsahu vzorku, aniž se tím riziko příliš zvětší. Teoretické základy sekvenčních výběrových šetření, které vypracoval ve čtyřicátých letech v USA Abraham Wald, jsou z nejnovější doby a velmi obtížné. Načrtneme jen krátce základní myšlenku, která je stejně jednoduchá jako zřejmá. Nejdříve se vybere poměrně malý vzorek a na jeho základech se ihned rozhodne v případech, kdy se dosáhlo extrémních hodnot: jestliže se např. ve vzorku o rozsahu n = 50 nenajde ani jeden vadný kus, dodávka se převezme. Jsou-li v něm dva nebo více zmetků, dodávka se odmítne. Jestliže je vadný jen 1 kus, rozšíří se vzorek o další kusy, přičemž musí být předem dohodnuta kritéria pro tento výběrový postup. Může se třeba předem dojednat rozšíření n = 100. Ne-vyskytne-li se přitom další vadný kus, dodávka se přijme; vyskytnou-li se dva vadné, odmítne se; vyskytne-li se jeden, provede se rozšíření např. na n = 140, a pak se již nesmí vyskytnout žádný vadný kus. Ale tak. jak je zásada jednoduchá, je složitý přesný propočet rizika chyb prvního a druhého druhu. Nezbytně počet vadných 0 70 40 60 80 100 120 140 160 180 200 rozsah vyberu Sekvenční výběrová analýza podle vyobrazeni u Wallise-Robertse. Vyskytnou-li se dva vadné exempláre dříve, než rozsah výběrového souboru dosáhne n = 40, je zásadně odmítnut. Jestliže však naproti tomu pri n = 100 je stále ještě jen jediný vadný exemplář, přijímá se. 0 5 10 15 20 25 30 B lepši než A Sekvenční výběrové analýzy podle vyobrazeni Haseloffa a Hofímanna. V řadě testů se srovnávají A a B. Vždy když je A lepší, postoupí se o jedno pole nahoru, když je lepší B. o jedno pole vpravo, jsou-li stejné, pokračuje se po diagonále dál. Na našem obrázku bylo při prvních třech pokusech A lepší, při čtvrtém lepší B. při pátém a šestém zase A. při sedmém a osmém B. při devátém a patnáctém opět A. Ukáže-li se A lepší i při dvou následujících pokusech, uzavírá se experiment s výsledkem „A je lepší než B". 177 176 6. O zacházení s hypotézami upadneme do hloubek, ba nesmírných hlubin matematické teorie rozhodování, jejímž skutečným tvůrcem byl ostatně Wald. Rakouský emigrant Wald byl v roce 1938 ve věku 36 let povolán na Kolumbijskou univerzitu a v následujících dvanácti letech revolučně rozvinul matematickou teorii výběrových šetření. Roku 1950 zahynul při leteckém neštěstí. 6.12 Kontrolní karty Z hlediska teoretického pojednání jsou mnohem pochopitelnější kontrolní karty, o kterých si nyní řekneme ještě několik slov. Jsou to různé formy záznamů výsledků vzorků z běžné výrobní kontroly; většinou se používá poněkud pozměněný systém souřadnic ve formě karet.Souřadnici tvoří dosavadnístřed-ní hodnota a každý výsledek měření se postupně zaznamenává nad nebo pod tuto „ideální čáru". Mimoto běží většinou s ní rovnoběžně po dvou čarách nad a pod souřadnici takzvaná „výstražná mez" nebo „akční mez". Výstražná mez probíhá převážně ve vzdálenosti 2 a od průměru, kontrolní nebo akční mez zpravidla 2,58 a. To znamená, že pokud výrobní proces běží normálně, bude 95 % měřených hodnot uvnitř výstražných mezí a jen 1 % vně akčních mezí. Stejně dobře lze však říci, že rozsah spolehlivosti (95 %) probíhá mezi oběma výstražnými mezemi, nebo také že pravděpodobnost chyb (1 %) označuje prostor vně akční meze; při měření mimo tyto hranice se proto setkáváme s „významnými" odchylkami. (Viz obr. na str. 180.) Kontrolní karta má však tu přednost, že ukáže i takové změny ve výrobním 178 postupu, které ještě nevyvolávají nut nost „akce" - jako např. nepatrné posunutí průměru nahoru nebo dolů (ovšem uvnitř výstražných mezí). Někdy se ukazuje užitečné zaznamenávat do kontrolních karet nikoli jednotlivé hodnoty měření, ale střední hodnoty z nejmenších vzorků. Výhoda je v tom, že jednotliví „zbloudilci" jsou do velké míry zneškodněni již uvnitř příslušného nejmenšího vzorku a nemusejí vyvolávat zbytečné starosti. Pak ovšem musí mít výstražné i akční meze také užší rozpětí, protože průměry vzorků mají menší rozptyl než jednotlivé hodnoty měření. K ilustraci použijeme malého příkladu. Normovaná hodnota u kontrolní karty nechť je 100, rozptyl a = 3, výstražné meze probíhají pak u (100 — 6) = 94, resp. (100 + 6) = 106, kontrolní mez u 92,2 a 107,8. Nyní máme těchto patnáct výsledků měření: 100,2 100,6 101.2 103,4 97,3 99.1 106.8 94,4 92,2 91,8 102,4 108,2 100.8 93,8 95,6 Máme dvě hodnoty nad (106,8 — 108,2), 3 hodnoty pod výstražnou mezí (92,2 — 91,8—93,8), 2 z toho dokonce mimo kontrolní mez (108,2 — 91,8), třetí přesně na kontrolní mezi (92,2). Nemůže tedy být pochyb: proces není statisticky pod kontrolou, všechno jde páté přes deváté. Vytvořme naproti tomu průměr vždy ze tří po sobě jdoucích měření, a už to vypadá mnohem lépe: 100,7 — 99,9 — 97,8 — 100,8 — 96,7. Všechny hodnoty leží pohodlně uvnitř našich starých výstražných mezí. Ty však právě pro tento případ již nejsou vhodné a měly by probíhat mnohem blíž u sebe. Konečně existují takzvané R-karty (R z angl. range — rozpětí), na nichž se uvádí rozpětí uvnitř jednoho výběrového souboru nejmenšího rozsahu. Zůstaneme-li opět u našich pěti tříčlenných hodnot, dostaneme: _6.12 Kontrolní karty 1,0 — 6,1 — 14,6 — 16,4 — 7,0. V daném případě se nic nezakrývá, můžeme se odvolat na normální rozdělen! jednotlivých hodnot měřen!: rozpět! přes 12 by se mělo vyskytovat jen zcela zřídka — a my tu máme z pěti již dvě intervalová měření, která jsou podstatně vyšší. Přiklad použiti kontrolní karty pro výrobní kontrolu průmyslového podniku Mer, se pevnost hr-dele zadní nápravy. Záznamy se týkají průměru z pěti přezkoušených hřideli zadn, nápravy (horní kontrolní karta), případně jejího rozpět! v pěti jednotlivých měřeních (karta rozpět, dole). Střední hodnota („úroveň") výroby je 98,3 kp/mm2. _ Pozoruhodné je, že tato kvalita by musela být označena jako neodpovídajíc, norme: kdyby pet zkušebních kusů výběrového souboru bylo úplně stejných (a snad dokonce na ..urovn, ) kleslo by rozpětí na 0 a prolomilo tak spodní kontrolní hranici. Jestliže totiž náhoda nevyuž^e prostor, který ji byl poskytnut, je třeba vždy zvýšit pozornost. 179 6. O zacházení s hypotézami horní kontr >lni hranic itr«anl ho" kontr ilm hranice Obrázek ukazuje souvislost mezi kontrolní kartou a normální křivkou. Měrné hodnoty blízké kontrolní hranici (HKH — horní. DKH — dolní kontrolní hranice) jsou extrémy a měly by se vyskytovat zřídka. 110 105 u =100 95 90 ■ ♦ Proč akční mez probíhá právě na 2,58 rj? Za prvé tam neprobíhá, nýbrž se tam prostě často kladla (mohla by také být podle potřeby na 2,5 neboZa), a za druhé je to vítězství myšlení v procentech nad normálním rozdělením; uvnitř ± 2,58 a leží 99%. mimo 1 %. Z těchto důvodu je také výstražná mez přesně na + 1,96 a a nikoliv na 2 a (= 99.5 %). Tři kontrolní karty s měrnými údaji, které jsou rozptýleny kolem střední hodnoty 100. Nahoře 32 měřeni, pod tím stejné údaje ve skupinách po 4 měřeních — průměr výběrového souboru se rozptyluje nápadně méně nei jednotlivá měřeni. Dole se měři na ..R-kar-tě" rozpčti osmi čtyřčlenných skupin. Zde je mimo jiné zřetelně vidět, že třetí skupina (průměr výběrového souboru 100,25, tedy zcela nenápadný) je složena z extrémů — rozpětí činí 11! 6.2 Jednoduché testy hypotéz Hypotéza znamená doslovně předpoklad či domněnku, že něco by mohlo být tak a tak nebo vysvětleno tak a tak. Hypotéza není ještě ani tezi, větou sloužící jako důkaz, jako tvrzení. Je to domněnka, která může vzniknout z okamžitého nápadu nebo může být vypreparována po dlouhých úvahách z určité pokusné řady: „Bylo by přece docela dobře možné, že..." nebo: „Předpokládejme, že je možná souvislost...". Máme-li takovou hypotézu, je věcí temperamentu a svědomitosti, zda se plným hlasem prohlašuje za novou moudrost vyvracející všechny námitky, nebo zda se nejdřív potichu uvažuje, jak by bylo možno správnost dané hypotézy ověřit. Mezi těmito dvěma extrémy je ještě mnoho možností, z nichž jedna je zvlášť oblíbená: s úmyslem podpořit hypotézu se shromažďuje vše, co slouží k jejímu posílení, a kriticky se zkoumá vše, co ji vyvrací. Kdo by však chtěl svoji (nebo také jinou) hypotézu zkoušet, bude se muset dříve nebo později uchýlit ke statistice — ledaže by šlo o hypotézu z oblasti, kde je sestavení statistických údaju zvlášť obtížné. S pomocí statistiky nebude např. možné tezi, že bohové byli kosmonauty, popřít, ale ani ověřit. Podobně je tomu s jinými historickými hypotézami, a to ze zcela zvláštního důvodu. Důkladné a přesné ověřování hypotéz vyžaduje testovací materiál, který je nutno opatřit jako doplněk k materiálu, jenž byl podnětem k vytvoření hypotézy. Jinak vzniká nebezpečí, že se pomocí matematických vzorců vybuduje pouze impozantní konstrukce kolem předem přijaté domněnky. _6.2 Jednoduché testy hypotéz Matematické testováni hypotéz je poměrně nový způsob statistické práce. Pochází z let krátce před vypuknutím druhé světové války a vytvorili jej především Jerzy Neyman a E. S. Pearson a dále pak rozvinul Abraham Wald. Od Neymana a E. S. Pearsona pochází také myšlenka testování hypotézy i představa o chybách prvního, resp. druhého druhu. První test hypotéz však pochází již z těch raných dob statistiky, kdy se právě osvobozovala od biblické kletby a kdy se začal statisticky opěvovat božský pořádek. Britský lékař a satirik John Arbuthnot vykonstruoval statistický důkaz bozi existence, když v roce 1710 prohlásil: V posledních 82 letech se v Londýně rodilo pravidelně více chlapců než děvčat. To nemůže být náhoda, protože kdyby narození chlapců a děvčat odpovídalo výskytu hlavy a orla při házení minci, byla by tato stálá převaha chlapců nemyslitelná. Je tedy nutno v tom vidět boží ruku, která ve své moudrosti řídí rozdělení narozených tak. jak je to správné. Tato úvaha má nedostatky teologické, pravděpodobnostně teoretické i logické, ale v zásadě jde o testováni hypotézy. Hypotéza „normální rozdělení narozených p = q = 0,5" byla vyvrácena faktickým materiálem. Uveďme jiný přiklad: v jedné věznici zjistím, že padělatelé směnek maji velmi vysoký kvocient inteligence. Vytvořím hypotézu, že tito podvodníci jsou nadprůměrně inteligentní. Jestliže použiji jen tento známý „materiál", mohu sice předložit svůj výsledek pozorování v nanejvýš působivé formě jako „statistiku", ale opravdové testováni hypotézy lze provádět teprve tehdy, až prozkoumám nový materiál, např. vězně z jiné věznice nebo nový přírůstek 181 zacházeni s hypotézami podvodníků se směnkami v dalších třech letech. Lze ovšem nalézt i jiné východisko, a to takové, že se řekne: Promiňte, prosím, ale vždyť já jsem od samého začátku měl hypotézu — ještě dřív než jsem se šetřením začal. Tato hypotéza spočívala v tom, že úroveň inteligence padělatelů směnek by se „rozdělila" stejně jako v celku všech vězňů (nebo také celého obyvatelstva). Potom však výsledky mého šetření tuto „nulovou hypotézu" vyvrátily a svůj výsledek mohu tedy označit jako výsledek ověřování hypotézy. Ještě dříve než řekneme více o této důležité nulové hypotéze a o vypovídací schopnosti testů hypotéz, podíváme se na okamžik nazpět — na to, co jsme uvedli v předchozích oddílech. Ukáží se totiž pozoruhodné paralely toho, co nyní velkolepě nazýváme „ověřování hypotéz". Vždyť už jsme sami přece hypotézy ověřovali! Např. když jsme zkoumali pytel ořechů a přitom jsme si na počátku řekli, že řádově bude asi 20 % zkažených. Potom jsme udělali náhodný výběr o vhodném rozsahu, a tím jsme uvedenou hypotézu ověřovali. Ještě jasnější to bylo v situaci, když jsme se zabývali kontrolními kartami a přejímacími zkouškami — jedno ověřování hypotéz za druhým. Na kontrolní kartě je ověřovaná hypotéza dokonce zakreslena: zde musí být střední hodnota, až sem a ne dál může být rozptyl, nemá-li být vyvrácena hypotéza „všechno probíhá normálně jako dosud". A co se děje při přejímací zkoušce? Odběratel vlastně testuje tuto hypotézu: „Chtějí mne doběhnout, zboží je špatné" — a rozhodne se pro převzetí zboží tehdy, je-li tato hypotéza vyvrácena. Dodavatel ověřuje hypotézu „mé zboží je vysoce hodnotné jako vždy" a je zděšen, ukáže-lí se něco jiného. Nebylo vám nápadné, že jsme vytrvale mluvili o tom, že hypotéza se zamítá? Neměli jsme být mnohem pozitivnější a říci: hypotéza se potvrdila? Ne, bohužel ne. Celé ověřování hypotéz spočívá koneckonců na tom, že se hypotéza zamítne — a to nikoliv bez důvodů. Máme totiž správnou míru pro nepravděpodobné: např. to, co je mimo trojnásobnou směrodatnou odchylku, má pravděpodobnost jen p = 0,003. Jestliže v této oblasti najdu více hodnot měření, než se tam „hodí", mohu říci: tento druh normálního rozdělení nevystihuje situaci. Hypotézu „// = 100, cr = 3" mohu zamítnout, jestliže mezi 100 měření bude 8 vyšších než 109. Ale co se tím pozitivně dokazuje? Hypotéza ^ = 110, nebo ,« = 107? Nebo může být hypotéza ii = 100 správná, ale a je mnohem vyšší, než se předpokládalo? Měrné hodnoty mohou upozornit, jaké by asi mohlo být rozdělení, ale pozitivně nic nedokazují. Nejspíše je ještě možno vymezit oblast tím, že se např. konstatuje, že hypotézu fi ^ 100 (slovy: menší/stejná) i hypotézu n ^118 (slovy: větší/stejná) lze pokládat za zamítnuté. Někde mezi tím musí být skutečný průměr. Kde přesně? Proto je možno uvést nanejvýš „maximum likelihood" (někdy se překládá jako „maximálni věrohodnost"), ale žádný důkaz. Hypotézy je proto možno zásadně prohlásit za falešné (zamítnout je), nikoliv však dokazovat. V praxi se tyto těžkosti obvykle rády přehlížejí a předpokládá se toto: jestliže se nulová hypotéza zamítne, bude asi správná moje alternativní hypotéza. To je většinou oprávněno v těch přípa- dech, kdy alternativní hypotéza má již předem široký akční prostor nebo jestliže je v povaze věci, že otázka je omezena na prosté „buď — anebo". Tak je tomu především tehdy, jde-li např. o zkoušení nového léku, nového postupu apod. V daném případě nulová hypotéza zní takto: „Vše zůstane při starém, nový postup není ani lepší, ani horší než starý." (Zde je také etymologický základ „nulové hypotézy", která říká, že změna se „rovná nule".) Jestliže se tedy nulová hypotéza zamítne, může se alternativní hypotéza „je účinný", resp. „je horši" pokládat za potvrzenou a neurčený je pouze stupeň zvýšení účinnosti. Především však nesmíme zapomenout na jedno: Protože se ověřování hypotéz zakládá na zkoumání výběrových souborů, podléhá také náhodným chybám prvního a druhého druhu. Proto se může vždy stát, že správná hypotéza bude zamítnuta a nesprávná přijata — především tehdy, když jde vůbec jen o chybné hypotézy. Jestliže se totiž ověřují jen nesprávné hypotézy, nemusí náhoda příležitostně jednu z nich označit za falešnou. Jestliže ;e naproti tomu ověřují jen hypotézy správné (alternativní), může sice jedna z nich být nedopatřením označena za falešnou, celkový výsledek je však uspokojující. Bylo tedy právem řečeno: „Statistické testy mají pouze jakýsi filtrační účinek,^ který způsobuje, že správné z přijatých hypotéz jsou poněkud obohaceny." Postupy ověřování hypotéz jsou většinou počtársky obtížné a nebudeme je proto uvádět v jednotlivostech. Některé z nich krátce nastíníme v poslední kapitole naší knihy, ale ten, kdo chce studovat matematické podrobnosti těchto testovacích postupů, může použít ně- _6-2 Jednoduché testy hypotéz které z učebnic statistiky, uvedených v příloze (viz str. 347—348). To však nevylučuje, abychom se alespoň v hrubých rysech neseznámili se základními myšlenkami ověřování hypotéz a statistického testování. Vzpomeňme si na výrobce A a kupujícího B, který nechce koupit zboží obsahující více než 2 % zmetků, přičemž si výrobce A myslí, že má svou výrobu pod kontrolou a že jeho zboží nemá více než 1 % zmetků. Kupujícímu záleží na tom, aby „chyba druhého druhu", „odběratelské riziko", byla pokud možno malá. Jinak řečeno, záleží mu na tom, aby hypotéza „více než 2 % zmetků v souboru" byla vyvrácena na tak dlouho, jak jen možno. Neboť pak — a jen tehdy — může předpokládat, že se zároveň potvrdí jeho alternativní hypotéza: „obsahuje 2 % nebo méně zmetků". V tomto a v mnoha jiných případech jde o „jednostranný test hypotéz". Otázka zni pouze, zda bude překročen určitý nejnižší nebo nejvyšší podii. To však při normálním rozdělení znaků znamená, že zájem je soustředěn jen na jeden konec normální křivky. Chci například vědět, kolik šroubů je příliš krátkých (nikoliv příliš dlouhých), zda podíl chyb je více než 2 % (nikoli však, zda je pod 0,5 %) atd. To ale znamená, že se připustná pravděpodobnost omylu soustřeďuje na tom konci křivky, který mne zajímá. Zatímco tedy při dvoustranném testu, který má dosáhnout 99% jistoty, se na každém z obou konců normálni křivky považuje 0,5% za „extrém" a vede k zamítnutí hypotézy, soustřeďuje se při jednostranném testu — za předpokladu stejné 99% pravděpodobnosti — toto 1 % na jedné straně. Vzpomeňte si. jaké překvapující rozdíly jsme nejdříve měli (v části 3.33) při 182 183 6. O zacházeni s hypotézami Jestliže se ..prosévaji" jen správné hypotézy, odmítne se někdy i správná. Ověrují-li se jen nesprávné hypotézy, přijme se někdy i některá nesprávná. Ověřování hypotéz se obecně užívá ke zvýšeni relativního počtu správných hypotéz tím, že většina nesprávných se zamítne a většina správných naproti tomu zamítnuta není. vysvětlováni tabulek normálního rozdělení a jak se v jedné tabulce říkalo, že „pravděpodobnosti se uvádějí pro horní konec" (viz obr. na str. 185). Víme, že při uvažováni obou konců hranice 99% probíhá u ± 2,58 a. Tabulka s jednostranným údajem pravděpodobnosti má však hranici 99 % u 2,33>T, protože ted se soustřeďuje nepatrná „extrémní" plocha pod jedním koncem křivky, zatímco dříve byla pravidelně rozdělena vpravo a vlevo. Stejně je, jak známo, 95 % souboru mezi + 2 o a —2 a (přesně mezi + 1.980 a —1,98 a), při uvažování jedné části křivky naproti tomu mezi ± 1.645 a. Zde je nutno co nejdůrazněji varovat 184 6.2 Jednoduché testy hypotéz 80% -3a -2 a -a + a +2a -1,28 a +1,28a +3a Rozděleni plochy pod normální křivkou se může provést dvoj.m způsobem Pozon' extrémní hodnoty v jednom směru (v našem přikladu jde asi o 20 %) 'hromaždu,, « na, konci; příslušná tabulka bude uvádět podíl plochy 0,80 pro z = 0.84. nau-ii i> uvažovat extrémy v obou směrech, rozděluje ,e 20% v našem pokladu ™dl°^"J^v 10 % a tabulka bude uvádět, že zbývající plocha 0.80 je omezena pro l: - 1.« l Jsou-li v tabulkách uvedeny oba způsoby výpočtu, ukáže se prvn. zobrazen, vétunou 1« druhé jako D(z). Zpravidla jde o omezeni extrémů v obou směrech. 185 6. O zacházení s hypotézami před nebezpečným nedorozuměním: pravděpodobnost 95% nebo 99% anebo každá jiná nevypovídá vůbec nic o správnosti hypotézy, naopak. Vždyť tím se označuje podíl volného prostoru, většinou normálního rozdělení. Myšlenkový postup je tedy tento: Za předpokladu, že// nebo P má nějakou hodnotu, mohu si být jist, že 95 % všech dílčích údajů bude mezi dvěma směrodatnými odchylkami — a 99% mezi ± 2,58 a. Jestliže však najdu měrné hodnoty, které je možno umístit v tomto 99% prostoru, neznamená to ještě 99% jistotu, že moje domněnka o /i nebo P je správná. (V extrémním případě bych došel až k 100% „jistotě" — postačí, když přijmu každou hodnotu.) Uvedených 99 % při testování hypotéz říká: Jestliže výsledek náhodného výběru umožňuje závěr, který je mimo 99 % intervalu spolehlivosti (nulové) hypotézy, mohu si být na „99 % jist", že hypotéza není správná. Tím se dostáváme znovu k našemu dřívějšímu zjištění, že hypotéza nemůže být přímo dokázána, nýbrž může být jen zamítnuta ji odporující (nulová) hypotéza. Na to musíme myslet vždy, když se domníváme, že můžeme hypotézu dokázat. Ukážeme to na příkladu tím, že provedeme početně jednoduché ověření hypotézy. 6.21 Narozeni chlapců pod normální křivkou Ověřujeme hypotézu, že je stejný počet narozených chlapců a děvčat. Jako podklady náhodného výběru máme 500 po sobě jdoucích zápisů v matrice narozených, z nichž je 266 chlapců a 234 děvčat. Přesná rovnováha by byla 250 ku 250. ale my již víme, že náhodě musí být ponechán volný prostor. Ptejme se tedy: je to velmi nepravděpodobný výsledek, třeba takový, který by bylo možno očekávat jen v 1 ý všech vzorků stejného rozsahu? Jinak řečeno: Hodí se náš výsledek do velkého souboru 99% všech možných výsledků vzorků, jestliže jsou pravděpodobnosti stejnoměrně rozděleny? Načrtneme si v duchu normální křivku se střední hodnotou np = 250 (neboť n = 500, p = 0,5) a směrodatnou odchylkou ľnpg" = VÍ25~ = 11.2. Potom hledáme onen bod, ve kterém pravděpodobnost překročí 99 % (jednostranný test). V tabulkách normálního rozdělení najdeme pro jednostranný test u 99 % hodnotu z = 2,33. Nyní vypočítáme kritickou hodnotu, kterou označíme c. podle vzorce c = za + np V našem případě: c = (2.33) (11,2) + + 250 = 276. To znamená: hodnota 276 leží na hranici pravděpodobnosti (99 %) a nepravděpodobného (1 %). 266 chlapců výběrového souboru je však daleko „uvnitř" této kritické hodnoty — hypotéza „narození děvčat a chlapců je stejně pravděpodobné" se tím jeví potvrzena (obr. na str. 187). Popravdě je ovšem tato hypotéza pouze „nezamítnuta", což není totéž \ako „přijata", ačkoliv i v odborné literatuře se stále znovu objevuje špatné chápání tohoto „páru protikladů". Pojďme o krok dále a ptejme se, zda by se takový výsledek objevil i mezi 90% „neextrémních" náhodných výsledků, kdyby p bylo opravdu 0,5. K tomu zopakujeme dřívější výpočet, přičemž nyní vezmeme a dosadíme 6.21 Narození chlapců pod normální křivkí a = 11,2 a = 11,2 Ve výbérovém souboru 500 novorozeňat bylo 266 chlapců a 234 děvčat. Je považovat za důkaz, že narozeni děvčat a chlapců není přesně rovnoměrně rozděleno! Kretky propočet (viz str. 186) ukazuje, že hypotézu ..rovnoměrného rozdě*m J£«C Pro .nepravděpodobnou" nebo „zamítnutou" hypotézu by prinejmeni.m mělo byt 277 nebo v,ce chlapců na 500 novorozeňat, neboť pak činí pravděpodobnost ,en 1 % nebo p = 0.01. z tabulky hodnotu z = 1.28. Nová kritická hodnota cn.u = (1,28) (11.2) + + 250 = 264. Náš počet 266 je již mimo prostor pravděpodobnosti 90 % všech vzorků vymezených číslem 264. Na této úrovni se hypotéza zamítá. Jestliže se v rozporu s dobrým svědomím pokusíme hypotézu „verifikovat", je třeba jistotu číst obráceně: 99% neznamená více bezpečnosti a jistoty, nýbrž spíše více velkorysosti a lhostejnosti. Považuji-li však domněnku stejné četnosti narození za nulovou hypotézu, lze říci: s 99% jistotou nemohu sice tuto nulovou hypotézu zamítnout, ale mohu to udělat snad s jistotou poněkud větší než 90 %. A dále: Skutečná četnost narozeni chlapců bude vyšší než 0,5. Kde přesně? Budu potřebovat větší vzorky a pak např. navzájem testovat hypotézy p, = 0,52 a p., = 0,54. abych poznal, která je pravděpodobnější, resp. která se dá dřív vyvrátit. Z výběrových souborů o rozsahu n = 500 a n = 2000 bychom samozřejmě nikdy nezískali tak přesná čísla, k jakým se došlo v průběhu staletých pozorování na celém světě. Víme. že podíl chlapců na živě narozených činí ve střední Evropě (a podobně na celém světě) asi 51.5%. Hypotéza p = 0.5 je tedy nesprávná a je možno ji — s příslušně velkým výběrovým souborem — kdykoli vyvrátit. Dříve než budeme dále rozvádět myl-lenku, jak se v tomto případě navzájem chovají základní soubor, vzorek a alter- 167 186 6. O zacházeni s hypotézami 49% 50% 51% 52% 53% 54% 55% 56% Typická nákupni situace přenesená na náš přiklad podilu chlapců na počtu narozených. Anděl jako „objednávající" si chce být jist, že čáp nedodá přiliš mnoho chlapců — 52 % nebo ještě více, obsažených ve „vzorové zásilce", se mu zdálo již příliš mnoho. „Dodavatel" čáp vi, že v průměru dodává 51 % chlapců, ale při tak přísných „přejímacích podmínkách" by bylo 16% jeho pětiset-kusové zásilky odmítnuto, ačkoliv „celková produkce" zcela odpovídá požadavkům. Otázka zni vždy znovu: jak se rozdělí riziko přejimky mezi dodavatelem a odběratelem? Zde na obrázku neriskuje anděl téměř nic. r nativní hypotézy, zabývejme se námitkou, kterou by mohli vznést velmi kritičtí, pečliví a pozorní čtenáři. Bylo by totiž možno oprávněně se zeptat, proč jsme právě před chvílí počítali vlastní „kritické hodnoty", když jsme přece již (od třetí kapitoly) mohli s mnohem menší námahou přesně vypočítat, jaký podíl pravděpodobnosti připadá na hodnoty pod 266, resp. nad 266 narození chlapců. Mohli jsme přece jen standardizovat normální rozdělení podle známého schématu: hodnota pozorováni — hypotetický průměr směrodatná odchylka V našem případě by vyšlo: 266 - 250 11.2 -1"*25 188 V tabulce standardizovaného normálního rozdělení bychom vyhledali 1,425 a dostali podíl plochy 92,3 %. Proč tedy ta rozvláčná srovnávání s 99, resp. 90 %? Vysvětlení spočívá prostě v tom, že jsme chtěli „uvést" metodu, která sice v daném případě nebyla potřebná, ale již brzy bude jako jediná k dispozici — jakmile se totiž blíže seznámíme se „Studentovým rozdělením t", které je založeno na hodnoceni výsledku srovnáváním s tabulkovou kritickou hodnotou (viz část 6. 41). Nyní se z těchto hledisek podívejme na scénku z „pohádky". Jedná se o dodávku dětí, kterou zařizuje příslušný anděl. V rámci populační exploze potřebuje nakoupit pro nejbližší dva týdny dva milióny dětí. Zmocněnec fy Cáp a spol. promptně dodávku přislíbí: „Je Vám známo, že náš podíl chlapců činí spolehlivě téměř přesně 51 %." Anděl je však opatrný: „Měli jsme již několik reklamací. Chtěl bych mít úplnou jistotu, že podíl určitě nebude vyšší než 54 %. Dodejte nám nejdříve vzorek v rozsahu řekněme 500 kusu." Pak jsou povoláni dva podnikoví statistikové, aby dohodli podrobnosti přejímací zkoušky. Přitom by nás mohla napadnout zlomyslná otázka, jak by vůbec mohl statistik přijít do nebe (statistikové minulosti však byli, jak už víme, velmi zbožní lidé). Statistik fy Čáp a spol. nyní uvažuje takto: „Je-li normální rozdělení naší produkce — vztaženo na vzorek o rozsahu 500 — kolem četnosti 51 %, se směrodatnou odchylkou 1 %, pak jen dva z každé stovky předpokládaného vzorku budou mít podíl 53,3, neboli více chlapců." (To nemusí dlouho počítat, najde to v tabulce.) Nebeský statistik si řekne: „Rozhodně nechceme 54 % nebo více chlapců a musíme proto zajistit, aby nebyla převzata celá dodávka na základě pochybného vzorku. Je-li tedy produkce střední četnosti rozptýlena kolem 54 % se směrodatnou odchylkou 1 %, znamená pro nás podílová četnost 52 % nebo ještě méně ve vzorku to, že odběratelské riziko činí ještě celá 2 %, protože dva ze sta vzorků by mohly náhodou tak nízkého podílu dosáhnout." Nebeský statistik je však člověk dobromyslný a svému partnerovi navrhne: „Dobře, jsme ochotni převzít celou dodávku, jestliže ve výběrovém souboru nebude podílová četnost chlapců větší než 52 %." Znalec fy Čáp a spol. nahlédne do tabulky a ztrápeně praví: ..To od nás opravdu nemůžete žádat. Podívejte se přece sám: při této podmínce převzetí bychom museli počítat s tím. že pouhou hrou náhody s 16% 6.22 Pravděpodobnost o hypot«zf pravděpodobností ztratíme objednávku, ačkoliv slíbenou jakost dodržíme." Nechrne už nezodpovězenu otázku, zda se dohodli, zda oba měli stejnou naději na úspěch nebo zda pozice vyjednáváni jednoho či druhého byla silnější, takže mohl vnutit partnerovi větší riziko. Jisté však je, že náš dřívější vzorek podle původního návrhu hodného nebeského statistika nevyhnutelně vedl k odmítnutí. K tomu by dokonce vedlo i „férové" rozděleni rizika. (Čáp a spol. měli právě s tímto vzorkem mimořádnou smůlu — podíl chlapců byl neobyčejně velký a mimoto firma špatně odhadovala svou produkci: skutečný průměr není 51 %, ale 51,5 %, a takový omyl již může vést ke značně chybným kalkulacím.) 6.22 Pravděpodobnost a hypotézy V praxi ověřování hypotéz jde tedy většinou o takovou sestavu testu, aby zamýšlené úrovně odmítnuti bylo pokud možno přesně dosaženo. Je samozřejmě možné (pokud je k dispozici libovolně velký rozsah výběrového souboru) dosáhnout extrémní kritické hodnoty, a tím pravděpodobnosti 99 a 99,9 %. avšak k tomu je často třeba mít velký výběrový soubor, zvláště když se testované střední hodnoty nebo četnosti navzájem jen nepatrně odchylují. Proto se musíme nejdříve ptát. jaká je skutečně požadovaná přesnost testu, jinak vznikají zbytečné náklady a práce. Jestliže se testované hodnoty navzájem silně odchylují, postačí již malý výběrový soubor k tomu. aby byte možno odmítnout nulovou hypotézu s postačující přesností. I bez provedeného propočtu je zřejmé, že nulová 169 6. O zacházení s hypotézar hypotéza („průměrná délka bude 5 cm") může být velmi rychle a beze zbytku odmítnuta výběrovým souborem x = 8 cm, zatímco výběrový soubor x = 5,5 cm bude dlouho svým rozdělením pronikat do rozděleni nulové hypotézy. Testování hypotéz odpovídajícím způsobem je mimo jiné nutné při řešení těchto otázek: Odpovídá výrobek, který má být zkoušen, daným požadavkům na čistotu, tvrdost nebo zmetkovitost apod.? (Nulová hypotéza: Neodpovídá.) Je nový výrobek lepší než dosavadní? (Nulová hypotéza: Není lepší. Dodatečný požadavek: Musí se projevit jako „významně" lepší.) Dovoluje vzorek o průměru x závěr, který bude odpovídat výběru z určitého základního souboru o průměru //? (Nulová hypotéza: Nepochází z tohoto základního souboru. Nebo, jde-Ii o jiný problém: Ověřuje se, zda toto x s malou pravděpodobností omylu nemohlo být převzato ze základního souboru.) Utvořil jsem hypotézu o určitých souvislostech mezi měrnými údaji — nebude experimentem vyvrácena? Jestliže nikoliv, potom: Mohly tyto výsledky vyjít, aniž by proto daná hypotéza ztrácela platnost? V těchto případech může jít o ověřování středních hodnot, rozptylu, podílu, způsobů rozdělení, korelací atd. Téměř vždy bude důležitý rozsah výběrového souboru: S rozsahem vzrůstá přesnost všech testů hypotéz, zároveň však rostou náklady. Při praktickém používání testů hypotéz vzniká proto vždy otázka, jaká má být spolehlivost výsledků, s jakou jisto tou má být nulová hypotéza vyvrácena Pfanzagl k tomu říká: „Základní pra vidlo zní: hrozí-li velká ztráta, ne poznáme-li skutečně existující rozdil zvolí se malá pravděpodobnost. Hrozí-li velká ztráta, předpokládá-li se existence rozdílu, pak se zvolí velká pravděpodobnost." (Viz obr. na str. 191.) Toto tvrzení alespoň stručně vysvětlíme. V prvním případě předpokládejme, že vynaložím 100 000 DM, bude-li se' nadále používat chemikálie A místo jen nepatrně lepší chemikálie B. V daném případě není nutno nulovou hypotézu („B není lepší než A") testovat příliš ostře, neboť lze říci: bude-li jen z 90% — nikoliv však z 95 % — odmítnuta, je B snad přece jen lepší. V druhém případě vynaložím 100 000 DM, jestliže použiji dražší B, protože se mylně domnívám, že je lepší než A. V daném případě budu velmi přísně ověřovat, zda hypotéza „B také není lepší než A" musí být zcela rozhodně odmítnuta. Teprve tehdy, mohu-li s 99% nebo větší jistotou říci, že nulová hypotéza může být pokládána za vyvrácenou, rozhodnu se pro nákladný přechod na B. Později se ještě vrátíme k některým speciálním případům testování hypotéz. Nejdříve se však seznámíme se starým a neobyčejně svérázným postupem. 6.3 Bayesova věta a její použití Ve většině učebnic statistiky se Bayesova věta neuvádí vůbec anebo jen zcela povrchnô a jméno Thomase Bayese se neuvádí ani v rejstříku. Hned vysvětlíme, proč t jmu tak je. Ať je názor na Bayesovu ' ětu jakýkoliv, nelze popřít jeho význam pro teorii testování hypotéz. Tento anglický duchovní z druhé poloviny 18. století je jedním z předků a praotců induktivní statistiky, a tím i celé teorie výběrových soubo- 190 6.3 Bayesova vít 0 0 použiti v pochybnostech so předpokládá, i že není rozdíl obor zamítnutí nulové hypotézy zbývající riziko obor převzetí nulové hypotézy Podle potřeb situace se požaduje více nebo méně přísné vyvráceni nulové hypotézy. Kdyby to znamenalo vysoké náklady nebo nebezpečí, když se nulová hypotéza odmítne příliš snadno, budeme ji zkoušet velmi přísně a ponecháme jí jen nepatrný prostor ze zbývajícího rizika (obr. nahoře). Vzniknou-li však vysoké náklady nebo nebezpečí spíše tehdy, jestliže se správná alternativní hypotéza nedopatřením odmítne, omezí se toto riziko tím, že se nulová hypotéza bude testovat jen s malou pravděpodobnost! jistoty (obr. dole). zbývající riziko rů. V době, kdy počet pravděpodobnosti byl ještě v dětských střevíčcích, zabýval se již problémem, jak by bylo možno uvádět pozdější zkušenosti do souladu s původními předpoklady, resp. jak takové zkušenosti změní současné hodnocení situace proti původ- ním předpokladům. Jde tedy do j.ste míry o dynamické ověřováni hypotéz se zabudovanou korekturou hypotéz, může-li se to tak říci. Přestože přísně matematická statistika uvrhla Bayesovu větu do klatby, prožívá právě v posledních letech své 191 6. O zacházení s hypotézami znovuzrození. Profesor Pitman z Hop-kinsovy univerzity řekl při příležitosti jubilejních oslav na počest Lapiaceho, Bayese a Bernoulliho: „Jsou velké rozdíly v názorech na teorii statistické infe-rence, umění nebo vědy činit platné závěry z náhodně pozorovaných prvotních hodnot... Pokoušíme se dělat výpovědi o více nebo méně neznámých rozděleních nebo takové výpovědi testovat. To je abstraktní matematická formulace problému. Z hlediska praxe to znamená usuzovat z účinků na příčiny. Až do počátku tohoto století spočívala nejdůležitější metoda řešení daného problému v tom, že se propočítalo podmíněné rozdělení příčin a posteriori, vycházející z daného nebo předpokládaného apriorního rozdělení. Nyní máme testy významnosti, obory spolehlivosti, důvěrné rozdělení, ale vzniká nespokojenost s těmito moderními nástroji a opět vážně uvažujeme o použití apriorních rozdělení." Ještě dnes tedy existují důslední obhájci Bayesovy věty. Jedním z nej-významnějších jeLeonard Savage. Vládnoucí učebnicový názor matematické statistiky však Bayese odmítá. Kromě toho existuje jakési zmatení pojmů o tom, co Bayes řekl, co myslel a co bylo pozdějším výkladem do jeho úvah vloženo. K tomu přistupuje podivně staromódni způsob, jímž byla uvedena tato věta (která není identická s Baye-sovým problémem a je tudíž takto nazývána neprávem). Říká přibližně toto: Představme si, že v pytlíku je 9 kostek — tři pravé a šest falešných (z nichž u tří padá číslo 6 vícekrát, u dalších jen zřídka). Vy-táhnu-li jednu jinak stejnou kostku a víckrát házím, mohu na základě dosažených výsledků postupně snížit svou původní nejistotu (vytaženi každé 192 ze tří druhů kostek je stejně pravděpodobné) a říci: „Jestliže jsem s touto kostkou při dvaceti pokusech hodil šestkrát číslo šest, věřím, že to je kostka zfalšovaná na číslo šest." Místo abych tedy původně („a priori") s pokrčením ramen musel říci: „Pravděpodobnost »/, pro každý ze tří druhů", snad potom řeknu („a posteriori", pá tomto krátkém testu): „Pravděpodobnost pro kostku se zfalšovaným číslem šest je %, pro správnou kostku '/4 a pro kostku, u které číslo šest padá zřídkakdy, je pouze To všechno vypadá velmi vykonstruované a křečovitě (konečně jako všechny příklady s házením a tažením kostek a koulí v teorii pravděpodobnosti), avšak základní koncept je možno rozšířit daleko za obor vymyšlených a vykonstruovaných her. Myšlenkový pochod lze zcela obecně vyjádřit takto: Nejdříve („a priori") mám vždy o dalším problému, o každé otázce nějakou více nebo méně jasnou představu. Jsem-li nucen se rozhodnout, budu se chovat podle těchto, snad jen velmi neurčitých myšlenek a pravděpodobností. Jestliže se však dovím nové skutečnosti týkající se daného problému, které budou mé původní hodnocení situace korigovat, mám a posteriori, na základě těchto skutečností (nebo také jen pověstí a tvrzení), odpovídajícím způsobem změnit původní postoj. Dokonce nevím-li vůbec nic — napríklad budu-li tázán, zda rychlost šíření neonového světla v pivu je větší nebo menší než slunečního světla ve vodě (Savageův příklad) — má se apriorní pravděpodobnost rovnat úplné rovnosti: p = q = 0,5. Tato apriorní pravděpodobnost se zrněni dodatečnou informací. Např. z ilustrovaného časopisu se dozvím, že se světlo nešíří v žádné jiné tekutině tak rychle jako v mořské vodě. Na základě dosavadních zkušeností sice vědecké úrovni listu příliš nevěřím, nicméně přece jen bych byl nyní spíše nakloněn k domněnce, že neonové světlo se v pivu šíří pomaleji než sluneční světlo ve vodě, ačkoliv mimo jiné stále ještě nevím, zda se neonové světlo vůbec nešíří pomaleji než světlo sluneční. Předpokládám: a) světlo je světlo, b) tvrzení časopisu snad přece jen vychází z vědeckých pramenů. V důsledku toho se mé původní hodnocení p = q = 0,5 změní na p = 0,6, nebo dokonce na p = 0,8. Početní schéma Bayesovy věty naznačíme na příkladu z lékařské statistiky. To není pouhá libovůle, vždyť právě v diagnostice pomocí samočinných počítačů se dnes Bayesova věta s oblibou používá a stále více se stává základem automatické diagnostiky. Představme si pacienta, který určitě trpí nemocí A nebo nemocí B. Podle našich dosavadních znalostí (anamnéza, klinický stav atd.) předpokládám, že pravděpodobnost nemoci A je 0,8, naproti tomu nemoci B jen 0,2. Pro získání dalších poznatků necháme, dejme tomu, provést zkoušku enzymů v séru, o níž víme, že u nemoci A je v 90 % případů pozitivní, u nemoci B naproti tomu jen ve 20 % případů. Test ukáže negativní výsledek. Jak je tím ovlivněna diagnóza? V zájmu jednoduchosti ponechme stranou otázku, jak má být tento test vážen. Bylo by možno zaujmout stanovisko, že úplně mění situaci: protože v případě B vyjde s 80% pravděpodobností negativně a u A jen v 10 % případů, jde zřejmě jistě o B, ať už byla naše předchozí domněnka jakákoliv. Nicméně chceme tuto laboratorní In- 6.3 Bayesova veto a její použiti formaci posuzovat „na stejné úrovni" s dosavadními domněnkami. Poznamenejme ještě jednou: výchozí pravděpodobnost (apriorní pravděpodobnost) pro A = 0,8, pro B = 0,2. Do jaké míry je nyní pravděpodobné, že jde o A, jestliže laboratorní výsledek je negativní? Zřejmě: (0,8). (0.1) = = 0,08. Pro B (laboratorní výsledek negativní) dostáváme: (0,2). (0,8) = = 0,16. Tyto hodnoty z laboratorních zkoušek nyní dosadíme do vzorce takto: 0,08 0,08 + 0.16 24 1 „Korigovaná" aposteriorní pravděpodobnost je nyní pro A pouze '/3-B naproti tomu získalo na pravděpodobnosti, neboť: 0,16 2 0,08 + 0,16 3" Problém stejného druhu, ale již poněkud složitější, uvádějí ruští matematici Gněděnko a Chinčin. V jejich příkladu jde o tři nemoci, které označíme A, B, C a speciální lékařská vyšetření se provádějí pětkrát, přičemž čtyři výsledky jsou pozitivní a jeden negativní. Výchozí údaje (apriorní pravděpodobnost nemocí) jsou tyto: A ='/.,, B = = 76, C = 75. Lékařský test je v případě nemoci A pozitivní pravděpodobností 0,1 (p = 0,1). v případě nemoci B ■e p = 0,2 a v případě nemoci C naproti tomu p = 0.9. Již víme. že z pěti testů vyšly čtyři výsledky pozitivní a jeden negativní. Do jaké míry je takový výsledek pravděpodobný? V případě A (čtenář si jistě vzpomina na naše pravděpodobnosti v kartách, uvedené ve třetí kapitole): 193 6. O zacházeni s hypotézami nemoc nemoc nemoc pravděpodobnost a priori test kladný test vykazuje čtyři pozitivní a jeden negativní výsledek pravděpodobnost ^. přitom činí pravděpodobnost a posteriori pacient trpí s téměř úplnou jistotou nemocí C Schematické znázornění Bayesovy korektury hypotéz. Zpočátku se předpokládala pravděpodobnost, že pacient trpí nemocemi A, B nebo C, z »/2, případně z >/6 nebo z '/3- Na základě nových informací o známých pravděpodobnostních hodnotách vycházejí „potom" (a posteriori) podstatně změněné pravděpodobnosti diagnózy. P°= ( 4 ) • (°-1)4 • °-9 = 45/100 000 V případě nemoci B dostaneme: Pb = [ 4 ) ■ (°'2)4 •0,8 = 640/100 000 = = 32/5000 Naproti tomu v případě C je nanejvýš pravděpodobný tento výsledek: P< = ( 4 ) • (°-9)4 • °-1 = 32 805/100 000 Nyní musíme ještě uvést výsledky laboratorních šetření do vztahu k původním domněnkám o pravděpodobnosti nemocí. Vždy vychází zlomek, v jehož čitateli je apriorní pravděpodobnost nemoci násobená odpovídající pravděpodobností výsledku testu. Ve jmenovateli je ve všech třech případech součet tří čitatelů. V našem případě to znamená: při výpočtu pravděpodobnosti a posteriori pro nemoc A je v čitateli: 1/2 . 45/100 000 » 0,0002; 194 při B je v čitateli: 1/6 . 32/5000 =» 0,0011; při C je v čitateli: 1/3.32 805/100 000 «a 0,109. Součet těchto tří hodnot činí asi 0,111. A nyní dosazujme: Aposteriorní pravděpodobnost pro A: 0,0002 0,111 0,002. Aposteriorní pravděpodobnost pro B: 0,0011 0,111 0,01. Aposteriorní pravděpodobnost pro C: 0,109 0,111 0,988. Je tedy téměř nezvratně jisté, že pacient má nemoc C. Vícenásobné opakování testu lze samozřejmě nahradit pěti (nebo také více) šetřeními, která mají vždy odlišnou pravděpodobnost pozitivního výsledku pro každou ze tří nemocí, ovšem výpočet se stává stále složitější. Není proto náhodou, že se Bayesova věta znovu uplatnila a že je uznávána v diagnostice pomocí samočinných počítačů: především proto, že jde většinou jen o odhady, a za druhé proto, že samočinné počítače si snadno poradí i s nejsložitějšími početními operacemi. Je samozřejmé, že také u Bayese platí, že závěry nemohou být lepší než premisy, že výsledek nemůže být spolehlivější než odhadované pravděpodobnosti. V praxi je to však bohužel často tak, že pro apriorní pravděpodobnost jsou k dispozici jen zcela nespolehlivé odhady nebo protichůdné údaje. V diag- _ 63 Bayesova věta a j ej í použi tt nostice pomocí počítačů jsou např. žádoucí co nejpřesnější pravděpodobnosti tohoto druhu: „Jde-li o ledvinové kameny, jak často má pacient vysoký tlak?", „Kolik procent ledvinových kamenů je zjistitelných na rentgenovém snímku?" atd. Pro všechny tyto a četné jiné relativní četnosti jsou však doposud k dispozici jen odhadované hodnoty, takže jejich mnohonásobným použitím roste obava z nepřesnosti výsledků. Převážná většina matematických statistiků, na rozdíl od pracovníků teorie rozhodování, Bayesovu větu zcela rozhodně odmítá, a to především z těchto důvodů: a) protože nemá pevnou teoretickou základnu, b) protože dosazené apriorní pravděpodobnosti, jak jsme také konečně viděli, jsou většinou určovány „od oka" a zakládají se na poměrně nečetných pozorováních. Bayesovi stoupenci na tuto námitku odpovídají tím, že řada údajně objektivních metod konvenční vědy obsahuje mnoho subjektivních názorů a mínění. Jak se založí pokus, jaký výsledek se pokládá za „významný", a vůbec celá řada rozhodujících dílčích otázek je ponechána statistikovi na uváženou. K tomu však v praxi ještě přistupuje, jak stále znovu zdůrazňují stoupenci subjektivní pravděpodobnosti, že pro hodnocení stavu není velmi často dostatek statistických údajů, zato však je mnoho subjektivních ocenění, která mnohdy bývají použita přinejmenším jako výchozí základna. Výchozím bodem Bayesových stoupenců je proto často sázka. I když o zítřejším počasí vůbec nic nevím, nemám revma v noze ani barometr, ani jsem neslyšel předpověď počasí, jsem však pravděpodobně ochoten — snad na základě včerejšího a dnešního počasí — uzavřít sázku 2 : 1. že zítra nebude pršet. Tím 195 6. O zacházeni s hypotézami ..Vzorek" je vlastně slovo převzaté ze staré řeči hutníků. Byl odebírán z tavičích peci, aby se získal přehled o stavu tavby. je dána apriorní pravděpodobnost, která může být nyní dále korigována. Dostali bychom se do hlubin filozofie statistiky a teorie pravděpodobnosti, kdybychom chtěli podrobně popisovat boj mezi Bayesovými stoupenci a zastánci teorie četnost! pravděpodobnosti. Omezíme se na dvě poznámky. Především je třeba na Bayesově větě ocenit dynamiku, která tvoří její součást — je to do jisté míry vzor regulérní technické pomůcky. Za druhé, subjektivní pravděpodobnosti a četnosti ne- 196 jsou vždy ve vzájemném rozporu. Subjektivní pravděpodobnost představuje většinou spíše náhražku za chybějící informace o „skutečných" četnostech. Pro teoretické rozhodovací modely je konečně subjektivní pravděpodobnost vůbec jedině rozhodující. Wilhelm Krelk např. říká: „Teorie rozhodování je proto od samého začátku... »baye-sovská«, to znamená, že pracuje se subjektivními pravděpodobnostmi, totiž těmi stupni jistoty osoby, která rozhoduje, že jiné osoby učiní určité opatření nebo že nastanou jiné nejisté události." Tato subjektivní pravděpodobnost se ovšem v případě racionálně se rozhodujícího člověka co nejvíce přizpůsobí statistické pravděpodobnosti, pokud taková pravděpodobnost existuje. A těmito objektivními metodami získávání informací na základě malých a nej-menších vzorků se budeme nyní zabývat. 6.4 Nejmenší vzorky V nejlepší příručce z přelomu století, ve dvacetisvazkovém naučném slovníku, kterému se v mnohém ohledu od té doby sotva co vyrovná, budeme ještě marně hledat pojem „vzorek". Jeho hutnický význam již zastaral („kdykoli tavič odpichuje tavbu, vždycky bere vzorek," říkalo se v jedné hutnické kronice ze 16. století o způsobu tavby ve vysokých pecích), a jeho nový, statistický význam ještě nepronikl mimo nejužší okruh vědcú-odborníků. Obsah pojmu, i když v poněkud jiném smyslu, existoval již ovšem déle. Už Thomas Bayes ve svém počtu pravděpodobnosti bral zřetel na jednotlivé nové poznatky. Ještě dříve museli první političtí aritmetici pracovat s tak nedostačujícími údaji, že jejich práce, ačkoliv se zakládala na vyčerpávajícím zjišťování, měla jen vypovídací schopnost vzorku, mnohdy dokonce ani ne náhodného vzorku v dnešním slova smyslu; náhoda spočívala pouze v tom, zda zrovna získali nějaké údaje. Později byly dílčí výsledky bezstarostně převedeny na výsledky celkové — Quételet vypočítal váhu všech obyvatel Bruselu prostě tak, že jednotlivé váhy příslušně násobil. Matematická teorie náhodných výběrů naproti tomu vznikla teprve ve dvacátých a třicátých letech našeho století a pak rychle nastoupila vítězný pochod světem. Vyčerpávající zjišťování existují ovšem i dnes, ale dynamika statistické teorie a praxe spočívá téměř výlučně na malých číslech, na vzorcích. Tento vývoj začal dříve — a především se dříve prosadil — v anglo-americké oblasti, ve Francii a v Itálii než v německé jazykové oblasti, kde ještě hluboko do 20. století převládal názor Georga von Mayra, že každá řádná statistika musí být vyčerpávajícím zjišťováním. Dílčí a výběrová zjišťování pokládala tato škola pouze za nouzovou pomůcku. Ještě v polovině třicátých let si stěžoval Oskar Anderson, že pod vlivem tohoto směru „je v Německu statistická teorie považována za vědu o státě, která se má převážně zabývat hromadnými jevy v lidské společnosti" a že „německý odborník vůbec nemůže rozumět např. anglickému teoretikovi a jeho odborným časopisům". Tím se také vysvětluje, proč v našem výkladu moderní statistiky jsou neustále představováni Angličané nebo Američané. Rovněž teorie malých čísel vznikla téměř bez výjimky v anglo-americké oblasti. ____6.41 Studentovo rozdělení t Jak malá však mohou být tato čísla, rozsahy vzorků, aby mohla vypovídat něco užitečného? Prováděli jsme již propočty o potřebném rozsahu výběrových souborů a přitom jsme viděli, že optimální rozsah náhodného výběru je možno vypočítat podle rozptylu (resp. četnosti znaků) a v závislosti na požadované přesnosti (úrovni významnosti). Alespoň poněkud spolehlivé výsledky předpokládají výběrové soubory o rozsahu 500 až 3000. Jak často však nelze — zejména ve vědeckém výzkumu — při nejlepší vůli zjišťovat tisíce hodnot? Máme např. testovat nový preparát proti třesavce — kolik pacientů, kteří přicházejí v úvahu, máme vůbec na klinice? Z nich však musí být část léčena jako kontrolní skupina dosavadní metodou! (Argument, že lék slibující úspěch se musí použít bez výjimky pro všechny pacienty, svědčí sice o vysoké etice, ale vede ke špatné statistice. Bez porovnání není nulové hypotézy ani ověřováni hypotéz.) V jiných případech je potřebný homogenní materiál k dispozici jen v omezeném rozsahu. Teoreticky dosažitelné údaje a zjišťování ze zahraničí lze použít jen s velkou zdrženlivostí — zkrátka, většinou to už bývá tak, že z nějakého důvodu mohou být vytvořeny jen velmi malé vzorky. Jako statistický materiál je k dispozici 20, 15 a ještě méně případů. Je vůbec možné něco s tím počít? 6.41 Studentovo rozdělení t William Sealy Gosset. který pracoval začátkem našeho století jako chemik v anqlickém pivovaru Guinness. vymyslel postup, který měl poskytnout možnost dělat z malých a nejmeníich 197 vzorků použitelné závěry, přinejmenším však poznat, jak posuzovat vypovídací hodnotu takových vzorků. Jméno Gosset je už dnes téměř neznámé, avšak každému statistikovi je zcela běžné „Studentovo t" a „rozděleni t" podle Studenta. Gosset se totiž pod svá průkopnická díla podepisoval pseudonymem „Student", protože mu jeho firma nedovolila publikovat vědecké práce pod vlastním jménem. Snad by ani nesměl formou „vedlejšího zaměstnáni" vůbec psát. a proto se úzkostlivě ukrýval pod pseudonymem. Výsledky jeho bádání, především rozdělení t, částečně doplněné a přepracované R. A. Fisherem, patři dnes k bezpodmínečné výzbroji moderní teorie výběrových souborů. R. A. Fisher sám vtiskl statistice první poloviny tohoto století svoji pečeť. Alexander McFarlane Mood o něm v roce 1950 napsal: „Fisher je obrem ve vývoji teoretické statistiky. Jeho první příspěvek vyšel v roce 1912 a od té doby až dodnes neustále publikuje... Tomuto jedinému muži je nutno připsat nejméně polovinu celého důležitého zásadního vývoje, vycházíme-li z dnešního stavu teorie." A skutečně, téměř všechny moderní matematické metody statistické analýzy pocházejí od R. A. Fishera. Již jsme uvedli, že zejména Bayesovi stoupenci uplatňují námitky proti čistě matematickým metodám, což platí zvláště o teorii nejmenších vzorků, „small sample theory" — a rozděleni t může být omezeno na vzorek sestávající pouze ze dvou (!) hodnot! Proti těmto metodám se ostře postavil zejména Richard von Mises, jeden z nejvýznam-nějších teoretiků počtu pravděpodobnosti, který v roce 1950 napsal: „Tento vývoj vedl obdobím, kdy byla sledována pochybná myšlenka — z malého sledu pozorování dělat statistické závěry, tzv. osmall sample theory«. Zdá se' že nyní jsou již tyto omyly v podstatě překonány..." Nuže, „small sample theory" není zatím vůbec překonána, Studentovo rozděleni t má stále ještě vynikající úlohu, a proto tuto důležitou metodu alespoň krátce popíšeme. Náš popis nemůže ovšem zdaleka zachytit celou problematiku a už vůbec ne celou techniku použití tohoto postupu, neboť nejde sice o „vyšší", ale přece jen o — řekněme — „střední" statistickou metodu, k jejímuž ovládnutí je třeba více matematiky a teorie pravděpodobnosti, než si zde můžeme dovolit uvést. Nicméně vyjádření základní myšlenky by se nám mělo podařit. Když jsme v páté kapitole mluvili o směrodatné chybě průměru a četnosti, upozorňovali jsme již na to, že vzorec vyžaduje a, zatímco ve skutečnosti je k dispozici pouze s vzorku. Tehdy nebylo toto rozlišování ještě opravdu důležité, protože výběrový soubor byl stále dostatečně velký, aby se z něho dal přibližně přesně určit rozptyl. Tento předpoklad však neplatí, máme-li velmi malé vzorky. Máme-li jen tři měrné hodnoty (např. 18, 14, 13), mohli bychom opravdu seriózně vypočítat standardní odchylku? Podle již vyzkoušeného schématu? (x = 15; 32 = 1 /14 = 9; 12 = 1; 2°- = 4; s = ]i y = 1.67.) Dokonce i když nedělíme n, nýbrž n — 1, jak je účelné i při větším rozsahu výběrového souboru, na což jsme již krátce upozornili v oddílu 2.5, je i průměr vzorku je při velmi malém výběrovém souboru téměř bezcenný. Mohlo by se lehce stát, že rozdělení souboru vůbec nemá rozptyl a = 1,67 (nebo také 2,65) kolem /< = 15, nýbrž že by skutečný průměr mohl docela dobře být 12 nebo 7, skutečná směrodatná odchylka 1 nebo také 3. Krátce řečeno, u vzorku o rozsahu 15 nebo ještě méně nemá smysl mluvit o „normálním rozdělení" a s tímto pojmem vážně pracovat. Ale co má přijít místo něho? Na jeho místo přichází srovnáni s tabulkou, která byla propočtena speciálně pro tyto případy, s tabulkou pocházející od Studenta. Předpokládejme hypotézu, že v určitém souboru skutečná střední hodnota činí přesně 100. Z tohoto základního souboru jsme vytvořili vzorek o rozsahu n = 5, abychom viděli, zda na tomto základě může být hypotéza zamítnuta. Pět potřebných měření dává tyto hodnoty: 82, 87,104, 92, 90. Lze ještě uvést tento výsledek do souladu s danou hypotézou? Nejdříve vypočítáme x, což je 91. Pak vypočteme známým postupem rozptyl: součet druhých mocnin odchylek od průměru výběrového souboru je 81 + 16 + 169 + 1 + 1 = = 268. Rozptyl s2 = 53,6, směrodatná odchylka výběrového souboru s = l'53,6 = = 7,32. Tyto hodnoty dosadíme do vzorce: směrodatná odchylka s pochybné ceny. K tomu však přistupuje ještě to, že nejen velikost rozptylu, ale Mohou překvapit svislé čárky, mezi nimiž je výraz /t—x; znamenají pouze „absolutní hodnota" a vyjadřují, že se nemusí dbát na znaménko. Výraz __6*1 Studentovo roidéleni t „absolutní hodnota" jsme již ve stručnosti poznali (srv. oddíl 2.5). Důležitější je něco jiného: t. jež nyní dostaneme, není totiž výsledek, který by třeba jako v případě normálního rozdělení bylo možno najit v tabulce a jehož přesnost výpovědi by se mohla přímo určit. Je to spíše testovací veličina, „zkušební proměnná", jak jsme ji poprvé předvedli v příkladu Čápa a spol. Nyní dosadíme naše hodnoty, přičemž nejdříve za a prostě použijeme nahoře vypočítané s, které se ovšem ukáže jako příliš malé. Pak dostaneme: 100 — 91 , t = 732 b = (1.23) (2.24) = 2.75. To je naše první zkušební veličina. Nežli ji však porovnáme s hodnotou uvedenou v tabulce rozdělení t, musíme ještě stanovit tzv. „stupně volnosti", které mají důležitou úlohu při všech vyšších metodách ověřování hypotéz. Stupně volnosti měří prostor (volnost) výsledků výběrů. Myšlenkový postup je tento: z našeho vzorku jsme dostali střední hodnotu x = 91. Jak vznikla? Existují nesčetné možnosti, avšak jen pro první čtyři měření: jestliže ta jsou určena, je tím určeno i páté. Když jsme např. ve čtyřech měřeních dostali 90. musí pate činit 95. má-li být střední hodnota x = 91. Nemají-li tedy všechny n vzorky úplnou volnost, nýbrž jen (n — 1). činí také číslo stupňů volnosti ve výběrovém souboru n-1 V našem přikladu jsme měli pět měřen, (n = 5). proto máme čtyři stupně volnost. (n — 1 = .. i Tabulka rozděleni t má sloupce a r«W- 199 198 6. O zacházení s hypotézami i i □ n bez stupně volnosti ky. Ve sloupcích je uvedena pravděpodobnost v procentech, v řádcích pak počet stupňů volnosti, na nichž se zakládá testovaný propočet. V průsečíku příslušného sloupku a řádku je srovnávací hodnota. Předpokládejme, že jsme chtěli 95% jistotu: vyhledáváme sloupec 95 % řádek 4 a tam najdeme: 2,13. Proti této tabulkové hodnotě je naše zkušební veličina (t = 2,75) poněkud větší, hypotéza (p. = 100) je tedy na této úrovni zamítnuta. Naproti tomu u 97,5 % je tabulková hodnota 2,78 a na této úrovni se již hypotéza nezamítá. Náš výsledek je tedy mimo 95 % velikosti náhodného rozdělení kolem průměru /i = 100, ale uvnitř 97,5% velikosti rozptylu. Zda je to „významné", je ponecháno našemu úsudku. Stupně volnosti pro rozdělení t se většinou udávají jen do 30 (nebo 50), protože nad tuto výši se již uplatňuje „bezmezná" volnost normálního rozdělení. (Mezní hodnota rozdělení t je totožná se směrodatnou odchylkou normálního rozdělení. Přitom se však musí vycházet z tabulek pro „jednostranné" pravděpodobnosti, protože i rozdělení t je jednostranné.) Souvislosti mezi normálním rozdělením, směrodatnou chybou průměru a Studentovým t jsou pozoruhodné. Pro standardizaci normálního rozděleni jsme použili vzorce (srovnej oddíl 3.32) Tři měrné hodnoty (nebo čísla, hrací kameny atd.) se rozdělí libovolně na tři volná místa, přičemž místo pro první kámen lze ještě vybírat. Také pro druhý je ještě nějaká „volnost" volby. Místo pro třetí je však již pevně určeno provedenými volnými rozhodnutími. Číslo „stupně volnosti" je tedy o jednu menši než počet míst. která jsou k dispozici. 6-41 Studentovo rozděleni t 100 15 100 15 2) 22 100 15 22 3) 18 100 15 22 18 4) 21 24 100 Mám-li z pěti libovolných hodnot dostat celkový součet 100, jsou k dispozici jen 4 stupně volnosti: první až čtvrté číslo mohu volit libovolně, páté však už je nutně určeno. Jestliže jsem zvolil 15. 22, 18 a 21, nezbývá mi již žádný stupeň volnosti: páté číslo nemůže být žádné jiné než 24. daná hodnota normovaná _ minus aritmet. průměr hodnota směrodatná odchylka nebo, vyjádřeno v symbolech, z = X'~fi a U Studentova t známe již vzorec \u — x| ,/— t = -'- Vn, který lze napsat ta- ké takto: \P — x\ a Hodnotu a/\n však známe (z oddílu 5.4) jako „směrodatnou chybu průměru1'. Můžeme tedy definovat: hypotetický průměr souboru — průměr výběrového zkušební _ souboru veličina t ~ směrodatná chyba průměru Potíž spočívá v tom. že konstantu -r hypotetického základního souboru můžeme odhadovat jen z náhodné proměnné s vzorku. Avšak právě u malých a nejmenších vzorků může být rozptyl výběrového souboru velmi nespoleh- Rozdělení I >. a n \. «% 975% 99% 99,5% 1 6.31 12,71 31,82 63.66 2 2.92 4,30 6,96 9.92 3 2.35 3,18 4,54 5,84 4 2.13 2.78 3.75 4.60 5 2.01 2,57 3,36 4.03 6 1.94 2.45 3.14 3.71 7 1.89 2.36 3.00 3.50 8 1.86 2,31 2.90 3.36 9 1.83 2.26 2,82 3,25 10 1.81 2,23 2.76 3,17 11 1.80 2.20 2.72 3.11 12 1.78 2.18 2,68 3,05 13 1.77 2.16 2.65 3.01 14 1.76 2.14 2.62 2,98 15 1.75 2,13 2,60 2.95 16 1.75 2.12 2,58 2.92 17 1.74 2,11 2.57 2.90 18 1.73 2.10 2,55 2.88 19 1.73 2,09 2,54 2.86 20 1.72 2.09 2.53 2.85 21 1.72 2,08 2.52 2.83 22 1.72 2.07 2.51 2.82 23 1.71 2.07 2.50 2,81 24 1.71 2.06 2.49 2.80 25 1.71 2.06 2.48 2.79 26 1,71 2.06 2,48 2.78 27 1.70 2.05 2.47 2.77 28 1.70 2,05 2,47 2.76 29 1,70 2.05 2.46 2.76 30 1.70 2,04 2.46 2.75 34 1,69 2.03 2.44 2.73 40 1.68 2.02 2.42 2.70 50 1,68 2.01 2.40 2.68 2.65 2.63 70 100 1.67 1.66 1.99 1.98 2.38 2.36 Tabu.kasrovnatelnýchh^notrozd*l«.«.Vto. vém sloupci je číslo stupňu volnosti »- 201 200 6. O zacházeni s hypotézami livý. Bude totiž menší než rozptyl v základním souboru a tento rozdíl bude zvlášť rušit u nejmenších vzorků. Jsou dvě možnosti, jak korigovat příliš malé hodnoty vzorků, přičemž obě vedou ke stejnému výsledku. Ukážeme je na našem příkladu, protože se tím také vyjasní někdy rozdílné definice s. Již v druhém oddílu jsme upozornili, že směrodatnou odchylku výběrového souboru lze matematicky správně získat tím, že součet umocněných odchylek — Ľ (x, — x)2 — se nedělí počtem měření (n), nýbrž jen (n — 1). Měli jsme tedy součet odchylek 268, dělený (n — 1 = 4), což dává s2 = 67 a s --- ]r67 = 8,18. Dosaďme tuto hodnotu do našeho vzorce místo neznámého a, čímž dostaneme správnější zkušební hodnotu (která již přihlíží k nepatrnému rozptylu výběrového souboru): t = (100 — 91) ľ5 8,18 20,16 8,18 = 2,46. Můžeme však použít také jiného způsobu a říci: odhadneme neznámou a tak, že nejdříve vypočítáme rozptyl výběrového souboru, jako kdyby šlo o rozptyl základního souboru (dělíme tedy n = 5), pak však použijeme opravného koeficientu. Tento koeficient zní í. n_j-,v našem příkladu tedy ľ5/4 = = Ví,25 = 1,12. Náš původní výpočet dal příliš malý rozptyl s = 7,32. Násobíme jej 1,12 a dostaneme jako nahoře 8,18. A tím opět t = 2,46. Moderní učebnice statistiky téměř bez výjimky používají definice s2 a s, která již zvýrazňuje charakter výběrového souboru, to znamená s dělením (n — 1). Ve starší literatuře se však můžeme setkat s tím, že se rozptyl výběrového souboru počítá stejně jako rozptyl základního souboru — a pak je nutno u malých výběrů použít „opravného koeficientu", jehož oprávněnost ještě dále prokážeme. V této knize jsme dříve zacházeli s rozptylem vzorku poněkud „naivně", ale nyní, když se zabýváme malými a nej-menšími vzorky a kromě toho se stále více věnujeme matematickým testům hypotéz, musíme s2 a s počítat přesně. Poznamenejme si tedy: naše zkušební veličina je nyní t = 2,46. Zkušební veličina se nachází „pohodlně" uvnitř 97,5 % náhodného rozptylu — žádný div, vždyť jsme poněkud zvětšili korekturu rozptylu. Skoro to vypadá tak, jako by se čitatel zkušební veličiny při rostoucím n stále zvyšoval, avšak to nesouhlasí, protože při rostoucím rozsahu vzorku směřuje i rozdíl (/i — x) k nule, neboť vzorek nevychází z hypotetického základního souboru, což má být mimochodem také testem dokázáno. V mezním případě výběrového souboru jen se dvěma měřeními (tedy minimem pro tvorbu střední hodnoty) je stále možno použít rozdělení t, které je pak ovšem krajně „velkorysé", protože v takovém případě se jeví jako možné téměř všechno. Předpokládejme, že bychom z výběrového souboru o rozsahu n = 2 dostali 2 výsledky: 4 a 6, tedy x = 5. Nyní bychom rádi věděli, zda se to snáší s hypotézou /x = 12, což se na první pohled zdá nesmyslné. Avšak dostáváme _ (12-5) V2 _ 1/2 V tabulce pro stupeň volnosti nacházíme však při 95% již 6,31, při 97,5% 202 6.41 Studentovo rozdelení • dokonce 12,71 - naše hypotéza je tedy těsně zamítnuta jen na úrovni 95 %, ale už vůbec ne na úrovni 97,5 %. Kdo již listoval ve statistické literatuře, narazil možná na vzorce, které se od zde uváděných poněkud liší. Hlavní důvod spočívá v tom, že — jak jsme již několikrát poznamenali — při používáni symbolů a také v terminologii není vždy úplný soulad mezi autory různých zemí a dob, nemluvě už o rozdílné matematické úrovni čtenářů. Mimoto neznamená n v tabulkách rozdělení t zpravidla rozsah vzorku n, nýbrž číslo stupňů volnosti. Dále je pravděpodobnost někdy „zrcadlovým obrazem": 1 % znamená 99%; co je tedy zamítnuto na úrovni 95 %, má pravděpodobnost více než 0,05. Ještě horší však je, že stejně jako u normálního rozdělení je třeba pečlivě zkoumat, zda tabulka platí pro jednostranné nebo dvoustranné testy — zpravidla jen pro jednostranné s odpovídající „koncentrací" pravděpodobnosti na jednom konci křivky rozdělení t (tato křivka totiž přece jen existuje, ale má pro každý stupeň volnosti poněkud jinou podobu, až nakonec přechází do normální křivky). Na tomto místě bylo důležité jen to, aby se podařilo načrtnout zásadní význam rozdělení t a testů t. Kdo se tím chce vážně zabývat, udělá dobře, bu-de-li ještě studovat odbornou literaturu. Studentův test je užitečný především tehdy, když se má zkoumat, zda dva vzorky pocházejí ze stejného základního souboru. U jednoho výběrového souboru vychází např. x, = 94, u druhého x., = 103. Nyní je třeba ověřit, jaká je pravděpodobnost, že oba pocházejí ze základního souboru se skutečným průměrem a = 99. Máme zde jakýsi druh hry na ověřování hypotéz (nulová hypotéza: „Mezi oběma vzorky není žádný významný rozdíl"), a to př. použití velmi malých vzorků, jako je tomu vždy u rozdělení t. Takové testy jsou velmi poučné zvláště tehdy, když podmínky pokusu u obou vzorků byly rozdílné. Erwin Kreyszig („Statistické metody a jejich používáni") k tomu uvádí příklad z anglického odborného časopisu. Při ručním tříděni fazolí („Popelčina metoda") byly vyzkoušeny dva způsoby. Při jednom se vadné fazole vkládají do dlaně a odloží se, až je dlaň plná. Při druhém se špatná fazole vezme a hned odhazuje. Devět dělníků zkoušelo obě metody s těmito výsledky: Dělník i. První metoda Druhá metoda 1 214 281 2 253 279 3 276 260 4 215 230 5 238 267 6 221 253 7 210 205 8 229 265 9 269 299 Podmínkou pro platnost testu při tom ovšem je, že při obou pokusných řadách jsou všechny fazole stejného druhu. Nulová hypotéza zní: „Oba způsoby jsou stejně dobré." Může být vyvrácena? První výběr má průměr x, = 260 a rozptyl s,2 = 796.4. druhý x2 - 236 a s„2 = 607.1. Zkušební veličina t se nyní vypočítava podle vzorce: t = 1*1— W »• 203 6. O zacházeni s hypotézami t = Dosadíme a dostaneme: (260 — 236) l'9 _ 3.24 V796 +1Ô7 ~ VuÔ3 ~ 72 V tabulce najdeme (při úrovni 95 % v řádku dvakrát osm = 16 s volnosti) 1.75. pnu Naše zkušební hodnota je vyšší, nulová hypotéza se tedy zamítá, způsoby zřejmě nejsou stejně dobré. (Pravděpodobnost, že jsou přece jen stejně dobré, je menší než 5 %.) Předpokládejme proto jako alternativní hypotézu, že druhý způsob výběru je lepší. 7 proč statistiky lžou? 7.1 „Statistiky", které nejsou statistikami Jestliže je statistika (jako metodika nebo jako vědní obor) často posuzována s pochybnostmi a odmítavě, může se za to poděkovat především statistikám, které ve skutečnosti statistikami nejsou. Je to stejné jako kdyby nemocného člověka léčil mastičkář, zřízenec nebo kuchyňský personál kliniky a nemocný pak mrzutě konstatoval: „Medicína není vůbec žádná věda; všichni lékaři jsou šarlatáni." Zákon však dbá o to, aby jako lékař působil jen ten, kdo dokončil příslušné studium, vykonal zkoušky a získal praktické zkušenosti. O statistice se naproti tomu bezmála každý domnívá, že zde může působit bez zvláštních předchozích znalostí kdokoliv — od ctižádostivého vedoucího prodeje až po šéfa s geniálními myšlenkami, intrikán a demagog stejně jako naivní pošetilec a dobromyslný ignorant. Již několikrát jsme měli příležitost ukázat, že stejnou věc je možné pozorovat z různých hledisek a podle toho statisticky různě vyjádřit. Vždycky jsme však přitom mlčky předpokládali, že — za prvé — číselný materiál, který je připraven k použití, je alespoň do určité míry správný a že — za druhé — se nelže vědomě. Jestliže se tedy mluví o lži ve statistice, je nutno vždy zjistit, o jaký druh lži jde. Existuje především zdánlivá lež, která není v podstatě nic jiného než nesprávně pojatá přesná statistika (je zcela mož- né, že je lstivě zaměřena na oklamání naivních lidí, ale sama o sobě svými údaji a tvrzeními je nenapadnutelná). Dále existuje odvozená, sekundární lež, charakterizovaná tím, že se statistik zaměňuje s komentátorem. Je to zvlášť rozšířený druh a vzniká většinou tak, že nějaký tajemný manipulátor, demagog nebo podvodník se seznámí — nebo je seznámen — s čísly, která vhodně vyložena se zdají dokazovat jeho myšlenkový koncept. Zmocní se tedy v podstatě správných čísel a buduje kolem nich konstrukce lži, která je nespornými čísly znamenitě udržována a posilována. To se stává především tehdy, když se k číslům vyhledávají „příčiny" nebo „následky". Až budeme později mluvit o korelacích a zdánlivých korelacích, bude ještě možné k tomu ledacos vážného i veselého dodat. A konečně existuje úplně nemotorná forma lži, při níž však lze postupovat statisticky korektně jak při zpracování, tak při výkladu. Bývá tomu tak tehdy, jestliže se hned od začátku zfalšuje prvotní materiál. Můžeme si zde uvést starou anekdotu o dvou cikánech. v které se jeden velice diví tomu, že ten druhý může prodávat koše pletené z vrbového proutí ještě laciněji než on sám. „Jak je to možné?" ptá se první. „Tak lacino nemohu prodávat, ačkoliv vrbové proutí kradu." Druhý se smíchem pokrčí rameny: „To já kradu celé koše." Jestliže se tedy najde vhodný číselný materiál, opravdu není zapotřebí namáhat se s vymýšlením rafinovaných 205 7. Proč statistiky lžou statistických operaci nebo. s obtížnými vychytralými výklady. Ernst Wage-mann, v letech 1923 až 1933 prezident Říšského statistického úřadu a autor četných populárně vědeckých knih, uvádí vc svém díle „Č7s/o jako detektiv" několik příkladů ze světových dějin, které — někdy po tisíciletí — vedly k nesprávným výkladům a závěrům: Xerxovo vojsko mělo podle Hérodota 4,2 miliónu mužů — ve skutečnosti však snad jen 20 tisíc, s vozatajstvem 60 až 70 tisíc. Švýcaři odhadovali ztráty Karla Smělého u Gransonu na 7000 mužů — ve skutečnosti padlo jen 7 rytířů a několik vojáků. V německých osvobozovacích válkách prý bylo v bitvě u Hagelsbergu pobito4000Francouzů — ve skutečnosti jich však padlo pouze 30. Použitím nesprávných výchozích údajů — nebo dokonce vědomým falšováním „prvotního záznamu" — je možno dokázat všechno. I nekritickému čtenáři nebo posluchači bude těžké namluvit, že 4 a 5 je 6, ale jestliže nejdříve zfalšuji 5 na 2, mohu potom plným právem tvrdit, že 2 a 4 je 6. Proto se vždy doporučuje nejdříve zjistit, zda se setkáváme s vrátným, ošetřovatelkou nebo šéflékařem, zda s pseudostatistikou nebo se statistikou. Rozlišení není na první pohled vždy snadné. I vrátný může v bílém plášti a v brýlích prohodit několik latinských slov a laikovi předstírat lékaře. Ještě snadněji se podaří mladému muži v osobním oddělení vypočítat na počítači procenta s přesností až na desetinná místa, a tak vyrobit zdánlivě pravou „statistiku". Jak se ubránit vylhaným sloupcům čísel a fantastickým křivkám, jak je poznat? Kdo dočetl tuto knihu až sem, je už značně imunní. Kdo ji dočte až do konce, může se pak s klidným svědo- 206 mim setkat se správnými i nesprávnými statistikami. Existuje však několik docela prostých zásadních pravidel, která ovšem — jako ostatně každé pravidlo — zaručují jen relativně malou pravděpodobnost jistoty. Vždy je ještě možno např. statistiky a výsledky anketních šetření, shrnuté v pěti (nebo i v deseti) řádcích noticky v denním tisku, označit za „ne zcela důvěryhodné". V nej-lepším případě jde o původní číselný materiál, který byl někým interpretován a v této podobě předán tisku. Potom nějaký novinář nikoli ve zlém úmyslu, nýbrž aby nerozzlobil čtenáře bojícího se čísel, část údajů vynechá a z komentovaného textu zdůrazní to, co působí aspoň trochu senzačně. W. J. Reichmann komentuje např. zprávu vytištěnou tučným písmem: „Každá druhá žena si stěžuje na bolesti v zádech", a uvádí pak, že již původní statistika obsahovala několik slabin. Předně nešlo o základní soubor „ženy" (mimo jiné by bylo třeba vyjasnit, zda například šestnáctileté dívky mají být zahrnuty nebo nikoliv), nýbrž o pacientky. Ženy, které navštíví lékaře, jsou ovšem bezpochyby v průměru méně zdravé a trpí více bolestmi než ty, které nejsou v čekárnách. Tedy jen: „Každá druhá pacientka si stěžuje na bolesti v zádech." Dále se ukázalo, že tento výsledek nebyl získán z reprezentativního anketního šetření mezi praktickými lékaři, nýbrž byl výsledkem soukromé statistiky jediného lékaře. Tedy jen: „Každá druhá pacientka doktora X si stěžuje na bolesti v zádech." Reichmann k tomu již zlomyslně poznamenává, že dotyčný lékař provozuje svou praxi buď ve velmi vlhké krajině, nebo má v čekárně dost nepohodlné židle. Ale to zdaleka není všechno. Každá 7.1 ..Statistiky", které nejsou sto t .st, I a MI šetření (prvotní materiál) zpracován výklad čtenářův výklad lež (nelze nazvat statistikou) statistiky je zneužito ke IZím nesprávná statistika ickáj práce) čtenář rozumí Schéma zdrojů chyb a možnosti klamáni v průběhu sestavování a zpracováváni statistik. druhá pacientka doktora X si na bolesti v zádech sama od sebe nestěžovala, nýbrž odpověděla „ano" na otázku, zda trpí bolestmi v zádech. Nu a koho někdy nebolí v zádech? Nebo hlava? Nebo kdo čas od času není nervózní? To všechno jsou tak rozšířené symptomy, že diagnosticky mají určitou cenu teprve tehdy, jsou-li intenzívní a pacienti je uvádějí jako značné obtíže. Ten, kdo teprve na otázku „Máte někdy bolesti v zádech" odpoví „ano", si na to vlastně nestěžuje a není tím „významně" omezen ve svém zdravotním stavu. Tak se scvrkává „statisticky podloženě" tvrzeni, podle něhož si každá druhá žena stěžuje na bolesti v zádech, na mnohem méně působivou skutečnost, že někde v Anglii je nějaký lékař, polovina jehož pacientek na otázku, zda také mají bolesti v zádech, odpovídá „ano". Tuto zprávu doplňovalo sdělení, že též na jedné ortopedické klinice si třetina pacientů stěžovala na bolesti v zádech, což Reichmann komentoval protiotáz-kou, zda je to na takové klinice překvapující, a skončil kousavým vtipem, že jednoho dne se s hlubokým dojetím zjistí, že v tuberkulózních sanatoriích trpí 100 % pacientů tuberkulózou. V tomto případě bylo alespoň možné vystopovat na základě původní zprávy všechny zdroje chyb. ale co má dělat čtenář, kterému se předkládá pod uvedeným titulkem hustý text. než domnívat se. že opravdu každá druhá žena v Anglii si stěžuje na bolesti v zádech? 207 7. Proč statistiky lžou 7.1 „Statistiky", které nejsou statistikám, Ještě horší je to s novinářským vyhodnocováním anketních šetření a „statistik", které mají pomoci překlenout okurkovou sezónu. Pak vznikají titulky typu „Průměrný člověk líbá v životě 56 807krát". Jeden ještě tučnější titulek hlásal: „Statistika dokazuje: šílenství chrání před rakovinou". V tomto případě bohužel chybějí věcné údaje téměř úplně, ale již z prvního odstavce, upraveného jako „trhák", je přece jen možno vytušit, o co vlastně jde: „Demografové a lékaři kroutí hlavou a neznají vysvětlení. Nejnižš! úmrtnost na rakovinu mají chovanci ústavu pro duševně choré." Už z toho je přinejmenším jasné, že šílenství vůbec „nechrání" před úmrtím na rakovinu, nýbrž že z duševně chorých umírá na rakovinu poměrně méně než z veškerého obyvatelstva. Zjištění, které si nepochybně zaslouží přesnější ověření hypotézy (pokud v této formě opravdu vznikla), však vůbec nepodává „statistický důkaz" o tom, že duševně choří neumírají na rakovinu. Z popisu „průměrného Američana" je možno se mimo jiné dozvědět toto: „Průměrný Američan je 1,75 m vysoký, váží 71,5 kg, navštěvuje všechny zápasy baseballu a košíkové a v hazardních hrách víc prohrává než vyhrává." Váha a výška jsou zřejmě hodnoty mediánu (viz str. 38). Poznámka o hazardních hrách je otřepanou pravdou, že všechny hazardní hry se zakládají na tom, aby přinášely provozovateli zisk, a proto může hráč „v průměru" jen prohrávat, stejně jako průměrný Středoevropan prohrává v loterii a sázkách více, než vyhrává. Co znamená „všechny baseballové zápasy"? Nelze se pak divit, že inteligentní čtenář na „statistiku" nadává... Horší je naproti tomu text, který se zdůrazněnou seriózností následuje za titulkem „Ve stáří budeš šťastnější". Doslova se říká: „Policejní statistika západoevropských zemí překvapivě jednomyslně zjišťuje: ze 100 sebevrahů je průměrně 45% ve věku mezi sedmnácti a pětadvaceti lety, 30 % mezi pětadvaceti a čtyřiceti, 15% mezi čtyřiceti a padesáti a jen 10% (!) lidí starších padesáti let má dost svého života. Rozhodnutí k sebevraždě má tedy s přibývajícím věkem sestupnou tendenci." Tento závěr je však absolutně nesprávný. Spíše opak je pravdou. Procento sebevrahů s přibývajícím věkem stoupá. Jak k tomu vlastně došlo? To je velice poučné: v „optimistické" verzi o spokojeném stáří byly pozorovány příčiny smrti v jednotlivých věkových skupinách. Mladí lidé většinou neumírají na rakovinu, srdeční infarkt, mozkovou mrtvici nebo sešlostí věkem, umírají vůbec zřídka. Když umírají, tedy především v důsledku úrazů, ale také sebevražd. Ve skupině 15 až 40letých se sebevraždy podílejí na úmrtích 14 %. A na co umírají lidé po šedesátce? Na rakovinu, na infarkt, na mozkovou mrtvici, sešlostí věkem a — umírají všichni! Relativní podíl sebevrahů, představující asi 1 %, je velmi malý. Když se na to díváme takto, pak mladí lidé se odhodlávaj! k sebevraždě „relativně častěji". Správnější je provést srovnání s celkem věkové skupiny, a pak se ukazuje stoupající četnost (na 100 000 žijících stejného věku): ze tří u mladistvých pod 15 let na 44 u mužů nad 60 let. (U žen jsou čísla podstatně nižší, mají však stejnou tendenci.) Podobných příkladů by bylo možno uvést ještě libovolný počet. Spokojíme sebevraždy v roce - nu - - - 15 20 25 až až až 19 24 29 30 40 50 60 70 $1 až až až attarii 39 49 59 69 ze 100 úmrtí věkové skupiny připadá na sebevraždy Tak se „lže" statistikou. První „statisticky dokázané zjištěni": sebe-vražednost se zvyšuje s rostoucím věkem. Průběh křivky grafu zřetelně ukazuje, že počet sebevrahů v roce a dané věkové skupině se plynule zvyšuje a ve věkové skupině „70 a starší" činí více než desetinásobek skupiny mladistvých. Druhé „statisticky dokázané zjištění": ve středním věku dosahuje sebevražednost vrcholu, vzácné jsou naproti tomu mezi mladými a nej-staršlmi. Průběh křivky grafu zřetelné ukazuje, že z každých 100 sebevražd připadá asi "/« "°-věkovou skupinu 51 až 60, avšak na sedmdesátileté (71—80) jen asi 10% a na skupinu 21 až 30 let pouze 8 %. Třetí „statisticky dokázané zjištění": sebevražednost je nemoci mládí a její význam klesá s rostoucím věkem. Průběh křivky grafu zřetelně ukazuje, že podíl sebevrahů na celkovém počtu úmrtí jedné věkové skupiny kle-SQ * 25% mezi mladými lidmi (15—25 let) na méně než 1 %. jakmile se věk blíží sedmde-sátce. 15 20 25 30 35 40 45 50 55 60 65 70 75 80 aiaiaiiiaiiiiiiiiiiiiiiiii a 20 25 30 35 40 45 50 55 60 65 70 75 80 stár ze 100 sebevražd připadá na příslušné věkové skupiny f -y t r \ k- -- / s f f J —^ s / r r 15 21 26 31 36 41 46 51 56 61 66 71 76 81 liaiiiiiaiiiiiiiiíiiiiiiiiii 20 25 30 35 40 45 50 55 60 65 70 75 80 85 V závislosti na volbě základu — a) pro žijící stejné věkové skupiny, b) pro celkový počet sebevrahů, c) pro úmrtí ve stejné věkové skupině — vzniká zcela rozdílný obraz. Naše tři 9hH k S'Ce týkQ'1 tří různých zeml a různých oodobl. a nejsou tedy v jednotlivostech srov-n«elné. jsou však srovnatelné — a to je v daném případě důležité — charakteristickým průběhem křivky. (První graf znázorňuj* »•-bevražednost mužů v Anglii a Walesu v roce 1956. druhý sebevražednost mužů v Hamburku v letech 1945—195« a třeti seb«vrai«*ia« ve Vídni v roce 1963.) 208 7. Proč statistiky liou se však s těmi, které jsme uvedli, protože nám šlo jen o to zdůvodnit naše varování před příliš „lidově" zjednodušenými „statistikami". Na které statistiky se tedy můžeme spolehnout? Zpravidla na úřední statistiky, na statistiky velkých instituci a organizací. Především však na ty, které uvádějí absolutní údaje, udávají rozsah výběrového souboru a pokud možno i některé údaje o způsobu zjišťování a pravděpodobnou teoretickou spolehlivost vzorku. I v těchto případech je však nutno připomenout: Nedoporučuje se číst mezi řádky! Kdo statistiku interpretuje, dělá to na vlastní nebezpečí. Kdo si nechá výklad nekriticky nakukat, nepotřebuje se na čísla ani dívat. Dobrá statistika poskytuje přehledně zpracované údaje, případně matematické souvislosti mezi těmito čísly, uvádí průměrné hodnoty a směrodatné odchylky, meze chyb, případně vysvětlující poznámky, nedokazuje však žádné hypotézy — ani vědecky „čisté", ani demagogicky „špinavé". Protože však demagogové a skrytí manipulátoři statistiku tak rádi používají, je užitečné zeptat se v případě, že vznikají pochybnosti o seriózním vyjádření, ještě jednou nedůvěřivě: cul bono (komu to prospívá)? Tato otázka pomáhá již po staletí odhalovat zločiny a osvědčuje se často jako velmi užitečná i při odhalování statistických podvodů. 7.2 Počtárske umění demagogů Proč jsou tak oblíbené a časté — a bohužel také často tak úspěšné — lži pomocí statistik? Je tomu tak proto, že průměrný občan vyrostl v uctivé plachost, před čísly, která jsou obklopena posvátnou, ale nenapadnutelnou přesností matematiky, a ve světě kolísavých představ jsou jediná absolutně spolehlivá. Lichtenberg sice řekl: „Jednou je nutno o všem pochybovat, i o tom, že dvakrát dvě jsou čtyři." Ale koho by vážně napadlo pochybovat o malé násobilce. Vzhledem k tomu, že statistika pracuje převážně s čísly, přenáší důvěřivý občan svůj vztah k počtům také na čísla statistiky — ačkoli vedle toho může docela dobře obstát ze zkušenosti získané přesvědčení, že „statistiky lžou". Ve skutečnosti je obojí správné. Statistika používá matematických metod a matematické přesnosti a — statistika lže. První, pozitivní představa mimochodem převládá, jinak by také nebylo tolik pokusů lhát pomocí statistik. Představa, že „čísla dokazují", není přes veškeré špatné zkušenosti překonána. Proto demagogové, manipulátoři a lháři používají statistiky všeho druhu obzvláště rádi, stejně jako fotografií, protože fotografie prý nelžou. V době amatérského filmování je ovšem možné seznámit se s tím, jak lze obrazy a scény sestavovat a manipulovat s nimi — avšak o statistických metodách ví laik strašně málo. Již jsme vyčlenili ty druhy „statistických" lží, které jsou jen pouhé lži a vůbec ne statistiky, jako např. falšováni prvotních materiálů. Jestliže chci proti svému lepšímu přesvědčení tvrdit, že v minulém měsíci se nevyskytl žádný případ cholery, nemohu kvůli tomu sestavit statistiku nemocí, která by zasluhovala tento název. Jestliže tvrdím, že můj nový přípravek je na základě laboratorních zkoušek o 65 % lepší než všechny ostatní preparáty (ačkoli 210 7.2 Počtárske uménl demagogů ve skutečnosti je sotva stejně dobrý), je to pouhá lež, maskovaná jako statistická výpověď. To však ponechme stranou; budeme se zabývat takovými manipulacemi, které přece jen mají základ ve skutečnostech, i když pochybný. Fakta velmi často nejsou přesně to, co se někomu právě hodí do konceptu, a proto je nutno vhodně je upravit a přizpůsobit (první příklad jsme ostatně poznali již v oddíle 4. 3, kde jsme nechali fiktivní zaměstnavatele a zaměstnance provádět kejkle s indexy). Pro tyto manipulace je charakteristické, že čísla a početní metody jsou sice úplně správné, že však se tím u čtenáře nebo posluchače vyvolává docela jiný, skutečnosti neodpovídající dojem. Dělá se to proto, aby se skrylo něco nepříjemného, předstíralo něco pozitivního, zkrátka ze všech možných důvodů, jichž reklama a propaganda užívají, aby se něco ukázalo zájemci v co nej-lepším světle. Při přepočtu je ovšem možno produkovat nesmysly různým způsobem. To se stává většinou tehdy, když se něco přepočítá a pak „seřadí za sebou". Lze na to uvést asi tento příklad: „Kdyby se všechny vlasy, které se denně ostříhají v mnichovských holičstvích, seřadily za sebou, sahaly by ze Země až ke Slunci (nebo k Marsu, event. k Jupiteru)." To je hra, která sice může řadu lidí značně obveselit, ale většinou vzniká na základě takových „srovnání" spíše větší než menší zmatek. Na tyto přepočítávací hříčky existuje velké množství příkladů. Kdybychom chtěli papír, na kterém jsou vytištěny, slepit za sebou, dostali bychom se asi až na Měsíc. Věnujme se však raději vážnějším věcem a dejme si pod drobnohled velmi zvláštní druh procent, a to ta, která se vyskytují pod titulky typu „Devět z deseti generálních ředitelů používá tužkových ořezávátek Lig-nix" nebo „Tři z deseti hospodyň čistí stříbro Swobodovým argentorizidem". Na základě prodejních statistik však velmi dobře vím, že můj argentorizid používá stěží 1 % hospodyň. Lhal jsem tedy? Ano i ne. Mohu se např. prostřednictvím maloobchodu dostat do styku se dvěma nebo třemi desítkami žen, které tento čisticí prostředek kupují. To by bylo hned třicet spotřebitelek a k tomu připočtu ještě 70 výsledků anketního zjištění z náhodného výběru a tady snad také ještě přibudou jedna nebo dvě. Zkrátka: ze sta dotázaných hospodyněk jich nejméně třicet můj prostředek používá. Tři z deseti! Jestliže naivní čtenář z toho usoudí, že jsou to vždy tři z každých deseti nebo vždy třicet z každého sta (což je v této formulaci podle smyslu stejné), zkrátka že asi třicet procent všech hospodyněk používá můj prostředek na čistění stříbra, mohu ještě vždy s politováním pokrčit rameny a hlasem vyjadřujícím hluboké přesvědčení ujistit: „To jsem netvrdil! O »z každých* nebylo ani řeči. To je nedorozumění." Samozřejmě žádné politováníhodné nedorozumění, spíše předpokládané, ba dokonce vyvolávané. Ale s touto formulací mám čisté ruce, zůstal jsem takříkajíc čestným člověkem. Možná že by se dalo jít ještě o krok dále. Daruji např. padesáti generálním ředitelům nový druh ořezávače tužek a dotazy u jejich sekretářek pak zjistím, že devět generálních ředitelů tu věc opravdu zkusilo. A teď mohu říci: „devět z padesáti", mohu však také říci „devět z deseti". Že je to devět z deseti dodatečně vybraných, opatrně zamlčím. (Viz obr. na str. 212.) 211 7. Proč statistiky lžou • • • • • • • • • • • • 9 ze 45 9 z 10 Mezi 45 kuličkami jsem našel devět modrých — mohu proto právem tvrdit, že bych mezi 10 kuličkami našel 9 modrých? Vždyť přece netvrdím, že mezi každou desítkou kuliček najdu 9 modrých! Takové slovní hříčky na pokraji serióznosti vrhají na „statistiku", která s tím nemá nic společného, špatné světlo. 7.2 Počtárske uměni demagogů cích všeobecně a o zdánlivých korelacích zvláště. Někdy se statistiky zneužívá k té nej-větši demagogii, jindy se jí však také dojímavým způsobem šidí. Tak např. potulný cirkus, jak jednou uváděl Rolf Wa-genfúhr, velkými písmeny oznamoval „32 účinkujících". Skutečně pak vystoupilo dvanáct artistů, čtyři koně, šest opic a deset psů. „Lež" této statistiky spočívá v tom, že si čtenář vykládá pojem „účinkující" zpravidla jinak než autor textu, který s tím počítá. Co se v daném případě jev! jako malá podivnost, postihuje i nej-serióznější vědecky přesné statistiky. Již jednou jsme poukázali na to, že kategorie „nezaměstnaní", „smrtelné nehody", „studenti" a mnohé další jsou v jednotlivých zemích určovány často rozdílně, což prakticky znemožňuje jakékoliv srovnání. Kdo by se vážné pokoušel přesně srovnat počet „akademiků" v NSR a v USA? „Odbory požadují zvýšení mezd o 15%!" — „Zaměstnavatelé nabízej! jen 5 %!" Jsou tyto pozice zcela neslučitelné? Ne vždy. Uvedených 15% se může týkat např. minimálnich mezd podle kolektivních smluv, zatímco 5 % vyplácených mezd, které jsou možná podstatně vyšší než minimální mzdy. To je metoda, která se ukáže správnou teprve až se dotyčné osoby identifikují. V inzerátu britského výrobce plynových spotřebičů bylo možné číst: „Devět z deseti proslulých šéfkuchařů používá k vaření plyn. Proč?" K tomu bylo připojeno devět fotografii a jmen kuchařů z renomovaných anglických hotelů. Avšak i to souvisí s otázkou solidnosti nebo nekalé soutěže více než se statistikou. Je přece veřejným tajemstvím, že známé osobnosti, především herci, dávají svá jména k dispozici pro reklamní účely. Samozřejmě za odpovídající honoráře. Obtížnější je, když se povolají vědecké ústavy jako korunní svědci. Tu vzniká především otázka: Je daný ústav vůbec zařízením, které lze brát vážně? Za druhé: Nejsou z posudku citovány jen jednotlivé části? Za třetí a hlavně: Co je vlastně v posudku přesně obsaženo? Již dříve (v oddílu 4.4) jsme poukázali na možnost libovolného výběru srovnávaných hodnot. Upozornili jsme tam na mnohostrannou možnost mluvit, podle sledovaného účinku, raději v procentech nebo absolutních číslech a ukázali jsme, že by bylo celkem lehké zařadit např. Stuttgart jako páté velké město mezi deseti západoevropskými městy. Darmstadt může být největší mezi deseti největšími západoněmecký-mi městy — nebo také nejmenší — zcela podle libosti. Volbou systému srovnáni je rovněž možno dosáhnout různých účinků: Co jsou například „největší" noviny? Jsou to snad ty, které mají největší náklad, nebo ty, které mají největší odbyt nebo největší počet stran anebo nejvíce inzerátů (event. také obojí: jedny s největším počtem inzerátů, druhé s největší inzertní plochou nebo největším počtem stran); kromě toho to mohou být i noviny „nejčtenější", které nemusí mít největší náklad. Další dva důležité manipulační obory ještě poznáme, až se budeme blíže zabývat grafickým znázorněním statistických údajů, a pak — v deváté kapitole — až budeme mluvit o korela- 212 Cirkus jednou na plakátech oznamoval „32 účinkujících": na tom nebylo_vubec n,c vy pokud se za „účinkující" nepokládali jen artisté - lidé. Jakmile se setká,! £ „> * je třeba nejvyššl opatrnosti. Příliš snadno vzniká představa „statist.ckeho souboru . vlastně nedá vůbec mluvit. ůbec nic vylhaného, klamou, ěmž se 213 7. Proč statistiky lžou Mezi hrubou hodinovou mzdou za normální pracovní hodiny a průměrnou čistou hodinovou mzdou se zřetelem na nezdaněné příplatky, přesčasové hodiny, náhrady za dovolenou, přídavky na děti atd. jsou takové rozdíly, že je možno podle zvolené definice sestavit naprosto rozdílné statistiky a učinit zcela rozdílné závěry. K tomu přistupuje ještě také skutečnost, že během určitého časového období dochází k posunu pojmů: průměrná „kriminalita" se samozřejmě zvýšila v důsledku růstu dopravních přestupků. Stane-li se homosexualita (nebo nějaký jiný delikt) beztrestná, počet deliktů automaticky klesne. Také vzrůst počtu úmrtí na rakovinu nemusí „statisticky dokazovat" bezmocnost medicíny, stejně jako zvýšení průměrného věku nelze vysvětlovat jen jejím pokrokem. Může prostě jít o přesnější diagnózy. Seznamy příčin úmrtí před 100 lety a dnes nelze vůbec srovnat. V jednom středoevropském velkoměstě zemřelo v roce 1863 asi 17 000 osob — z toho 864 sešlostí věkem, 600 na fyzickou slabost, 4840 na souchotiny, 1135 na průjem, 180 v šestinedělí, 590 na tyfus, 1433 na zápal plic, 300 na černé neštovice a 302 na spálu. Jestliže pomineme dětskou a kojeneckou úmrtnost, zůstávají souchotiny, zápal plic, sešlost věkem a tyfus nejdůležitějšími příčinami smrti, zatímco o rakovině ani o chorobách krevního oběhu není ani zmínky. (Obr. na str. 215.) — Jako kuriozitu k tomu dodáváme, že Abraham de Moivre, kterého jsme poznali jako jednoho z velkých předků naší vědy, zemřel podle úmrtního listu na ..somnolence", na ospalost. Jiné nepřípustné srovnání: „Průzkumy jedné švédské automobilové firmy ukázaly, že ze 42 813 osob, které měly auto- 214 nehody, jich 52 zemřelo; z toho 49 nemělo bezpečnostní pásy." proc t0 vůbec nic neříká? Protože chybí údaj 0 procentech uživatelů bezpečnostních pásů. Jestliže například pásy používá jen 1 % automobilistů, je spíše po-vážlivé. že 3 z 52 obětí pásy nepoužívaly. Kapitola sama pro sebe jsou válečné statistiky. K nespo/eh/.vost/ odhadu se druží více nebo méně vědomé falšování údajů vojenskými a úředními místy. V únoru 1968 oznamoval časopis „Newsweek", že mrtví Vietkongu prý byli „často počítáni vícekrát", mimoto prý byli obvykle „na každou ukořistěnou zbraň počítáni 3 až 4 mrtví nepřátelé". Ministr obrany McNamara mluvil jednou o 165 000 mrtvých nepřátel za minulý rok, přičemž ovšem dodal, že tyto údaje se zakládají zčásti na „faktorech posuzování" (judgment fac-tors) a musí se brát s rezervou. V bouřlivém vnitropolitickém sporu v Rakousku o údajně „manipulované statistice socialistů" se vedle oprávněných námitek argumentovalo mimo jiné 1 takto: „Zatímco na začátku roku 1966 byl počet příjemců nejnižších příjmů (pod 1000 šilinků měsíčně) asi 230 000, Statistická porovnáni za dlouhá obdob! jsou prakticky nemožná. Během několika staletí se úplně změnil/ dokonce i příčiny úmrtí — částečně v důsledku rozdílů v diagnostice. Matrika zemřelých z Londýna vykazuje v morovém roce 1665 přes 68 tisíc zemřelých na mor z celkového počtu 97 tisíc úmrtí. Větíina dalších příčin smrti je dnes téměř neznámá nebo se nazývá jinak: střídavá zimnice, krvotok, psotnlk, božec, souchotiny, padoucnicc. ujímáni, bolesti v břiše, skvrnitý tyf a „surfet" snad bylo obžerství. Naproti tomu „cancer" není zřejmě rakovina v dnešním smyslu slova, nýbrž těch několik případů „cancer. gangrene and fistula" se týká hnisavých nádorů a sněti. A general! Bill for this prefent year, ending the \90iVecembtr iW I476 o W AUcrfpw—jsi'- rfi—- ir>i—i«fi S' A.*"" tliiOl- S vunM. lKhut.<-< S' trrmn Fjock- . S' ľ»«i. Oi«r,k«kn s. Ec-ir-i.wW-si V loao JWrtkog- I I • c|^<.Ca-"k—*■— W» ,,,'S'Gci—Mit.ltrhc.|. ,x ■aa-KÉ-MV k«to 416 .k7R S U«i X, S D»..0«.. u,\-- V lied. L—VarJ.l70 V Iihriboroof..— ;y, )', l"^'-11 "4 V foflen V Oikrkl IVo.,h.,.b ňV s'Ocorg.lolrlrl.U»i4i S' rkXcr.1--icS S'CW.tcf km . 17 VMvjMiNarfOitl,,. to .JH^Abo-A.— 10« o •^rjAVkr—kup,;" 70 » X"T AJArrmar,—, 0 '04 Mar, tak..-k 3 lOjyMBjUv. l>)SV|iar. H V Iu»oD.kr 1 pit,t S' loraaGal.ibo.il« S' |*l«< Í4řui- S' Jok»i»«»£< .1-- S* lokli, ZMh,n, - S( i' KkfhCT.M C«lft,»r lyy S' KffoenM CiroW.' i t] VLnrran lewij- 04 S' lootok* o™ ttney 114 P J /Mar, Ma l|OC' - S' Lr«dFolW.lw Jo |V M.fn., Pir.fr,-- 4^7.S- Migraci Loth bury U7 I . Jorum *» 07 Pi 1'" iaohl*..ofi.- --«4 . . —,--tkr. — , f, vOS H-i.—.ft, .1 ;'.'»>X«7 S~M-_47 ' VK,r,W»kk»,l 0( S M117 Waaaaxk - 7f l4 ■> ttm.o, Inwil •' 1 VUna UdfaM—igi i 11 V kUrujw Orson- ■ - 110 4« S'Mm.r.Ogi-W.k -ÍO 140 V Morůro v,n,'. 14 Mi S MWW.UJrími+4 60 VMi.11,1 iousn.,1'. %-jS 66 VNoraid outOj. |!5) 1,107 *wf4M*H i«4 .vilm oMWoa-,, fľi :7 T i.*^01"""—l*o' r, I7I rV»«t»r.řMiW».fcl|l4 iď 1)4 i'ftioi, ř»—- I-- P M » ....... , -n, iiio ivMCiipirf.ilíe ift » *.*"■ *'k^4,'j4 1J IIO í 19 r»7 S'»tJ.r«lUA«»i"|lJl8 )'o;;»..o«w«ii P« ťatt*4«wGrci|49t ?44 "*■ S'tkllW.IW Ufc '9) 1 .V ,S IxrJph V bvJ,n-|lIlt.l4l7;y»ouJ,k ■.rkUt-íulóP^'^'rw^Ji-4i)S A j »«1».»«,;, II 1'tnAa___i, III V lh.mii Aruai.—ľ it i«4T»Mr«a--,15 mtefV'ta 17y V IWI.-WM- «.>..itttu rUeV.11,.!y«7 75í VCrr.I.V>nk»l 10. t'.Miois' Srra-k,,, ^A.\to3ai , Altm-J^äf r-%> V maCrnkfrn Ho^.S:-'kTk t.,k.^uT\l!77 V Lcoo».JihorA„h lAOy I, :jiijjilf : |u7 v Mm n.»,.-. •171110041,.,,!, " S« I049S MirTin.H'.«— l«y'' IW) i»>l>~»«____t](lji,gj hi»rfljr»,--9,!4 */^~r/.J'^f'O'r- II410 ■ |05?H1JS' Mn» Smoj - -ot <)i i'aoS \S'»«»nimVVf*Ulbt Clrtfmi,s,- y>Í7 ! TivTMil if */ll&t suiiu ita jut- )7}aj : Whtrttf, if iofie-- v-unit» via uiik- 134'Lethargy- Corďumption and Tiflick-4S^8 Liv«Stown - n Imponume-—— aa7,Sotci,UÁctt,Uotoaodbo«loi -oa5(KilJby fctsall accidents-4»! Limbs ———_-.j, McS'KingsEviU--8« Spleen--■■ 14 -it SpottcJ Fcaver And Patrpic* tjiia i4iStoppin:: ut the llonnclt—jji íojStax' and Scnua^ury ——.4 -is, t ■ i«i*> —ft %££L T«ZZ^á^žF*"---Ř.^=z Drowned---—-5 ° 0«tltad Sc Su, ved--« 5 CMtles--5 "4, CbriftncOI the Plan*- inawfcd of uVinaguekiihe jjor^ruta»Jid«thePdl.bouftd»5r«- tit* 7. Proč statistiky lžou činil počátkem roku 1969 již jen 120 000; zmenšil se tedy asi o polovinu." Co se stalo? Začátkem roku 1966 byly nejnižší důchody těsně pod hranicí 1000 šilinků. V dalších letech se postupně zvyšovaly v souladu s vývojem indexu životních nákladů a v roce 1969 byly těsně nad 1000 šilinků. V tomto vývoji se zatím neodráží nic jiného než plíživé znehodnocení něny, ale již vůbec ne ústup chudoby — k tomu by bylo třeba prokázat, že nejnižší příjmy stouply relativně více než za prvé ceny a za druhé průměrné příjmy. Dnes již zřídka rodí ženy doma. Ještě před několika desítiletími však bylo možno „statisticky dokázat", že porody doma jsou bezpečnější než na klinice. Z jednoduchého důvodu: jestliže hrozilo nebezpečí komplikací, doporučil ošetřující lékař porod na klinice. Proto porody na klinikách netvořily „reprezentativní průřez", nýbrž představovaly nadprůměrně vysoké procento komplikovaných těhotenství. Také na zápal plic se doma umírá méně často, protože těžké případy se posílají do nemocnic. V klimatických lázních umírá nadprůměrně mnoho lidí na tuberkulózu, v lázních, kde se léčí poruchy krevního oběhu, nadprůměrně mnoho na srdeční infarkt. Ti, kdo potřebují léčení, jsou přirozeně více ohroženi. Nesmí se však také zapomenout, že právě provedené srovnání úmrtnosti u porodů doma a na klinice v ještě starších dobách vyjadřovalo skutečně něco správného. Předtím než Ignác Semmelweis objevil horečku omladnic a dokud se v porodnicích systematicky nepoužívala sterilizace, umíralo skutečně více matek na klinikách. Nebezpečí nákazy tam bylo opravdu větší než doma. Na hru s indexy jsme již upozornili. K tomu ještě doplněk z americké vnitřní politiky. Wallis a Roberts uvádějí: „Před volbami v roce 1936 demokraté tvrdili, že prý zaměstnanost a výroba podstatně stouply, aniž se zvýšily životní náklady. Při svém srovnání vycházeli pro zaměstnanost a výrobu z roku 1933 ale pro životní náklady z let 1925 až 1929. Republikáni naproti tomu tvrdili, že prý životní náklady stouply, ale zaměstnanost a výroba se nezvýšily. Při výpočtu životních nákladů vycházeli ze základu roku 1933. u zaměstnanosti z průměru let 1925—1929." Krásný případ působivé pseudostatis-tiky poskytuje také úvaha, kterou jednou pronesl americký rozhlasový komentátor v souvislosti s projektem reformy kalendáře. „Dokázal", že náš nepohodlný kalendářní systém stojí jen samo město New York přes 5 miliónů dolarů ročně. První důvod spočíval v tom, že je prý zatím třeba asi 1 minuty k tomu, aby se k libovolnému datu našel v kalendáři odpovídající den v týdnu. Jako druhý důvod uváděl, že to dělá každý obyvatel New Yorku každý druhý den. Tím vzniká časová ztráta přes 58 300 hodin denně. Průměrná dělnická mzda činila tenkrát jen 25 centů za hodinu, ale i s tímto číslem došel tento statistik-amatér k denní ztrátě 14 583 dolarů a k roční ztrátě přes 5,3 miliónu. Podle dnešních průměrných mezd by tento naivní propočet ukázal ztrátu přes 40 miliónů dolarů. Ponecháme na čtenáři, aby si sám vzpomněl na další hrubé logické a statistické chyby. Uvedený příklad je spíše zábavný než demagogický, ale jeho schéma přesně odpovídá schématu, které se někdy používá, ať již z nerozumu nebo z demagogie, také při vážnějších problémech. Podobně jako výhodu zjednodušeného kalendáře je 216 možno „dokázat" téměř všechno. Hranici mezi zábavou a vážným pokusem o oklamání pomoci pseudostatistik lze často stanovit jen obtížně. Mohli bychom donekonečna uvádět takovéto „výkvěty", ležící na fascinujícím pomezí demagogie a naivity. Závěrem snad ještě jeden příklad výpočtu ve dvou verzích. Nejdříve však čísla: Za prvé, spolková vláda a zemské vlády NSR vydaly v roce 1968 asi 6 miliard DM na úsek „veřejná bezpečnost, pořádek a právní ochrana". Za druhé, počet obyvatel činil zhruba 60 miliónů. Za třetí, dani ze mzdy a z příjmů podléhaloasi 28 miliónů osob. První statisticky doložená skutečnost: Každý poplatník musí v průměru ročně zaplatit hodně přes 200 DM na policii a soudy. Druhá skutečnost podložená stejnými údaji: Na jednoho obyvatele se na soudnictví a udržení veřejného pořádku denně nevynakladá ani 30 fe-niků (toto druhé číslo je možno podle potřeby chápat bud" tak, že se od občana vybírá jen tato zanedbatelná částka, nebo i tak, že udržení pořádku a právní jistoty státu nestojí za víc než za těch pár grošů). Chci-li však ukázat, že podíly daní na tuto kapitolu rozpočtu jsou mimořádně nízké, uvědomím si, že jen asi 70 % _73 Od extropoloce k futurolog státních výdajů NSR se kryje z daňových výnosů - a pak již připadá na jednoho obyvatele jen asi 20 femkú daní na den. 7.3 Od extrapolace k futurologii „Budoucnost není možno plánovat ve světle minulosti," řekl prý kdysi Edmund Burke, jinak tradicionalistický a konzervativní státovědný teoretik. Odmítne-li se „světlo minulosti", ocitáme se v úplné „temnotě" nebo jsme odkázáni jen na magickou zář fantazie. Chceme-li však přistoupit k dešifrování budoucnosti na základě statistického materiálu, musíme si být vědomi toho. že naše Čísla a údaje pocházejí z minulosti. I když naším úmyslem neni „průzkum budoucnosti" v užším slova smyslu, přece jen se používá statistických údajů téměř bez výjimky jako pomůcky pro rozhodováni. Studují se relativní čísla přítomnosti a minulosti k získání poznatků o jejich budoucí podobě. Po celá léta se sledují „trendy", aby mohly být extrapolovány do budoucnosti. Také sledování „stálého souboru" není určeno jen pro archívy nebo k zajištění plné zaměstnanosti statistických úřadu. V daleko větší míře má být orien- Každý daňový poplatník musí platit ročně daleko více než 200 marek na policii a soudy Na jednoho obyvatele se vynakládá denně ani ne 30 feniků na právni ochranu a udrženi pořádku Stejnou skutečnost lx« vyjádřit velmi rozdílnými slovy, takže podle přáni ml ..pozitivně" nebo ..negativně". KhI tomu vlak jeh* ..«aos-tika" nelie. 217 7. Proč statistiky liou tační pomůckou pro rozhodování všeho druhu. Avšak minulost znamená vždy jistotu, budoucnost vždy jen možnost a pravděpodobnost. Co bylo po dvacet let, nemusí již být zítra, ale přece jen to bude pravděpodobné. Jestliže nemoci srdce o krevního oběhu tvořily v posledních letech v průměru 30 % příčin úmrtí, je možno předpokládat, že letos bude číslo podobné. Dokonce to lze předpokládat i pro rok 1980 nebo dokonce 2000. Podívejme se na zcela jednoduchý (tak se alespoň zpočátku jeví), dobře známý a velmi diskutovaný příklad — populační explozi. Obyvatelstvo světa čítalo v roce 1800 asi 775 miliónů, v roce 1850 1,1 miliardy, v roce 1900 1,6 miliardy a v roce 1950 2,4 miliardy. Tento růst populace můžeme vyjádřit graficky a dostaneme křivku, kterou lze proložit do budoucnosti. Přesněji řečeno neobdržíme jedinou jednoznačnou křivku, nýbrž je možné — bua* podle matematických znalostí, nebo temperamentu, intuice a informovanosti — promítnout do budoucnosti křivky velmi rozdílné. V závislosti na tom obdržíme i pro rok 2000 velmi rozdílné hodnoty. Tým fu-turologů Kahna a Wienera počítá s asi 6,5 miliardy, ponechává však dostatek prostoru i pro jiná čísla a čtenáři poskytuje pro určení počtu obyvatel Číny v roce 2000 výběr mezi hodnotami 922 a 1600 miliónů. V daném případě OSN 58 N 45 W53 1910 1920 1930 1940 1950 1960 1970 1980 19902000 Extrapolace obyvatelstva světa. V roce 1945 a pak v roce 1953 vypoíitali Notestein (N) a Woy-tinski (W) na základě tehdy dostupných údajů, že v roce 2000 bude na světě v'ce net ™ tra. lidi. V roce 1958 se jií zřetelně projevila populační exploze v rozvojových zemích, a ta ^ polace. kterou v tomto roce provedla OSN. odhaduje jií počet obyvatel světa v roce IV než 6 miliard. nelze moc zkazit, skutečná hodnota bude někde mezi tím. Německý fyzik a futurolog Wilhelm Fucks dochází k 6,6 miliardy. Statistická ročenka NSR uvádí pro rok 1970 na podkladě údajů Statistického úřadu Spojených národů počet obyvatel světa v roce 2000 ve výši 6129 700 000, což je poněkud podivné vzhledem k tomu, že by muselo dojít k šťastné náhodě, kdyby se tento počet ukázal správným alespoň na stamilionové místo. Jiné odhady z novější doby se pohybují mezi 6 miliardami a více než 7 miliardami a může se zdát, že bylo dosaženo dosti značného souladu a že by proto bylo dobře možné extrapolovat dosavadní vývoj uvnitř poměrně úzkých hranic. Při bližším zkoumání se však tato čísla objeví v jiném světle. Mnozí autoři zabývající se rokem 2000 mohou totiž stěží sami provádět statistická šetření o růstu počtu obyvatel světa, a důvěřují proto údajům o sčítání lidu a odhadům Statistického úřadu OSN a jeho extrapolačním metodám. Použití poněkud starších odhadů není bez nebezpečí, jak hned uvidíme. Dennis Gabor píše ve své knize „Inventing theFu-ture" (Vynalézání zítřka) docela správně: „Kdyby se populační vývoj v roce 1940 extrapoloval z údajů, které tehdy byly k dispozici, došlo by se pro rok 2000 při extrapolaci trendu třicátých let k číslu 4,4 miliardy, s přihlédnutím k celkovému průběhu od roku 1920 do roku 1940 pouze k číslu 3,5 miliardy — a toto číslo bylo tehdy skutečně pokládáno za nejspolehlivější odhad." Dobrý a svědomitý odhad Franka W. Notesteina v roce 1945 uváděl pro rok 2000 počet obyvatel světa pouze ve výši 3.35 miliardy, a v roce 1953 pečlivě zpracovaný odhad Woytinských dokonce ještě nižší: 3.25 miliardy! Ně- 7.3 Od extrapolace k futurologii mecký hospodářský statistik Ernst Wagemann psal v tomto smyslu ještě v roce 1952: „Když počet obyvatelstva poroste i nadále stejným tempem, obývalo by za sedmdesát pět let Zemi již 5 miliard lidských bytosti." Za 75 let — to znamená, že se to vztahovalo k roku 2025! Ať se zdá tato prognóza jakkoli falešná, přece jen je správná, čteme-li přesně, co Wagemann tehdy napsal: „Když počet obyvatelstva poroste i nadále stejným tempem (tj. jako v posledních desetiletích před rokem 1950)..." Kdyby se byl tento předpoklad splnil, byl by uvedený odhad správný. Wagemann sám hned ještě poznamenal: „Jak lehce lze při populačně politických prognózách upadnout do omylu, ukazují nejlépe dřívější pokusy v této oblasti." Tak Gregory King odhadoval v roce 1696, že do roku 3500 bude v Anglii žit asi 22 miliónů lidí. (Dnes má Anglie a Wales asi 48 miliónů.) King počítal takto: v roce 1260 bylo napočteno 2,75 miliónu lidí, v roce 1695 jich bylo dvakrát tolik — 5,5 miliónu. K zdvojnásobení bylo tedy zapotřebí 435 let: z toho vyplývá i dalších 435 let na zdvojnásobení na 11 miliónů (v roce 2130) a „již" v roce 2565 další zdvojnásobení na 22 miliónů obyvatel. Gregory King se domníval, že podobný prudký růst je na dlouhou dobu nemyslitelný, že pro budoucí zdvojnásobení se musí předpokládat asi dvakrát delší časové období než dosud — tedy 11 miliónů lidí kolem roku 2565 a 22 miliónů kolem roku 3440. Ještě jeden citát z Wagemanna: „Každá prognóza se vaří jen z vody. tj. zkušenosti z minulosti, tak jak vznikaly ve své době. transponuje do budoucnosti. Nemáme proto žádný důvod k povýšenému úsměvu, jestliže velký kritik spo- 219 218 7. Proč statistiky lžou lečnosti, Voltaire, v 18. století prohlásil, že považuje za fantazii předpoklady o možném zvyšování počtu obyvatelstva byť i jen o 5 % za sto let. Totéž platí o Montesquieuově pesimismu, když byl přesvědčen, že se počet lidí den ze dne zmenšuje a že za tisíc let lidstvo zcela přirozeným způsobem zmizí s povrchu zemského." Dnešní futurolog se pravděpodobně přece jen bude povýšeně usmívat a prohlašovat, že při vší úctě k Voltairovi a Montesquieovi nelze oba pány přece jen považovat za vědecké futurology. Především prý také tehdejší statistický podkladový materiál byl nedostačující, a technika i teorie extrapolace prý na tom byly obzvláště špatně. Fu-turologové jsou ochotni připustit, že ani kolem roku 1900 nebylo možno udělat relativně přesné prognózy vývoje na příštích sedmdesát let. Právě jsme však viděli, že ještě v roce 1950 byly demografické prognózy zcela nesprávné. Přesto však nás odborníci ujišťují, že nyní se pracuje přísně vědecky, a proto také spolehlivě. Ještě se k tomu vrátíme, nejdříve se však podíváme na jinou pozoruhodnou extrapolaci. W. S. Woytinski uvádí ve své knize „Li-m/ts of Mathematics in Statistics" (Meze matematiky ve statistice) příklad, který je plný ironie, protože jsme právě poznali Woytinského v souvislosti s velmi nešťastnou prognózou z nedávné minulosti. Woytinski píše o matematikovi N. S. Pritchettovi, který koncem minulého století extrapoloval demografický vývoj Spojených států v letech 1790 až 1890 tak, že těchto jedenáct ročních hodnot vynesl do systému souřadnic, tyto body pak proložil parabolou třetího stupně a — matematicky bezvadně — propočítal počet obyvatel Spojených států až do roku 2900. Stanovil, že počet obyvatel USA v uvedené době dosáhne 41 miliard Nuže, Woytinski se Pritchettovi smáli ale my dnes čteme — zčásti zděšeně! zčásti lhostejně — že sice nikoliv obyvatelstvo Spojených států samých, ale obyvatelstvo světa dosáhne počtu 40 miliard — nikoliv ovšem až v roce 2900, nýbrž již ve druhé polovině příštího století, tedy kolem roku 2075. Dříve než přikročíme k závěru a poněkud blíže osvětlíme statisticko-mate-matické aspekty tohoto problému, zodpovíme otázku, kterou by snad čtenář mohl položit: proč se vůbec tak podrobně zabýváme právě vývojem obyvatelstva? Máme pro to více důvodů. Za prvé, projevujeme tím úctu nejstarši větvi statistiky, statistice obyvatelstva. Za druhé, populační exploze je dnes obecně uznávána jako životně důležitý problém a doporučuje se vědět něco o možnostech a mezích těchto prognóz. Za třetí a především — tento příklad jsme zvolili proto, že je sice poměrně jednoduchý, přesto však naznačuje nekonečně obtížné problémy prognóz. Jak to, že statistika obyvatelstva je poměrně jednoduchá? Především je možno s pomocí úmrtnostních tabulek zjistit, kolik z dnes žijících lidí bude ještě naživu za deset, dvacet nebo třicet let. Za druhé je možno s ještě větší pravděpodobností určit, kolik osob dosáhne v příštích dvaceti letech sňatkového věku. Za třetí lze — ovšem již s velmi omezenou pravděpodobností — předpovídat počty narozených v nejbližších letech a snad i desetiletích. Jak to tedy, že je statistika obyvatelstva přesto tak obtížná a plná nejtěžších chyb? Abychom to mohli objasnit, musíme si především uvědomit, jak vůbec dochází k „přirozenému pohybu obyvatelstva'. 7.3 Od extrapolace k futurology na 1000 obyvatel 24 22 20 18- 18-14-12 10 8 6 4 2 přebytek narozených — deficit narozených i narození na 1000 obyvatel ■úmrti na 1000 obyvatel 1860 1861 1882 1883 1884 1885 1888 1887 1888 1868 1870 Přebytek a deficit narozených jsou početním výsledkem dvou „proměnných" — počtu narozených a počtu úmrtí. Jestliže každá rodina má 7 děti. vznikají veliké počty narozených: jestliže z nich však 5 předčasně zemře, jsou také vysoké počty úmrtí a nevzniká „populační exploze". (Náš graf je pouze ilustrativní, udává však pro střední Evropu charakteristické počty narozeni a úmrtí.) Často se nesprávně předpokládá, že populační exploze je výsledkem zvýšené porodnosti. To je úplně, nebo řečeno opatrněji, téměř úplně nesprávné. Skutečnou příčinou je spíše snížení úmrtnosti. Zní to nesmyslně vzhledem k zákonu lidského života, který zní, že každý musí dříve nebo později zemřít. Ten, kdo se dnes objeví ve statistice narozených, objeví se jednoho dne také ve statistice zemřelých. Čím je však základna pyramidy obyvatelstva širší, tím menší je relativní úmrtnost (úmrtí na 100 obyvatel): ve vrcholku několik zemře, v základě se mnoho narodí. Tento vývoj, tak charakteristický pro dnešní rozvojové země, vzniká tehdy, když se výrazně snižuje úmrtnost kojenců, dětí a mladistvých, avšak zůstává zachován počet porodů připadajících na ženu v plodném věku. (Obr. na str. 222.) Proč se teprve nyní volá po ..kontrole porodnosti" a „pilulce"? Protože až do doby před několika desetiletími „kontrola smrti", prováděná přírodou, vznik tohoto problému vůbec ani nedovolila: jestliže ze sedmi živě narozených děti v rodině jen dvě dosáhnou plodného věku, nemůže vzniknout populační exploze. Jestliže se však všech sedm dětí dožije věku sňatku, jsou oba rodiče nahrazeni 3,5 manželského páru a každý z njcn — za předpokladu stejné plodi-vostj — je opět nahrazen 3.5 páru atd. až — až dokdy? Dokud nezačne působit některý z kontrolních mechanismů — kontrola porodnosti nebo kontrola smrti. Stromy nerostou do nebe; obyvatelstvo Spojených států 220 221 7. Proč statistiky lžou Cejlón (1955) muži Francie (1958) 8% • % 4% 2% 0 Japonsko (1958) 4—M 2% 4% 6% 8% žen) I I I I I I I I I I I věk T8 + 70-T4 85-48 80-64 65-58 60-54 46-48 40-44 35-38 30-34 25-28 20-24 16-18 10-14 5-8 0-4 8% 4% 2% 0 2% 4% 8% Mexiko (1950) T6 + T0-T4 20-24 15-18 10-14 6-8 0-4 1 m 1 1 1 1 1 1 1 6% 4% 2% 0 2-z 4% 2% 4% 6% 8% Švédsko (1958) USA (1959) 2% 4"/. 8% I I I I I i 8% 4% 2% 0 2% 4% 8% 222 7.3 Od extrapolace k ŕuturologn v roce 2900 nedosáhne 49 miliard. Pro statistika to především znamená, že nestačí pozorovat jen přírůstek obyvatelstva, ale především vývoj dvou křivek, jejichž „rozevření" teprve udává přírůstek obyvatelstva: počet porodů (absolutní a relativní) a počet úmrtí (absolutně a relativně). Teprve pak přijde mnohem obtížnější část: jak extrapolovat tyto údaje do budoucnosti? V jaké míře respektovat kolísání vývoje z poslední doby nebo více přihlížet k dlouhodobějšímu vývoji? V třicátých letech se počet obyvatelstva Evropy téměř nezměnil, v padesátých letech silně vzrostl — jaký bude vývoj v osmdesátých letech? Zde končí matematická statistika a začíná dobrodružství domněnky — „ars coniectandi" (umění dohadu), jak kdysi nazval Jacob Bernoulli svou knihu o počtu pravděpodobnosti. V daném případě nejde o početní teorii pravděpodobnosti, ale o odhady a předpovědi sociologického, hospodářského a technického vývoje, které spíše patří do oblasti tvůrčí fantazie než do statistické analýzy. Statistika nemůže v této situaci dělat nic jiného, než propočítávat matematické důsledky předpokladů podle schématu: „za jinak stejných okolností pak...", nebo: „když růst obyvatelstva světa bude plynule klesat až na roční přírůstek 1,3%, pak...". Každá pro- Věkové pyramidy různých struktur. Pro rozvojové zcmč je charakteristický Cejlon se stále ještě vysokou úmrtnosti děti a mládeže. V Japonsku se ve slabé věkové skupině pod 4 roky projevuje účinek kontroly porodnosti. Nepatrná úmrtnost v mladém a středním věku je zřejmá ve švédsku a v USA. gnóza vychází z určitého předpokladu — zpravidla přinejmenším z mlčky přijatého „ceteris paribus" — že experi-mentuji-li s určitou veličinou, ostatní zůstávají neměnné. Každá prognóza obyvatelstva pro rok 2000 vychází mimo jiné z předpokladu, že nedojde ke třetí světové válce, zejména ne k atomové válce. Nelze totiž vůbec odhadnout, jak by taková válka skončila a kdy, zda by nebyly vyhubeny *fs lidstva a zbytek z převážné většiny smrtelně nemocný. Je proto každá prognóza nesmyslná? Jistěže ne. Protože, za prvé, slouží k tomu, abychom si namáhali hlavu tvorbou vhodných alternativ, a v tom koneckonců spočívá rozhodující význam průzkumu budoucnosti. Za druhé, prognózy jsou o to reálnější a prakticky cennější, čím jsou krátkodobější, a to ze zcela jednoduchého důvodu. V „dohledné" době je prudký zlom v mld dolarů + 5i-1— přebytek Til -10 1+6 schode! [ h-5 1855 1958 1957 1958 TBT ^ odhad na počátku roku B konečné údaje Především to vždy dopadne jinak — pětiletí rozpočtu Spojených států v odhadech a skutečnosti. Ani jinde nejsou prognózy podstatné spolehlivější'. 223 osoby 13000 12000 7.3 Od extrapolace k futurologii 1955 Švýcarský chemický koncern koncern roku 1970 „extrapoloval" celkový stav svých zaměstnanců o podii pravidelných uživatelů automobilů až do roku 1990. Z tohoto odhadu vyplynul pro rok 1990 počet 13 000 zaměstnanců, z toho 6500 pravidelných uživatelů automobilu. Graf ukazuje, že grafickými extrapolacemi je možno dojít ke zcela jiným údajům. Pokud jde o celkový stav zaměstnanců, může být jeho výíe samozřejmě určována dlouhodobým plánováním podniku. Podíl uživatelů automobilů pro rok 1990 se však dá stěží určit. vývoje příliš málo pravděpodobný. (Velmi rozšířený názor, že střednědobý průzkum budoucnosti poskytuje lepší výsledky než krátkodobý, je nutno považovat za významový omyl: od krátkodobé prognózy požadujeme podrobnosti a přesnost, které vůbec nelze očekávat od střednědobé.) Nakonec lze ještě namítnout, že na vývoj obyvatelstva snad působí iracionální síly, zatímco při extrapolaci technického a hospodářského vývoje není nutno mít obavy před nečekanými „zlo- my". To však bohužel není správné. Stát s centrálně plánovaným hospodářstvím může sice dalekosáhle řídit spotřebu a výrobu, nicméně zkušenost ukázala, že plánovaných hodnot se nikdy přesně nedosáhlo: v nejlepším případě jsou daleko překročeny, v nej-horším jich nebylo ani zdaleka dosaženo. K tomu ještě přistupuje, jak již víme. skutečnost, že vysoké procentuální přírůstky při nízké absolutní úrovni jsou zcela dosažitelné, při vyšší základně jsou však nemožné. Některá země může výrobu automobilů v průběhu jednoho roku zvýšit ze 100 000 na 200 000 jednotek, je však vyloučeno, aby se výroba z 10 miliónů zvýšila za stejnou dobu na 20 miliónů. Posuzujeme-li hospodářské prognózy poněkud skeptičtěji než prognózy obyvatelstva, má to svůj zvláštní důvod. Obvykle vývoj hospodářství úzce souvisí s vývojem obyvatelstva. Tak např. lze již dnes docela dobře odhadnout potřeby školních prostor na nejbližších 5 nebo 10 let. Nyní však víme, že ani vývoj obyvatelstva nelze přesně vypočítat předem. Mimoto zde vzniká problém, jak racionálně nebo také iracionálně (např. móda je skoro vždy iracionální) se bude obyvatelstvo chovat za 2 roky, za 5 let, za 10 let, o co bude usilovat a co bude odmítat. Při nedostatku zboží lze ještě takové propočty dělat s určitou pravděpodobností, sotva je to však možné ve společnosti, která má přebytky zboží. Co spotřebitele omrzí, které reklamě podlehne, které netušené psychologické faktory se objeví? Před 10 lety, i když v podstatě již existovaly, zůstávaly zcela bez povšimnutí problémy znečištění ovzduší, řek, devastace životního prostředí a další škody napáchané civilizací. Ještě před 5 lety sotva pronikaly do vědomí průměrného občana. Neovlivní to však za 5 let jeho spotřebitelské chováni, a jak to bude vypadat za 10 let? Neztratí do té doby platnost i neúprosný zákon hospodářského pokroku, který nás vždy vedl k přesvědčení, že se musí vyrábět stále více a laciněji (i když ne vždy lépe a zdravěji)? Jak se vyvine světový obchod, když se dospívající generace zřekne hektického růstu spotřeby? Není žádným uměním, nýbrž pouze po- četním úkonem vypočítat hrubý společenský produkt v roce 2000 alternativně při předpokládaném průměrném přírůstku 4,5 a 5 % — opravdové uměni předpovědi spočívá ve vizionářském, prorockém a utopickém. Pro statistika vznikají takové problémy, jako je sled vzájemně navazujících intervalů spolehlivosti. To např. znamená (jestliže pro současnost zvolíme opět základní index 100), že nejdříve se odhaduje růst hrubého společenského produktu v obou nejbližších letech na 3 a 5 %; pro další 3 roky se počítá sice se stejným růstem (mezi 3 a 5 %), ale již s menší pravděpodobností (asi 90 místo 95 %), pro dalších 5 let s růstem mezi 2,5 a 4,5 % (s pravděpodobností 85%). I když se nepřihlíží k tomu, že můj odhad pravděpodobnosti nemá matematický podklad, nýbrž je velmi subjektivní, co to říká o situaci, která nastane za 10 let? Jestliže vývoj zůstane převážně v dolní části mých odhadů, bude za 10 let index asi 134. Jsou-li správnější optimistické odhady, může vystoupit na 158. To je již velmi široký interval spolehlivosti. Avšak i ten předpokládá, že zvolené pravděpodobnosti jsou téměř zcela správné. Nesmí se vyskytnout systematická chyba, nesmí se přihodit něco neočekávaného, ani se nesmí nějakou náhodou (které např. při 85% pravděpodobnosti zůstává přece jen vyhrazeno 15%) ukázat odhadovaný rozsah jako příliš úzký. Zkušenost ostatně vždy znovu ukazuje, že hospodářské prognózy se nesplnily ani pro nejbližši jeden až dva roky. (Dodatečně se také vědělo proč, ale my jsme to chtěli vědět předem.) I když jsou některé statistické materiály a extrapolace obdivuhodně přesné, mohou takovými být jen za předpokla- 224 225 7. Proč statistiky liou 7.3 Od extrapolace k futuroloqil 1970 jtj 2060 0.5 II 1.0 Z 1.5 mm -C e 2.0 2.5 nm i mim mimi = 2 mld lidi ttttt MIM MMI Mí 3.0 HMD MM* MMI MMI IMM Mí 3.5 MIM MIM MIM MIM MIM MIM MIM MIM MIH II Alternativy pro svět zítřka. Růst obyvatelstva světa do roku 2060. vyjádřený obrázkovou statistikou (podle „Populatlon Bulletinu") za předpokladu sedmi různých procentních přírůstků. du, že vývoj bude přibližně stejný jako dosud. Je-li tento předpoklad nesprávný, čísla nemohou souhlasit. Pak statistika zase jednou lže... Jiné nebezpečí ukvapené extrapolace stručně ukážeme na příkladu z nedávné minulosti. V roce 1969 vyvolala velké vzrušení zpráva amerického fyzika z oboru záření Sternglasse, který na základě velkého počtu údajů a grafických zobrazení ukazoval, že relativní počet mrtvě narozených děti v americkém státě Missouri od počátku pokusů s atomovou bombou v Nevadské poušti poklesl podstatně méně výrazně než v uplynulých 15 letech, ba dokonce se téměř nezměnil. Jedním z nejpůsobivějších obrázků byla křivka extrapolovaného průběhu za léta 1935 až 1950, porovnaná se skutečnými údaji o mrtvě narozených dětech. Na základě předložených materiálů nelze zcela bezpečně vyloučit možnost, že zvýšené záření stroncia 90 „významně" ublížilo ještě nenarozeným dětem. Avšak hypotéza „atomové pokusy jsou vinny" byla již znehodnocena absurdní extrapolací křivky vývoje. Nikdo nám totiž nemůže zabránit, abychom tuto křivku neprodloužili ještě dále, a pak by — i bez atomových pokusů — již v roce 1980 nebyl ani jediný případ mrtvě narozeného dítěte. (Po tomto datu by dokonce muselo docházet ke kříšení mrtvých nebo k živému narození nezplozených dětí.) Přehlédla se a zanedbala skutečnost, že určité úkazy mohou sice dosahovat výrazných vzestupů nebo poklesů, ale že nemohou být nekonečně velké, ani že se nemohou rovnat nule. Na počátku třicátých let operovali v Anglii odpůrci očkování podobnou extrapolací jako profesor Sternglass. „Dokázali", že od zavedení očkování začátkem třicá- oblast prognózy no rok 1973 1973 1972 1973 1972 Každým rokem se stále více rozevírá vějíř prognózy. Je-li pro přiítl rok ještě možno vymezit s vysokou spolehlivostí relativně úzký rámec prognózy, pak pro pozdější období je stále širší (nebo stále méně spolehlivý). Výchozí předpoklad: přírůstek (např. obyvatelstva) v roce 1972: 2 %. tých let prý poklesla úmrtnost celého obyvatelstva podstatně méně (ba vůbec ne) než v desítiletích od roku 1890 do roku 1930. Dokonce extrapolovali, jak hluboko by úmrtnost podle jejich mínění musela klesnout do roku 1940. .Extrapolace do roku 1950 by i v tomto případě vedla ke „kříšení mrtvých". Tento příklad je ještě podivnější než Sternglassův. Je zcela dobře možné si představit, že kdysi snad vůbec nebyly případy mrtvě narozených děti. ale je jen stěží představitelné, že by někdy nebyly v celém obyvatelstvu žádné případy úmrtí a že by populační exploze byla navíc podporována věčným životem na Zemi. Na závěr je nutno ještě krátce upozornit na filozofický problém předpovědí; zabývat se jím podrobněji není však na tomto místě vhodné. Je ovšem zcela možné zastávat názor, že budoucí dění je předurčeno — ať již boží vůlí, „vestavěnou" automatikou vesmíru nebo historickou zákonitostí. Aby bylo možno předpovídat budoucnost, vzniká v tomto případě snaha objevit početní vzorce této zákonitosti, a to podobně jako se první statistikové domnívali, že mohou dokazovat boží vůli z údajů o statistice 227 226 7. Proč statistiky lžou 7.4 Grafické zobrazeni: obraz lže vic než tisic čísel Úmrtnost amerických dětí do 1 roku no 1000 iivě nerozených 1958—1941 zkoušky atomových a vodíkových zbrani • neprováděly USA. SSSR a Velká Británie podepisuj dohodu o zákazu zkoušek v ovzduii Tak by to mohlo jít dál, kdyby., a to chce ukázat uvedený gráf! Čárkovaná linka extrapolace vývoje má jednu malou chybu — ještě v tomto století by bylo dosaženo prakticky nedosažitelné nulové hranice. Francie a Čína pokračuji v pokusech v ovzduii 1954—1958 19*1—19*1 pokusy s vodíkovou bou^v Pacifiku T9ŠTeC79!8 pokusy s^a^o^iojro^^b^mibou^ Nevadě —h 1935 1940 1945 1950 1955 1960 1965 1970 1975 obyvatelstva. Kdyby se podařilo nalézt matematický zákon, musela by být prognóza absolutně přesná. Lze však také ve větší nebo menší míře uznávat svobodu lidské vůle a jednání, a pak bude prostor pro svobodné individuální nebo kolektivní rozhodování i prostor pro náhodu vždy větší, ovšem přesná prognóza bude zásadně nemožná, případně se musí pokládat za případ náhodného výsledku. Reálné možnosti statistických metod propočtu budoucnosti leží mezi oběma uvedenými extrémy. Používají pozorovaných zákonitostí minulosti, avšak ponechávají náhodě a nepředvídanému určitý prostor — někdy příliš velký, jindy příliš malý, zřídkakdy ve zcela správné míře. Praktický význam statistické extra- polace nespočívá tedy především v prodlužování časových řad a v extrapolaci vývoje, nýbrž mnohem více v důmyslném vyhodnocováni výběrových souborů pro budoucí rozhodování. To proto, že např. výsledek ověřování hypotézy ,,lék A je významně účinnější než lék B" je založen na vzorku, který byl vytvořen v minulosti a nyní vyhodnocen, zahrnuje však i fiktivní základní soubor „minulých i budoucích pacientů s touto nemocí". Praktické vyhodnocení testu hypotézy neříká nic jiného než toto: „Protože v nedávné minulosti byl lék A účinnější než lék B, bude účinnější i v dohledné době." Kouzlo extrapolovaných časových řad však působí na laika většinou silněji, je-li graficky působivě vyjádřeno. 11 250 1 200 150 e o C •a c C m £ 3 ■« 100 50 í » y.1 tahá enio čkov áni i- r / * 1 <- . _ p i lei i tw — i tju vcae velmi brzy ke kříieni 1890 1900 1910 ■ 1900 -1910 -1920 1920 * 1930 -1930 W -1940 mrtvých („negativní úmrtnost") Protivnici očkováni jednou ..dokázali", že od zahájeni očkováni úmrtnost klesala pomaleji než v minulých desetiletích. Extrapolace, tak jak si ji představovali, by byla již ve čtyřicátých letech vedla „k likvidaci smrti" a pak snad až k zmrtvýchvstání zemřelých. — Nerozumná extrapolace vede i v méně průhledných případech k pošetilým závěrům. 7.íi Grafická zobrazení: obraz lže víc než tisíc čísel S rozšířením fotografie a zdokonalením reprodukční techniky vzniklo i úsloví: „Obraz ř/'kd vic než tisic slov." Považujeme za zbytečné zabývat se zde rozmanitými psychologickými, teoreticko-informačními a kulturně historickými hledisky poměru mezi slovem a obra- zem. Musíme se omezit pouze na ty body, které platí pro poměr mezi číselnou a obrázkovou statistikou. Prvotním materiálem statistických šetření jsou kvantifikované informace: zpracováni tohoto materiálu pak dává číselné řady. sloupce čísel, poměrná čísla, korelace, obory spolehlivosti, pravděpodobnosti, indexy, časové řady... číslo lze — někdy velmi roz- 228 7. Proč statistiky liou 7.4 Grafické zobrazeni: obraz li. vic n.í ,„ie f|M dílně — vyjádřit kresbou. Můžeme rozlišovat mezi obrazovou statistikou v užším smyslu a grafickou statistikou, i když není možno přesně vymezit hranici mezi nimi. Pro obrazovou statistiku v užším smyslu je rozhodující přání, aby se čísla převedla na optický vjem, jsou to takzvané „cartoons" statistiky a za svůj vznik také především vděčí snahám o poučení. Ke konci dvacátých let našeho století vznikla pod vedením Otto Neu-ratha „vídeňská škola obrazové statistiky", která sledovala popularizaci statistických informací především použitím stylizovaných figurek. Obrazová statistika je tedy především a hlavně učební pomůckou, která nezůstala ovšem omezena na školy, ale velmi brzy se stala součástí populárního zobrazení statistických materiálů i v hospodářské části novin. Obrazová statistika říká „víc než tisíc slov" jen tomu, kdo má hluboce zakořeněný odpor k číslům a údajům, avšak je ochoten zamyšleně pozorovat pestré stylizované figurky. Kdo si nemůže nebo nechce nic představit pod Automobilový průmysl 1929 v Severní a Jižni Americe v Evropě tilMM! "^iftfc -liljWr íÄlW: r^flK; •SAjS; "5^^^ i^ňřJr £Obs; JÍSus-J^^^r >S^^ <^Bk7 >^^Lt: -S^sť *^^^ "^ä^ .^^^ r^&57 rjHll^ m m IT] každá figurka —100 000 dělníku ■SB^Sľ"SBHlteŕ<^ÉH^^>^ÉB7:i^ÉBS; automobilového průmyslu m m m m m každý vůz — 100 000 vyrobených •lutomobilu „Klasická" ukázka obrazové statistiky z doby Otto Neuratha a „vídeňské školy obrazové statistiky". V Evropě tenkrát vyrábělo 800 000 dělníků jen 700 000 automobilů. 230 čísly nebo křivkami, tomu obrazová statistika představuje mužíčky a žínky, stylizovaná auta, krabičky od cigaret nebo měšce s penězi. Základní osnovu obrazové statistiky představuje legenda: „každá figurka — 20 000 lidí" nebo „každý vůz — 100 000 vyrobených automobilů". Přitom nelze zabránit tomu, aby se vyskytly a byly zobrazeny také jiné situace než průměry, jako např. 2,34 dítěte na jednu rodinu, které laik pozoruje s nedůvěrou: jestliže jedna figurka představuje 20 000 lidí a obrázkem se má vyjádřit 128 000 lidí, je to šest celých a čtyři desetiny figurky v obrazové statistice. Hned se dostaneme i k dalším otázkám populárních statistických vyobrazení. Nejdříve však ještě několik slov k ,,/e-gitimnimu statistickému" grafickému zobrazení. V daném případě jde o to, aby zpracovaný statistický materiál poskytl již na první pohled dojem, který je jinak dosažitelný až na základě srovnáni více čišel a údajů. Tak např. křivka vývoje ukazuje v jediném okamžiku všechno, co by se jinak muselo vyhledat ze dvou desítek čísel několikanásobným srovnáním. Taková vyobrazení lze proto často nalézt i v odborných vědeckých publikacích, nicméně v nich jsou figurky nahrazeny úsečkami a sloupky. Věková pyramida sestavená statistikem se skládá z úseček a pyramida sestavená obrazovým statistikem z malých figurek. Obojí statistické znázornění —obrazová statistika i vědecké statistické grafy — mají své výhody a nevýhody. Brzy se poznalo, že rčení „obraz říká víc než tisíc slov" by často stejně dobře mohlo a mnohdy dokonce muselo znít: „obraz lže víc než tisíc slov", protože obraz má schopnost vyřadit svým emocionálním působením rozumovou vý- chovu, která je většinou spojena s čtením textu. Obraz může utkvět v paměti a ovlivnit názor na určitý problém vk než deset úvodníků (především tehdy, když se úvodníky nečtou). Také statistický obraz lže Často víc než tisíc čísel. Proč a jak se toho dosahuje, prozkoumáme poněkud podrobněp. Krajní případy nejsou zvlášť problematické: tabulka s deseti figurkami a pod ní vysvětlivka: „každá figurka — 5000 dělníků" je pouze ilustraci čísla. Zobrazení regresní křivky nebo operační charakteristiky či sezónně vyrovnaného klouzavého průměru v nějakém statistickém díle také není problematické: čtenář věci rozumí a ví též. co je to dvojitá logaritmická siť nebo pravděpodobnostní papír a proč se používá. Rozsáhlý okruh zmatků a nedorozumění začíná tam, kde v podstatě legitimní zobrazovací metody vyvolávají u nepozorného nebo nedostatečně informovaného pozorovatele jiný dojem, než by vlastně odpovídalo Číselnému materiálu. Nejprostším případem je silně stoupající, resp. plochá křivka vývoje. Předpokládejme, že bychom měli pro čtyři různá období tyto hodnoty: 7500. 8000. 8700 a konečně 9400 — např. roční výroba šicích strojů v určitém závodě nebo úspory (v tisících) ve spořitelně apod. Tato čísla zakreslíme jako body do systému souřadnic a jedna z nich (abscisa) tvoří časovou osu. No osu x zakreslíme čtyři stejně dlouhé intervaly. Na pořadnici (osa y) se nanese měřítko pro měřené hodnoty (vyrobené šicí stroje, případně úspory v tisících apod.). Okamžitě vzniká otázka, mám-li zoät stupnici na dolním konci nulou — zda musím nebo smim? Nikoliv, stupn.ce nemusí začínat nulou, avšak ten. kdo Proč statistiky lžou Věková pyramida Rakouska v roce 1923 věk B5-69 60-64 mt mm .mtm«-mttm «~ mmmk umům mrnmn mtmtm ~» 45-49 40-44 35-39 15-19 mtm uwm mimn mttmm ntttmtm mmmtm mmmtm mmrnnm mnnmwm mrnmmtm JJJ.MJ.M.M.M.I. Q O O O O O O OOOO QOOOOQOO oooooo 5-9 0-4 roky každá figurka — 20 000 lidí 65-69 60-64 55-59 50-54 45-49 40-44 35-39 30-34 26-29 20-24 15-19 10-14 6-9 0-4 □ 7A Grafické zobrazeni: obraz lže víc než tisíc čisti -L 300000 200 000 100000 _I_I-1- 100000 200000 300000 To. co vyjadřuje obrazová statistika v symbolech, mění se v méně pitoreskním zobrazeni většinou na sloupky. (Obrázek nahoře: vyjádřeno „obrazovou statistikou" Otto Neu-ratha.) je zcela přesný, naznačí pomocí vroub-kované čáry ležící mezi nulou a první hodnotou na stupnici, že se od nuly plynule nenanášelo ve stejném měřítku. Začneme na stupnici u 6000 — jednak pro úsporu místa, jednak také proto, aby křivka nemusela začínat až někde dole. (Pozor: to je už libovolné rozhodnutí, pro které neexistují žádné závazné předpisy!) Na základě čeho provedeme volbu velikosti intervalů na obou osách? Z estetických nebo typografických důvodů si zvolíme čtvercový diagram — v tomto případě bude vzdálenost pro jednotlivé roky na ose x odpovídat 1000 jednotek na ose y. Také to je libovolné rozhodnutí. Nic a nikdo mi nemůže zakázat, abych neudělal vyobrazení široké a nízké — roční interval třeba 2500 jednotek. V tomto případě bude růst menší, optický dojem působí spíše jako tlumený růst. Se stejným oprávněním mohu meziroční interval upravit na šíři 500 nebo ještě méně jednotek z osy y — a křivka již stoupá strmě do výše. Tento rozdílný účinek nevzniká jen jako důsledek plochého a širokého nebo úzkého a vysokého zobrazení — jde pouze o poměr měřítek. A ještě něco: nejdříve jsme stupnici začali na 6000, nyní zvolíme jako výchozí bod 7500 a dosáhneme optického účinku prudkého růstu od nuly do oblačných výšin. Z určitého důvodu však chceme, aby tento růst se ukázal menší. K tomu máme mnoho možností. Jednou z nich 10000 9 000 8000 7000-6000 9500 9 000 8500 8 000 7500 I II III IV 9% 8% 7% 6% 5% - "ll "'III % Plochý vzestup křivky (nahoře) jako by t naznačoval mírný růst — ste|né údaje m také dají vyjádřit optimisticky explozi (uprostřed). Nesrovnávají-li se absolútni " ale jen přírůstky dosažené v těchto dvou doblch. je možno vyjádřit růst I pokle* (dttttt). 232 233 7. Proč statistiky liou 10000 9000 8000- 7000- 1 1 1 r m ICO -lil --114 --107 -11V1 _ ! Dvě rozdílné stupnice v jednom grafu naznačuji srovnáni, které ve skutečnosti je nesprávné. 7.4 Grafické zobrazeni: obraz lže vlc než tisic čísel IV je srovnávat navzájem procentní přírůstky, a nikoliv absolutní údaje. V našem příkladu máme tři údaje o růstu během čtyřletého období: 6,65, 8,75 a 8,05 %. V odpovídajícím grafickém zobrazení dostaneme zase smutně klesající křivku. Druhou možností je vyhledat nějakou blízkou časovou řadu, která má větší růst. Předpokládejme, že srovnáme tyto „úspory" s indexem hrubých mezd, který v uvedených čtyřech letech má tyto hodnoty: 100,108, 118 a 131. Na pravé straně nakreslím druhou stupnici, zakreslím tuto novou křivku jinou barvou do původního diagramu a pak se ukáže, jak růst úspor zaostává za přírůstky mezd. Zda se tím dokazuje nějaký nedostatek, je jiná otázka, rozhodně jsem však dosáhl sledovaného účinku — znevážit křivku růstu úspor. Třetí možností je použít k srovnán/ údajů o absolutním růstu většího podniku_je tu např. koncern, který v uvedených čtyřech letech vyrobil 16 000. 16 600, 17 500 a 19 000 šicích strojů, čímž běžně zvyšoval svůj absolutní předstih. Čtvrtou možností je provést srovnáni s malým předstihem, který však dosáhl 234 vyššího relativního růstu — např. ze 3000 přes 3400 a 3750 na 4100. V tomto případě porovnám přírůstky zase v procentech nebo nanesu absolutní údaje na logaritmický papír, čímž se dosáhne stejného výsledku. Takových srovnání jsme se již krátce dotkli, když jsme různými grafy vyjádřili relativní a absolutní růst exportu automobilů tří značek do USA (srv. oddíl 4.4). V mnoha případech vůbec nemusí jít o klamné manévry, někdy se vtěsnají dvě křivky do stejného grafu jen pro nedostatek místa. Nebo se šetří místem (úmyslně nebo neúmyslně) tak, že se počátek určité časové řady posune. Průběh kursů např. od roku 1965 do roku 1970 na většině mezinárodních burz nevypadá tak špatně — co se však stane, když se počátek křivky položí do roku 1962? (Viz obr. na str. 236.) A co by se stalo, kdyby se k propočtu nepoužilo indexů absolutních čísel, ale kdyby se počítalo — např. s použitím cenového indexu — jen na základě indexu kupní síly? Jestliže jsem v roce 1962 investoval 1000 DM do určité akcie, kterou jsem v roce 1970 musel prodat při indexu 600, pak již těchto 600 DM, které dostanu, není týchž 600 DM z roku 1962 (pro srovnání jejich kupní síly musím počítat i s poklesem hodnoty peněz). Prakticky to vypadá takto: Index spotřebních cen (1962 = 100) je pro čtyřčlennou rodinu v roce 1970 asi 124. Jinak řečeno: 100 DM v roce 100 1970 odpovídalo -^j- = 81 DM v roce 1962. Na základě zvolené formulace jsem dostal bud* jen 600 DM za 1240, nebo 6 . 81 = 486 DM za 1000. Jestliže tento výsledek vyjádřím graficky, bude se ztráta jevit ještě větší. V jiných případech, např. při průměrném hrubém přírůstku 3%, mohu dostat celkem snadno klesající křivku, jestliže počítám „reálný" místo „nominálního" růstu. Přestože některá zobrazení vypadají tak „lživě", byla všechna zcela korektní. Platí pro ně, tak jako pro všechny další způsoby statistických zobrazení, zásada: svévolné výklady jen na vlastni nebezpečí! Pokud je pod diagramem správně uvedeno, o které jednotky jde, pokud jsou hodnoty na stupnici správně zaneseny, nelze mluvit o podvodu nebo lži, nanejvýš o pokusu o manipulaci. Docela jinak tomu však je, když náhle chybí na stupnici měřítko nebo když jsou na ní sice správně zanesena nějaká čísla, není však uvedeno, jedná-li se o marky, libry, liry nebo indické rupie. Bud jde o trestuhodnou lehkomyslnost, nebo, a to mnohem častěji, o přímý pokus o podvod. V takovém případě se již nelže pomocí statistiky, nýbrž zcela prostě lže. U statistických obrazových vyjádření 1960 1961 1962 1963 1964 1965 1966 WT Jestliže chci postavit do nepříznivého světla z roku no rok neustále vzájemně porovnat ročni přírůstky. V naiem přikladu dostáváme po růstu o 15 /. pnjo 7 a po krátkém znovuoživení o 9 % opět „pokles". 235 7. Proč statistiky lžou 1963 1964 1965 1966 1962 1963 1964 1965 Kursovní diagram této akcie vykazuje klidnou a dokonce mírně vzestupnou tendenci. Uvede-li se však rok 1962. vykazuje diagram prudký a nikoli ani přibližně vyrovnaný pokles kursu. je obtížné rozhodnout, kde končí naivita a kde začíná podváděni. Víme již, že obrázková statistika pracuje převážně se symbolickými figurkami, které jsou často uspořádány ve skupinách po pěti (podle zkušeností může lidské oko na první pohled zřetelně rozeznat nejvýš pět jednotek) a jsou seřazeny vedle sebe nebo nad sebou. Samozřejmě je možno uvažovat také takto: Proč mám kreslit nejdřív 16 sku- pin po pěti zelených a vedle toho 8 skupin po pěti červených figurkách, jestliže totéž mohu vyjádřit jedinou figurkou? Nepotřebuji nic jiného než jednu zelerou figurku, která je dvakrát tak velká ako vedle stojící červená. Zcela jedncduché, že? Otázkou však je, jak velké je „dvakrát tak velké"? Červenou figurku mohu nakreslit vysokou 3 cm a vedle toho zelenou vysokou 6 cm — jaký je však 236 7.4 Grafické zobrazeni: obraz lže vlc než tisíc (itel účinek? Protože nejde o čáry (nebo případně o sloupky), ale o plochy, které symbolizují tři dimenze lidského těla, dvakrát tak vysoká zelená figurka nevypadá „dvakrát tak velká", nýbrž čtyřikrát až pětkrát tak velká. Má tedy kreslíř přesně změřit plochu figurky a soustředit se na plošný poměr 2:1? Nyní však přechází účinek do jiného extrému: figurka plošně dvakrát tak velká vypadá jen „poněkud větší". Problém však nevzniká jenom u statistických obrázkových figurek, ale i při srovnávání kruhů, které se často s oblibou používaj! k zobrazeni mincí. Jak po-stupovat,chci-li zobrazit pokles kupní síly nějaké měny na polovinu její dřívější hodnoty? Poměr průměrů 1 : 2 známe- Rok Náklady na výzkum a vývoj v mil. US dol PocVt nových registraci jednotné účinné • ubtconca -Celné biologicky aktivních ubltancl xdvojené a kombinované pfeporal.; terapeutické formy 59 1«7 $ "O 61 238 • • 63 2*2 u 235^ 65 351 $ 23 • • V 67 "$ 25 71 ✓ 68 "$ 14 97 69 "S 11 65 Statistická zobrazeni maji přece jen svůj význam, jsou-li doplněna příslušnými údaji. Srovnáni znaků dolarů nebo tablet (podle zobrazeni CIBA). stejně jako figurek, které znázorňuji růst obyvatelstva (podle „Sonntags-blattu"). dovoluje jen tušit symbolizované velikostní poměry; v případě figurek kresba dokonce klame, protože číselné poměry jsou v/|ádřeny pouze jejich výškou: „málo rozvi- t 0,7 t 0,8 1920 i ■ ■ i 1940 i i i 1960 1980 2000 vyvinuté J rozvojové země země ! nutý" se v roce 2000 zdá skoro desetkrát vWi než „vyvinutý" - ve skutečnosti je sotva tři- krát větši. 237 7. Proř statistiky lžou Vyobrazeni z „Tribune de Genéve" představuje drobné umělecké dilo, nikoliv však obrazovou statistiku. Figura vlevo by měla být vyšší, než je polovina velikosti obra vpravo: mezi symbolickými figurami roku 1920 a roku 1941 by neměl být téměř žádný rozdíl. ná poměr ploch 1 :4! Poměru ploch 1 : 2 odpovídá poměr průměrů í: V2. Poměrně značný pokles kupní síly ve výši 30 %, zobrazený plošně, nebude zvlášť nápadný. (Viz obr. na str. 239.) Ještě obtížnější je, když jsou vedle sebe měšce peněz a navíc je v rukou drží kostýmované figury. Předpokládejme, že by se pomocí měšců mělo porovnat 900 miliónů, 400 miliónů a 100 miliónů. V plošném vyjádření by měly rozměry (protože jsou zhruba pravoúhlé) asi 9,4 a 1 cm2. Čím přirozeněji se však kreslí, tím více se ukazuje potřebné vyjádřit třetí rozměr, a pak se již dosahuje poměru 81:16:1. Vzhledem k tomu je stejně nutné uvést u nich čísla — a nakonec obrázek víc mýlí, než vysvětluje. To platí bohužel pro velmi četná obrázková statistická vyjádření (statistická zobrazení). Usiluje se o originální účinky, hledají se nezvyklá působivá zobrazení — a přitom se ztrácí statistická výpověď a zůstane jen podivná zvláštnost, s jejímž pochopením má zájemce mnohem více práce, než kdyby dostal čtyři střízlivé údaje. Ale to je smutný osud čtenáře, který je většinou pokládán za naivnějšího, než ve skutečnosti je, a který je nakonec takto skutečně ohlupován. Na druhé straně však existují také rafinovaná grafická znázornění, skutečná mistrovská díla statistické vynaléza- 238 vzdálenosti II l 7.4 Grafické zobrazeni: obraz lže vle než tisic čís Srovnání velikosti 1 : 2 plochy H-14,2—h tělesa !«-12,B-»J Srovnání velikostí pomocí přímek a sloupků nečiní zvláštní potíže. Plochy a zvláště tělesa mohou naproti tomu velmi klamat. Tak např. krychle s délkou hrany 10 jednotek má jen poloviční obsah než krychle s délkou hrany 12,6. Dvojnásobná délka hrany by dokonce dala osminásobný obsah. vosti, která nakonec přece jen a mnohdy i na vyšší úrovni donutí zájemce pečlivě studovat graf a intenzívně přemýšlet. Tak tomu je především v případě, když na souřadnicích nejsou jen prostě uvedeny roky a měrné hodnoty, nýbrž již zpracované údaje, jako např. poměrná čísla. Nebo — a to se vyskytuje ještě častěji — když je v souřadnicovém systému uvedeno více navzájem se doplňujících údajů. Uvádíme zde graf Spolkového statistického úřadu NSR, který v souřadnicovém systému, na první pohled zcela jednoduchém (osa x — věkové skupiny; osa y — procentní stupnice) uvádí muže výdělečně činné podle tří hospodářských sektorů, a přitom zachycuje pro každou věkovou skupinu vývoj za posledních deset let na podkladě tří zjišťování. (Obr. str. 241.) Malá poznámka na okraj — doslova ,,na okraji", totiž na pravém okraji tohoto grafu. Není to ostuda, když procento osob činných v zemědělství a lesnictví tak prudce roste v nej-vyšších věkových skupinách?! Kolik starých lidí si ještě musí namáhavě vydělávat na živobytí? Snad je jich však pouze několik stovek. Graf nám totiž říká jen to, že ze všech výdělečně činných ve věkové skupině 70—75 (a těch může být na celém území NSR 200 nebo 200 000) celých 42 % pracuje v zemědělství a lesnictví a jen 21 % v ostatních výrobních odvětvích. Vzhledem k tomu, že ve výrobních odvětvích Průměrný starobní důchod ^^^^^ 1969 1969 W 1965 ľ1965 1 \ 2.484 W 1^762^ dělnici úřednici Tento graf byl ..střelen od boku". Hody k™hů se k sobě vůbec nemají jako 24« : 3274,n*o jako 1762 : 2322. Plocha černýchikruhu t* téměř dvojnásobná. (Údaje jsou uvaleny v rakouských šilincích.) 7. Proč statistiky lžou 7.S Uménl výkladu. Statistická interpretace USA KUVAJT ŠVÉDSKO ISLAND KANADA ŠVÝCARSKO 2.176.250 1.682.500 1.676.875 LS5U75 1.529375 1.398.750 NORSKO DÁNSKO 1.300.000 1298.125 NSR NOVÝ ZÉLAND AUSTRÁLIE ITÁLIE 1.191.875 1.184.375 1.170.625 754.375 Obrázek z italského časopisu „Domenica del Corriere". Velikosti poměrů měšců peněz neposkytuji správnou představu o číselných poměrech, které vyjadřuji. Měšec Američana (vlevo nahoře) vypadá nepochybně deset až dvacetkrát větši než měšec Itala (vpravo dole). Skutečný číselný poměr je pouze 3:1. totiž 2176:754. Porovnáni tři dimenzionálních objektů (v dvoudimenzio-nálnlm zobrazeni) většinou vlc klame, než objasňuje. zdaleka největší počet zaměstnanců odchází po dosažení 65 let do důchodu, je absolutní počet zaměstnaných po 70. roce věku jistě příliš vysoký. Kdo prosazuje penzijní pojištěn! zemědělců, s nadšením uvítá tento absolutně správný a nanejvýš zajímavý graf. Nikdy bychom neskončili, kdybychom chtěli uvést všechny možnosti zobrazování a klamání pomocí obrazové statistiky a statistických grafů. Na závěr se spokojíme prostou, ale důležitou radou: Neusuzujte jen podle obrázku. Vždyť je třeba všimnout si též čísel a stupnic! Křivka klame často víc než tisíc slov. Je samozřejmé, že je možný také obrácený postup: několik slov může postavit bezpočet jasných statistických údajů do úplně jiného světla. Tímto problémem, interpretací, resp. výkladem se budeme zabývat v dalším oddílu. 240 7.5 Umění výkladu. Statistická interpretace „Jeden duchaplný Francouz kdysi tvrdil: »Statistika je umění dokázat správnými čísly něco nesprávného.« Chtěl tím říci, že statistické údaje jsou sice vcelku správné, ale že jsou nesprávně vykládány. Wallis a Roberts naproti tomu ve své knize Statistické metody prohlašu- ji: »To nejdůležitější, co je třeba o interpretaci říci, je, že statistické údaje se musí interpretovat.* Tím vzniká obtížná volba. Na jedné straně je výklad nezbytný, na druhé straně je však nebezpečný." Citovali jsme Hanse Kel-lerera, protože krátce ukázal, jak důmyslná statistická vyhodnocování úda jů musí proplouvat mezi Scyllou nekomentovaných číselných řad a Cha- VÝVOJ PODlLU HOSPODÁŘSKÝCH ODBORŮ NA 100 VÝDĚLEČNÉ ČINNÝCH MÚZO. RESP. ZEN PRÍSLUŠNÉHO ROCNlKU NAROZENI (VĚKOVÉ SKUPINY) ■•'.-,.•■...© I -!i * 1963 0 1968 Roinik niroidfii I 939 194 J MU2l VÝDĚLEČNÉ ČINNl" ŽENY VÝDĚLEČNÉ ČINNÉ »a »:B »:» »:» »:« «0 «'» »'« «u «« »» »-» *» n» " " " " "' vékovi »kuP'iw vikovl skupina iitu.c.éti-airtfMa Toto neobvyklé zobrazeni představuje graf pro labužníky. Podrobnosti se musi P*"*™*^ avšak již na první pohled je mimo jiné zřejmé, jak klesá podii zaměstnaných v. vyrobmch oboral, a současně vzrůstá podii skupiny „obchod, doprava, služby atd." 241 > - 7. Proi statistiky lžou 7.5 Umčnl výkladu. Statistická interpretace rybdou hotových závěrů dodaných ,,až do domu". Čísla sama čtenáře hned od počátku buď odradí, nebo svádějí k vlastním závěrům, které mohou být ještě mylnější. Zpracovaná vysvětlení výsledků mohou naproti tomu velmi snadno vyjadřovat subjektivní názor, „statistickou ideologii", a tím ještě více klamat. V čistě vědeckých pracích je nebezpečí takového klamání poměrně malé, ačkoliv nezřídka bývají s použitím mnoha statistických metod složitým způsobem zpracovány nebo i vykouzleny z pochybného materiálu působivé závěry. Takové práce se však dostanou k průměrnému čtenáři v původní podobě jen zřídkakdy a mimoto jsou obvykle málo srozumitelné. Laik se převážně setkává se statistikami z druhé a třetí ruky. Statistika z třetí ruky většinou znamená, že původně vypracovaný statistický materiál se nejdříve zjednoduší a pak komentuje. Při zjednodušování se škrtne to, čím nemá být čtenář zatěžován. Je možné, že se do komentáře (který může být sám z třetí ruky) vloudí nezamýšlené nebo záměrně nesprávné výklady všeho druhu. Reichmann ve své knize „Use and Abuse of Statistics" (Používání a zneužívání statistiky) říká: „Denní tisk vybírá a zdůrazňuje vždy to, co se zdá zvlášť pozoruhodné, na úkor tabulek a poznámek, které často současně neotis-kuje. To není kritika tisku, jehož úkolem je na skutečnosti upozorňovat, nikoliv však je do všech podrobností popisovat. Žádný čtenář novin nechce dlouhé statistické tabulky místo svého obvyklého čtení, ale nesmí podlehnout pokušení brát doslovně znázornění, které se stalo povrchním... Mnohé zprávy jsou ovšem dokonce výslovně nesprávnými výklady, dovozují nesprávné 242 závěry a tím neprávem kazí pověst statistiky." Čteme-li slova „statistika dokazuje, že...", můžeme být zpravidla přesvědčeni, že statistika právě to vůbec nedokazuje. „Statistika dokazuje, že v Římě se žije déle", znamená toto: V Římě je úmrtnost na 1000 obyvatel menší než např. ve Florencii, protože mnoho mladých lidí hledá práci v hlavním městě a zakládá tam rodinu. „Statistika dokazuje, že obézní lidé jsou častěji nemocní" — což může být pravda, je to však napadnutelné, jestliže se tohoto tvrzení používá jako důkazu pro odtučňovací kůru. „Statistika dokazuje, že studenti umírají v mladém věku!" Tak mohl znít tučný titulek v bulvárních novinách roku 1835; tehdy statistik H. C. Lombard zkoumal 8488 úmrtí a všímal si průměrného věku úmrtí podle jednotlivých povolání — a hrůza: studenti umírali průměrně ve věku 20 let! (Obráceně by se mohlo dokázat, že papežové umírají v nadprůměrně vysokém věku.) Co dokazuje statistika, která uvádí, že v uplynulém roce bylo 32% všech Rakušanů postiženo nemocí (z toho třetina s pobytem v nemocnici), zatímco současně podskupina „samostatně činní a svobodná povolání" vykazuje pouze 13 % nemocných (s 3 % pacientů v nemocnicích)? Jasný případ: to jsou bohatí lenoši, kteří mají pořád dovolenou a mají se dobře. Nebo nikoli, a právě naopak: jsou to chudáci, které žádné sociální pojištění nepřivádí na myšlenku odpočívat ve stavu nemocných a kteří se zaťatými zuby pracují dál, když páni zaměstnanci chodí na procházky s potvrzením o nemoci v kapse. Statistika „dokazuje" obojí. „Statistika dokazuje, že s bezpečnostními pásy je naděje na přežiti 20 000 ku 1" — načež při podrobnějším posouzení se ukáže: Odborníci jsou toho názoru, že pásy mohou být v jediném případě z 20 000 horší než vůbec žádné. S „nadějí na přežití 20 000 ku 1" nemá tento odhad (neboť nic jiného to není) ani nejmenší souvislost. „Statistika dokazuje, že Eisenstadt je nejbohatši rakouské město" — to znamená, že v městečku, které má několik tisíc obyvatel a je správním centrem rakouské východní provincie, Burgenlandu, jsou registrována všechna služební vozidla zemské vlády a většiny zemských úřadů, což dává „na jednoho obyvatele Eisen-stadtu" takový počet automobilů, jaký je jen v Americe. „Statistika dokazuje: řití se lavina lékařů." Znamená to, že stoupl počet posluchačů zapsaných na lékařských fakultách. Podkladem pro takové tvrzení může být jen stoupající počet absolventů, nikoliv však počet studentů (mezi nimiž mohou být ve větším počtu třeba dívky, které studium nedokončí). „Statistika dokazuje: významné osobnosti žijí déle." Znamená to, že osoby uvedené v publikaci „Who's Who" z roku 1950/1951 měly nižší úmrtnost než průměr amerických úředníků, podnikatelů, vyšších úředníků a příslušníků svobodných povolání. Je otázka, zda bylo provedeno specifické pozorování podle věkových skupin. Jestliže nikoli, pak tu máme „papežský fenomén": kdo se dostane do Who's Who, udělal již kariéru a je starší než průměr srovnatelné skupiny zaměřené jen na určitá povolání. Soudci Nejvyššího soudního dvora nemohou zemřít ve 45 letech, protože v tomto veku takový úřad zastávat nemohou. „Soudci" umírají tedy v průměru dříve "ež „významní soudci". Formulaci „významné osobnosti žijí déle" je správné číst obráceně: kdo žije déle, stane se spí- še významnou osobnosti. Kdo zemře ve 30 letech, nestane se spolkovým prezidentem. „Statistika dokazuje: cizina způsobuji zmatek v dopravě." Znamená to, že během sezóny cizineckého ruchu se na 70 % dopravních nehod v Tyrolsku podílela zahraniční vozidla. Bylo by ale zcela dobře možné, že podíl zahraničních vozidel v celkovém provozu byl ještě větší — pak by ovšem cizinci jezdili bezpečněji než domácí. „Statistika dokazuje: opilci jsou za volantem jistější než jako chodci." Znamená to, že počet usmrcených opilých chodců je absolutně větší než usmrcených opilých řidičů. Po tomto malém výběru charakteristických nesprávných výkladů se však také podívejme na několik příkladů, kde výpovědi a úkoly statistiky nebyly vůbec pochopeny. Pěkný příklad poskytuje tato polemika z jednoho časopisu nájemníků: „Statistika lže! Jestli si někdo myslí, že do statistiky patří také jednopokojové byty bez tekoucí vody..., pak si dovolujeme říci, že se započtením takových obydlí může snad statistika souhlasit, že však je ostuda, že takové byty v roce 1968 stále ještě existují." Tedy, přesné šetřeni o výši nájemného musí přihlížet ke všem typům bytů podle jejich počtu. Statistik nemůže vybírat a říkat: ne, malé, staré byty neuvažuji, protože tam by vlastně neměl nikdo bydlet. (Stejně dobře by bylo možno argumentovat i takto: ne. velké luxusní byty neuvažujeme, protože nikdo by neměl bydlet tak přepychově.) Ve stejném smyslu píše jeden autor, když naráží na problém automatizace: „V tomto případě je ještě těžší sledovat hru čísel statistiků. Většina z nich se totiž shoduje v tom. že celkové obyvatelstvo poroste z různých důvodů rycfc- 243 7. Proč stotistiky lžou leji než počet pracujících. Jestliže se z toho usuzuje, že v budoucnu bude k dispozici poměrně méně lidí pro zabezpečení potřeby zboží pro stále větší počet spotřebitelů..., zůstávají nám statistici dlužni odpověď na otázku, odkud získá kupní sílu stále rostoucí přebytek spotřebitelů." Aby bylo jasno: taková otázka se statistikům vůbec klást nemůže. Extrapolovali pouze z vývoje posledních desítiletí relativní úbytek pracujícího obyvatelstva — a bašta! Sociální a ekonomické důsledky musí promyslet politici a hospodářští experti. Jak špatně lze volky či nevolky chápat teorii výběrových souborů a počtu pravděpodobnosti, ukázala např. v Rakousku v létě 1970 činnost „komise pro prověřování výsad". Tato komise měla mimo jiné zkoumat, zda a jak by měly být zdaněny platy politiků. V průběhu prací komise rozeslala asi stovce politiků dotazník se žádostí, aby uvedli výši svých příjmů, služebních diet a služebních výdajů. Část těchto dotazníků se skutečně vrátila vyplněna a hle: politikové, kteří odpověděli, měli skutečně relativně nízké jiné příjmy a mimořádně vysoké služební výdaje (navzdory volné jízdence na železnici byly např. uváděny velmi vysoké výdaje na cestovné). Jeden novinář se zeptal předsedy komise, zda snad tyto dotaz- níky poněkud nezkreslují skutečnou situaci. Dotázaný se mírně usmál a pravil: „Nikoliv, statistická pravděpodobnost přece vyřadí extrémy a poskytuje správný obraz..." „Statistická pravděpodobnost" může jedině zjistit střední hodnoty uvedených příjmů a doložených výdajů na základě dotazníků, které byly v průběhu akce zodpovězeny. Anketní šetření však jednak nebývá reprezentativní, jednak — z důvodu politické zdvořilosti_ si nelze ověřit správnost zjištěných dílčích výsledků. Zkrátka: už samo zjišťování poskytlo nanejvýš pochybný prvotní materiál, a proto všechny matematické a statistické operace s těmito údaji mají, mírně řečeno, omezenou cenu. Na závěr a jako přechod k další kapitole ještě několik slov o velmi častém zdroji nesprávných interpretací: Vypovídací schopnost malého šetření se cestou od statistika k poslednímu spotřebiteli stále více přeceňuje a zdůrazňuje. Co bylo původně uváděno s pravděpodobností jistoty a intervalem spolehlivosti jako zcela pravděpodobné, stává se nakonec zcela jisté, matematicky a statisticky dokázanou skutečností. Jediný vzorek se dotkl nulové hypotézy a titulek již hlásá: „Statistika dokazuje...!" 8 Jednotlivec a statistika 8.1 Statistika všedního dne Zdrženlivost a nedůvěra, s nimiž „průměrný občan" přistupuje ke statistice, spočívá ve značné míře v neuvědomělém, zčásti však zcela správném přesvědčení, že se statistika vůbec nestará o jednotlivce, že předmětem jejího zájmu je pouze kolektiv, „obyvatelstvo", nanejvýš ještě výběrový soubor (rovněž sestavený z většího počtu). Víme, že o popisné statistice stále platí, že se zabývá jen hromadnými jevy. Zcela jasně se však ukázalo již dříve, zvláště když jsme mluvili o technice zjišťování a anketních šetřeních, že statistika jednotlivcem nepohrdá. Jednotlivec se dokonce stává představitelem velkého počtu, je pro některý znak zachycen jako zástupce mnoha jiných. Jako velmi komplikovaný a jedinečný „svazek znaků" si však zachovává svou individualitu neomezenu, i když jednotlivé znaky jsou statisticky zjišťovány a vyhodnocovány. Statistika nejenže jednotlivce tímto způsobem nepoškozuje, ale každý z ní může mít prospěch, i když v okamžiku uvažování nebo rozhodování často vůbec neví, že se zabývá statistikou. Každý z nás se totiž vždy znovu ocitá v situacích, které vyžadují posouzení a pak většinou jednání. Na čem se však má zakládat úsudek i jednání, ne-li na dobře uspořádaných znalostech o dosavadních událostech? Již v oddíle o extrapolaci na základě statistik jsme poukázali na to, že jsou v podstatě jen dva způsoby chování, jestliže se muil učinil rozhodnutí: rozumové, které vychází z informací, a iracionální, které vychází z intuice. Tyto dva způsoby jsou v různé míře obsaženy ve svých nesčíslných kombinacích. Většinou lze říci, že i rozhodnutí zdánlivě vycházející jen z intuice spočívá na rychlém propojení informací, které jsou třeba jen z poloviny vědomé, takže koneckonců rozhodnutí nevychází z intuice: „subjektivní pravděpodobnost" nebude téměř nikdy přímo odporovat statistické pravděpodobnosti. Proč se však přesto laik téměř instinktivně statistice brání? Pokládá ji za speciální matematický vědní obor, kterému nerozumí a který se ho jen málo týká. K první z těchto bezděčných námitek je třeba říci toto: je samozřejmé, že je nutno vědeckou statistiku přenechat odborníkům, tak jako se jim přenechává srdeční chirurgie, policejní správa, daňová politika a jaderná fyzika. K všeobecným znalostem však dnes patří znalost alespoň základních pojmů z ekonomie, fyziky, medicíny a matematiky, z politiky a statistiky. Tyto požadavky nevyplývají z nějakého ideálu a teoretických úvah o politickém vzdělání, ale vycházejí docela prostě z praktických potřeb denního života. Tím jsme se dostali k druhé námitce — že totiž statistika může jen málo poskytnout jednotlivci. Několik stránek nazpět — ale i v úvodní kapitole této knihy — 245 Výber na ochutnáni neni iano nic Jiného než vzorek. Treini nebo hroznové vlno se ochutnávají proto, aby se mohlo po-soudit, zda zboil odpovídá po-iadavkům. 8.1 Statistika všedního dne víechny oblasti života, kde má statistika nějakou úlohu. Vzhledem k tomu, že nelze dohlédnout konce, bylo by to velmi únavné. Již jsme ukázali nedůležitější příklady všedního dne. ve kterých má statistika zvláštní význam. a v další části tohoto oddílu uvedeme ještě několik dalších příkladů. V této souvislosti se seznámíme poněkud blíže s „klasickým" oborem statistiky _s úřední statistikou, popisnou statistikou masových jevů, která se ovšem dnes již vůbec neomezuje na obtížné zjišťování základních souborů, ale s velkým úspěchem používá nejmoderněj-ších metod teorie výběru. Čáít této kapitoly dále věnujeme po- jišťovnictví, které je vedle počtu pravděpodobnosti a statistiky obyvatelstva třetím důležitým východiskem klasické statistiky a které má dnes pro jednotlivého občana větší význam než kdykoliv jindy. Pojištěn! mimoto s elementární jasnost! ukazuje úzké souvislosti mezi osudem jednotlivce, náhodou a vypoči-tatelnou četností jevů v kolektivu. V jednom oddílu této kapitoly konečně nahlédneme do oboru vyšších statistických metod, který začíná mít v době hromadných sdělovacích prostředků převládající úlohu; je to tzv. teorie hromadné obsluhy, jinými slovy „teorie front", resp. „teorie přepážek". jsme poukázali na základni význam statistiky pro jakékoliv rozhodováni. Ještě jednou krátce a heslovitě shrneme, kde jsme se při řešení praktických otázek denního života setkali dosud se statistikou. Každý, kdo se aktivně účastni hospodářského života, se nějakým způsobem zabývá výrobní kontrolou, vytvářením výběrových souborů nebo srovnáváním obratu. Každý čtenář novin, každý posluchač rozhlasu a televizní divák slyší a vidí statistický materiál, ale zároveň i propagaci (hospodářskou a politickou), která se odvolává na statistiku. Lidé zabývající se průzkumem potřeb a veřejného mínění chodí od domu k domu, a bud jsme sami dotazováni, nebo čteme výsledky zjištění aktuálních šetřeni. Život nás všech a především naše životní úroveň závisí rozhodujícím způsobem na indexech, především cenových a mzdových. Kdo 246 se zabývá vědeckým výzkumem, neobejde se bez statistických metod — a ve společenských vědách patří mezi nej-důležitější pomůcky poznání vůbec. Elementární výběr se objevuje na trhu s ovocem, jestliže váhající hospodyňka vybírá třešni na ochutnání nebo prodavačka rozřízne jablko, aby dokázala, jak je pěkné a zralé. Statistické zkušenosti se dokonce zrcadlí i v příslovích a aforismech životních pravidel. Francouzský statistik Vessereau hned na prvních stránkách svého tenkého svazku „La Statist/que" trefně poznamenává, že každý, kdo v jarním jitru uvažuje o tom, zda si má přece jen vzít plášť, a hlavou mu přitom proletí přísloví „En avrll ne te découvre pas ďun fil" (asi: „V dubnu není žádný kus oděvu zbytečný"), používá pro své rozhodnutí koneckonců ve stejné míře statistiku jako ekonom-plánovač. Není úkolem této knihy vypočítávat Také zkoušky a školní úlohy jsou vzorkem — vzorkem celkových znalosti jednotlivých žáků. 8. Jednotlivec a statistika 8.2 Mikrocensus a hospodářské statistika Číselné zachycení hromadných jevů ve velkých společenstvích, které bylo asi na přelomu našeho století pokládáno za statistiku, tvoří dnes — ani ne tak metodikou jako spíše předmětem — převážně pracovní okruh úřední statistiky. V jejím rámci převládající úlohu má hospodářská statistika. Ve Statistické ročence NSR připadají asi 4/s vnitrostátní části na údaje z oblasti hospodářské statistiky: obchod, zemědělství, ceny a mzdy, peníze a úvěr, dopravu, průmysl, zaměstnanost, státní rozpočet, národní důchod atd. Nejstarší forma statistiky, statistika obyvatelstva, má vedle toho stále ještě významnou úlohu, zatímco statistika kultury, školství, náboženství a soudnictví hrají spíše skromnou roli. (Ve Statistické ročence ČSSR je podíl hospodářské statistiky stejně velký.) Dříve než řekneme několik slov o hospodářské statistice (a o obecných problémech úřední statistiky), musíme si ještě něco vyjasnit. Již několikrát jsme stavěli proti sobě „klasickou" statistiku (sčítání, příprava a uspořádání hromadných jevů) a „moderní" — analytickou nebo induktivní — statistiku (úsudky z výběrových souborů), takže mohl vzniknout dojem, jako by existovala jedna zastaralá a jedna moderní forma statistiky, které nemají navzájem nic společného. Tedy. protiklady nejsou tak ostré. Také „stdtovědnd" statistika používá ve stále větším rozsahu metod induktivní statistiky, a tím se jí otvírají nové, rozsáhlé obzory, které nebyly přístupné při vyčerpávajícím zjišťování. O dějinách sčítáni lidu jsme již mluvili na jiném mfstě (oddíl 5.21) a víme, že vyčerpávající zjišťování takového rozsahu se i nadále důsledně provádí v desetiletých intervalech. Stále více jsou však doplňována novými druhy zjišťování, které si vynutila zvýšená potřeba informací v současné rychle se měnící světové a hospodářské struktuře a které umožňují používání techniky výběrů. Jednou z nich je metoda označená CPS (Current Population Survey — běžné sčítání lidu), nazývaná také „mikrocensus", jež se nejdříve objevila v Americe. První mikrocensus v NSR byl proveden v roce 1957. V podstatě jde o dotazování malého počtu domácností (1—2 %), které zvlášť svědomitě provádějí dobře školené osoby. Tímto způsobem se zabijí dvě mouchy jednou ranou. Především je možno klást více a podrobnějších otázek než při vyčerpávajícím zjišťování, a za druhé vysoká kvalita výsledků zjišťování většinou vyloučí obávanou systematickou chybu, takže nevyhnutelná výběrová chyba je snesitelná. (Přitom se navíc získají cenné zkušenosti pro další sčítání). — V ČSSR se podobná šetření domácností provádějí zhruba ve dvou až tříletých intervalech. Mikrocensus se většinou provádí ve čtvrtletních intervalech a je velmi aktuální. Kromě toho je (celkovou vynaloženou částkou) podstatně lacinější a dá odpověď na mnohem více otázek. Zvlášť dobře se osvědčuje při běžném pozorování osobní spotřeby a změn struktury zaměstnání a příjmů. Obsah kladených otázek je většinou výrazně aktuální, jak o tom svědčí tyto charakteristické formulace: „Kolik hodin jste v uplynulém týdnu skutečně pracoval?" nebo: „Jakou činností jste se v minulém týdnu zabýval?" Odpovědi poskytují přesný skutečný obraz současných událostí, ne- 248 8.2 Mikrocensus a hospodárska im-mbi zkreslený nepochopenými otázkami dotazníků. Někdy totiž není vůbec snadné nalézt správnou a jednoznačnou odpověď na všeobecnou otázku týkající se „pracovní doby" nebo „povolání". Stěží se také najde čtenář, který by si při studiu dotazníku nekladl otázku: Jaká je v tomto případě opravdu výstižná a poctivá odpověď? (Zda se potom napíše, to je už jiná věc.) Takové potíže a pochybnosti nelze však zdůvodnit naivitou těch, kdo dotazník sestavují nebo jej pak vyplňují. Opravdu, některé otázky vypadající na první pohled docela prostě, působí při bližším zkoumání téměř zmateně. Bylo by možné napsat celou knihu jen o jazykových a logických problémech statistických zjišťování. Postačí však, budeme-li se alespoň chvíli zabývat formulací otázek týkajících se „povolání" a „výdělečné činnosti". Co je povolání? Je to povolání, kterému se člověk vyučil, nebo které právě vykonává? Často jsou totožné, nikoliv však vždy. Téměř „nesčetné" jsou pak údaje o povoláních, které se uvádějí, jestliže dotazník trvá na pokud možno přesném označení povolání: při posledním rakouském sčítání lidu jich bylo asi 10 000, a ta pak byla rozdělena do 550 skupin povolání, které dnes používá mezinárodní statistika. Povoláni a postavení v povoláni mohou někdy být dvě rozdílné skutečnosti: strojní zámečník může být mistrem, vedoucím čety nebo zaučeným dělníkem. Povolání a odvětví nelze vždy zcela jasně rozlišit: kdo může s určitostí rozlišit, ve kterém průmyslovém odvětví pracuje „lisař" nebo „formíř" anebo, chcete-li, „statistik"? Některé problémy bylo možno řešit jen tak, že se rozhodlo: udělá se to tak a tak. Tím způsobem bylo např rozhodnuto, že označeni „v domácnosti" se nepokládá za povoláni, protože obvykle používaná definice povoláni říká, že to musí být placené zaměstnání trvající určitou dobu — s „platem" to však je u ženy v domácnosti většinou pochybené. Důchodci jsou pak tzv. „samostatní bez povolání", a tak patři do kategorie příjemců příjmů, nikoliv však do kategorie pracujícího obyvatelstva. Důchodce už ze zásady nemůže tedy být nezaměstnaný — tato pochybná výsada je vyhrazena pracujícím „osobám výdělečně činným". Dalším problémem je, že se počty nezaměstnaných zjištěné při mikrocensu většinou velmi podstatně liší od těch, které lze při šetřeních získat od úřadu sociálního zabezpečení. Stále znovu se stává, že ženy opustí své povolání a jsou pak až na další v domácnosti. Subjektivně se už pokládají za ženy v domácnosti, ale z finančních důvodů pobírají podporu v nezaměstnanosti tak dlouho, jak je to jen možné. Jsou nezaměstnané, protože existují nezaměstnaní pracující, anebo jsou „vyživované osoby", protože jsou „ženami v domácnosti"? „Nezaměstnaní pracující" není mimochodem rozporný výraz, protože pracující se členi na zaměstnané a nezaměstnané. A jak \e tos vedlejším povoláním?Kdy se z vedlejšího stane hlavní? Je rozhodující pracovní doba. nebo příjem? Jaká různorodá směs se skrývá pod pojmem „samostatný", který se. ať chceme nebo ne. ve statistikách vyskytuje vždy znovu. Rozpětí tohoto pojmu sahá od malého příštipkáře myslníka. od uměleckého řemesln.ka až po srdečního chirurga. Spokojíme se s těmito stručným, pa- 249 otlivec a statistika KRAJ OKRES PAGINA Sile H D Sociálni skupina pfednoíty HD Vík predn. HD Rod. HOV Druh bytu O — 3 • Si fl Obytná plocho Clité nájemné Ústřední topeni Pomer HD k bytu □ Důvod opufté-ni bytu □ □ 14 ekonom aktiv. ek. okt. v zemře". vydělávajících důchodců neprat důchodců závislých dici detí do 2 □ Závlllých drti 6-0 au od 22 23 24 • 25 10-15 ostatních členů Živených Ustavní oíetřeni osoby dny osoby m Jesle Školní jídelny Rekreace ROH Podnik, rekreace Pionýr. dny osoby dny osoby dny osoby dny tábory osoby | I I I I I I I I I I | I 3 Pionýr, tábory d.y Přednosta domácnost* hr. příjem ze zamést. daří ze mzdy hr. příjem ze zamést. daň ze mzdy Ostotní členové hr. příjem ze zomést. dan ze mzdy přednosta dom. Čisté příjmy z JZD Přídavky na déti Nemocenské Mateřský příspévek *8 ostatní členové Jiné dávky Důchody 3 PHjai» J vedle|Iiho zoméii. 55 5« Notu rolnl pfifliri r o prodeje zem. výr. 5« ze zemé-délstvl Ostatní příjmy od soc. organizaci Rekr. možnosti Nákupní úmysly Fin. litu* oce □ 59 od soukromníků Půjčky účelové Federální statistický úřad Český statistický úřad Slovenský statistický úřad 250 MIKROCENSUS 1973 Vyznačovací list za HD známkami. Z těchto některých — poměrně velmi prostých — otázek z relativně malé dílčí oblasti hospodářské statistiky bylo snad přece jen možno vidět, jak mohou být (a většinou jsou) obtížné i takové statistické problémy, které se obvykle pokládají za obyčejné početní postupy. Kdo vyplňuje dotazník nějakého statistického úřadu, může se s některými otázkami dost nazlobit nebo se jim divit, ale na jedno je třeba přitom myslet: většinou jsou výsledkem dlouhých, pečlivých a svědomitých úvah. Samostatnou otázku tvoří fakt, že pro laika jsou někdy přesto téměř nesrozumitelné nebo v něm přímo vyvolávají zmatek svou zdánlivě přemrštěnou přesností — ale s tím se ovšem nepotýkaj! jen statistikové. Je už prostě v podstatě mnoha složitých věcí, že je nelze formulovat zcela jednoduše. Dovětek k mikrocensu všeobecně a k dotazování v domácnostech zvlášť: v domácnostech nebydlí veškeré obyvatelstvo. V NSR je téměř 700 000 lůžek v nemocnicích. K tomu patří i „obyvatelstvo ústavů", jako jsou kasárny, kláštery, věznice a starobince. Každé zjišťování, které nepřihlíží k tomuto velkému okruhu osob, lze stěží označit za reprezentativní. Jak však udělat výběr souboru „obyvatelstvo ústavu"? Většinou se postupuje tak, že jsou dotazovány všechny osoby se stejným začátečním písmenem příjmení (např. N), přičemž se nej- Formulář mikrocensu Federálníhostatistického úřadu ČSSR. Pomoci mikrocensu jsou v poměrné krátkých intervalech dotazovány výběry tvořené z bydlícího obyvatelstva. Tím se překlenuji desetiletá období mezi sčítáním lidu a vedle toho jsou zpracovávány četné další informace. 8.2 Mikrocensus a hospodářská statistika dříve musíme přesvědčit, že, za prvé, relativní četnost takových jmen je ve Šlesvicku přibližně stejná jako v Bavorsku, jinak se nám do zjišťování nepozorovaně vplíží systematická chyba, a že, za druhé, toto písmeno není charakteristické pro určitý původ. (V jedné písni zpívá „roduvěrný Vídeňák", který listuje v telefonní m seznamu: „Všichni moji přátelé jsou zde — a sice u písmene V: Vondrak, Vitek, Vytlačil, Veselý a Vykoupil, Vranek, Vrtil, Vypadl...") Úřední statistika vůbec a hospodářská statistika zvlášť naráží na skutečnost, která je příčinou závažných potíží: není možno vždy očekávat, že přes veškeré zákonné předpisy (na něž se • v dotaznících více nebo méně nenápadně upozorňuje) budou formuláře přesně a okamžitě vyplněny. Dotazovaný se nezřídka snaží čelit zvědavosti úřadů zběžnými odhady nebo v jisté míře nepřesnými údaji. Potom je třeba zvláštních výběrových šetření, aby bylo možno posoudit, do jaké míry a v jakém směru se od sebe liší „bajka" a pravda. V podstatě některých jevů je však také to, že prostě nejsou přesně zjistitelné: kdo se odváží určit s přesností alespoň na 10 000 DM nebo jen na 50 000 DM. kolik peněz vydali západoněmečtí občané v cizině v roce 1970! Pokud jde 0 hrubý domácí produkt, z opatrnost, se uvádí jen na desítky miliónů, ale 1 coto zaokrouhlení je ještě dokladem překvapujícího optimismu. Hrubý domácí produkt NSR byl v roce 1969 („předběžný výsledek") vykázán ye výši 601 miliard DM. Kdyby toto číslo bylo na miliardu přesné, bylo by možne být šťastný, spokojený a vděčny^ Konečné údaje" za uplynule tř. až ftyh roky se vyznačují dalším místem za 251 8. Jednotlivec a statistika pacientíci N 1= SS Igl M lacient mírním. K vytvořeni vzorku z „osazenstva ústavu" se často používá příjmení. V našem případě byli vybráni všichni, jejichž jméno začíná písmenem N. desetinnou čárkou a přihlížejí k těm nepřesnostem, které se mezitím podařilo vystopovat, ale i pro ně stále ještě platí, že miliardu víc nebo méně nelze brát příliš vážně.) Poznámkou o hrubém domácím produktu jsme se mimochodem již dotkli také otázky, kde vlastně přechází hospodářská statistika do ekonometrie. Je již v povaze přechodů, že nelze vždy přesně zjistit bod, ve kterém něco přestává a něco jiného začíná. Nejspíše je možno říci, že ekonometrie je vyšší forma hospodářské statistiky, obohacená o vě- 8.2 Mikrocensus a hospodářská statistika deckoekonomické modelování. Ragnar Frisch, jeden z nejvýznamnějšich národohospodářských teoretiků naší doby. jednou řekl: „Ekonometrie se zabývá použitím matematických metod k řešení hospodářských a statistických problémů. Je v povaze věci.... Ze tyto problémy často vyžadují matematické postupy a metody relativně pokročilého druhu." Zatímco statistika — a to platí zejména pro popisnou statistiku — zaznamenává a případně sestavuje údaje, skutečnosti nebo vývoj, ekonometrie se pokouši uvést tyto údaje do souladu s hypotetickými modely hospodářských procesů, analyzovat vzájemné působení různých faktorů a případně je pomocí matematických modelů napodobit a prověřit. TVORBA A UŽITl NÁRODNÍHO DŮCHODU ČSSR ROKU 1971 MO -M tííítfíííi u Diagram ukazuje růst ntfroa ního důchodu v ČSSR. a to m zvláště vyjádřenou růstovou čarou dvou odvětvi, která maji — jak je zřejmé z diagramu na str. 25* — nejvétii podii na tvorbě národního důchodu ČSSD: průmyslu a stavebnictví. Národní důchod je vyjádřen v bežných cenách. To znamená, *• jeho růst je ovlivňován i pohybem cen. Proto se v nékteryck případech národní důchod CSSA vyjadřuje i ve stalých cenách do roku 1966 ilo o ceny z roku 19*0 a od roku 1967 se uxM cen. které platily k 1. 1. 19*7. 25J -- 8. Jednotlivec a statistika Jestliže zásadám čisté statistické práce odporuje interpretace číselných závislostí (korelací) jako vztahu příčiny a následku, je ekonometrie od těchto omezení osvobozena a může vypracovat na základě statistických údajů, matematických metod a národohospodářských teorií ekonometrický model. Tím není určeno pořadí: Větší možnost použití hypotéz a teorií, které je eko-nometrii dovoleno, se platí ztrátou vypočítané přesnosti; pravděpodobnostní jistota statistického rozboru platí jen na základě počtu pravděpodobnosti. Je však pozoruhodné, že obě první Nobelovy ceny za hospodářské vědy dostali dva ekonomové — Ragnar Frisch a Jan Tinbergen, a to „za vývoj a použití matematických modelů pro analýzu hospodářských procesů". Ještě těžší je vymezení statistiky ve vztahu k těm vědním oborům, které zdomácněly v hraničním území ekonometrie, jako např. operační výzkum nebo lineární programování. Jsou to dva nejmodernější vědní obory, jejichž základ tvoří matematika, statistika, národohospodářská teorie a podniková ekonomika a které úzce navazují na zpracování dat. Konečně by bylo možno se ptát: kde přechází statistika do teorie rozhodování? To je zvlášť těžká otázka, protože lze plným právem tvrdit, že moderní statistika je podstatnou částí teorie rozhodování. Co se vlastně sleduje všemi těmi tabulkami, zjišťováním a porovnáváním, když ne toto: dát uživateli návod k racionálnímu chování! Od nej-primitivnějších prastarých mudrosloví, která jako by zachycovala rozdělení PODÍL ODVĚTVÍ NA TVORBĚ NÁRODNÍHO DŮCHODU ČSSR ROKU 1971 Tento diagram znázorňuje strukturu vytvořeného národního důchodu v roce 1971 podle odvětvi materiální výroby, která se podílejí na jeho tvorbě. Dále ukazuje strukturu užiti vytvořeného národního důchodu. Za užitý národní důchod se považuje vytvořený národní důchod po odečtení přebytku platební bilance a ztrát na vytvořeném národním důchodu. V uvedeném roce činil užitý národní důchod 95.55 % vytvořeného. Nejvyšší podíl na užitém národním důchodu měla osobní spotřeba oby-vatelstva (55.9 %). Akumulace činila 25,5 "/ oicatni odvttvi (0.9 "„) obchod o veřejné stravováni (°.?".,( - molcrlálnc technické zásobováni (1.3"„) — ipo|t (0,5'vi — nákladní dopravo (3.6"..) — Icmlctvl (1.2"„) _ lemídílttvi (10.5 ".0 . stovcbmcivi (11.6®,,) -prCm,il(61.0°o) 254 četnosti povětrnostních úkazů, až k nejsložitějším faktorově analytickým ověřovacím metodám vyšší statistiky jde koneckonců vždy o přípravu rozhodování. Učit se ze zkušenosti — to je zároveň metoda i konečný účel statistické práce: zkoumán! skutečností, většinou jen zlomkovitě vysledovatel-ných, a jejich promítání do neznámého základního souboru, ale také, a to především — do neznámé budoucnosti. Statistika se nedělá pro poznávání včerejška, nýbrž proto, aby bylo možno lépe poznat zítřek. 8.3 Máme se dát pojistit? Dávno před prvními elementárními úvahami o počtu pravděpodobnosti a dávno před prvními předchůdci politické aritmetiky a statistiky obyvatelstva byly známy dva jevy, které vlastně představují syntézu teorie pravděpodobnosti a popisné statistiky — totiž sázky a pojištěni. Pojištěni je svou strukturou velmi podobné sázkám, ovšem s jedním podstatným rozdílem: zakládá se na velkém počtu událostí stejného druhu, zatímco při sázce stojí proti sobě dva jednotlivci rozdílných subjektivních názorů. Plynulý přechod tvoří sázkové kanceláře a velké loterie: v tomto případě — především u loterie — podnikatel (většinou stát) zprostředkuje bez vlastního rizika vyrovnání mezi množstvím sázejících. Početné malé dílčí příspěvky (sázky) j sou po srážce nákladů a daní odevzdány do rukou těch několika málo, kteří měli štěstí. (Viz obr. na str. 256—257.) Pojištění pracuje na stejném principu: četné malé dílčí částky (pojistné) jsou po srážce nákladů a zisku odevzdány _8j Máme se dát pojistit? Sportka je do jisté míry opakem pojištěni: vyplácí se však nikoliv v případě škody, ale v případě výhry. Pojistné je zde sázkou. těm několika málo, kdo mají dostat náhradu za utrpěnou škodu. Předpokladem pro vznik pojištění bylo poznání, že jisté škodní události se vyskytují s přibližně odhadnutelnou četností. Pak přišel další logický krok. Když „každá desátá lod"' ztroskotá, je možno škodu vyrovnat tak, že každý vlastník lodi zaplatí desetinu hodnoty jako pojistné. Již ve čtvrtém století před naším letopočtem, když ostrov Rhodos ovládl lodní plavbu ve východním Středomoří a vytvořil počátky obchodního a námořního práva, vznikla první úprava rozdělení ztráty při vyhazování zboží přes palubu v případě nebezpečí na moři — úprava, která byla později jako „/ex Rhodia de iactu" (rhodský zákon o odlehčování lodi potopením zboží) převzat do římského práva. Uvedený zákon se zakládal na této situaci: obchodní lod je naložena zbo- 255 8. Jednotlivec o stotistíko sociální pojištění náklady (správa apod.) státní dotace U 4i, 4í, ál, 4i, 4i, pm| prnrj pmrj jnnnj p| dávky v nemoci apod. očekávaná hodnota: jsou-li státní dotace vyšší než správni náklady, je větší než průměrný příspěvek aslíiO% asi 10% státu na správni výdaje očekávané výhry: 50 % sázek čistý zisk společnosti očekávaná hodnota: náklady je různá podle výíe pojistného, (správa avšak vždy menší neí průměrně apod.) prémie Pojištění a loterie se navzájem strukturálně podobají. Celková částka pojistného (případně cena prodaných losů) plyne nejdříve do „společného hrnce", a potom náhoda vybere jednotlivé šťastlivce (připadne poškozené), kteří obdrží částky vyšší, než byl vklad, jako výhru (případně náhradu škody). Průměrná očekávaná hodnota je zásadné nižší než zaplacená částka vzhledem k tomu, že je nutno uhradit náklady apod. Pouze v případě, že státní dotace (např. na sociální pojištění) zvýší prostředky použitelné k vyplaceni, může očekávaná hodnota dosáhnout výše příspěvků nebo ji překročit. žím, které patří více obchodníkům. Dostane se do bouře a musí se zbavit nákladu, aby se nepotopila. Lodní posádka popadne, co jí právě přijde pod ruku a co se dá zvlášť snadno hodit přes palubu nebo co je zvlášť těžké — a dopluje konečně do ochrany přístavu. Záchrana lodi, mužstva a často většiny zboží byla možná jen za podmínky, že bylo obětováno zboží jednoho nebo více obchodníků — a měli by právě tito obchodníci sami být poškozeni? „Lex Rhodia de lactu" rozhodl tedy tak, že škoda se rozdělí na všechny, kdo měli zájem na záchraně lodi nebo nákladu. Podobným způsobem se tento problém řeší v námořním obchodním právu i dnes, jestliže se má po havárii lodi rozhodnout o rozdělení škody. Od tohoto zákonem upraveného dělení škody po havárii je pouze malý krok k dobrovolnému předchozímu placení pojistného za dopravované zboží. Náklady přitom velmi podstatně klesnou, protože se pojistné platí i za ty lodní přepravy, které skončí beze ztrát. 256 257 8. Jednotlivec o statistika 8.3 Máme se dát pojistit? Již v antické době podněcovalo ztroskotání lodi a podobné škodní případy vznik prvních smluv a zákonů o dělení škody. To posloužilo jako příklad pro pozdější havarijní pojištění. Takový záměr ovšem předpokládá mnohem důkladnější organizaci systému placení, a proto první základy moderního pojištění škod nacházíme teprve koncem 13. století v Itálii, kde v souvislosti s „námořními půjčkami" (foenus nauticum) byla provedena úprava placení pojistného tak, že bohatí jednotlivci nebo peněžní ústavy pojišťovali lodní náklady. Nemůžeme se zde podrobně zabývat dějinami pojišťovnictví, ale přece jen ještě malý výlet do oblasti vzniku slov: „havárie" pochází z arabského slova „avar", kterým se označovalo vadné nebo poškozené zboží. V angličtině se používá slova „average" — toto slovo známe v užívanějším významu „průměr". Tento průměr není 258 nic jiného než průměrná škoda, kterou lze vypočítat na základě právě uvedených starých ustanovení námořního práva. V počátcích pojišťovnictví bylo nutno si vypomáhat dost nespolehlivými údaji o četnosti nehod a škod. Dnes je k dispozici bohatý statistický materiál, který umožňuje výpočet „férového" pojistného. Jestliže mám jen určité představy o četnosti škod, mohu očekávat dva stejně nepříjemné omyly: Bud podcením četnost škod, požaduji nízké pojistné, musím moc vyplácet — a udělám úpadek. Nebo z opatrnosti nasadím pojistné příliš vysoko, zpočátku vydělávám víc než dost, ztratím však brzy zákazníky, kteří přejdou k správněji kalkulujícímu, a tím laci- nějšímu konkurentovi — a vystavuji se úpadku v ještě větší míře, protože předpokladem existence pojištění je pokud možno velký počet pojištěných. Jen tak je zaručeno, že náhodou ovlivňované Škodní události jsou rozděleny tak, jak to přibližné odpovídá četnosti všech škod určitého druhu v celé zemi. Během tří let 1967—1969 se v NSR podílelo na nehodách se zraněním 399116, 410 463 a 417 082 osobních automobilů. Celkový počet osobních automobi I ů či ni 110,2 (1967), 10,8 (1968) a 11,7 (1969) miliónu. Z toho vyplývá průměrná četnost asi 5 případů nehod se zraněním osob na sto osobních vozidel. Pojišťovna s 10 000 pojištěných vozidel by tedy mohla s určitým oprávněním očekávat, že na těchto nehodách se bude podílet nejvýše 5 % jejích pojištěnců. (Přesně se to propočítá tak, že se z téměř nekonečného základního souboru s četností škod p = 0,04 usuzuje na četnost ve výběrovém souboru o rozsahu n = 10 000; srovnej kap. 3 a 6.) Docela jinak by tomu bylo, kdybych chtěl založit minipojišťovnu, našel 25 zákazníků a vypočítal si, že „podle počtu pravděpodobnosti a statistiky" se bude jen jeden podílet na nehodě se zraněním osoby, a podle toho bych kalkuloval pojistné. Výsledek by byl víc než zhoubný. Bylo by totiž docela dobře možné, že právě u mých pojištěnců by nastaly dvě, tři nebo ještě více nehod. Proti tomu bych se musel chránit zajištěním u některé velké pojišťovny — a vzniklé výdaje bych přitom Katastrofy velkého rozsahu, jako např. zánik Titanicu, nemohou krýt ani nejbohatšl pojišťovací společnosti samy. Systém zajišťování musí pomoci nést taková rizika. bohužel musel přesunout na svých 25 pojištěnců. Ať už máme cokoliv proti koncernům, pojišťovny musí být velké. Mimořádně veliká rizika proto málokdy nese jen jedna pojišťovna. Žádná pojišťovna není kapitálově tak silná, aby byla zabezpečena proti ztrátě 50 000tunové osobní lodi uzavřením dalšího tisíce podobných smluv. Proto dochází k celému řetězu zajištění, takže riziko je rozděleno různým dílem mezi půl tuctem velkých pojišťovacích ústavů. Zájem pojišťoven na uzavírání pojistek je dobře znám přinejmenším těm, kterým pojišťovny neustále zasílají lákavé dopisy a k nimž posílají výřečné zástupce. Pojišťovny přece kalkulují pojistné tak, aby vždy dosáhly zisku. Ale proč by se jim mělo přitom pomáhat? Co je přece pro pojišťovnu ziskem, musí být pro pojištěnce nutně ztrátou — nebo ne? V daném případě nutno rozlišovat dvě věci, které se velmi lehce směšují: matematicky objektivní očekávanou hodnotu a subjektivní osobní riziko. „Oče- > já 259 8. Jednotlivec a statistika kovanou hodnotu" je možno početně přesně stanovit: je to průměrná částka výplat vztažená na celkovou částku pojistného. Když tisíc lidí zaplatí do loterie po 100 DM a celkem je vylosována jedna hlavní výhra v částce 10 000 DM a deset výher po 5000 DM, pak proti celkové sázce ve výši 100000 DM stojí součet výher 60000 DM — očekávaná hodnota každého losu po 100 DM je tedy přesně 60 DM. Očekávaná výhra je vlastně „očekávanou ztrátou" ve výši 40 DM; na každého výherce 5000 marek připadá více než 80 prohrávajících. Očekávaná ztráta v loterii není ani pro celkem rozumně uvažujícího člověka vždy odstrašujícím momentem. protože představuje i jakýsi dráždivý a napínavý zážitek. Rozumně myslící člověk se především ptá: Mohu si dovo-lit takovou sázku, kterou s největší pravděpodobností ztratím? Jestliže ano, bude tuto hru pokládat za to, čím vě skutečnosti je — za dárek státní pokladně s tím, že získává malou naději na velkou výhru. Nerozumně se chová ovšem ten, kdo má jen stěží zajištěno živobytí, a přesto nosí své peníze do sázkové kanceláře. U pojištění musí naproti tomu znít první rozhodující otázka takto: Mohu si dovolit škodu, ztrátu? V tomto případě je tomu tak, že méně zámožný bývá více postižen. Přesto se však bohatší chovají jako 8.3 Máme se dát pojistit? 10 vkladů á 5 5J 5J 5J 5J 5J 5J 5J 5J 5] 5J určeno na náklady příjmy pojištění (loterie): 50 průměrný očekávaný zisk 11 10 = 3,5 tzn. průměrná ztráta 5-3,5 = 1,5 Deset osob platí po 5 DM pojistné (nebo za losy). Z celkových 50 marek se — v našem příkladu — vydělí 15 marek na náklady, zbytek se vyplácl. Jeden účastník dostane 10 DM, druhý 25 DM jako výhru nebo odškodnění, zbývající vyjdou naprázdno. V této „hře" činí očekávaná hodnota 3,5 DM, sázka 5 DM. 260 2Jil£JJ£Jojjojojoj chytřejší obchodníci: ačkoliv je ztráta ve vážné chvíli ani zdaleka tak nepostihne, přece platí běžně pojistné (které je sotva zatěžuje) a jsou ušetřeni případné mrzutosti a neočekávané škody. „Malý člověk" naopak skrblí na pojistném, které se mu zdá příliš vysoké — a v případě škody je bez ochrany. Je pojistné opravdu příliš vysoké? Samozřejmě že je příliš vysoké, a to nikoliv bez příčiny. Pojišťovatel musí vybrat dost peněz nejen proto, aby mohl nahradit škody vzniklé v běžném roce, ale i proto, že musí také krýt všechny své náklady — od nákladů na propagaci až po platy ředitelů, od výdajů za formuláře až po platy zaměstnanců, a kromě toho dosáhnout určitého zisku. Musí si také vytvořit rezervy, protože skutečná četnost škod někdy může být mnohem vyšší než odhadnutá. Na 100 DM vyplacených náhrad škod (nebo jiné pojistné dávky) musí tedy inkasovat 120,140 a více DM pojistného — podle druhu pojištění, počtu pojištěnců, vlastních výdajů a dosahovaného zisku. Takto posuzováno je každé pojištění pro pojištěného špatným obchodem a je spojeno jen s „očekáváním ztráty". Pouze sociální pojištění může mít kladnou očekávanou hodnotu — nikoliv však proto, že by zde byla pojistná matematika postavena na hlavu, nýbrž proto, že z příspěvků zaměstnavatelů, dotací apod. plynou pojišťovně prostředky, které pojištěnec nemusí vynakládat. I v tomto případě se musí za 100 DM „škody" zaplatit 120 nebo 140 DM — pojištěnec sám však z toho platí jen 60 nebo 80 DM a o zbytek se postarají dobří „skřítkové". Jestliže toto nevezmeme v úvahu, je každé pojištění „v průměru" a „pro pojištěnce jako celek" ztrátové. Pro jed- notlivce však může být nevyhnutelnou nutností. Pravděpodobnost zničení vozu o hodnotě 4000 DM — za předpokladu, že oba řidiči maji stejné jízdní schopnosti, vozy stejný výkon atd. — je pro čtvrtý vůz milionáře (s kterým jezdí jeho dcera nebo tajemník) přibližně stejná jako pro obchodního cestujícího, který do vozu vložil celou svou hotovost a který jej naléhavě potřebuje pro výkon svého povolání. Je koneckonců pouze věcí náhody, zda ten nebo onen vůz je jedné noci úplně demolován cizím šíleným řidičem. Pro pojišťovnu to jsou dva naprosto stejné případy: vůz v hodnotě 4000 DM byl totálně demolován. Pro pojištěné jsou však důsledky velmi rozdílné. Pro „malého člověka" může mít taková škoda dalekosáhlé důsledky: výpůjčka peněz a lichvářské úroky, zadlužení, případně nervové zhroucení a sebevražda. Pro bohatého je to jen nemilá příhoda a nic víc. Zásadně tedy platí pravidlo: Čim méně je možno dovolit si ztrátu, tím spiše je nutno se pojistit. (Obtížný hraniční případ se vyskytuje tehdy, když je četnost škod tak nepatrná, že i malé pojistné se zdá být zbytečným nákladem.) To není žádné průkopnické poznání. Již v začátcích počtu pravděpodobnosti, před 250 lety. byla položena otázka, jak velký musí být majetek jednoho člověka, aby sám mohl nést určité riziko. Všeobecně platné matematické řešení této otázky nelze nalézt, ačkoliv bylo od té doby provedeno mnoho pokusů a vyskytla se řada podnětů. Velmi mnoho totiž přece záleží také na osobním potěšeni z podstupovaného rizika. Úzkostlivý a opatrný člověk nebude tolik riskovat jako temperamentní a dynamický, a přitom oba mohou 261 8. Jednotlivec a statistika Oba škodní případy jsou prakticky úplně stejné, pro jednoho to však znamená finanřní katastrofu, pro druhého nový, lepší vůz. Poučeni: kdo by byl škodou těžce postižen, musí se proti ní bezpodmínečně pojistit. jednat subjektivně zcela „správně". To samozřejmě platí i v otázce pojištění, které v podstatě riziko vyřazuje — za odpovídající úplatu. Kromě toho je nutno poukázat na jedno důležité hledisko: pojištění nemůže ovšem zabránit určité události, může jen poskytnout finanční pomoc v případě vzniku škody. Pojištění příslušníků rodiny může tedy vyplynout pouze z finančních, nikoli citových pohnutek. Před uzavřením pojistné smlouvy zní proto otázka vždy takto: Jak silně by mne (případně příslušníky mé rodiny) finančně zatížil „vznik pojistné události"? A jak pravděpodobný je vznik lakové události? Odpověd je nutno dlouho, pečlivě a kriticky zvažovat, protože nesprávný optimismus může být osudný. A konečně — v jakém poměru je výše pojistného k mému odhadu rizika, i s přihlédnutím k nematematickým okolnostem? Rozhodující úlohu často totiž má osoba pojištěnce. Stojím-li před otázkou, jestli uzavřít pojistku na cestovní zavazadlo proti krádeži, musím si položit otázku, zda zpravidla dávám na své věci pozor, zda jsem důvěřivý, zda se mi již vícekrát ztratily cenné věci apod. Existuje samozřejmě i jiné riziko, jestliže mám v úmyslu bydlet s příručním kufříkem v rodinném penziónu, anebo budu-li s drahým fotoaparátem a několika prvotřídními obleky bydlet každý druhý den v jiném hotelu. Pojišťovnám je ovšem také známo, že o pojistnou ochranu se ucházejí právě ti lidé, kteří se cítí nadprůměrně ohroženi — a podle toho také propočítávají pojistné. Absolutně spolehlivé pravidlo, co a kdy se má pojistit, není možno stanovit. Ještě několik slov k vysokým rizikům s malou pravděpodobností. Zdá se, že by mělo smysl platit jednu marku ročního pojistného za pojištění rodinného domku proti zřícení letadla? —Tak jako je malá pravděpodobnost takové katastrofy, je nízké i pojistné. Avšak před uzavřením takovéhoto pojištění by bylo nutné si ověřit, zda je pojiš- 262 8.4 Délka ťovna schopna platit. Kdyby se totiž o zavedení podobného speciálního pojištění pokoušel nějaký čilý, ale malý podnikatel, musel by pojistit téměř všechny rodinné domky ve Spolkové republice, aby vůbec mohl z přijatého pojistného krýt jeden nebo dva případy vzniklé škody — a mimoto by jeho výlohy byly vyšší než celková částka pojistného. (Zpravidla jen jedna nebo dvě světoznámé mezinárodní pojišťovny pojišťují nohy filmových hvězd proti úrazu nebo cenné sbírky známek proti zničení v případě války. To proto, že jde o vysoké pojistné, které nemůže být vyrovnáno statistickými četnostmi. Vznik škody by mohl malou nebo střední pojišťovnu zcela zničit, zatímco pro velkou je ztráta snesitelná a bezplatná reklama je skutečným ziskem.) Kromě toho pojistná ochrana přestává platit mimo smluvní podmínky a při změně situace, která existovala v době uzavření smlouvy. Proti válce a jejím následkům pojištění neexistuje. Dokonce ani proti pronikavé změně politického kursu a pouze ve zcela omezeném rozsahu proti světové hospodářské krizi. Vzhledem k tomu, že neexistuje absolutní jistota neomezeného trvání kteréhokoliv státu a hospodářského řádu, nemůže být jistota ani v tom, že pojištění bude platit na smluvní dobu. Nicméně k základnímu principu rozumného chování patři, aby se nejvýš nepravděpodobné pokládalo za nemožné. Tedy nikoliv pojištění pro případ zřícení letadla, ale přesné placení pojistného uzavřeného životního pojištění, sdruženého pojištění domácnosti, případně i havarijního pojištění. idského života a statistiko obyvatelstva 8.4 Délka lidského života a statistika obyvatelstva Již několikrát jsme hovořili o statistice obyvatelstva — např. když jsme psali 1 o historických začátcích statistických šetření, která všechna byla sčítáním lidu, nebo také, když jsme v sedmé kapitole při výkladu možností a úskalí extrapolace na příkladu populační exploze a populačních pyramid ukazovali, jak velké je nebezpečí nesprávných odhadů i v této zdánlivě tak jednoduché oblasti. Konečně jsme se také zmínili o tom, že vedle převládajícího významu hospodářské statistiky má statistika obyvatelstva stále ještě i dnes významnou úlohu. Tři kapitoly: „Území a obyvatelstvo", „Pohyb obyvatelstva" a „Zdravotnictví", nejsou na začátku statistických ročenek uváděny jen tradičně, nýbrž tvoří stále ještě základ pro všechny ostatní údaje, neboť pro koho jiného pracuje statistika, když ne pro lidi, pro obyvatelstvo? V kapitole o statistice obyvatelstva můžeme samozřejmě tuto oblast vyčerpat pouze v neúplné míře, stejně jako tomu bylo i u ostatních dílčích odvětvi statistické práce. Abychom doplnili, co již bylo dříve uvedeno, zastavíme se poněkud podrobněji u jedné dílčí oblasti, která stále znovu vyvolává nedorozumění a která má pro jednotlivce jistě velký význam: u problému „délky lidského Života" nebo. řečeno negativně, „pořadí vymírání". | když někdo sotva ví něco o statistice obyvatelstva, zcela jistě slyšel o tom. že lidský život je dnes zásluhou pokroku v lékařství a sociálních vymožeností v průměru mnohem *»- «f byl ještě na přelomu našeho stole . nemluvě už vůbec o stolet.ch dřivě, '63 8. Jednotlivec o stotistiko věk úmrtí v letech: 2 dosažené průměrné stáří: věk úmrtí v letech: 50 dosažené průměrné stáří: 14 50 60 65 70 75 80 2+14+50+60+65+70+75 + 80 416 . -i-= T= 52 let 60 65 66 70 70 75 80 50 + 60+65+66+70+70+75+80 536 . -i-= T = 67let Vyloučeni úmrtnosti dětí vede k prudkému zvýšeni průměrné délky života. V horním příkladu zemřou dvě osoby z osmi ve věku dvou, resp. čtrnácti let. V dolním přikladu se předpokládá, že obě tyto osoby dosáhly věku 66, resp. 70 let. V ostatních případech se věk úmrtí nemění. Dosažený průměrný věk se přitom zvyšuje z 52 na 67 let. ších. Průměrná délka lidského života vzrostla od začátku našeho století v NSR u mužů ze sotva 45 let na více než 67 let, u žen dokonce ze 48 na více než 73 let. (Živě narozené dítě mužského pohlaví má v ČSSR očekávanou průměrnou délku života 67,3 roku, i když některé z dětí jednou oslaví své sté narozeniny a jiné se smrtelně zraní na školním výletě. 67,3 roku je průměr a jednotlivá dřívější úmrtí snižují aritmetický průměr oproti mediánu.) Přitom jde samozřejmě o „průměrnou délku lidského života", tedy střední hodnotu jednotlivých délek života. Výpočet však není tak jednoduchý — vždyť údaje o skutečném trvání života jednotlivých ročníků jsou plně k dispozici teprve o sto let později; v daném připadě však nechceme jít do podrobností. Zásadně jde o zjištění, jakého stáři dosáhne novorozenec v průmě- ru, který je aritmetickým průměrem. Výsledkem tohoto propočtu je ona „průměrná doba života", která pak slouží např. pojišťovnám jako základ pro životní pojištění novorozence. Tato průměrná délka lidského života se od přelomu století velmi zvýšila a ve srovnání s dobou před sto lety se dokonce téměř zdvojnásobila. Příčinou je ovšem především skutečnost, že se velmi podstatně snížila úmrtnost kojenců a dětí, jak jsme mohli zjistit již při diskusi o populační explozi. Nebezpečí prvního roku života se však dodnes statisticky projevuje v tom, že jednoroční dítě má delší očekávanou průměrnou délku života než novorozenec: překonalo již kritický první rok a je tedy možno odečíst dosud existující vysoké riziko „smrti v prvním roce života" (pravděpodobná úmrtnost přes 3 %, hodnota, která se znovu dosahuje až po 65. roce života!). Dnes tento zisk 264 8.4 Délka li činí jen o něco více než půldruhého roku života, ale v letech 1870—1880 to bylo ještě tak, že živě narozené novorozeně mělo očekávanou průměrnou délku života jen 35,6, jednoleté dítě již 46,5 a tříleté dokonce 49,5 roku! Dnes je očekávaná průměrná délka života tříletých přibližně stejná jako novorozených. Kdybychom chtěli použít pesimistický výklad, mohli bychom říci, že se ztratil dřívější zisk 14 let života. Ve skutečnosti je to tak, že prodloužení průměrné délky života bylo dosaženo především, nikoliv však výlučně, velkým poklesem kojenecké a dětské úmrtnosti. Také střední a starší ročníky získaly několik let života zlepšením hygieny a moderními léčebnými metodami, ovšem zdaleka ne tolik jako novorození. Padesátiletý muž mohl před sto lety žít ještě 18 let, na přelomu století 19,5 roku a dnes 23 let. Šedesátiletá žena dosahovala před sto lety „průměrně" 73 let věku, na přelomu století 74 a dnes téměř 79 let. Pro osmdesátileté a devadesátileté se nezměnilo téměř nic. Je proto třeba velmi pečlivě rozlišovat mezi tím, co se nepřesně nazývá „očekávanou průměrnou délkou života" a vztahuje se na pravděpodobný „průměrný věk" novorozených, vypočítaný pojistnou matematikou, a pro jednotlivce (a jeho pojištěni) mnohem důležitější, věkem specifikovanou průměrnou délkou života. Kdo např. uzavře životní pojistku ve věku 35 let, tomu pojišťovna přizná dalších asi 36 let života, pojistné vypočítá za předpokladu, že „tento zákazník se dožije věku 71 let". Pojišťovna ovšem nekalkuluje na tomto základě. Většinou totiž vyžaduje lékařské vyšetření a vyšší rizika (např. nemocné těžkou tuberkulózou, po ope- dského života g statistiko oby.«,|,t,, raci žaludku atd.) přitom z pojištění vylučuje nebo pojišťuje pouze za vyšlí pojistné. Kromě toho vypočítaná délka lidského života se vztahuje na celek všech pětatřiceti letých a normální pojištěnci stejného věku budou žít spíše o něco déle. Pro pojišťovnu zde může být velmi výhodné, jestliže je smlouva uzavřena pro případ úmrtí: pojištěnec platí pojistné déle. Nevýhodné to pro pojišťovnu bude. bylo-li dojednáno placení důchodu; při pojištění důchodu, splatného ročně po dosažení 65. roku věku, je tedy třeba použít jiných měřítek: vážně nemocni budou v daném případě kalkulačné nejlepšími zákazníky. Pojišťovna naproti tomu může, je-li stav pojištěných dostatečně velký, dokonce běžně porovnávat, zda vznikají neobvyklé výkyvy ve srovnání s úředními tabulkami úmrtnosti. Ve statistických ročenkách se totiž uvádějí pro každý nebo pro každý pátý rok věku příslušné „pravděpodobnosti úmrtí". (Pravděpodobnost úmrtí 0,045 658 pro padesátiletého muže ve zkrácených úmrtnostních tabulkách, jak jsou uvedeny ve Statistické ročence ČSSR 1968. znamená, že ze 100 tisíc mužů. kteří se dožili 50 let, jich ve stáří 50—54 let zemře 4566.) Ve vysokém věku tato pravděpodobnost prudce vzrůstá: ze 100 000 devadesátiletých se jich 95. narozenin nedožije 86 332. Z úmrtnostní tabulky je možno téměř na první pohled nalézt od poved na tyto otázky: třicetiletý muž se ožení s dvacetiletou ženou. Jak velká je pravděpodobnost, že za 40 let oba budou ještě živi. že zůstane na živu jen jeden z nich. že oba zemřou? Nejdříve najdeme v řádku „muž. 30 číslo 94 311. Říká. že ze 100 000 novorozených mužského pohlaví tohoto věku 265 8. Jednotlivec a statistika 'I | | 10 20 30 40 50 60 70 věk v letech 80 90 každou věkovou skupinu Zeleni ZÍ1 ľ' krÍVka udáv° P™°ěpodobnost "mrtf pro stupnice vpravo ukazuje kolik erJZ ľ ľľ'' P°ZV°'né Vymírání Íedn°"ivých ročníku. Zelená úmrtí je stále ještě vysoké oLlZ 1 Ítítě ži'e- NáPadné na Pravděpodobnosti podobnost úmrtí v prľbehu oíu o„T, T™!?'- "P™ v sedmdesátém roce věku je pravdě-stoupá ostře vzhůru v osma ľ ^ Í0k° pr° "°Vě nar°"né»°- P°<< však křivka roce již 0.16. v devadesátém ZlTnuY'^'.doSahne Pravděpodobnosti 0.1. v osmdesátém pátém »1. narozenin). Graf se zakláHA ľ"-' u" 1 W ítyř devoáesátiletých se nedožije svých 1959/1961. je však typiekv rtnr«L. T r°kouské všeobecné úmrtnostnl tabulky pro ženy (Důležitý rLTnÍKr^Ä!^ M°ky ' Pr° mUŽe ° téŽ iiné eVr°Pjkí Země" protože však muži vůbec umíráIIT ľ P m°|f vysokou pravděpodobnost úmrtí: 0,042. sedmém roce věku.) dosáhne se této pravděpodobnosti opět již v šedesátém 8.4 Délka dosáhne jen 94 311. Náš muž však tohoto věku již dosáhl a tak to, co již bylo, se nás netýká. Nyní se podívejme, jak to vypadá o 40 let později: v řádku „muž, 70" najdeme 54 683 — rovněž vztažených na 100 000 nově narozených. Naději na dožití udává kvocient 54 683:94 311 = 0,58. Pravděpodobnost úmrtí pro celé období 40 let představuje to, co chybí do jistoty (1), tedy 1 — 0,58 = 0,42. Naděje na dožití u podstatně mladší ženy je pochopitelně mnohem větší. V řádku „žena, 20" najdeme 97 068, „žena, 60" stále ještě 86 788; kvocient je tedy 0,895 pro dožití a 0,105 pro úmrtí. Ke zjištění pravděpodobnosti pro složené jevy postačí tato čísla odpovídajícím způsobem navzájem násobit, protože máme navzájem nezávislé pravděpodobnosti. Pro případ „oba se dožijí": 0,58 . 0,895 = 0,52. Případ „oba lidského života g statistika obyvat,U,v„ zemřou" bude velmi nepravděpodobný: 0,42.0,105 = 0,04. Naproti tomu lze zcela dobře počítat s tím, že žena zatím ovdoví: 0,42 . 0,895 = 0,38. Není však příliš pravděpodobné, že by muž přežil svou ženu: 0,58 . 0,105 = 0,06. Z 1000 takových manželských párů by se podle toho mělo 520 dožít čtyřicátého výročí svého sňatku, a dále dožít by se jej mělo 380 vdov a 60 vdovců; ze 40 manželských párů by již nezůstal na živu ani jeden z manželů. V tomto případě jde o výpočty na základě nezávislých pravděpodobností. Protože však zkušenost ukazuje, že smrt jednoho z manželů často urychluje úmrtí druhého, je třeba se dívat na tato čísla jen jako na pojistně matematické ukazatele. Nejen v těchto případech desetiletí společného života, nýbrž i zcela všeobecně totiž platí, že taková čisla maji pro jednotlivce mnohem menši význam Očekávaná střední délka života v ČSSR 0 1 10 20 30 40 50 60 70 80 Věk muži ženy 1929/1932 1949/1951 1960/1961 1966 1929/1932 1949/1951 1960/1961 j 1966 51,9 59,9 54.0 45,3 37.1 29,0 21.2 14.3 8,7 4,7 60.9 65.5 57.7 48.5 39.6 •30.8 22.4 15,2 9.4 5.4 67,6 68.4 60,0 50.4 41.2 32.0 23,2 15.5 9,6 5.2 67,3 68,2 59,7 50.2 40,9 31,7 23,0 15.3 9,5 5.3 55,2 62.0 56.1 47,4 39.2 31.0 22.8 15.3 9.2 5,1 65.5 69.4 61.5 52.1 43.0 33,9 25.1 17.0 10.2 5.6 73.1 73.6 65.0 55.2 45,6 36,0 26,9 18.4 11.0 5.8 73.6 74.1 65.5 55.7 46.0 36.4 27.2 18.6 11.3 5.9 Pramen: Statistická ročenka ČSSR 1966. 1968. Údaje za rok 1966 jsou vypočteny ze zkrácených úmrtnostních tabulek. 266 267 8. Jednotlivec a statistika než pro pojištěni. Ve velikém množství pojištěných se nakonec projevuje náhodné rozdělení úmrtí (od autonehody až po sešlost věkem) s překvapující přesností, pro jednotlivce však tato čísla mohou představovat jen určité odhady. Průměrně zdravý padesátník si může vypočítat a říci, že osmdesátky se asi nedožije, přesto však více než čtvrtina všech padesátiletých tohoto věku dosáhne. Kdo ovšem dosáhl osmdesáti let, dožije se velmi pozoruhodného statistického úkazu: s každým dalším rokem života roste zcela mimořádně očekávaná délka jeho života (nikoliv absolutně, ale rela- průměrná očekávaná délka života ještě 68 let průměrná očekávaná délka života ještě 70 let 6 let 76 let 90 let 93 let ^hmJdkěate¥fen^dnÍm.VěíU 2 prOÍÍté r°ky ŽÍVOta P'ní -odpisuji": zbývajíc! délka života osmile- naroÍ !„.'¥ vIokTm vM^ ^ * '« ° °VQ ^ ^ vana dé ka ,iv„. o„ Ví, ? 'S°U napr0ti t0mu do Íisté mlr/ hodnoceným dobropisem: očeká- dvou let. dosáhne-l, 96. muže se dožit ještě téměř dvou let. 268 8.4 Délka lidského života a statistika obyvatelstvo tivně). Zatímco šestileté děvče se má dožít dalších 68,9 roku, má sedmileté před sebou 67,9 roku života, devítileté 66 let. To znamená: tři prožité roky — od šesti do devíti — téměř nic nezměnily na celkové očekávané délce života, která činí přibližně 75 let. Osmdesátiletá žena má naproti tomu ještě očekávanou délku života asi 6 let, jedenaosmdesátiletá 5,6 roku a třia-osmdesátiletá 4,9 roku. Dožitím tří let se tedy zvýšila očekávaná celková doba života ze zhruba 86 let na téměř 88 let! Očekávaná délka života jedenade-vadesátileté ženy je pouze 2,8 roku, osmadevadesátileté však stále ještě 1,8 roku. (Viz obr. na str. 268.) K průměrné očekávané délce života novorozených je třeba ještě dodat, že ve skutečnosti je vyšší než vypočítaná nebo, jinak řečeno, uvedená střední hodnota klame. Pro jednotlivce je vzhledem k délce života nejzajímavější hodnota mediánu: v jakém věku zemřela polovina mého ročníku? Tento střední věk je však znatelně vyšší než aritmetický průměr věku úmrtí, kalkulovaný pojistnou matematikou, jak bylo již krátce uvedeno. Vysvětlení je prosté. Předpokládejme, že např. z deseti osob stejného ročníku narození zemře jedna ve věku 12 let a dalších devět v těchto letech: 46 — 54 — 63 — 67 —69 — 71 — 73 — 79 — 86. Celkový součet činí 620 let života. Průměr 62 let je „očekávaná průměrná délka života" v době narození. Polovina těchto osob však dosáhla vyššího věku než 67 let, a protože jde o sudý počet osob. činil by medián = 68. 67 + 69 Dříve byl tento rozdíl mezi aritmetic- kým průměrem a mediánem Často velmi výrazný. Dnes. kdy je velmi málo případů předčasné smrti (většinou jde o oběti nehod), není tak znatelný. Přesto však dnes činí „očekávaná průměrná délka lidského života" živě narozených chlapců v NSR 67.5 roku, ale polovina z nich dosáhne asi 71. roku věku. (Po prvním roce života se však tento rozdíl silně zmenšuje. Víme již totiž, že průměrná délka lidského života jednoletého je vyšší než novorozeného; medián však není tímto posunem dotčen: první část oné poloviny, která se nedožije více než jedenasedmdesáci let. již zemřela.) Veškerá pořadí vymírání a tabulky úmrtnosti mají však vážnou vadu. Nemohou v dostatečné míře přihlížet k hygienickým a zdravotním poměrům, nyní tak odlišným ve srovnání s minulostí. Kdo má dnes 70 let, ten se narodil těsně po přelomu století, dětství prožil pod hrozbou životu nebezpečných dětských nemocí, zažil dvě světové války, protrpěl dvě poválečná období. Očekávanou délku jeho života lze však vypočítat jen na podkladě údajů úmrtnosti ještě dřívější generace. Stejně tak nelze s jistotou říci. že nastupující generace (třeba dnešních padesátníků) bude mít v sedmdesáti letech věku pro zbytek svého života stejné podmínky jako dnešní sedmdesátníci. Kdyby se rakovina stala vyléčitelnou, ztratí všechny úmrtnostní tabulky během několika let svou vypovídací schopnost. Kdyby se však naopak třeba ukázalo, že znečištění ovzduší má trvalejší škodlivé účinky na organismus, než se dnes domníváme, musely by být tabulky opraveny v opačném směru. Jttcé » jedno: v posledních dvacet, letech v NSR vzrostla délka života novorozeňat mužského pohlaví jen minimálně. 269 8. Jednotlivec a statistika u patnáctiletých zůstala stejná, u 25 až 75letých se nepatrně snížila. Teprve za dalších deset až dvacet let bude možno posoudit, zda tato čísla nesignalizují neblahý vývoj. Velice pochybná se však zdá prognóza, podle níž je třeba během dvaceti let počítat v NSR s průměrnou délkou života 85 let. To by totiž vyžadovalo nejen zvítězit nad rakovinou, ale i podstatně snížit počet dopravních nehod, jejichž růst znatelně snižuje průměrný věk mužů. Pro ženy to zatím neplatí: délka jejich života vzrostla ve všech věkových skupinách, jejich předstih proti mužům se výrazně zvýšil. Dovětek k populační explozi. Heslo „nejdříve ženy a děti", které platí pro všechny záchranné akce, nemá snad svůj původ ani tak ve vrozené galantnosti a rytířství mužů, jako spíše ve správném pocitu, že další život národa, rodiny, kmene zajišťují ženy a děti, nikoliv muži nebo staří lidé. Proto absolutní počet obyvatelstva není výchozím bodem pro očekávanou porodnost. Tu je možno vypočítat pouze podle počtu žen v plodném věku. (Dokonce tak těžké ztráty mužů, jaké byly ve druhé světové válce, se v poválečné době projevily ve statistice porodů jen nepatrně.) Někdy vyslovovaný názor, že s ohledem na explozivně rostoucí počet obyvatelstva světa by se neměl také ještě všemi prostředky geriatrie prodlužovat život starých lidí o měsíce nebo dokonce léta, je nesprávný ve dvou směrech: jednak má lékařství na tomto úseku jen relativně malé možnosti, jednak se tím dlouhodobě mnoho nedosáhne. 8.41 Morální statistika, aneb: „Utíkejte! Všechno je prozrazeno!" Jedna humorná historka z Balkánu vypravuje o muži, který se chtěl pomstít hostinskému. Jednou večer, když byla hospoda jako obvykle plná, vrazil udýchaně dovnitř s významnými posuňky a hlasitě volal: „Utíkejte! Všechno je prozrazeno!" Všichni hosté se v divokém spěchu rozprchli a nezůstal nikdo, kdo by zaplatil útratu. Na první pohled by nemuselo být jasné, co má tato anekdota společného se statistikou. Poslechněte si však k tomu druhý, velmi podobný příběh, který uvádí Arnold Schwarz ve své knize „Zahlen beweisen" (Čísla dokazují): „Před několika desítkami let byla celá Paříž znepokojena velkým počtem anonymních dopisů, které měly vzápětí za následek desítky rozvodů, a velkým počtem anonymních udání, která v mnoha případech končila sebevraždami. V činnosti byla jakási ďábelská moc, jež se zdála být zasvěcena do nejin-timnějších tajností stovek osob... Policie zahájila rozsáhlé vyšetřování a nakonec se dostala k domovnici, která byla autorkou dopisů. Přiznala, že každé ráno zabodla do stránek pařížského adresáře pletací jehlici. Když přišla na nějakou firmu, napsala jí, že její účetní se již léta dopouští zpronevěry. Jestliže přišla na nějakou domácnost, psala manželce, že manžel je jí nevěrný. Byla to metoda náhodného výběru v oblasti morální statistiky podle všech pravidel." Nabodávání obsáhlého seznamu nebo dlouhého textu jehlicí pro náhodný výběr je mimochodem prastará, dokonce velmi doslovná metoda náhodného výběru. Pochází z okrajové oblasti sta- 270 8.41 Morální statistika, aneb: „Utíkejte! Všechno je pr ozrazeno!" Také z adresáře a telefonního seznamu je možno vytvořit „vzorek". Není to sice většinou vědecky správné, ale lze tím dosáhnout pozoruhodných výsledků, jak ukazuje výběr jedné pařížské domovnice, o níž pojednáváme v oddílu o morální statistice. tistiky, v níž nelze přesně oddělit důvěru v osud od víry v moc čísel. John Wesley, zakladatel církve metodistů, dokonce říká, že tímto způsobem hledal v bibli odpověď na otázku, zda je Bož! vůle, aby se oženil. Odpověď byla záporná a Wesley zůstal svobodný. Nechceme však zdůrazňovat uvedenou techniku náhodného výběru, nýbrž říci několik slov o „morální statistice". Zdá se, že tento výraz pochází z třicátých let 19. století od Francouze Gherryho, který napsal „Essay sur la statistique morale de la France" (Úvaha o francouzské morální statistice). Morální statistika se zabývá těmi údaji, které umožňují zpětný úsudek o mravech, právních názorech a morálce obyvatelstva. Doba jejího rozkvětu spadá do druhé poloviny minulého století. Dnes se tohoto výrazu užívá jen zřídka, ale údaje, které jsou pro něj charakteristické, se různými způsoby stále ještě zjišťují. Do morální statistiky se mimo jiné zahrnují pozorování o sebevraždách, o zločinnosti, o porodech mimo manželství, o počtu odsouzených a vězňů, ale samozřejmě i anketní šetření, jako např. statisticky nečistě zpracovaná tzv. „Kinsey-Report" (Kinseyova zpráva) a jiná zjišťování o sexuálním chováni lidí. Potíže morální statistiky jsou zřejmé z již uvedených anekdot: temné číslo mnoha „morálních deliktů" je velmi vysoké. Reprezentativní dotazováni o četnosti manželské nevěry musí skoro nevyhnutelně vést k rozporným a nespolehlivým údajům, z nichž závěry lze dělat jen s velkou opatrností. Naproti tomu existují určité údaje, které zcela dobře umožňují porovnání. K nim 271 8. Jednotlivec a stotistika [ ^ mé»l *«1 5 p'.Btulw ne IX 000 oOf.osti 20—U 25—30 Mordlnl statistika x přelomu století: počet zabiti (a vražd) na 10X3 000 obyvatel v jednotil-vých italských provinciích. Na Sklili a Sardinii jsou ilsla zvldlť vysoká. (Uvedeno u A. Schwar. ze: „Názorná statistika".) především potři statistiky dat narozeni prvního dítěte. No základě těchto údajů lze například velmi dobře dokázat, že manželství se ve velmi vysokém procentu uzaviraji teprve tehdy, když je zcela jasně lékařsky prokázáno těhotenství nevěsty. Takto např. vypadá statistika „narozeni během prvních dvanácti měsíců manželství" v libovolně vzatém roce z nedávné minulosti ve Vídni — a Vídeň není o nic víc „nemorální" než jiná středoevropská velkoměsta: Trváni manželství v mísících Narozeni (méní než 1) 1 2 3 4 5 6 7 e 9 ot 11 168 233 340 578 965 1248 744 303 249 832 8.41 Morálni statistika, aneb: „Utíkejte! Viechno je prozrazeno!" V prvním roce manželství se z celkového počtu 5660 děti narodí jen o něco více než 800 děti. které byly počaty v manželství. Velká kumulace porodů v 5. až 7. měsíci manželství (tedy po U a 6 měsících trváni manželství) jasně ukazuje, jak rychle po zjištění těhotenství byla zorganizována svatba. Vzhledem k tomu, že ve zvoleném roce bylo uzavřeno asi 14 500sňatkú (včetně novéhosňatku ovdovělých apod.), ukazuje „morálni statistika'*, že ve třetině manželství se dítě již čekalo. Na tom se však mimochodem, bez ohledu na vlnu sexu nebo existenci antikoncepčních prostředků, během doby změnilo jen velmi málo. Vcelku je však při těchto porovnáních třeba velké opatrnosti. Tak např. vysoký vzrůst zaznamenala jako důsledek rychlého rozvoje automobilismu „krimi- nální statistika", vzhledem k tomu, že přibyla zcela nová skupina přečinů; výraz „národ potrestaných" pochází z vysoce rozvinutých zemí. Jestliže se dopravní trestní právo jediným škrtem pera „odkriminalizuje" například tím, že se trest bude ukládat jen správní cestou, dojde k prudkému poklesu kriminality. Stejně tak se snižuje i počet mravnostních deliktů, zejména když se některé již nepokládají za trestný čin (např. homosexualita apod.). Proto lze nanejvýš víceméně porovnávat kategorie jako „loupež" nebo „vražda", ale dokonce i zde je možné postupovat nesprávně, např. proto, že trestní právo — vědomě nebo nevědomě — jinak vymezuje vraždu a zabití, loupež a krádež. Dříve než začneme porovnávat, je nutno pečlivě si ověřit, „Morální statistika" ukazu|e. že v dobí sňatku je čáp často již na cestí. Ve čtvrtím až sed-mím mísící manželství se narodí podstatní vlc dftl než v devátém a dvanáctém. 1200- 1000- 800- 600- 400- 200 100- m I B9 I I I I I 1 1 1 I I I pod 1 1_ 2 3 4 5 6 7 8 9 10 11 2 3 4 5 6 7 8 9 10 11 12 trvání manželství v měsících 272 273 8. Jednotlivec a statistika zda právní pojmy skutečně obsahují stejnou skutkovou podstatu. Avšak i potom jde spíše o kulturně historický nebo sociologický popis prostředí než o matematickou statistiku. Pro téměř celou oblast morální statistiky je však přesto charakteristické zjištění, které kdysi učinil Quételet o zločinech a Emile Dürkheim o sebevraždách: pokud všeobecné životní pod -minky zůstávají přibližně stejné, ukazuje jejich četnost překvapující rovnoměrnost. Zjevné změny nastávají až tehdy, když dojde k trvalejší změně životních poměrů. Přitom účinky jsou někdy překvapující: např. počet sebevražd, jak ukazují zkušenosti, poněkud klesá v době války. To, co na morální statistice zasluhuje pozornosti, patří z převážné části do oblasti sociologie, a proto můžeme čte- náře odkázat na odborná sociologická díla. Kriminalita mládeže, delikty pod vlivem omamných látek, sdružování se do tlup. opilci za volantem a mnohé jiné dnes tak často diskutované aktuální problémy patří do „morální statistiky". Jak nepozorovatelný je přechod od morální statistiky ke statistice obyvatelstva, jasně ukazují např. antikoncepční prostředky. Vraťme se však ke statistickým metodám, o kterých nebylo v 19. století ani potuchy, které však jsou pro hladký běh moderní civilizace často důležitější než morálně statistické výpočty. Tak „teorie hromadné obsluhy" se zabývá problémem, který je i matematicky velmi složitý, studiem optimální obsluhy zákazníků (v obchodech i úřadech, v dopravních prostředcích i lokálech). 8.5 Čekáni 8.5 Čekání na autobus — teorie hromadné obsluhy Na zastávce autobusu čeká již pět lidí, další autobus tedy už musí přijet každou chvíli, neboť intervaly v tuto denní dobu činí, podle oznámení na vývěsce, 10 minut. Minuta za minutou utíká, zástup čekajících stále roste. Osm. deset, dvanáct minut uteklo, polohlasně se reptá, jeden netrpělivec dokonce již mezitím zamával na projíždějící taxík. Konečně se vzadu v zatáčce objevuje autobus, blíží se, zastavuje a je přirozeně nacpaný k prasknuti. Tlačenice u výstupu, tlačenice u vstupu, průvodčí netrpělivě gestikuluje a volá: „Za námi jede další!" Mezitím co se posledním pasažérům podařilo nacpat se dovnitř, ze zatáčky skutečně vyjíždi další, prázdný autobus stejné linky. Podobných příkladů tohoto druhu je v moderním světě víc než dost. Jsou to fronty čekajících u hraničních závor v turistické sezóně, nebo zejména u úředních přepážek, kde si potřebují něco vyřídit. Dále je tu telefon, který je stále obsazen v důsledku nahromadění volajících, kteří stojí abstraktní frontu. Je to, jsou to — ale co to má všechno společného se statistikou? Víc než by se dalo na první pohled předpokládat, ačkoliv hned poznáme, že v daném případě narážíme na obtížnou speciální a okrajovou oblast statistiky a počtu pravděpodobnosti — na „teorii hromadné obsluhy" nebo „teorii front". Používané výpočetní postupy jsou obtížné, vlastní výpočty se provádějí většinou za pomoci výpočetní techniky. ■ a autobus - teorie hromadné obsluhy Nemůžeme popisovat výpočetní metody v jednotlivostech. Vzhledem k významu shlukování a front, který mají v našem životě, a vzhledem k tomu. že se v tomto oddíle zabýváme především rolí statistiky v každodenním životě, řekněme si přece jen několik slov o tom nejpod-statnějšim z teorie hromadné obsluhy. Jak dochází k shlukováni? Velmi prostou příčinou vzniku shlukování je trvalý nedostatek kapacit, převaha poptávky nad nabídkou. Jestliže na jedné autobusové lince je k dispozici pouze i0 míst. zatímco potřeba činí 70, je trvalá tlačenice nevyhnutelná. Jestliže na poštovním úřadě je na počátku měsíce otevřena pouze jedna přepážka pro přijem peněz, narůstá tam fronta a takový stav trvá pár dní. Je-li telefonní centrála zařízena pouze na tisíc spojení, ozývá se ze sluchátka trvale obsazovací tón. Na tento druh shlukování je těžké jít se statistikou. Musí se zařadit další autobus, otevřít další přepážka — a pak se všechno hladce vyřídí. Je nutno např. dbát o to, aby přepážka byla otevřena osm hodin, i když jednání se stranami by vyžadovalo jen 6 hodin (např. 180 zákazníků po 2 minutách). V daném případě má pak úředník ještě dost času, aby vyřídil i ostatní práce, snědl své obložené chlebíčky a popovídal si s kolegy — a nikdo nemusí čekat. Opravdu nikdo nemusí čekat? Po-nechme zatím stranou existenci ..špiček" a optimisticky předpokládejme, že by dlouhé čekání ve „špičkách" vychovalo zákazníky tak. že by přicházeli k přepážce po celý den pravidelně — Klient vstupuie do přepážkové haly - půjde přímo k prdrinému ,M»>* cekajících! ..Teorie obsluhy" se pokouši vypočítat opumalm f^^J^JT** v obchodech, při využiti sedadel v kinech, hostincích a v dopravních prostředcích. 275 8. Jednotlivec o stotistika____ asi 20 až 25 lidí za hodinu. Přicházejí však náhodně rozptýleni — jednou tři krátce za sebou, jindy deset minut nikdo, jak už to bývá. Čekat však nemusí nikdo. Ale copak, copak? Otevřete dveře a u ,,vaší" přepážky už zase stojí 4 lidé. Jak je to možné? Pomůže nám vzpomínka na Poissonovo rozdělení, s kterým jsme se seznámili již dříve (srovnej oddíl 3. 4) — jen se nesmí „vzácný jev" vykládat příliš doslovně. Otázka pak např. zní: Jaká je pravděpodobnost, že zákazník najde přepážku volnou, když k přepážce přijde za hodinu v průměru 22.5 zákazníka a každý z nich tam potřebuje k jednání 2 minuty? Myšlené východisko je jednodušší, než se zpočátku zdá. Z každých 60 minut doby, po kterou je přepážka otevřena, má úředník průměrně 15 minut volno, což již ostatně víme. To však neznamená, že během těchto 15 minut není nikdo odbaven, že jen 15 minut je přístup volný a bez čekání. To však znamená: kdykoli — náhodou — přijdu, nebudu moci ve třech ze čtyř případů (45 z 60 minut) ihned k přepážce, nýbrž nejméně jedna osoba bude přede mnou. Je možné, že přijdu právě v posledních vteřinách onoho úředního jednání, není však také tak nepravděpodobné, že čekají tři, čtyři nebo ještě více lidí. A jestliže nový přírůstek čekajících překročí dvouminutový rytmus vyřizování, fronta narůstá... Jaký druh front můžeme u této přepážky očekávat? Celková doba otevření přepážky je 8 hodin, tzn. 480 minut; přijde 180 zákazníků a každý potřebuje 2 minuty, tj. celkem 360 minut. Doba vyřizováni záležitostí jednoho zákazníka je tedy 360/480 = 3/, = 0,75. Označme toto číslo /., abychom znázornili strukturální souvislost s Poisso- novým vzorcem. Nyní uvažujme: čtvrtina všech zákazníků najde přepážku volnou a v tom okamžiku, kdy je někdo obsluhován, tvoří potenciální čelo fronty, „fronty z jednoho člena". Pro výpočet této pravděpodobnosti použijeme následující varianty Poissonova vzorce: (x-1) ! Za x = 1 dostaneme: 1-' Pl = e-°" (0,75)° (1-1)! 1,1 1 = ~e^" '1 =ToŤŠ-=0'47- Z celkové pravděpodobnosti (= jistoty; p = 1), že někdo utvoří čelo fronty a vznikne fronta — i když jen jednočlenná — připadá 0,47 na možnost „jen jeden člen". Z celku (180/4 = 45) zákazníků, kteří najdou přepážku volnou, odejde asi polovina (22), aniž by za nimi vznikla fronta. Dále: _ „(-075)2 p2=e (0.75)' 2° = _.(0,75).1 (2-1)! 0,75 4,5 = 0,17. Ze 17 % ze 45 zákazníků (7 až 8) vznikne dvoučlenná fronta: za ně se postaví 1 osoba a tou miniaturní fronta pak zanikne. Za zbývajícími 15 až 16, tvořícími „čelo fronty", vznikne naproti tomu asi ve 3 případech trojčlenná, ve dvou případech čtyř nebo pětičlenná fronta. Stále ještě zbývá asi 8 „čel fronty", každá po 6, 7 a 8 členech (přibližně). Nemusí to být vždy špatná organizace, jestliže se u jednoho okénka (vlevo) vytváří fronta, zatímco u jiných okének (vpravo) se přijde hned na řadu. Fronty vznikají často jen jako důsledek náhodného nepravidelného příchodu klientů. ale během dne může vzniknout docela dobře také jedna dvanáctičlenná fronta: 1 1210 • p12= ? .(0.75)». — * 1 62 mld * . (0,04) . ——~ m 0,0075 8100 v ' 40 mil. Při tomto výpočtu dostáváme sice jen 0,75 % zákazníků přepážky, kteří tvoří čelo jedné dvanáctičlenné fronty, avšak pomyslíme-li, že pravděpodobnosti jedenácti nebo třináctičlenné fronty jsou přibližně stejné, je pro celkovou pravděpodobnost „jedné z těchto tří délek" přece jen P„, P18 nebo Pu * 0,02 (= 2 % ze 45 osob, tedy jedna). Tímto způsobem mohou být již stejně velmi malé pravděpodobnosti pro ještě delší fronty sečteny a ukáže se, že některá fronta může mít až 24 osob. A to vše za situace, kdy přepážka je otevřena déle, než by bylo třeba k vyřízení zále- žitostí a ačkoliv se návštěvníci neshromažďují „ve špičkách", nýbrž přicházejí náhodně rozptýleni. Tento výsledek se jeví tak nepravděpodobný, že jsme v pokušení provést jeho kontrolu. Můžeme sledovat osud našich 180 jednotlivých zákazníků a zjistíme (zčásti z dosavadních údajů, zčásti z údajů dalších, avšak zjištěných stejným způsobem): Celkem 22 zůstanou sami 22 7 až 8 vytvoří dvoučlennou frontu H až 16 asi 3 tříčlennou frontu 9 asi 2 čtyřčlennou 2 pětičlennou 10 1 šestičlennou 6 1 sedmičlennou 7 1 osmi nebo devítičlennou 8 až 9 1 deseti nebo 1 jedenáctičlennou 10 až 11 12, 13 nebo Učlennou 12 až H 277 276 8. l-rfnotlivec o statistiko Fronty nevznikají jen tam. kde je kapacita vyřizovacího místa příliš malá. ale také tam. kde dochází k náhodnému rozdelení zákazníků, cestujících atd., tedy k nepravidelnému vytížení. U této přepážky nemá někdy úředník na práci nic, ale jindy se přesto vytvoří fronta — i když by se předpokládalo, že každý klient potřebuje k vyřízení své záležitosti stejně času. 1 15 ažlôčlennou 15 až 18 1 19 až 23člennou 19 až 23 1 24 až 30člennou 24 až 30 164 až 183 Tento model je samozřejmě možno ještě zlepšit, jestliže se zcela reálně předpokládá, že se nikdo nepostaví do 15členné fronty, nýbrž přijde raději ještě jednou. Již tento nejzákladnější výpočet je však, jak jsme viděli, dosti namáhavý. Vyšší postupy jsou ještě složitější. Vraťme se od fronty na autobusovou zastávku a zamysleme se nad zdejším shlukováním. Autobus, který přijel opožděně, byl sice plný k prasknutí, ale další byl prázdný. Kapacita sedadel na lince byla tedy dostatečná, závadné Stejnoměrné intervaly znamenají, že průměrná doba čekání činí polovinu délky intervalu. Nepravidelné intervaly všeobecně prodlužuji čekací dobu. Jestliže je interval tak dlouhý, že zpožděný autobus přijede současně teprve až s druhým následujícím, který jedo podle jízdního řádu, vzroste čekací doba na dvojnásobek. ► 278 bylo jen rozdělení. Zde do sebe zapadají nebo se překrývají dvě pravděpodobnosti. Na jednotlivých zastávkách se zpočátku odehrává totéž co na poštovním úřadě: cestující přicházejí náhodně rozděleni, jednou krátce po sobě, pak zase vůbec nikdo. V tomto případě k tomu přistupuje ještě druhá série 8.5 Čekání na autobus - teorie hromadné obsluhy náhodných jevů: hustota provozu, světelné signály atd. Nakonec se zpočátku nezávislé jevy navzájem vyrovnají: autobus zůstane stát na červenou, tím přibývá čekajících na nejbližsí stanici. Jejich odbaveni (nástup, později výstup) trvá déle. doby stání jsou nadprůměrné, jízdní řád již © 1 další autobus za 10 min. 279 * 8. Jednotlivec o statistiko nelze dodržet, na dalších zastávkách se nahromadí ještě více čekajících atd. Touto hrou na nervy se nebudeme vůbec zabývat, nýbrž jen zkoumat účinek nepravidelných intervalů na uživatele autobusu. Jestliže stanovený interval je 10 minut, může „náhodný cestující" (který např. denně jezdí určitou linkou, ale nemůže se řídit jízdním řádem) počítat s průměrnou čekací dobou 5 minut — poloviční dobou intervalu. Jestliže však naproti tomu autobusy z jakýchkoliv důvodů nejezdí v pravidelných intervalech, nýbrž střídavě v intervalech pěti a patnáctiminutových, vpadne ve třech ze čtyř případů do delšího intervalu (průměrná čekací doba 7,5 minuty) a jen jednou do kratšího (průměrná čekací doba 2,5 minuty). Tím se však vypočítá pravděpodobná čekací doba náhodného cestujícího za další období takto: 3 . (7.5) + 1 . (2,5) = 6,25. Při stejné hodinové frekvenci nabízených míst bude tedy muset čekat o 1'/. minuty déle. Autobusy sice zpravidla vyjíždějí v pravidelných intervalech, nicméně neustále dochází k posunům intervalů v důsledku uvedených dopravních situací s jejich následnými účinky. Podívejme se ještě rychle na krajní případ, kterým jsme tento oddíl uvedli. Teoretický interval 10 minut se prodloužil tak, že přijel již další autobus — z dvakrát deseti minut je dvacet minut plus 0 minut. Dva jednotlivé autobusy prakticky splynuly v jeden velkoprostorový superautobus, který přijíždí jen každých 20 minut. Podobné frekvenční problémy nejsou samozřejmě omezeny pouze na úřady, dopravní prostředky a jiná veřejná zařízení. V těchto případech se jen zvlášť nápadně projevují, protože „velké číslo" si přímo vynucuje statistické zpracování a výpočet na základě teorie pravděpodobnosti. V zásadě to platí dokonce i pro malý obchod s potravinami, jehož šéf se ptá, kolik asi banánů má mít v sobotu pro své zákazníky: náhodná poptávka může způsobit, že již v 11 hodin je vyprodáno, ale také, že třetina zboží zůstane ležet a do pondělka se zkazí. V případě restaurací, biografů atd. je použitelnost modelů hromadné obsluhy zřejmá ještě daleko více. Bohužel se zde nemůžeme dále zabývat těmito otázkami, které již zasahují do oblasti operačního výzkumu, optimalizace a teorie her, protože bychom museli nadlouho opustit naši vlastní oblast — statistiku v užším slova smyslu. To však nemůžeme, neboť se musíme ještě blíže seznámit s ústředním problémem statistické práce — s naukou o vztazích, o korelacích. 9 Post hoc ergo propter hoc 9.1 Vztahy, příčiny, účinky V oddílu 3.1 jsme mluvili o diskrétních a spojitých znacích a o relativních četnostech. Mezitím jsme se vždy znovu zabývali rozdělením takových znaků ve výběrových nebo základních souborech. Pravděpodobně se již také objevil výraz „proměnná", kterým se nyní budeme stručně zabývat, dříve než přejdeme ke zkoumání vztahů mezi takovými „proměnnými". „Proměnnou" je to, co může nabývat různých tvarů nebo hodnot. Je to „proměnná", avšak nikoliv s ohledem na jednotlivé nositele znaku, protože pak by „proměnnou" byla např. barva vlasů určité ženy, která může být bezmála každý týden jiná. Nikoliv, „proměnná" se vztahuje na statistická zjišťování a označuje předmět pozorování, nebo přesněji: hodnoty, jichž zkoumaný znak nabývá. Je to náhodná proměnná, která se nemění přesně předvídatelným způsobem, nýbrž která nabývá určitých hodnot jen v závislosti na náhodě. Zkoumáme-li 100 osob z hlediska jejich tělesné výšky, příjmu, váhy, pohlaví a barvy vlasů, dostaneme údaje o pěti proměnlivých znacích — tři kvantitativní, které se týkají spojitých znaků (tělesná výška, příjmy a váha) a dva kvalitativní, týkající se diskrétních znaků (pohlaví a barvy vlasů). Zde se nebudeme podrobně zabývat problematikou často poněkud nepřesného roz- lišování mezi diskrétními a spojitými znaky, mezi kvantitativním a kvalitativním, mezi homográdním a hetero-grádním. V tomto případě jde jen o vyjasnění pojmu „proměnlivý znak". Doposud jsme se téměř výlučně zabývali jediným proměnlivým znakem: počítali jsme podíl dobrých ořechů v pytli (proměnlivý znak: jakost ořechů), diskutovalo se o příjmech obyvatelstva ve Zbohatlíkově (proměnlivý znak: příjem), analyzovali jsme pyramidu obyvatelstva (proměnlivý znak: stáří, případně přebytek porodů). Někdy jsme časově propojili i časově odlehlé měrné hodnoty navzájem a vytvořili časovou řadu. Veškeré děni však je — a tím neříkáme nic nového — nejrůznějšim způsobem spojeno, přičemž některé souvislosti se vyznačují elementární jednoduchostí (např. souvislost tělesné výšky a váhy), jiné jsou naopak složité, těžko prokazatelné, dokonce velmi sporné — např. otázka, zda datum narození má vliv na charakter a osud člověka. Nebo, abychom vybrali aktuálnější a vědečtější téma: existuje souvislost mezi proměnlivým znakem „znečišťování ovzduší" a proměnlivým znakem „úmrtnost na rakovinu", a jestliže ano. jak těsná je tato souvislost? Dokonce jsme již vyjádřili vztahy mez, proměnnými: přebytek porodů je vy-počitatelný ze dvou proměnlivých znaků" „porodnost" a „úmrtnost". Reálny příjem udává poměr mezi proměnny- 281 9. Post hoc ergo propter hoc mi „zvýšení příjmů" a „zvýšení cen . V této kapitole se však chceme vypořádat s těmi významnými a důležitými problémy, kdy se klade otázka po vztahu mezi dvěma nebo více proměnnými a u nichž jde o číselné vyjádření tohoto vztahu, aby se mohl vyznačit jeho význam a řádová velikost. Takové vztahy mají důležitou úlohu i v průzkumu trhu a veřejného míněni, protože v daném případě často jde o zjištění zájmu o určitý výrobek v závislosti na věku, přijmu nebo úrovni vzděláni dotazovaných. Tak např. počet knih, které někdo má, asi souvisí se všemi třemi uvedenými znaky, přičemž k tomu ovšem mohou přistupovat ještě další, těžko měřitelné rozhodující faktory, jako např. inteligence. V případě otázek týkajících se průzkumu trhu většinou postačí hrubé roztřídění podle příjmové, věkové a zaměstnanecké skupiny: starší lidé kupují spiše A, mladší spíše B; do přesného kvantitativního výpočtu souvislostí (např. na 10 DM měsíčního příjmu je v knihovně o 0,2 knihy více) se raději nepouštíme. Zjišťování např. příjmu se týká jen jednoho proměnlivého znaku. Zajímám-li se současně o věk příjemců, dostávám dvě proměnné. Vytvářím dvourozměrnou sérii pozorování (angl. bivariate). Jestliže se dále ptám na počet m2 bytu, na měsíční spotřebu elektrického proudu atd.. jde o v/cerozměrnd pozorováni (angl. multivariate). Uvést do vzájemného spojení vícerozměrné (multivariantní) řady pozorováni, včetně zpracovaných údajů, v jejich vzájemných souvislostech a při jednotlivých vliv.ech je úkolem tzv. v/cerozmérné analýzy. Za tímto působivým módním slovem je skryt obtížný početní problém, se kte- 282 rým. nebo alespoň s jeho podstatou, se seznámíme, až budeme mluvit o analýze rozptylu (oddíl 10.3) Nejdříve je však třeba pochopit podstatu korelačního počtu: dvě nebo více proměnných má být prozkoumáno z toho hlediska, zda mezi nimi není prokazatelná souvislost. Přitom jde nejdříve — a to je třeba neustále zdůrazňovat — jen a jen o matematické souvislosti, které nelze zaměnit za vztah příčiny a následku. Korelace může poskytnout důležité poznatky o příčinách nebo účincích, může však jít také o náhodnou korelaci, zdánlivou korelaci nebo prakticky zcela bezvýznamnou korelaci. Dokonce je to tak, že nelze očekávat úplnou matematickou nezávislost dvou proměnných znaků ani tehdy, jestliže je zcela jisté, že neexistují vůbec žádné souvislosti. Zdánlivé a náhodné korelace se mohou velmi lehce vyskytnout zejména u výběrových souborů poměrně nepatrného rozsahu. Korelační počet je matematický postup, který činí číselná zjištění o souvislostech dvou měrných hodnot. Druh těchto měrných hodnot je pro korelační počet zcela bezvýznamný. Pokud neexistuje nějaká souvislost, bude to jasně vidět z výsledku výpočtu. Více nebo méně zřetelná korelace ještě však neříká, že existuje vnitřní přímá souvislost mezi zjištěnými hodnotami — a už vůbec ne, že existuje příčinná souvislost. Korelaci je možno hledat mezi vším a v různé míře také mezi vším existuje. Tělesná výška a váha jsou nepochybně v těsné souvislosti, velikost bot a objem hlavy asi také, vnější teplota a spotřeba paliva také, avšak nekonečnou řadu mohou tvořit měrné veličiny, u nichž je pochybné, nikoliv však vyloučené, že mezi nimi existuje nějaká měřitelná souvislost. Je nějaká souvislost mezi 9.1 Vztohy, přižiny. účink manželstvím a rakovinou plic? Mezi vlastnictvím rodinného domku a zájezdy do Itálie? Mezi dobrými známkami z matematiky a tělesnou vahou? Mezi počtem přenocujících cizinců a cenou piva? Mezi vývozem magnezitu a dovozem pomerančů? Mezi počtem opic v městské zoologické zahradě a časem vyhrazeným reklamám na prací prostředky v televizi? Pokud by byla v těchto pozoruhodných pojmových, případně číselných dvojicích zjistitelná (pozitivní nebo negativní) korelace, zůstává vhodný výklad vyhrazen především ostrovtipu interpreta. Ke korelaci nepatří zásadně nic jiného než dva proměnné znaky, dvě veličiny proměnné ve svých hodnotách. Stále znovu se však vyskytují statisticky jasně prokazatelné souvislosti, které nepochybně nejsou zdánlivými korelacemi, zdají se zcela logické, a přesto mají své skryté záludnosti. Mezi ně patří korelace mezi vzděláním a příjmem: kdo déle studoval, má větší příjem. Tak před několika lety bylo zjištěno, že v NSR 45 % zaměstnanců s vysokoškolským vzděláním mělo měsíční čistý příjem 1200 DM; u zaměstnanců s odborným školním vzděláním činil tento podíl jen 6 % a u zaměstnanců se základním vzděláním pouze 2 %. V nízkých příjmových skupinách tomu bylo přesně naopak: jen 9 % vysokoškoláků mělo příjem nižší než 600 DM, naproti tomu spadalo do této skupiny 54 % osob s odborným vzděláním a 76 % se základním vzděláním. Tato sestava má několik drobných závad. Např. se můžeme ptát. kde zůstali abiturienti bez vysokoškolského vzdělání nebo zda do zjišťování byli nebo nebyli zahrnuti i samostatně činní (mluví se poněkud nejasně o „výdělečně činných osobách"). Tyto podrobnosti lze však pominout, protože zatím jde o zásadní věc -všeobecný jev. že vyšší vzdělání má zřejmě za následek vyšší příjem. Tak v USA bylo vypočítáno, že pracovní síla bez školního vzdělání („illiterate", což znamená analfabet) vydělá za 40 let pracovní činnosti 40 000 dolarů, pracovní síla se středním vzděláním již 150 000 dolarů a pracovník s ukončeným vysokoškolským vzděláním dokonce 750 000 dolarů. Zjistit tuto očividnou korelaci není nikterak obtížné. Již z výběrového souboru několika set osob zcela zřetelně vyplyne, že oba proměnné znaky nejsou na sobě nezávislé, nýbrž jejich vzájemná souvislost je zjistitelná již „pouhým okem". Sestaví se matice s řádky a sloupci, v řádcích se uvede několik příjmových skupin, ve sloupcích tři nebo čtyři stupně vzdělání a již se hromadně objevují dvojice „vyšší vzdělání— vyšší příjem", „střední vzdělání— střední příjem" a „nižší vzdělání — nízký příjem". V daném případě jde dokonce o velmi zjednodušený případ korelace, protože jedna proměnná může sice mít libovolné množství hodnot (příjem může kolísat od nuly až do miliónů, proto musí být uměle vymezen třídami a středy tříd), pro druhou proměnnou jsou však prakticky možné jen tři až čtyři hodnoty: základní škola, maturita, odborná škola, vysoká škola. Statistická souvislost - první krok -,e početně jasně prokázána (aniž bychom prováděli vlastní korelační vypočet) a jeví se - druhý krok - také zcela logická a pochopitelná. Jistě někdy v/dělává pomocný stavební, dělník v c než mladý absolvent vysoké .koj. ° zaměstnanci (nebo „vydeiecne 283 9. Post hoc ergo propter hoc osoby*') nesporně vyšší výdělkové možnosti než lidé s nižším vzděláním nebo dokonce bez vzdělání. Tedy — třetí krok: kdo navštěvoval vysokou školu, vydělává proto podstatně vice než ten, kdo vysokoškolské vzdělání nemá. I když tento úsudek vypadá jako nesporný, musíme zvolat: „Pozor!" Co jsme zjistili, je ..post hoc" — po dosažení odpovídajícího školního vzdělání jsou příjmy vyšší. Je to nezbytně také „propter hoc" (v důsledku toho)? Znamená to též, že proto a jen proto jsou příjmy vyšší? Například co když často studují mladí, dynamičtí lidé, kteří mají úspěch nikoliv v důsledku studia, ale v důsledku svých všeobecných schopností? Nebo jak to je, když v životě něčeho dosáhnou lidé, o které bylo již od kolébky vždy předem dobře postaráno: zámožný otec financuje studium a také později se pečlivě stará, aby synáček dostal teplé místo! To jsou úvahy, které je nutno brát se vší vážností a jejich oprávněnost by bylo možno objasnit až v další sérii zkoumání. Tímto tak jednoduše vypadajícím příkladem jsme chtěli ukázat, jaké léčky číhají dokonce i v domněle nejjasněj-ších případech korelací. Dost často se stává, že další společný, v pořadí už třetí faktor je příčinou dvou jevů nebo úkazů, které nemají přímo nic společného. Když v Maďarsku mrzne, kupují Švýcaři palivo — kde je závislost, kterou by bylo možno korelaci lehce prokázat? Nuže právě v tom, že klimatické podmínky jsou přibližně stejné: ve středních šířkách severní polokoule je od prosince do března zpravidla zvlášť chladno, v Maďarsku jako ve Švýcarsku. Často se uvádí jako nesmyslná korelace, která úplně nesmyslnou není: po 284 dlouhou řadu let lze prokázat, že |e zřejmá souvislost mezi platy pastorů a cenami alkoholu. Je možno z toho soudit, že větší příjmy pastorů se obratem přemění v pálenku? Nikoliv, tou třetí společnou věcí je obyčejná světská inflace — ponenáhlu je všechno dražší, stoupají všechny příjmy a všechny ceny.' Někdy jsou to právě takové pošetile vypadající korelace, které umožňují mnohdy získat pozoruhodné poznatky, jako např. tato: Jednou hrál mladý hudební nadšenec na Floridě svým pokojovým květinám ve třech různých místnostech různé hudební skladby, až nakonec objevil, že rostlinám v pokoji, kde hrál beatovou hudbu, se dařilo nejlépe. To snad mohlo být náhodným výsledkem ledabyle uspořádaného pokusu, nebo snad byla ona místnost slunnější či vlhčí. Přece však se zdá, jak konečně vyplývá i z jiných pokusů, že krávy, kterým se pouští hudba, dávají více mléka. Tak se při korelacích neustále pohybujeme mezi Scyllou a Charybdou — mezi nebezpečím, že je nedoceníme nebo přeceníme. Z těchto důvodů jsou korelace oblíbeným rejdištěm demagogů: jasné závislosti se mohou číselně dokázat a k tomu se připojí vlastní výklad: „statistika dokazuje, že...". Statistika však pouze zjistila korelaci, .ale neřekla nic o příčině a následku. V předcházejícím oddílu (viz str. 208) jsme mluvili o matoucím titulku „Šílenství chrání před rakovinou" a ukazovali, že statistika to vůbec nedokazuje. Nyní však musíme říci: jestliže je prokazatelná negativní korelace mezi duševní chorobou a úmrtím na rakovinu (i kdyby byla zcela nepatrná), bylo by nutno dalšími sériemi pokusů zjišťovat vzájemné vztahy mezi různými proměnlivými znaky. Bio- 9.1 Vztahy, příčiny, účinky chemické procesy v organismu, rozdíly ve stravování, uklidňující prostředky běžně používané v léčebných ústavech pro nervově choré, snížená (nebo zvýšená) vzrušitelnost — to by bylo několik proměnlivých znaků, které by měly být ověřeny. Není vůbec vyloučeno, že právě rakovina bude jednou překonána oklikou přes nesčetné korelační výpočty. Korelační počet prokazuje svůj význam převážně v oblasti vědeckých experimentů. Jestliže se totiž při pokusu daří udržet v přibližné rovnováze většinu všech účinných faktorů a vždy jen jeden nebo několik málo postupně měnit, je někdy možno získat z korelací tak jasné poznatky, že přece jen lze mluvit o důkazu účinku. Když např. výnos sklizně daného roku a stejného osiva na půdách stejného druhu vykazuje vzestup odpovídající použitému množství hnojiva, může být za statisticky zjištěné pokládáno tvrzení, že větší použití hnojiva přineslo větší výnosy. Právě na tomto příkladu je však možno hned také ukázat, že se korelace často nedají extrapolovat donekonečna a že nemusí vždy probíhat „lineárně". Budu-li neustále zvyšovat dávky hnojiva, nebude se docilovaný výnos ve stále větší míře vyplácet (problematika mezní hodnoty v ekonomické teorii) a jednou dokonce dosáhnu bodu, v němž se výnos začne snižovat, protože dobrého bylo příliš mnoho. Od tohoto bodu se korelace stane dokonce negativní: čím více hnojiva, tím menší výnosy. K provedení takového pokusu se pokusné pole se stejně kvalitní půdou rozdělí na jednotlivé ověřovací úseky a pak se na jednotlivé úseky použije různé množství hnojiva. O tomto uspořádání „latinských čtverců", které se často vyskytuje při pláno- nepřípustná extrapolace regresní přímky za obor • • • • ■ •** obor měrných hod not = oblast (přibližná) platnosti korelace Za oborem měrných hodnot není již statisticky zjištěná korelace. Regresní přímka nesmí být zpravidla extrapolována — pravidlo, které se často nezachovává a vede pak lehce k omylům. váných pokusech, ještě uslyšíme, až se budeme zabývat analýzou rozptylu (viz str. 334), která této metody také často s oblibou používá. To samozřejmě není pouhá náhoda. V obou případech mají být objasněny závislosti mezi dvěma nebo více proměnnými znaky, variacemi v uspořádání pokusu. Analýza rozptylu přitom převyšuje korelační počet tím, že se snaží rozlišovat mezi náhodnými výběrovými chybami a významnými odchylkami, zatímco korelační počet přejímá zkoumání dvojice měřených hodnot jako dané a zatím se nezajímá o to. do jaké míry mají být tyto údaje pokládány jen za náhodný výsledek určitého rozdělení. Tím jsme se již dostali k ústřední otázce tohoto oddílu: co to jsou korelace, jaký maji význam a jak se počítají. 285 9.2 Korelace Co je matematická funkce, si mnozí ze školy pamatují už jen tak přibližně — tedy jedna hodnota zde závisí na jiné je jí vyjádřena. Nejjednodušší způsob je např.: y = 2 x, o něco obtížnější je y = 2 x + 2. sotva obtížnější je y = = x2 —1. Přesto se rychle podívejme, které hodnoty závislá proměnná y přijímá, jestliže přidělíme nezávisle proměnné označené x různé hodnoty: y = 2x y = 2x+2 y = x2-1 x = 0 y = 0 x=1 y=2 x=2 y= 4 x=3 y=6 y=2 y = 4 y = 6 y = 8 y = -1 y = 0 y = 3 y = 8 Zaneseme-li tyto hodnoty do souřadnicové sítě, dostaneme dvě souběžné přímky a jednu křivku (viz vedlejší obr. nahoře). Křivkou se zatím nebudeme zabývat, protože nám jde jen o lineární regresi. Podívejme se proto ještě jednou na obě funkční rovnice: y = 2 x, y = 2x + 2. Je nápadné, že probíhají úplně souběžně; závisí to snad právě na těch „2 x"? Zkusíme to s y = 2 x — 1 Nahoře: Rovnice y = 2x — 1. y = 2x a y = 2x + 2 maji stejné směrnice přimky: rozdílná konstanta na pravé straně rovnice udává pouze „úsek osy . Světle modrá křivka vyjadřuje kvadratickou rovnici. Dole: ' . Větší strmost stoupáni přibližuje y = 2.5x velmi rychle přímce y = 2x + 1, která začíná výš U x = i by se přímky protínaly. Záporné znaménko y = -2x + 6 znamená „negativní směrnici*', „záporné stoupáni". _a Zase dostáváme rovnoběžku, tentokrát body se souřadnicemi (0, —1), (1,1), (2.3) a (3,5). Vzestup přímky závisí tedy jen na čísle před x, konstanta vzadu odpovídá pouze na otázku, kde přímka přetíná osu y. Tak má y = = 2,5 x — 1 strmější směrnici než y = = 2 x + 1. ačkoliv tato přímka začíná „výše" (viz obr. na str. 286 dole). Směr ostatně nemusí vždy být vzestupem, může být také poklesem a negativní korelaci. Je to např. případ funkce y=—2 x+6. Zde dostáváme jako první body v souřadnicovém systému (0,6), 92 Korelace (1.4). (2,2). (3.0). Obecně zní Imeární regresní rovnice takto: y = ax + b. přičemž a znamená směrnici, b úsek osy. V matematice jsou tyto strnulé závislosti podobného typu dosti časté, v běžné statistice, která je odrazem všedních dnů, se prakticky nevyskytují. Někdy se jim ovšem značně přibližuji. Podívejme se např. na stěhování z německých spolkových zemí (mimo Bavorsko) do Mnichova, resp. z Mnichova. V mnichovské statistice za rok 1969 jsou tyto hodnoty (stěhování obyvatelstva v tisících): Téměř dokonalou korelaci ukazuji údaje „vystěhování z a přistěhováni do", v Mnichova. Ze všech spolkových zemi NSR se sice vice lidi do Mnichova přistěhovává nei oOnKt—. ale číselný poměr obojích je téměř stejný. 287 9. Post hoc ergo propter hoc 13 evropských státu, vnitrostátní údaje počet dopisu na 1 obyvatele 250- 200- 150 100- 50- 2*2 Švýcarsko '84 220 Belgie321 210 Nizozemí 130 • m 1Ý2 Francie 297 198 Velká BritanielSS šved$ko J72 146 Rakousko 332 ÜB NSR237 106 ItdlieSSZ • 96 Španělsko**? 55 Jugcjilávie410 39 NDR*79 24 Řecko 663 100 200 300 400 500 600 700 počet telegramů na 1000 obyvatel Velmi zřetelnou zápornou korelaci vykazují odeslané dopisy a telegramy (vždy vnitrostátní údaje) ve 13 evropských státech: kde se píše mnoho dopisů, telegrafuje se poměrné málo. a naopak. Země Odstého- Přistěhování do vání z Mni-Mnichova chova Bádensko-Wurttembersko 7,8 4,1 Severní Porýní-Vestfálsko 6.7 3,4 Hessensko 3.3 1,9 Dolní Sasko 2.5 1.2 Berlin 2.3 1,1 Porýni-Falcko 1.5 0.9 Hamburk 1.2 0.8 Šlesvicko-Holítýnsko 1,0 0.6 Sársko 0,4 0.2 Brémy 0,4 0,2 Jestliže zaneseme tyto hodnoty do našeho souřadnicového systému, dostaneme řadu bodu, které nás téměř nutí k tomu, abychom jimi protáhli zcela přímou linii. I ve statistice se tedy vyskytují skoro dokonalé korelace. (Viz obr. na str. 287.) Ostatně i záporné. V souřadnicovém systému jsme sestavili údaje ze 13 evropských zemí o počtu odeslaných telegramu a dopisu. Na ose x je uveden počet odeslaných vnitrostátních telegramů na 1000 obyvatel, na ose y počet dopisů na 1 obyvatele. Čísla jsou z roku 1965. V tomto případě není sice vidět přímku, avšak zápornou korelaci lze zřetelně rozeznat. Čím více se píše dopisů, tím méně se posílá telegramů. Je možno uvést i psychologické důvody: kde se málo píše. hlásí se lidé. jen když 9.2 Korelace je to životně důležité — a potom se posílá telegram. Nebo lze usuzovat i takto: kde není možno spolehnout se na doručení dopisu a na spolehlivou práci pošty, píše se málo a skutečně důležité věci se telegrafují, aby zpráva došla včas. (Viz obr. na str. 288.) Jestliže je k dispozici velký počet dvojic měřených hodnot, doporučuje se seskupit výsledky do skupin (intervalů) obdobným způsobem, jaký byl použit v oddíle 2.6. K objasnění tohoto postupu uvádíme příklad z biometrie. Opět jde o korelaci mezi tělesnou výškou a váhou a čísla uvádíme z díla E. Webera „Grundriss der Biologischen Statistik" (Rukověť biologické statistiky). Zde se uvádí, že při měření a vážení 648 mladých mužů byly zjištěny tyto výsledky, které byly podle četnosti uspořádány do skupin: značily např. normální rozdělení tělesných výšek v příslušné váhové skupině. Již z Číselné tabulky lze poznat zleva dole doprava nahoru stoupající charakteristickou přímku kladné korelace, zvláště tehdy, když se zvýrazní zvlášť často zastoupené dvojice měřených hodnot. Ještě výraznější však tato korelace bude, jestliže proti jednotlivým velikostním skupinám postavíme průměrnou váhu. Potom např. muži vysocí 157,5 cm váží v průměru: /"•kup. 157.5 — 3 . 64 + 10 . 59 + 9 . 54 1263 22 3 + 10 + 9 = 57,6 kg. Zaneseme-li tyto hodnoty do našeho 89 ' k 1 84 3 1 2 79 1 8 5 3 74 2 4 10 21 18 12 69 3 17 42 55 37 11 64 3 12 51 72 44 9 3 59 10 31 51 40 7 1 54 9 23 13 4 •* 157/, 161/, 165/, 169/, 173/, 177/, 181/, Výška v cm 4 2 2 1 3 185/, Přehled o absolutní četnosti měřených hodnot z našeho příkladu o korelaci mezi tělesnou vahou a tělesnou výškou (čísla vždy udávají střed intervalu; šířka intervalu činí 4 kg. resp. 5 cm). Hodnoty znaků vypadají tak podivně jen proto, že jde o příslušné středy intervalů: 169,5 .cm znamená „mezi 167,5 a 171,5 cm". Rovněž tělesná váha 69 kg udává střed intervalu „širokého" 5 kg. která sahá od 66.5 do 71,5 kg. Četnosti u silně zastoupených intervalů jsou ostatně již dost velké, aby jasně vy- souřadnicového systému, bude tato přímka ještě zřetelnější „regresní přímkou". Omezením původních 648 dvojic měřených hodnot na několik kombinací skupin s průměrnými hodnotami se podstatně zvýší přehlednost. Početní úloha se ovšem nezjednodušila: chce-me-li totiž zjistit přesnou číselnou kore- 2% 289 9. Post hoc ergo propter hoc Tělesné výška v jednotlivých váhových intervalech (v tomto případě středu intervalu 69 kg) ukazuje již velmi zřetelně při-blížení k normálnímu rozdělení. 161.5 165,5 169,5 173,5 177,5 181,5 185,5 cm řádové rozdělení „váhové třídy 69 kg" 1J7.5 161,5 165,5 169,5 173,5 177,5 181,5 185,5 cm Jestliže se vyjádři četnosti shody jednotlivých váhových a výškových intervalů graficky (na obrázku pomocí čtvercových ploch), je vidět velmi pozitivní korelaci zvlášť zřetelně. 290 9.2 Korelace laci, nemohly by se již nynější dvojice měřených hodnot pokládat za stejně hodnotné jako jednotlivá měření (jako v případě 648 původních měření). Mnohé z těchto bodů zastupují totiž nyní několik desítek (v jednom případě dokonce 72) měření. Před dalším početním „zpracováním" musely by proto být tyto dvojice průměrných hodnot vhodně „váženy": ojedinělí, zvlášť lehcí nebo těžcí, zvlášť velcí nebo malí muži by padali mnohem méně „na váhu" než ty četné stovky „ve středu pole". Do tohoto počítání se pouštět nebudeme nikoliv proto, že by bylo zvlášť obtížné, ale spíše proto, že vyžaduje mnoho času. Především však proto, že jsme se ještě neseznámili ani se základním principem této početní metody. Jestliže si blíže všimneme grafu, můžeme dostat přijatelnou přibližnou hodnotu dokonce bez výpočtů. Jak tomu bude například, když y = 0,7 x— 50? Činí tedy váha přibližně 7/10 tělesné výšky minus 50? Tato rovnice se velmi dobře (ještě lépe ve tvaru y = 0,7 x_ — 54) přizpůsobí bodům v souřadnicovém systému, ale je nutno vyvarovat se řešení rovnice podle x a usuzovat: když y = 0,7 x — 54, pak 0,7 x = y + + 54 a x = 1,43 y + 77. V tomto případě nejde o matematickou funkci, naše rovnice vyjadřuje pouze přibližnou závislost, a to především jen závislost tělesné váhy (y) na tělesné Zběžně odhadnutá přímka y = = 0.7x — 50 zobrazuje poměr váhy k tělesné výšce již docela dobře. Přesněji vypočítaná je regresní přímka y = 0,7x — 54. Z nl lze vyčíst odpověď na otázku: jak asi těžký bude muž vysoký x cm? Není to však ncjlepšl rovnice pro zjištěni výšky při dané váze. on. 1*" ou 75 1 < fa - 1 70- - * bO" RO- ■ DU 1 i i— 55-d 15 r,5 16 ,5 165 ,5 169,5 17 i,5 177,5 181,5 185,5cm Tato tabulka dává odpovéd na otázku „jak asi těžký bude muž určité výškové třídy". Tělesná výška (x) je dána, hledá se váha (y). — Je-li naopak známa váha, výška však nikoliv, musí se vypočítat tabulka uvedená na str. 292. tělesná váha (zatím neznámá) J j 1 I i I 57,6 I -59,1- -62,1- 64,5 1 _ 68.5 1 70.4 72,9-75,9 — _j——i—— i—i— 1—— 157,5 161,5 165,5 169,5 173,5 177,5 181.5 185,5 výška (střed intervalu) (známá) 291 9. Post hoc ergo propter hoc výšce (x). Rovnice y = 0.7 x — 54 nám poskytuje pouze odhad hodnoty, kterou potřebujeme pro odpověď na otázku: „Kolik asi bude vážit muž. který je x cm vysoký?" K tomuto odhadu je třeba přistupovat opatrně; v příští kapitole se dovíme víc o tom, jak se tato regresní křivka vypočítává a jaké může mít chyby. Bez ohledu na to nelze x a y beztrestně zaměnit (mimo případ funkční závislosti) a pak očekávat od vzorce y = = 0,7 x — 54 odpověď na otázku: „Jak vysoký bude muž. který váží y kg?" Výpočet se provede snadno, ale je nesprávný. To uvidíme zcela jasně, jestliže ke každému středu skupiny tělesné váhy zjistíme průměrnou výšku: 90 55- 4 t —. 's» — 157,5 161.5 165,5 169,5 173,5 177,5 181,5 185,5 Regresni přímky se navzájem protínají právě v bodě (i. y). 54 59 64 69 74 79 84 89 162.7 165.7 169.2 173.1 174,7 176.9 179.0 181.5 Průměrná výška (zatím neznámá) Vyhledáme-li tyto body v našem souřadnicovém systému, zjistíme, že až na několik málo výjimek jsou hodně vzdáleny od naší staré přímky y = = 0,7 x — 54. Spíše se formují do jiné přímky, která se protíná s první v důležitém bodě: při 170 cm a 65.2 kg, přičemž dodatečný propočet by ukázal, že tyto hodnoty jsou celkovými průměry všech.tělesných výšek, případně tělesných vah. Krátce a statisticky formulováno: x = 170 cm. y = 65.2 kg. Regresní přímky se navzájem protínají vždy v bodě (*. ý)- Než budeme pokračovat, ještě malá 292 hra myšlenek. Co se stane s oběma regresními přímkami, není-li mezi oběma řadami znaků vůbec žádná souvislost, takže jsou v systému souřadnic rozděleny jako kulatý mrak bodů? Tedy je-li y zcela nezávislé na x, mění se y naprosto „svébytně", orientace na situaci podél osy x mizí úplně, regresní přímka se stane paralelou s hodnotou y = ý. Na otázku: „Jaké y asi dostaneme, máme-li tu nebo onu hodnotu x?". je stále stejná odpověď: „Zkuste tos průměrnou hodnotou y, s y." — Stejně tak se regresní přímka pro x stane paralelou osy y s konstantní hodnotou x = x. Obě přímky se protínají v bodě (x, y) jako všechny regresní přímky. 9.2 Korelace y pro kaidé dané x je ý nejlepší odhad druhé X = 9 hodnoty y 1 pro kaidé dané y jex nejlepší odhad druhé hodnoty _ y x 10 B- - < S y 6-4 ■i Jestliže se korelace rovná nule (což se stává zřídka, dokonce i při úplné nezávislosti x a y). probíhají regresní přímky, které toto označení již sotva zasluhují, navzájem kolmo, avšak i v tomto případě se protínají v bodě (i, ý). I' _ ——— 2 1 6 3 1 0 1 2 1 4 16 X svírají však spolu pravý úhel; jedná se o nulovou korelaci. Druhý extrém již známe. Je-li y funkcí x a každé hodnotě x odpovídá přesně vypočitatelná hodnota y. regresní přímky splývají a tvoří grafický výraz funkce — např. y = 2 x. Ve statistické praxi se oba extrémy téměř nevyskytují, regresní přímky se tedy ani navzájem neslučují, ani nestojí kolmo na sobě, nýbrž svírají spolu více nebo méně ostrý úhel. Tento úhel bude tím menší, čím těsnější je korelace mezi x a y. Velikost úhlu vyjadřuje tedy míru „závislosti" — závislosti v uvozovkách, protože se nechceme vázat určením, která proměnná je opravdu závislá na druhé. ar v Míru korelace lze vyčíst z úhlu. který tvoři obě regresni přímky: cim ostřejši úhel. tím vyiši korelace. 293 9. Post hoc ergo propter hoc 9.21 Korelační koeficient Závislost lze vyčíst nejen z velikosti úhlu. který svírají obě regresní přímky v systému souřadnic, ale je také možno výpočtem zjistit (což je obvyklý způsob) tzv. „korelační koeficient". Jak lze takový korelační koeficient vytvořit? Má vyjadřovat, jak je navzájem závislé chování obou proměnných x a y; toto chování je však charakterizováno rozptylem a střední hodnotou — v případě normálního rozdělení tedy pomocí x a sx, případně y a sf. (Nejde-li o normální rozdělení, je možno použít mimo jiné testů pořadí nezávislých na rozdělení.) Většinou však jde o normální rozdělení a věda považuje společné rozdělení obou proměnných za „dvourozměrné normálni rozděleni". Mimo tyto charakteristické hodnoty jednotlivých proměnných musí být také nějak vyjádřeno jejich spojení. To se stane pomocí tzv. kovariance x a y. Při výpočtu rozptylů jsme vždy počítali rozdíly jednotlivých měrných hodnot od aritmetického průměru, tedy (x,— — x); potom jsme tyto diference umocnili na (X; — x)2, druhé mocniny sečetli na Z (x, — x)2 a tento součet zase rozdělili počtem n měření nebo správněji (n — 1), abychom dostali rozptyl sx*. U dvojic měřených hodnot (x,, y,), které jsou charakteristické pro regresní a korelační počty, probíhá stejný postup i pro y. Indexem / u x. a yi vyjadřujeme, že jde o nějakou libovolnou hodnotu, kterou x nebo y přijímá. To je přesný vědecký způsob psaní (rovněž x. a y;), často jsme však místo toho psali jen x a y a budeme to příležitostně dělat i nadále. Ale ať už se píše např. (x — x)2 nebo (x( — x)2, je v obou případech míněno totéž. Abychom dostali kovarianci znaků x a y. vezmeme u každé jednotlivé dvojice měřených hodnot (x., y.) rozdíly protj příslušnému aritmetickému průměru a navzájem je vynásobíme; tak dostaneme pro každou dvojici měřených hodnot výraz (x, — x) (y. — y). Součet těchto výsledků se nakonec dělí, jak jsme se shodli při výkladu Studentova t, počtem měření zmenšeným o jednu (n — 1) a pak dostaneme kovarianci znaků x a y, psanou většinou jako s Nyní dosadíme naše hodnoty do vzorce pro korelační koeficient: Jde-li o základní soubory, mění se s na o a r na o (ró). Zpravidla však půjde o výběry, korelační koeficient r je proto — jako vše, co pochází z výběrů — postižen nejistotou, je jen přibližně správný: r je pouze „funkce odhadu" pro n a tím méně spolehlivý, čím menší je rozsah výběrového souboru. Nízký korelační koeficient z velkého vzorku ukazuje mnohem více na statisticky zjištěnou souvislost než vysoký korelační koeficient z malého vzorku. Podívejme se nyní na podkladě příkladu André Vessereaua blíže na pracovní postup při provádění korelační analýzy. Jde přitom o náhodný vzorek deseti znaků. Otázka zní: existuje korelace mezi věkem ženicha a věkem nevěsty? Tabulka s již vypočítanými hodnotami pro náš vzorec je uvedena na protější straně. Rozhodující hodnoty jsou tedy: n = 10; Ľ (x — x) (y — ý) = 179; s„ = l/357s,=|/ÍW: s., = 19.9. 294 9.21 Korelačni koeficient Věk Věk -—r ženicha nevěsty x — ■i (x —i)> i — i (y-rr \* — *) krát i Y (r- -ŕ) 22 19 — 7 49 — 6 36 + 42 25 22 — 4 16 — 3 9 + 12 26 21 — 3 9 — 4 16 + 12 26 23 — 3 9 — 2 4 + 6 27 23 — 2 k — 2 4 + 4 - 28 24 — 1 1 _ 1 1 - + 1 30 29 + 1 1 + 4 16 + 4 30 27 + 1 1 + 2 4 + 2 35 33 x 6 36 + 8 64 + 48 41 29 x 12 144 + 4 16 + 48 Celkem 290 250 270 _ 170 + 179 Průměr i = 29 ý = 25 — — Zobrazení výpočetního postupu přikladu uvedeného v textu o korelaci mezi věkem ženicha a nevěsty. Dosadíme a dostaneme: 19.9 J/30 y 18,9 = 0.835. Vessereau ostatně počítá zjednodušeně přímo s tabulkovými součty a dostává stejný výsledek tímto způsobem: 179 j/270 j/170 = 0.835. Korelace je vždy — alespoň v tomto výběrovém souboru — velmi vysoká. Než však začneme uvažovat, co tento korelační koeficient znamená pro základní soubor sňatků (nebo sňatků uzavřených v Paříži během jednoho roku), podívejme se ještě pozorněji na postup, který je základem tohoto výpočtu. Zjišťují se: především rozptyl obou proměnných — jaký je rozptyl x kolem x. jaký je rozptyl y kolem y? Při každém měření se však současně zjišťuje, jak se navzájem chovají obě odchylky dvojice měřených hodnot (proti vlastnímu průměru). Protože při tomto násobeni platí znaménka, je zcela dobře možné, že součet těchto výsledků (x — x) (y — ý) bude velmi nízký, a protože je uveden v čitateli vzorec pro r, povede k tomu, že též korelační koeficient bude nízký. (Viz obr. na str. 296.) Vzhledem k základnímu významu korelačního počtu na dalších dvou příkladech ukážeme, jak se tato výpočetni metoda projevuje. Již jsme předvedli vysokou korelaci a nyní představme nepatrný vzorek jiného složeni. K tomu je třeba důrazně připomenout, že vzorek s n = 5, který pro jednoduchost volíme, je při použiti této výpočetni metody zásadně nepřípustný, protože vypovídací hodnota takto zjištěného korelačního koeficientu se prakticky rovná nule. Přesto se však podívejme na takový vzorek s dále uvedenými hodnotami: 295 9. Post hoc ergo propter hoc x = 4,5 Kovanonce měří obé odchylky bodu (xj, y,) proti oběma středním hodnotám (í, ý). Zatímco umocněné odchylky (x,-x)« a (x,—y)« jsou skutečně vždy kvodratické (čtvercové), jeví se kovanonce jako obdélník. Jen když (x,— i)= (y,—y). je také kovariance kvadratická (čtvercová). přitom opět volíme zjednodušený vý- To je nepatrný, bezvýznamný záporný početní postup: korelační koeficient, který však celkem A (5:5)- ■ — W/ ■ ' (4;: " - ) (U ;2)| v~ (J;z,a) 1 2 3 4 5 X x = 1,05y+ 0,1 není-li rovnost, je plocha čtverce menší y — 0,83x + 0,3 není-li rovnost, je plocha čtverce menší 9.3 Regresní poč i —- - (5,5) 1(4; 3) (1,5;2)IH^ 1 2 : 14 5 x Regresní přímka odpovídá požadavku, že součet všech kvadratických odchylek jednotlivých bodů je tak malý. jak je to jen možné. y < -->: 5- (5;5 ; ■ 4- 3- ■ (4 3) 2 (1*2) (3; 1 (V ) / 1 2 í 5 X diferenciální počet. Ovšem i ty jsou tak zdlouhavé, že se omezíme na zcela elementární početní úkol. Do systému souřadnic jsme zanesli pět dvojic výsledků měření s těmito hodnotami: (x = 1, y = 1), (1.5. 2), (3, 2.5). (4. 3) a (5. 5). Na první pohled se zdá, že jednoduchá rovnice y = x by mohla docela dobře poskytnout vyhovující regresní přímku. Je to však nejlepší možná? Zatím nejdříve zjistíme střední hodnoty x a y. x = (1 +1,5 + 3 + 4 + 5) /5 = 2,9; ý = (1 + 2 + 2,5 + 3 + 5) /5 = 2,7. Nyní zase sestavíme známou tabulku: Několik malých chyb jako důsledek zaokrouhlení neovlivni podstatně výsledek — zanedbali jsme setinové body do 0,05. Chceme-li nyní určit regresní přímku pro y, dosadíme nejdříve hodnoty do tohoto vzorce, který vyjadřuje směrnici přímky, tedy a v onom ax + b, které jsme poznali jako obecnou lineární rovnici: a = J(x-x)(x-y) __9j__nft, r(x — x)* 11.2 Rovnice y = 0.83 x udává tedy již správný směr přímky, my však ještě 300 9. Post hoc ergo propter hoc přezkoumáme, zda nemusí být připočtena nebo odečtena nějaká konstanta b. Také pro tento účel existuje vzorec, a to dokonce velmi jednoduchý: b = y — ax. Všechny tyto hodnoty již známe, takže jen dosazujeme: b = 2.7 —(0.83)(2.9) = 2.7 —2 A = 0.3. Jako konečnou regresní přímku pro y jsme nyní dostali: y = 0,83 x + 0,3. Po začlenění do systému souřadnic vykazuje tato přímka ještě lepší přizpůsobení než dřívější „střelená od boku" y = x (obr. str. 300 dole). Jestliže se skutečné hodnoty spojí odpovídajícími svislými liniemi s regresní přímkou, dostaneme ony nejmenší vzdálenosti, které — umocněny — odpovídají hledaným „nejmenším čtvercům". Každá jiná přímka by byla horší z hlediska rozptylu y. Vzpomínáme si však, že x je možno posuzovat také jako závislý proměnlivý znak ypsilonu a že pak, pokud tu není funkční závislost, musí regresní přímka x mít jinou hodnotu. Pro určení této regresní přímky postupujeme úplně stejně jako předtím a zaměníme pouze ve vzorcích vždy x a y, případně x a ý. Pokud jde o míru směrnice, čitatel se nemění, ve jmenovateli se však nyní objeví E (y — ý)*, takže na závěr dostá-9.3 varne: a =-— = 1,05. 0,0 A pro „úsek osy": b = 2,9 —(1,05)(2,7) = 0,1. To dává: x = 1,05 y + 0,1. Zaneseme-li nyní tuto druhou regresní přímku do systému souřadnic, ukáže se, že svírá s první velmi ostrý úhel, což svědčí o velmi těsné korelaci mezi x a y (obr. str. 301). Již nyní můžeme říci. že korelační koeficient bude nejméně asi 0,9. Přesnější propočet lze provést snadno. Kovariance je již v čitateli našeho zlomku pro směrnici regresní přímky, i když zatím ještě ve formě součtů výsledků. Dělíme tedy ono 9,3 hodnotou (n —1=4) a dostáváme kovarianci 2,32. Obě potřebné hodnoty pro sx a %f můžeme snadno upravit z tabulkových hodnot: B Z(x — xf 11,2 n — 1 n —1 8,8 4 To dává s„ = 1,67; s, = 1.48 a tím 2,32 (1.67)(1,48) = 0,935. Pro výpočet korelačních koeficientů je ostatně bezvýznamné, zda se součet mocnin dělí n nebo (n — 1) anebo vůbec nedělí; je však nutno být důsledný a počítat jmenovatele i čitatele stejným způsobem. Dělením n dostáváme pak s,, = 1,86; sx = 1,5; s = 1,33 a znovu: 1,86 (1.5)(1.33) = 0,935. Nebo počítáme: 9.3 9.3 j 11.2 j 8,8 (3.35)(2.97) = 0,935. Zcela se potvrzuje naše domněnka, že korelace v tomto případě je velmi vysoká. Chápeme-li však tuto korelační analýzu jako průzkum vzorku, je nutno naléhavě varovat před spolehlivostí tohoto r. Čím méně dvojic měřených hodnot je k dispozici, tím lehčí je určit 9.3 Regresní počet regresní přímku, ale tím nejistější je také její hodnota. Jako varovný příklad nechť poslouží extrémní případ: výběrový soubor o rozsahu n dává po zanesení do systému souřadnic ve formě dvou bodů nádhernou regresní přímku, která přesně probíhá oběma těmito body; korelační koefi- cient r = 1 lze vyčíst na první pohled. Mimochodem není vůbec řečeno, že se výsledek regresní rovnice musí graficky znázorňovat vždy jen přímkou. Mezi proměnnými x a y může být zcela dobře nejtěsnější závislost, aniž by však regresní přímka musela plně odpovídat této skutečnosti. Uvažme jen třeba (5:3) (1 1. _A -i / / / J t 1(2 ■V *j I 12 4 3 y = X (1:1) (2,2) <4;€) (5:3) 8 (x-i? 4 1 1 _4 10 (y-yy (x-í)(y-ý) 4 4 1 1 9 3 .£ -° 14 8 b = y-ai = 3-2.4 = 0.6 y .0,8»+0.6 b.i-ay=3-1.71-1J9 x = 0.57y + 1.29 popř.a=A=0.57 Dvěma dvojicemi měřených hodnot může vidy probíhat přímka, která předstírá jokoodeu korelaci - tak. jak je tomu nahoře u dvojic měřených hodnot (1: 1) a (5: 3). př.padné [t.V a (4:6). Jestliže viak dáme tyto čtyři dvojice měřených hodnot do jednoho «y dokonalá korelace zmizí; zůstanou jen dvě regresní přímky, z nichž žádná se nedotyká an. .edmeno měřeného bodu. 302 303 9 Post hoc ergo propter hoc funkci y = xs —1. o které jsme se zmínili na začátku oddílu 9.2. Nelineární regrese ovšem znamená, že aspoň jedna z obou proměnných nemá normální rozdělení. S trochou fantazie a velkou matematickou erudicí je možno k téměř každé kombinaci měřených hodnot obstojně vypočítat odpovídající regresní křivku — od sinusové křivky jako y = sin x až po funkci třetího stupně, jako např. y = x3 — 6 x2 + 11 x — 5. Opovážlivý matematik může přitom až příliš lehce upadnout do pokušení hledat tvrdo- Jedna z proslulých zdánlivých korelaci: když se zkracuje délka sukni, kursy akcii stoupají. Nehledě k tomu, že to vždy nesouhlasí, šlo by určitě o zdánlivou nebo nesmyslnou korelaci. hlavě regresní křivku tak dlouho, až nakonec nějakou najde. Ta může sice stavu výběrového souboru vcelku odpovídat, pro posouzení závislostí v základním souboru ji však bude možno použít jen s nejvyšší opatrností. Konečně budiž ještě zdůrazněno, že jsme se zabývali jen případem s dvěma proměnnými (x a y). Samozřejmě jsou také výpočetní metody pro vícenásobnou regresní analýzu, regresní počet s třemi a více proměnnými. Tyto metody jsou však nepoměrně obtížnější a v praxi je lze zvládnout v přijatelném čase pouze pomocí výpočetní techniky. V oblasti korelace není ale všechno jen rozumné, jak hned uvidíme v dalším oddílu. 9.4 Zdánlivá korelace — logika a statistika Jsou-li prokázány závislosti, zbývá většinou ještě otázka o příčině a účinku, o náhodě nebo hlubším významu, o přímé závislosti, společném třetím („podmíněná korelace") nebo klamném zdání. Této zdánlivé korelaci věnujeme na závěr malý oddíl, protože je tak matoucí, a tím nebezpečná, ale také proto, že je někdy i zábavná. V angličtině se o ní ostatně mluví většinou velmi jadrně jako o „nonsense correlation" (nesmyslné korelaci), v češtině bývá též nazývána Iluzorní korelaci nebo pseudo-korelacl. Zdánlivou korelaci, která v posledních letech — zase jednou — prošla celým světovým tiskem, vytváří souvislost mezi burzovními kursy a délkou sukní podle zásady ,,člm kratší sukně, lim vyšší kursy". Jestliže se nosí mini, na burze stoupají kursy. Někdy se tento žert uvádí se vši vážností: tak prý asi 9.4 v roce 1967 zjistil jeden finanční poradce ve státě Massachusetts (,USA), že tato korelace je dokazatelná za dobu 47 let. Toto tvrzení pravděpodobně není správné (a pokud jde o střední Evropu, byly kursy v roce zakrytých kolen 1962 mnohem vyšší než v roc? minisukní 1970), ale i kdyby bylo prokazatelné, šlo by přece jen o „nonsense correlation". Ledaže by snad šlo o teorii, že staří burziáni byli cestou na burzu kratičkými sukýnkami naladěni tak citlivě, že pak jednomyslně a s nadšením hnali kursy nahoru. Jiný příklad udává Helen M. Wolkerová, autorka elementární učebnice statistiky ze čtyřicátých let: Zjistí se například, že úhel kladení chodidel na zem při chůzi je u starších žen většinou poněkud větší než u mladších. Stárnou ženy tedy proto, že pokládají chodidla více na vnější stranu? Sotva. Je to tedy snad obráceně — s přibývajícím věkem se chodidla kladou více k vnější straně. Vždyť to dokázala statistika! Ve skutečnosti však jde asi pouze o skutečnost, „že starší ženy vyrůstaly v době, kdy se mladé dívky učily klást při chůzi chodidla špičkami od sebe, mladší ženy se však učily držení těla v době, kdy podobná chůze již nebyla v oblibě". Čistě početní korelace je (nebo snad správněji: byla) tedy zcela dána, jenže nemá žádný význam a klame. Wallis a Roberts říkají proto zcela právem, že zdánlivá korelace pochází většinou z nesprávného výkladu skutečně existujících korelaci; při bližším pohledu se ukáže jen jako nesprávná interpretace. Zmiňují se však také o zdánlivé korelaci, která vzniká pouze při výpočtu. Když například chceme usuzovat ze tří proměnlivých znaků X, V a Z na závislosti, lze přijít na myšlenku porovnat Poměr X : Z s poměrem V : Z — a bude nlivá korelace - logika O statist > fr a 3 1 i / / r 9* I =*■ f * I I i ■ i. Původní měřené hodnoty z našeho příkladu v textu ukazují krajně malou korelaci. Jestliže se však uvedou do vztahu k třetí měřené hodnotě, může vzniknout dojem vysoké korelace, která však ve skuteínosti neexistuje. Tato třetí hodnota se totiž výpočetním postupem vztahuje sama k sobě a zkresluje tak původní obraz. možno vypočítat působivou korelaci, která se však uskutečňuje převážně tím, že se ve hře stále znovu uplatňuje hodnota 1/Z: je-li Z velké, zmenší se X/Z i y/Z. Je-li Z malé, zvětší se X/Z i f/Z. Nesprávný početní postup vede v daném případě na scestí a ke zdánlivé korelaci. Předpokládejme např., že bychom zjistili u tří proměnných — x, y a z — tyto kombinace měřených hodnot: 0.5 5 3 2 8 5 3 1 2 10 12 2 10 7 304 9. Post hoc ergo propter hoc Zaneseme-li dvojice měřených hodnot (x, y) do systému souřadnic, sotva dostaneme věrohodnou regresní přímku; body jsou rozptýleny zcela neuspořádaně. (Viz obr. na str. 305.) Dáme-li však x, případně y do vztahu k z, dostaneme nejdříve tuto tabulku: X/Z rl* 1 i 0,3 0.33 2,5 0,6 1 0,5 2.5 0,3 0.17 4 0.5 0.43 Z těchto hodnot dostaneme pak velmi působivou regresní přímku a můžeme nepochybně vypočítat i vysoký korelační koeficient. To všechno se však stalo pod vlivem Z, kterému se naše V domečku pro předvídáni počasí je přísná záporná korelace: čím více vystoupí jedna figurka z domečku, tím více ustoupí druhá zpět do domečku. To, co se zde sleduje, může se ve statistice vyskytnout jako nebezpečná myšlenková chyba: jestliže se soubor rozdělí no dva díly, tyto díly nutně vykazují korelaci —1. zkoumání vlastně ani nemělo věnovat. S takovými metodami lze úplně mimoděk a jen na trochu vyšší úrovni upadnout do hádanek, kdy si někdo nejdříve myslí nějaké číslo, které pak musí několikrát násobit, dělit, něco připočíst nebo odečíst, až se konečně hledané číslo „uhodne". Hrubá logická myšlenková chyba vzniká konečně i tehdy, když se nějaký soubor rozdělí na dílčí množství a jejich podíl se porovnává v určitém časovém intervalu: nutně musí dojít k výrazné korelaci, neboť jestliže ze dvou procentních podílů, které se navzájem doplňují na 100 %, jeden podíl stoupá, musí druhý klesat: mezi kuřáky a nekuřáky, mezi bílými a barevnými, mezi dny se srážkami a beze srážek bude vždy existovat výrazná záporná korelace tak jako u figurek ve starých domečcích pro předpovídání počasí, které jsou od sebe vždy vzdáleny o 180°, ať před domečkem zrovna stojí kterákoliv z nich. Pravou „nonsense correlation" uvádí Kellerer: „Když se za posledních padesát let zjistí jednak dovoz pomerančů (= x), jednak počet úmrtí na rakovinu (= y) a každá takto získaná dvojice hodnot x:, y, se zanese do pravoúhlého souřadnicového systému, ukáže se, že s výjimkou válečných a bezprostředně poválečných let vysokým (nízkým) hodnotám x odpovídají také vysoké (nízké) hodnoty y. Přes formální souvislost zde není vůbec žádné spojení." Poté následuje velmi závažná .věta: „Obecně platí, že při použití regresního počtu pro časové řady musí být u každé z obou veličin nejdříve vyznačen trend." Pak se totiž nemůže stát, že se „prokáže" souvislost mezi cenami pálenky a platy pastorů nebo cenami kyselého zelí ve Vídni a počtem návštěvníků ze Švýcarska v tomto městě. Zbývá 306 9.4 však ještě nesmyslná náhodná korelace. Je ovšem někdy velmi obtížné určit, do jaké míry je korelace nesmyslná. Jakmile je totiž statistickými metodami testování rozhodně zamítnuta nulová hypotéza „jde o náhodu", zůstane možná ještě „významná" korelace, kterou si nikdo nedovede vysvětlit, která však může mít docela dobře alespoň prognostickou hodnotu. Vezměme třeba dosti zvláštní až bizarní případ, že na otázku po oblíbené barvě téměř všichni lidé, kteří trpí ledvinovými kameny, odpovědí „zelená", zatímco mezi ostatními pacienty je obliba jednotlivých barev rozdělena náhodně. Jakmile by byla statisticky zjištěna korelace „oblíbená barva zelená — ledvinové kameny", bylo by možno alespoň předpovídat, že mezi tisícem pacientů, jejichž oblíbenou barvou je zelená, bude s největší pravděpodobností také několik nemocných ledvinovými kameny, zatímco mezi těmi, kteří mají v oblibě jinou baryu, nebude asi ani jediný. Lékař by si pak mohl na základě odpovědi „červená" nebo „žlutá" hned říci: „Aha, ledvinové kameny nemá" — ačkoliv mezi oblíbenou barvou a nemocí ledvin není zjistitelná žádná logická nebo medicínská souvislost. To je ostatně i otázka, která zajímala již Marca Tullia Cicerona a jeho bratra Quinta: zda se korelace (kterým se tehdy ještě tak neříkalo) smějí použít k prognózám, jestliže není vysvětlitelná souvislost. Marcus Tullius to odmítal, Quintus byl pro. My držíme spíše s Quintem. Tím, že chybí vysvětlení, nestává se ještě prokázaná korelace vratkou. Primitivní korelace jsou často zjišťovány nebo potvrzovány v prastarých Zo-ontlv, kor,lace „ (ofllfc I» • 104 !•• ••1.1 •1. • 72.3 t» » ida M.I ;•»' M.1 • ■•.4 17» •••• Ml •71.1 »».7 *oei • korclatni koeficient r pořel hodnotových dvore n % x I x" e y E xy 1*1 m m i«i i>) í 141 Q 0 0 0 0 P 2 «.6 0 0 0 • 1 I •1X4000« 2 2 7. 0 0 0 0 • 1 5 1 0.» 0 00 » 2 1 2 9.5 0 00 t 1 I 5927000« 2 I 3 10 0 0 0 • 1 I 6722000» 2 1 3 1. 9 0 0 0 « 1 I 7000000» 2 1 Jk.1 0 0 0 » 1 79 7.1000» 2 3 610 0 0» 1 916« 0 0 0 » 2 3 7.7 0 00 » 1 996.5000 » 2 3 6.9 0 0 0 « 1 97 1.1000« 2 3 9.7 0 00 « 1 10668000« 2 099» 2 »6 100 0 0 0 - 9 3 3 0,50 0 0 » 8 1 1 1 5 9.6 3 00 " 7 76*66000 - 6 62870769200 " 5 262864.6400 " 11 , Výpočet korelačního koeficientu za pomoci malého elektronického počítače s predprogramovanými statistickými funkcemi. Výpočet viech těch (x, — í) atd. provede počítač, který mimo výsledek r= 0,9942 vypočte také pomocné hodnoty. V tomto přikladu je to např. A* x součet deseti ročních obratú na 1 pracovníka. A" y součet deseti ročních údajů mezd a platů. Pro vyjádřeni očekávaného vývoj* výkonu zo «raenu na dělníka v podlomí p'i telo* torného imll pro rok 1971 má být provedeno lineárni extrapolace trendu. Hledí >e: 1. regresní koeficient a 2. regresní konstanta b 3. y —ox + b, ká,Ix 13(1971) Směnoví výkon na dělníka pod zemí rok b» kg (y) 1959 1 18*5 19*0 2 1057 1961 3 2207 1962 « 2372 1963 5 2521 19a 6 2613 1965 7 2705 1966 8 2926 1967 9 326« 1968 10 3526 2172. ». 2»2I. 2111. 270*. MM •.* MM 10. MM. regresní koefment a regresní konstonta b to 1 8 * 5.0 20 2 0 5 7.0 30 2 2 0 7.0 4.0 2 3 7 2.0 5.0 2 5 2 1. 0 60 2 6 130 7.0 2705.0 60 29 260 9.0 3 2 6 4.0 110 35260 0 0 0 « 00 0 » 0C0« oco» 0 0 0 » 0 0 0 » 0 0 0 » 000 » 0 0 0 » 0 Op « o c o • 0 0 0 « o c o » 000 « o c o « 0 0 0 » 0 0 0 » 0 0 0 » 0 0 0 ' 0 0 0 « rok 1971 13. 171,297 (y •■ ose + b) 1 7 1. 2 9 7 0 I 1 6 6 1. * 6 6 3 ' 16 6 1.4665 i 13 0 0 0 0« 1 7 1. 2 9 7 0 ! 2 2 2 68610» 38863275»! schopnými zastávat lépe placená místa. Nebo není tím přece jen spíše dokázáno, že odstrkování v zaměstnání vede k frustraci a ta k alkoholismu? Pdtý přiklad: při jednom rozsáhlém šetření byla zjištěna zřetelná korelace mezi špatnou obytnou čtvrtí (staré domy, malé byty, špatné hygienické poměry atd.) a úmrtností na rakovinu. Kdo je chudý, musí tedy dříve umřít na rakovinu. K tomuto poslednímu příkladu, který před několika lety vyvolal v jednom středoevropském velkoměstě značné vzrušení a který není tak lehce vysvětlitelný jako čtyři předcházející, přece jen dodáme, jak tato klamná korelace vznikla. Byla to. jak již tak často, chyba v interpretaci. Skutečnou příčinu tvořila společná třetí proměnná: ve starých obytných čtvrtích bydleli nejen převážně chudší, ale především převážně starší lidé. Proto zde bylo úmrtí na rakovinu poměrně četnější než ve čtvrtích s novostavbami, kde bydlely v průměru znatelně mladší rodiny. Dodatečná analýza, provedená specificky z hlediska věku, neukázala významnější rozdíly, 9.4 Zdánlivá korelace — logiko o statistiko z nichž by vyplývala odpovědnost bytových poměrů za úmrtnost na rakovinu. „Společná třetí" tvoří jakýsi neznatelný přechod od zdánlivé korelace k důmyslné korelaci. V takových případech se často mluví o „podmíněné korelaci". Pfanzagl referuje např. o zjišťování mezi školáky ve věku od 6 do 10 let. které se týkalo korelace mezi tělesnou váhou a manuální zručností. Vyšel korelační koeficient r = 0.45. tedy dosti zřetelná závislost, která nejdříve překvapí: těžší, robustnější děti mají být šikovnější? Ve skutečnosti to byla korelace obou znaků s věkem: starší děti jsou šikovnější i těžši v poměru k mladším. Proto musí být nejdříve tento faktor početně vyloučen, resp. viditelně vyjádřen. Výsledek po „věkovém vyrovnání" vykázal pak podle očekávání nepatrně zápornou korelaci: mezi stejně starými jsou tlustší poněkud nešikovnější. Na závěr ještě jedna zdánlivá korelace zvláštního druhu: nepoměrně více lidi umírá v posteli než na ulici, na moři nebo ve vykřičené krčmě. Postel je proto prokazatelně nejnebezpečnější místo pobytu. Regresní výpočet pomoci počítače. Podle schématu x = ax + b se hledají pro x= 13 extrapolované směnové výkony na základě zkušeností z předchozích deseti let. Výsledek |e: x = 13 .171,3 + + 1661 = 3688. Směnový výkon na dělníka se na základě vývoje z let 1959—1968 odhaduje pro rok 1971 na 3888 kg. (Z návodu k obsluze výpočetního systému „sigmatron".) 308 10 Hledání jistoty 10.1 Hypotézy a kontingence které vycházejí ze spojení dvou řad znaků. Z rakouské statistické ročenky vybereme např. tabulku, jež ukazuje rodinný stav nevěsty a ženicha před uzavřením sňatku: tože se nedoporučuje trhat ženy před oddávajícím úředníkem na kousky, řek-849 .97 neme, že -^qqq se rovná 82. Mělo by se tedy 82 rozvedených žen provdat 10.1 Hypotézy a kontingence Moderní statistika sestává z velké části z testováni hypotéz. Podle výsledků výběrových zkoumání odhaduje rozděleni četnosti nebo korelaci v základním souboru, a tím zároveň dává doporučení pro chování, pomůcku pro roz-hodování: tento lék se zdá být významně účinnější, tato nerovnoměrnost výroby nemůže být jen nahodilá, tuto shodu dvou jevů je však možno vysvětlit působením náhody. Na základě prvních výsledků výběrových zkoumání, a někdy také jen na základě tvůrčí fantazie, se pak vytvářejí hypotézy: „Zde by přece mohla být souvislost". — „To by přece mělo ukázat důsledky." — „Jestliže se tedy předpokládá, že je to pouze náhoda..." Potom se tyto hypotézy podrobí statistickým testům a skutečnost se vymezuje stále úžeji, pravděpodobnost pro správné, rozumné chování se stále zvětšuje. 0 mnohých zásadách testování hypotéz jsme se již dověděli v šesté kapitole, kdy se jednalo o výrobní kontrole, přejímací kontrole, o analýze vzorků všeobecně a o nejmenších vzorcích. Tak jsme mimo jiné poznali princip nulové hypotézy: všechno se tak dlouho připisuje náhodě, až se překročí jakýsi práh (ne)pravděpodobnosti. Pojednali jsme tam také o problému testů hypotéz, při nichž šlo o zjištění, v jakých mezích pravděpodobně platí střední hodnota (nebo četnost) určená ve vzorku i pro základní soubor. K to- mu bude třeba dodat již jen málo. Často však jde při ověřování hypotéz o testování pravděpodobnosti a významu (těsnosti) korelace. Pacienti spí po léku A o půl hodiny déle než po přípravku B — lze to ještě vysvětlit jako náhodu? Rozvedení muži si berou rozvedené ženy častěji, než by to vlastně odpovídalo podílu rozvedených na počtu lidí uzavírajících sňatek — je to snad jen náhoda? Korelační koeficient je 0,3 — je to v daném případě postačující pro zamítnutí nulové hypotézy? Není snad možno pozorovanou korelaci vztáhnout na dva nebo více faktorů místo pouze na jeden — a jak je asi vysoký podíl jednotlivých faktorů na pozorovaném účinku? To jsou zhruba charakteristické otázky při testování hypotéz. Odpovědi na ně ovlivňují v každém okamžiku někde na světě rozhodnutí, která mohou podstatně ovlivnit i náš osud. Ať již jde o pevnost stavebních hmot, o vedlejší účinky léků, o jakost profilů pneumatik, o nové způsoby školního vzdělání nebo o neškodnost konzervačního prostředku, vždy jde o získání údajů z experimentů a o jejich ověření statistickými testy z hlediska jejich vypovídací schopnosti. Nejdříve na příkladu ukážeme, jak v praxi vypadá náhodné rozdělení dvou proměnných. Sestavíme tzv. kontin-genčni tabulku. Slovo kontingence se do statistiky dostalo přes angličtinu z latiny — kontingence znamená téměř doslova setkáni, spojeni. V takové tabulce se tedy zaznamenávají výsledky. Sňatky v roce 1968 podle rodinného stavu ženicha a nevěsty Rodinný stav ženicha před sňatkem Rodinný stav nevésty před sňatkem svobodná ovdovělá rozvedená celkem Rodinný stav nevěsty před sňatkem svobodná ovdovělá! rozvedená celkem prvotní údaje ze 100 sňatků svobodný ovdověl ý rozvedený a 833 978 3 405 391 581 375- 2343 560 2535 47 567 2119 6 315 80,0 1.8 6.1 0.7 1.0 0.7 4.2 1.0 4.5 84,9 3.8 11.3 Celkem 49 216 1347 5438 56 001 87.9 2.4 9.7 100.0 Z tabulky samé nemůže neškolené oko mnoho vyčíst: že u převážného počtu sňatků jsou oba partneři svobodni, není překvapující. I když vypočítáme rozdíly rodinného stavu, nebude ještě nic zvláštního nápadné. Z ženících se mužů bylo 84,9% svobodných, 3.8% ovdovělých, 11,3 % rozvedených. Z žen bylo 87,9 % svobodných. 2,4 % ovdovělých a °>7 % rozvedených. U mužů mají vdovci a rozvedení poněkud vyšší podíl; to je nyní zcela zřetelné. Nyní. když známe tyto podílové četnosti pro oba partnery, sestavíme kon-tingenční tabulku nulové hypotézy, tj. předpokládáme, že jde pouze o nahodilost, která podmiňuje rodinný stav manželských partnerů. Protože například 9,7 % nevěst je rozvedených, připadá na 1000 ženichů 97 rozvedených žen. Z 1000 ženichů je však 849 svo-849 bodných, takže --^ z 97 rozvedených 1000 žen se provdá za svobodné muže. Pró- za svobodné muže, 11 za rozvedené a 4 za vdovce. Dobře si uvědomme, že je to naše nulová hypotéza čistého nahodilého rozdělení. Je to model házení kostkou: kostkou „rodinný stav nevěsty" se hází nezávisle na kostce „rodinný stav ženicha". Protože tedy domněle jde o nezávislé jevy, platí pravidlo o násobení pravděpodobnosti: pravděpodobnost „svobodný muž" (pm = 0,849) násobená pravděpodobností „rozvedená žena" (prl = 0,097) dává celkovou pravděpodobnost „svazek mezi svobodným mužem a rozvedenou ženou". Ptm ■ Pn = (0.849) . (0.097) = 0.0825. tedy. jestliže opět odmítáme roztrhat ženu. 82 nebo 83 takových manželství na 100 sňatku. Nyní sestavíme hypotetickou kontingtnini tabulku pro vSechny myslitelné případy (v %): 311 310 10. Hledání jistoty Ženich svobodný ovdovělý rozvedený Celkem Nevěsta svobodná ovdovělá 74.7 3,3 9.9 87.9 2.0 0.1 0.3 2.4 rozvedená 8.2 0,4 1.1 celkem 84,0 3,8 11.3 9.7 100.0 Proti této kontingenční tabulce nulové hypotézy („čistá náhoda") postavíme nyní na procenta přepočítanou původní tabulku skutečných četností: Ženich svobodný ovdovělý rozvedený Nevěsta svobod- ovdo-ná vělá rozvedená 80,0 1,8 6.1 0,7 1.0 0,7 4,2 1,0 4,5 Rozdíl mezi hypotetickým a skutečným rozdělením je zřejmý zejména tehdy, jestliže se porovná úhlopříčka — tedy dvojice, kde se druží „rovný s rovným". Např. u oboustranně ovdovělých dvojic je skutečná četnost desetkrát větší než podle nulové hypotézy. (Žádný div: ovdovělé osoby jsou většinou již starší Pravé náhodné rozdělení sňatků by vzniklo, kdyby se ovdověli, rozvedeni a svobodní k sobě nechali dotápat naslepo. V běžném životě se vsak ukazuje, že o náhodném rozděleni nemůže být ani řeči: s obl.bou se sdružuje rovná s rovným. Zkoumá se. kdo se k sobi vlee nebo mini hodl. 312 10-1 Hypotézy a kontingent*. Ženich svobodný ovdověly rozve X X 1/3 očekd 1/2 vané < 1/2 X v \ 21/2 i *_ 2/3 četnost 2x X x. Proti hypotetickému náhodnému rozdělení vykazují sňatky nápadné rozdíly. Zejména ovdověli a rozvedeni se navzájem evidentně přitahují, zatímco vdovci si berou nápadně zřídka svobodné ženy a svobodní muži zřídkakdy ženy rozvedené. a častěji volí opět partnera usedlejšího ročníku, který ovšem bývá také často ovdovělý. To však je jen pokus o vysvětlení, který není v žádné přímé souvislosti s číselnými podklady: jak víme, korelace nutně neznamená poměr příčina — účinek. Nejdříve se ziistí neočekávaně velká četnost a potom si musí statistik nebo odborník v příslušné specializované oblasti lámat hlavu nad příčinou.) Odkaz na neočekávaně vysoké hodno- ty v úhlopříčce kontingenční tabulky nám však ještě neposkytuje početní rozbor významnosti nebo bezvýznamnosti. K tomuto účelu musíme použit testovacích metod, s nimiž se seznámíme, neboť porovnání mezi hypetetickým a skutečným rozdělením je hlavním úkolem tzv. testu (chí kvadrát testu). Nejdříve si však ještě jednou připomeneme pojem „stupe* ~ kterým jsme se poprvé setkal. rovn*ž př. testování hypotéz, a to ph „rozd*- 313 10. Hleddnf jistoty lení t". Kdybychom chtěli v příkladu, který zkoumáme, hledat stupeň volnosti, museli bychom např. u mužů říci: především máme volnost určení svobodných — mohlo by to být 90 %. Dále si dovolíme určit rozvedené — mohlo by to být 8 %. A konečně si dovolíme určit libovolně i ovdovělé — ale můžeme to ještě udělat? Máme-li 8 % -f- 90 % celku a máme určit již jen jednu kategorii, žádná volnost nám nezbývá: je přesně určena poměrem 100 — 98 = 2 %. Máme tedy jen dva stupně volnosti. Stejně je tomu samozřejmě i u žen: dva stupně volnosti. Pro celou kontingenční tabulku dostáváme dvakrát dva, tedy čtyři stupně volnosti. Nakonec poznámku k nulové hypotéze. Není vůbec řečeno, že nulová hypotéza musí vždy mít náhodné rozdělení. Mohli bychom např. nalézt zemi, kde rozvedení téměř vždy uzavírají sňatek s ovdovělými a obráceně. Nulová hypotéza pro zkoumání číselných podkladů Rakouska by pak mohla znít: ,,Předpokládejme, že by tomu zde bylo také tak — je možno údaje jiného druhu vysvětlit pouhou náhodou?" Protože tedy máme při volbě testované hypotézy takovou volnost, naskýtá se další velmi důležitá možnost. Výsledek prvního výběrového souboru mohu pokládat za nulovou hypotézu pro výsledek druhého výběrového souboru tak, že řeknu: „Předpokládejme, že by druhý výběrový soubor byl vytvořen ze stejného základního souboru jako první, to však nevím přesně. Má se tento předpoklad zamítnout?" Jestliže jsem oba výběrové soubory domněle vytvořil ze stejného obyvatelstva, pak významný rozdíl dovolí domněnku, že se ve skutečnosti nejedná o stejný základní soubor. Jestliže jsem Ještě na nemocničním lůžku, když v zamyšleni hází kostkou a dosáhne překvapivého výsledku, sáhne statistik po tabulce chi kvadrát. Test chí kvadrát ukazuje totiž většinou velmi přesně hranice (meze) náhody. však — a to je u testování hypotéz častější případ — výběr provedl ze dvou podobných, nikoliv však stejných základních souborů, může prohlášení nulové hypotézy za falešnou poskytnout cenné poznatky o účinnosti rozdílných pracovních postupů, jakosti materiálu, přípravků atd. Při testování hypotéz pak často otázka zní takto: odpovídá pozorované rozdělení očekávanému? Ve většině případů odpověď na to dává test %*. 10.2 Test chí kvadrát (z2) Polehávající nemocný statistik hází zamyšleně kostkou po podnosu — třicetkrát, padesátkrát, šedesátkrát. Potom sečte zaznamenané výsledky: sedmkrát padla jednička, devětkrát dvojka, desetkrát trojka, šestkrát čtyřka, patnáctkrát pětka a třináctkrát šestka. „Hmhm," bručí sám pro sebe, „šestkrát čtyřka, ale patnáctkrát pětka? Je to vůbec možné?" A znovu vezme tužku. Mohl by například pomocí směrodatné odchylky binomického rozdělení (cr = ynpq) vypočítat, že pro každý počet ok je směrodatná odchylka j/60 .1/6.5/6 = ]/o\35 = 2,9, a z toho by mohl poznat, že každý počet ok má četnost ještě uvnitř dvojnásobné směrodatné odchylky— totiž mezi (10 — 5,8 = = 4,2) a (10 + 5,8 = 15,8); zvolí však elegantnější a přesnější metodu. Poznamená si: síme si postup zopakovat. Co se stalo' By/y vypočítdny rozdíly, a to zcela podobným způsobem, s jakým jsme se seznámili na počátku druhé kapitoly při výpočtu rozptylu. Měřená hodnota nebyla ovsem porovnána s aritmetickým prů-měrem všech pozorovaných hodnot, nýbrž s hypotetickou očekávanou hodnotou, očekávanou četnosti. Ta byla ve všech případech vždy 10, neboť - protože kostka má 6 ploch a u správné kostky je pravděpodobnost pro každý jednotlivý počet ok 1/6 — očekávaná hodnota (která je podle definice průměrem) činí při celkem 60 hodech vždy 10 pro každý počet ok. (Obr. str. 316.) S touto očekávanou četností byla tedy porovnána pozorovaná četnost, rozdíl byl umocněn známým způsobem, ale pak dělen očekávanou četností. Přitom se umocněním zvlášť zřetelně ukázaly extrémní odchylky: rozdíl 1 dal nakonec pouze 0,1, rozdíl 5 však 2,5. Počet ok Četnost očekávaná pozorovaná Rozdíl Mocnina rozdílu Mocnina rozdílu dělená očekávanou četnosti 10 10 10 10 10 10 7 9 10 6 15 13 9 1 0 16 25 9 0.9 0,1 0 1.6 2.5 0.9 6.0 „Přesně šest," mumlá si statistik a sáhne po tabulce chí kvadrát, kterou má samozřejmě u postele, „šest a pět stupňů volnosti." Nahlédnutí do tabulky a již se spokojeně usmívá: „Vše v pořádku, kostka je prima." Zjistil totiž, že předpoklad, že kostka je v pořádku, nebyl testem chí kvadrát zamítnut. Dříve však než se i my budeme spokojeně usmívat, mu- Nakonec byly mocniny odchylek sečteny a dostali jsme číslo 6 jako kritickou veličinu pro tabulku chí kvadrát. (Obr. str. 317.) Náš výsledek jsme dostali podle tohoto vzorce: 314 IX • •• • •• • •• ••• 531 ••• ••• 1 ••• ••• mm ••• WH ••• ••• ••• 1 ••• mi • •• ••• ••• • •• mm • •• • •• mm jměrnó četnost Porovnáni očekávané a pozorované četnosti je základem pro výpočet chí kvadrátu. Při 60 hodech „správné" kostky je očekávaná hodnota každé oko 60/6=10. Pozorované četnosti v našem přikladu se od sebe vice nebo méně odchyluji. Slovy: chi kvadrát je součet všech umocněných rozdílů mezi pozorovanými (&) a očekávanými (E) hodnotami, dělený očekávanou (E) četnosti. Dostali jsme tedy X1 = 6. A co ted s timto číslem? Stejně jako v případě „rozdělení t" pouze toto číslo samo nestačí ještě ke zjištění jeho významnosti z tabulky. Mimo toto číslo %* musí být dále znám počet stupňů volnosti. V našem případě dostaneme 6 —1=5 stupňů volnosti, protože při celkem šesti možnostech je poslední určována ostatními pěti (jak jsme podrobněji vysvětlili v oddílu 6.41). V tabulce rozdělení chí kvadrát vyhledáme řádek pro „pět stupňu volnosti" a sloupec s hledanou významností. Chceme-li například zkoumat, zda je náš výsledek v 95 % všech náhodných výsledků správné kostky, vyhledáme ve sloupci 95 % řádek 5 a najdeme tam porovnávací hodnotu 11,1 — a to je mnohem více než 6,0, které jsme dostali při našem pokusu. Nulová hypotéza („kostka je v pořádku, všechno byla pouze náhoda") nebyla v úrovni 95 % zamítnuta. (Viz obr. na str. 318.) Zkusíme-li znovu své štěstí při hladině významnosti 97,5 %, dostaneme samozřejmě ještě vyšší hodnotu, protože jsme tím rozšířili prostor náhodnosti nulové hypotézy. Pro zúžení prostoru bychom museli hledat jiným směrem, v tomto případě se však ukazuje, že např. i 80 % pravděpodobnosti je ještě u 7,3, takže náš výsledek nejen není nevýznamný, ale není ani zcela neobvyklý. Tabulky chí kvadrát mají však ještě 316 10.2 Test chi kvadrát (g*) zvláštní vlastnost: kromě krajně vysoké a 50% pravděpodobnosti obsahuji i pravděpodobnosti krajně nízké — a to má svůj účel. (Viz tabulku na str. 319.) To, co jsme nazývali nulovou hypotézou, je u testu chí kvadrát nulovou hypotézou zvláštního druhu — je to hypotéza, že „se hodí" hypotetické rozdělení. Čekali jsme, že se kostka bude chovat jako pravá kostka, že se tedy bude řidit zákony binomického rozdělení. Porovnávali jsme pozorované hodnoty s „očekávanými" hodnotami binomického rozdělení a naše domněnka, že snad takové rozdělení existuje, nebyla zamítnuta. Taková domněnka však může být zamítnuta nebo alespoň zpochybněna také jiným způsobem — totiž tehdy, jestliže pozorovaný výsledek „se hodí" až příliš dobře, když náhoda jí vyhrazený prostor takříkajíc vůbec nevyža- Rozdíl mezi očekávaným a pozorovaným f.—i • f—1 • • • • • •_ • • • • • • A • • • •_ Z • • • • • • •_ E • • • • • • • • • • • •_ E • • • • • • • E • • • • • • .e_ p • • • ■ • • •_ z. lu • • • • • m <-3)J :::! <-D3 m H <-4)1 5J : :-Hv mocniny rozdílu: 9. . J_ . 0 16 25 9. = 60 = g =y2 očekávané: 10+10 10 10 10 10 10 Ve druhém kroku výpočtu chl kvadrátu zjistíme „chybějící", případně »P^*"*" ^ jednotlivých počtů ok a potom je umocníme. Součet těchto umocněných odchylek dává hodnotu chl kvadrátu. 317 10. Hledáni jistoty Rozděleni Rozděleni chl kvadrát 1% 5% 50% 95% 99% i 1 2 3 4 5 6 7 8 9 10 11 12 13 4 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 34 40 50 70 100 0.0 0,0 0.1 0,3 0.6 0,9 1,2 1.6 2.1 2,6 3.0 3.6 4.1 4.7 5.2 5.8 6.4 7,0 7,6 8.3 8.9 9.5 10.2 10,9 11.5 12.2 12,9 13.6 14.3 15.0 17,8 22.2 29.7 45.4 70.1 0.0 0.1 0.4 0,7 1.1 1.6 2.2 2.7 3.3 3,9 0,5 1.4 2,4 3.4 4,4 5.4 6,4 7.3 8,3 9,3 4,6 10,3 5.2 11,3 5,9 12.3 6.6 13,3 7.3 14,3 8,0 15,3 8.7 16,3 9.4 17.3 10.1 18.3 10,9 19,3 11,6 20.3 12.3 21,3 13.1 22.3 13.8 23,3 14.6 24,3 15.4 25,3 16.2 26,3 16.9 27,3 17.7 28,3 18.5 29,3 21.7 33,3 26,5 39,3 34.8 49,3 51,7 69,3 77.9 99,3 3,8 6.0 7.8 9.5 11,1 12.6 14,1 15.5 16,9 18.3 19.7 21.0 22.4 23,7 25.0 26.3 27.6 28.9 30.1 31.4 32.7 33,9 35.2 36.4 37.7 38,9 40,1 41.3 42.6 43.8 48,6 55,8 67.5 90,5 124,3 6.6 9,2 11.3 13.3 15,1 16,8 18.5 20.1 21.7 23.2 24,7 26,2 27.7 29.1 30.6 32,0 33.4 34.8 36.2 37.6 38.9 40.3 41,6 43,0 44,3 45,6 47.0 48,3 49.6 50,9 56.1 63.7 76.2 100.4 135,8 'č o Pravděpodobnost1 || 20% 10% 5% 2% 1% 0.1% 1 1,64 2,70 3,84 5,41 6,63 10,82 2 3,21 4.60 5,99 7.82 9,21 U81 3 4,64 6,25 7,81 9,83 11,34 16,26 4 5,98 7,77 9,48 11,66 13,27 18.46 5 7,28 9,23 11,07 13,38 15,08 20,51 6 8,55 10,64 12,59 15,03 16.81 22,45 7 9,80 12,01 14,06 16,62 18,47 24,32 8 11,03 13,36 15,50 18,16 20,09 26,12 9 12.24 14.68 16,91 19,67 21,66 27,87 10 13,44 15,98 18,30 21,16 23,20 29,58 11 14,63 17,27 19,67 22,61 24.72 31.26 12 15.81 18,54 21,02 24,05 26,21 32.90 13 16.98 19,81 22,36 25,47 27,68 34,52 14 18,15 21,06 23,68 26,87 29,14 36,12 15 19,31 22,30 24,99 28,25 30,57 37,69 16 20,46 23,54 26,29 29,63 32,00 39,25 17 21,61 24,76 27,58 30,99 33,40 40,79 18 22,76 25,98 28,86 32,34 34,80 42.31 19 23,90 27,20 30,14 33,68 36,19 43,82 20 25,03 28,41 31.41 35.02 37,56 45,31 21 26,17 29,61 32,67 36,34 38,93 46,79 22 27,30 30,81 33,92 37.65 40.28 48,26 23 28.42 32.00 35,17 38,96 41,63 49,72 24 29.55 33,19 36,41 40,27 42,98 51.17 25 30.67 34,38 37,56 41,56 44,31 52,62 26 31,79 35,56 38,88 42,85 45,64 54,05 27 32,91 36,74 40,11 44.14 46,96 55,47 28 34,02 37,91 41,33 45,41 48,27 56,89 29 35,13 39,08 42,55 46.69 49,58 58,30 30 36,25 40,25 43,77 47,96 50,89 59,70 1 Procentní pravděpodobnost dostat určitou v tabulce uvedenou nebo vyšší hodnotu chl kvadrátu. Tři různé tabulky rozděleni chl kvadrátu podle Kreysziga. Haseloffa-Hoffmanna a Pfanzagla. Při správném použiti dávají samozřejmě vždy správné hodnoty. 318 10.2 Test chl kvadrát Rozd< Slení chí kvadrát Počet stupňů volnosti F{x) 1 2 3 4 5 6 7 8 9 10 0,001 0,00 0,00 0.02 0,09 0,21 0,38 0,60 0,86 1.15 1.48 0,005 0.00 0,01 0,07 0,21 0,41 0.68 0,99 1,34 1.73 2.16 0,01 0,00 0,02 0.11 0.30 0,55 0,87 1.24 1,65 2.09 2.56 0,025 0,00 0.05 0,22 0.48 0.83 1.24 1.69 2.18 2,70 3.25 0,05 0,00 0,10 0,35 0.71 1,15 1,64 2,17 2,73 3,33 3.94 0,1 0.02 0,21 0,58 1,06 1,61 2.20 2.83 3.49 4,17 4,87 0,25 0,10 0,58 1,21 1,92 2.67 3,45 4,25 5.07 5,90 6.74 0,5 0,45 1,39 2,37 3,36 4,35 5,35 6,35 7.34 8.34 9,34 0.75 1,32 2,77 4,11 5.39 6,63 7.84 9.04 10,22 11.39 12.55 0,9 2,71 4,61 6,25 7,78 9,24 10,64 12,02 13,36 14.68 15.99 0,95 3.84 5.99 7.81 9.49 11,07 12,59 14,07 15,51 16.92 18,31 0.975 5,02 7,38 9,35 11,14 12,83 14,45 16,01 17.53 19,02 20.48 0,99 6,63 9.21 11,34 13,28 15,09 16,81 18,48 20,09 21,67 23,21 0,995 7,88 10,60 12,84 14,86 16,75 18.55 20,28 21.96 23,59 25.19 0,999 10.83 13.82 16,27 18,47 20,52 22,46 24,32 26,13 27.88 29,59 F(x) Počet stupňů volnosti 11 12 13 14 15 16 17 18 19 20 0,001 1.83 2,21 2,62 3,04 3,48 3,94 4,42 4.90 5.41 5.92 0,005 2,60 3,07 3,57 4,07 4,60 5,14 5,70 6,26 6.84 7,43 0,01 3.05 3.57 4,11 4,66 5,23 5,81 6.41 7.01 7,63 8.26 0,025 3,82 4.40 5.01 5,63 6.26 6.91 7.56 8,23 8.91 9,59 0,05 4,57 5,23 5,89 6,57 7.26 7.96 8.67 9,39 10.12 10,85 0,1 5,58 6,30 7,04 7,79 8,55 9,31 10,09 10.86 11.65 12,44 0.25 7.58 8,44 9.30 10,17 11.04 11,91 12,79 13,68 14,56 15.45 0,5 10.34 11,34 12,34 13.34 14,34 15,34 16,34 17.34 18.34 19.34 0,75 13,70 14,85 15,98 17.12 18,25 19,37 20.49 21.60 22.72 23,83 0,9 17.28 18.55 19.81 21,06 22,31 23,54 24,77 25.99 27.20 28,41 0,95 19,68 21,03 22,36 23,68 25.00 26,30 27.59 28.87 30.14 31.41 0,975 21,92 23.34 24,74 26,12 27.49 28,85 30.19 31.53 32.85 34.17 0,99 24,73 26,22 27,69 29,14 30,58 32,00 33.41 34.81 36,19 37,57 0.995 26,76 28,30 29,82 31,32 32,80 34.27 35.72 37.16 38,58 40.00 0,999 31.26 32,91 34,53 36.12 37.70 39,25 40.79 42.31 43.82 45.32 319 . Hledáni jistoty 20 JO Tabulka chi kvadrát v grafické podobě podle Fisherových a Yatesových ..Statistických tabulek". Deset stupňů volnosti dává na úrovni 5% J* = 19. Tabulka udává přesnou hodnotu 18.3. (Co zde znamená úroveň 5 %. uvádí se ve větiině tabulek jako 95% úroveň atd.) duje. Kdybychom totiž v průběhu 60 hodů skutečně hodili každé ze Šesti čísel přesně desetkrát, byl by to opravdu neobvyklý případ náhody. Výpočet by samozřejmě dal /! = 0o pohled do tabulky by ukázal, že (5 stupňů volnosti. 1 %) se vyžaduje hodnota ■/} = 0.6. Jinými slovy: je nasnadě podezření, že se neuplatnilo binomické rozdělení, protože se manipulovalo. V případě naši kostky to snad byla přece jen vzácná náhoda, při jiných pokusech však může překvapivě dobře „se hodící" výsledek být testem chí kvadrát odhalen jako „významné podezřelý". (Pro test chí kvadrát plat! ostatně jako pro „rozděleni t": opatrně při používání tabulek, zvláště ze starších prací — pro- centa jsou někdy „zrcadlově převrácena", místo stupňů volnosti jsou uvedeny třídy znaků.) Také rozdělení chí kvadrát lze nakreslit jako křivku, má však — podle počtu stupňů volnosti — různý tvar. Mezi ním, rozdělením t, rozdělením F (se kterým se ještě krátce seznámíme) a normálním rozdělením jsou zajímavé, ale složité souvislosti, o jejichž popis se zde nebudeme pokoušet. Rozdělení X1 poprvé objevil v roce 1876 německý matematik a geodet Friedrich Robert Helmert, upadlo však úplně v zapomenutí, až je v roce 1900 nezávisle na Hel-mertovi znovu objevil a pro použití v matematické statistice připravil Karl Pearson, kterého již známe jako tvůrce korelačního koeficientu. Teprve když tento Pearsonův objev vyvolal pozornost a posunul statistiku o veliký krok kupředu, zjistil Bortkievicz, že Helmert již dříve formuloval podobné myšlenky. Rozdělení y1 má v praxi testování hypotéz nepřecenitelaou úlohu, protože je schopno určit, zda ověřovaný názor na rozdělení bude nebo nebude zamítnut šetřením. Přitom je možno pracovat s malými, ne však nejmenšími výběry, což je pochopitelné, protože k poznání struktury rozdělení je třeba poměrně mnoha jednotlivých údaju. Vzhledem k významu tohoto testu uvedeme ještě jiný příklad, pro který však použijeme údajů o sňatcích z předcházejícího oddílu. Předpokládejme, že bychom údaje tam uvedené pro základní soubor zjistili v odpovídající četnosti ve výběrovém souboru o rozsahu n = 1000, a nyní chceme zkoumat, zda tím může být zamítnuta nulová hypotéza „čistě náhodného rozdělení". Nulovou hypotézu čistě náhodného rozdělení jsme prve (v '-/. ) načrtli takto: 320 Ženich Nevěsta svo- ovdo- roz- Cel- bod- vělá vede- kem ná ná svobodný 747 20 82 849 ovdovělý 33 1 4 38 rozvedený 99 3 11 113 Celkem 879 24 97 1000 Zjištěný výsledek, sestavený ve stejném uspořádání, však vypadal takto: Ženich Nevěsta svobodná ovdovělá rozvedená svobodný 800 7 : 42 ovdovělý 18 10 10 rozvedený 61 7 45 Rozdíly (8 — £), tedy „pozorované četnosti minus očekávané četnosti", vypadají takto, přičemž hned také vypočítáme mocniny těchto rozdílů: Ženich Nevěsta svobodná ovdovělá rozvedená (B-E) (B-E)= (B-E) (8-E)= (B-E) (B-E)« svob. 53 ovd. —25 rozv. —38 2809 —13 169 —40 1600 625 9 81 6 36 1444 4 16 34 1156 Mocniny rozdílů (8 — £)* se nyní dělí očekávanou četností a dostáváme tuto tabulku: 2809/747 = 3.8 625/ 33 = 18.9 14a/ 99 = 14.5 37,2 1600/82 = 19.5 36/ 4 - 9.0 1156/11 - 105.1 + 169/20 = 8.5 81/ 1 = 81.0 16/ 3 ■ 5.3 + 94.8 133.6 - 265.6 celkem -__10-2 Test chí kvadrát ty') Počet stupňů volnosti jsme již dříve určili jako hodnotu 4. Ať však hledáme kdekoli ve sloupci „4 stupně volnosti" prakticky na každé úrovni je tato nulová hypotéza („vše je pouze náhoda") zcela rozhodně zamítnuta: i když jdeme až do 99.9 % a ponecháme tedy náhodnému rozdělení volný prostor až přes tři směrodatné odchylky, vždy je v tabulce uvedeno nejdříve 18,5. Bez nejmenší pochybnosti je tím hypotéza zamítnuta a můžeme s určitostí říci: uzavírání sňatků, jak jsme zjistili, má takové důvody, které nelze vysvětlit ani nejopovážlivějš! hrou náhody. Jaké jsou to důvody? To nelze vyčíst ani z čísel, ani z tabulky chí kvadrát. O tom je možno přemýšlet, radit se se sociology, s odborníky v manželských poradnách nebo oddávajícími úředníky a hledat v příručkách, potom vytvořit novou hypotézu a testovat ji znovu — s novými údaji! Přece jen nám však již pouhý pohled na jednotlivé mocniny rozdílů dělené četnosti řekl, že se od náhodného rozdělení extrémně odchylují především sňatky mezi dvěma ovdovělými, resp. mezi dvěma rozvedenými. Snad se především zde budou hledat možné důvody. K samé technice provedení musíme dodat toto upozornění na malou závadu: když se počítá chi kvadrátem, mílo by být v každém řádku nejméní 5 mířeni. To se právě stalo při našich pozorováních, nikoliv však v kontingenční tabulce náhodného rozdělení, kde je v jedné řádce 1 měření, v další řádce 3 a v jedné řádce 4. Nám jde o princip výpočtu a mimoto víme. že bychom mohli plným právem uvést každé číslo desetkrát větší, protože podklady pocházejí z mnohem většího výběrového souboru. 321 10. Hledáni jistoty jgj Test chí kvadrát svobodný! ovdověly rozvedeny I ^ svobodná ovdověla rozvedená ► «=2809 747 = 1^=8.5 20 (-251 =625 33~18'9 9 =^=81,0 6 =7=9.° 4 99 3-5,3 34 =1156=105 1 37,2 94,8 133,6 = 265,6 =X Jeitě zřetelněji než porovnáni absolutních čísel ukazuje test chl kvadrát nápadné odchylky na obě strany. Umocněné rozdíly mezi očekávanými a pozorovanými hodnotami se dělí očekávanými hodnotami. Jako nejnápadněji! se ted ukazuje četnost sňatků mezi rozvedenými: %* =105,1. nej-vyiií číslo v tabulce. Co se však stane, máme-li desetkrát vice pozorováni (se stejným podílovým rozdělením)? I hypotetické hodnoty pak musí být dosazeny v desetinásobné velikosti — a mocniny rozdílů stokrát tak veliké! U obou svobodných by to znamenalo: očekáváno 7470, pozorováno 8000, rozdíl 530, čtverec rozdílu 280900, děleno 7470 dává nyní 38 místo dosavadních 3,8! Podobným způsobem 322 se zdesateronásobí všechny dílčí zkušební hodnoty chí kvadrátu, a tak dostaneme zkušební hodnotu 2656 místo dřívějších 265,6. V našem příkladu bylo ovšem toto menší číslo již více než dostatečně veliké pro zamítnutí nulové hypotézy. V jiných případech může být zamítnutí možné teprve po přiměřeném zvětšení rozsahu výběrového souboru. Kdyby např. kostkou házející statistik v 600 hodech (místo v původních 60) hodil sedmdesátkrát jedničku, devadesátkrát dvojku atd., vyšly by z toho pro jednotlivé počty ok tyto rozdíly, mocniny rozdílů a hodnoty chí kvadrátu: 1 — 30 900 9 2 — 10 100 1 i 3 0 0 0 4 — 40 1600 16 5 50 2500 25 6 30 900 9 60 Nyní je to zcela jasné: ve sloupci pro 5 stupňů volnosti je těch 60 všude příliš mnoho. Už to není náhoda, nyní je dokázáno, že s kostkou není něco v pořádku. Rozsah výběrového souboru je již zahrnut v obecném výpočetním postupu a nemusí se k němu zvlášť přihlížet — „očekávaná" čísla se zvyšují s rostoucím rozsahem výběrového souboru. Menší výběrové soubory dávají menší hodnoty pro x2, takže při zmenšujícím se rozsahu výběrového souboru je zamítnutí nulové hypotézy stále obtížnější. Test chí kvadrát se proto často používá k zamítnutí korelace, kterou nejdříve bezděčně předpokládáme, protože je „viditelná pouhým okem", a to tak, že se testem připisuje náhodě a tím nabádá k opatrnosti. Předpokládejme např., že by bylo v nějakém podniku zaznamenáno během jednoho roku v ranní směně pět těžkých pracovních úrazů, v odpolední třináct a v noční směně dvanáct. Není nic snadnějšího než říci, že rozdíl je nápadný — dělníci první směny jsou lépe odpočinutí, nebo je možno uvést jako důvod cokoliv jiného. Test chí kvadrát však odkáže rozdělení těchto úrazů do možné oblasti náhody. Nulová hypotéza („nehody jsou v každé směně stejně pravděpodobné, při celkovém počtu třiceti by mělo na každou směnu připadnout v průměru deset") se totiž nezamítá. Dostaneme: yí= (5-10)' (13-10)» * «n 1 Tk--(- 10 10 (12-10)* V řádce pro dva stupně volnosti (3 minus 1) najdeme však u 90 % ještě 4,6. což nestačí k zamítnutí nulové hypotézy. Teprve na příliš nízké úrovni stěží 85 % se zdá tento výsledek nápadný. Jinak by již tomu bylo při pouze třech úrazech v ranní směně a patnácti, případně dvanácti odpoledne a večer. Pak bychom dostali: X1 = 4,9 + 2,5 + 0,4 = 7,8. 7,8 je však přesně tabulková hodnota pro 95 %. Zde již sotva budeme mluvit o náhodném výsledku. Pro test chí kvadrát je tedy charakteristické jeho použití k průzkumu hypotéz z hlediska rozdělení. Odpovídá na otázku: „Jak se hod! zjištěné hodnoty k naší představě o domnělém rozdělení?" Nebo. vyjádřeno ve směru nulové hypotézy: „Je ze zjištěných hodnot prokazatelné, že předpoklad náhodného rozdělení — nebo jiného zcela určitého rozdělení — lze pokládat za vyvrácený?" Testuje se tedy, zda a jak dalece „se hodí" hypotetické rozděleni na skutečnost. a proto anglická literatura označuje chí kvadrát jako „goodness-of-fit-tesť\ postup ke zjištění, jak dobře se hodí hypotéza, pokud jde o rozdělení. A protože se test týká této hypotézy, těchto „očekávaných hodnot", dělí se mocniny rozdílů očekávanými, a nikoliv zjištěnými četnostmi. Bylo by opravdu ne- 323 10. Hledáni jistoty__-- smyslné chtít testovat, zda něco skutečně zjištěného může nastat nebo ne. Skutečnost nemůže být zkoumána z hlediska své pravděpodobnosti, protože je skutečností, a tím jistotou. Nejisté je pouze to, zda ji lze či nelze uvést do souladu s určitým předpokladem. 10.3 Analýza rozptylu Střelec pálí desetkrát na terč. Později se ukáže, že všechny střely šly daleko mimo střed a skončily v pravé horní části terče. Kdyby se byly rozptýlily přibližně stejnoměrně kolem středu terče, nebylo by to nijak překvapující. Takto však usuzuje pečlivý pozorovatel, že tu není něco v pořádku. Snad není zaměřovači dalekohled zcela bez závad, snad je poněkud nepřesně postavena hlaveň pušky, snad má střelec vadný zrak. Zaměřovači dalekohled přezkouší optik a zjistí: skutečně, malá nepřesnost znemožňuje přesné zacílení. Puškař pečlivě přezkouší zbraň a zjišťuje: opravdu, hlaveň pušky má maličkou nepřesnost, kterou lze vysvětlit odchýlení střel vpravo. Nakonec jde sám střelec k očnímu lékaři a ten zjišťuje: celkem je zrak v pořádku, trochou nejistoty při odhadu vzdáleností by však bylo případně možno vysvětlit špatné výkony při střelbě. Konečný výsledek: máme tři faktory, které asi spolupůsobily, a tak vedly k neočekávanému výsledku na střelnici. V tomto případě by bylo nepochopitelné, kdyby střelec, jakmile se dověděl výsledek první série, byl systematicky mířil nikoliv do černého, nýbrž jeden bod vlevo dolů od středu. Nám však jde o zásadu následujícího problému: dosáhli jsme takového výsledku pokusu, který se významně odchyluje od střední hodnoty základního souboru, a domníváme se, že jeho příčinou jsou dva nebo více faktorů. Jak je máme od sebe oddělit? Chceme-li především ušetřit výlohy na optika, puškaře a očního lékaře, doporučuje se např. toto uspořádání pokusu: střelec nejdříve dostane nový zaměřovači dalekohled na starou pušku. Pak se mu dá jiná puška se starým dalekohledem. Za třetí se mu dá nová puška s novým dalekohledem. To máme 10.3 Analýzo rozptylu Zásah na terč. je príl.i vysoko vpravo nahoře. V našem přikladu předpokládáme, ze to zavinily raku ch h 7l KľÍľ VYIém ÚČÍnkU dOP'ňUÍÍ (níkdy 56 ** ""mohou vylučovat) c y a zraku, chyba dalekohledu, chyba pušky. Samozřejmí lze připojit další zdroj chyb - nápř ne-dostatečná praxe ve střelbě. Když střelec opět netrefi do černého, může být pro to vlce důvodů. Zrak' Puška? Zaměřovači dalekohled? Rozlišením vlce vlivů na výsledek testu se zabývá analýza rozptylu. celkem čtyři výběry. Je však možno jít ještě dál a dát různé kombinace pušek a dalekohledů dvěma jiným střelcům, takže nakonec dostaneme dvanáct výběrů nebo střeleckých souborů. Z. porovnání hodnot docílených při všech těchto pokusech (kruhy terče, poloha zásahů) je pak snad možno postupně vytřídit jednotlivé faktory: tak přispívá k odchylce puška, tak zaměřovači dalekohled, tak střelec. Zpočátku nepřehledně promíšený celkový rozptyl se rozkládá, rozptyl se analyzuje — dostali jsme se k analýze rozptylu (variance), k „rozkladu rozptylu1'. Statistikovi vzniká často tento problém v obrácené podobě: pokus byl několikrát obměňován a nyní se má odpovědět na otázku, zda navzájem odlišné výsledky jsou skutečně důsledkem změn v uspořádání pokusů nebo zda jde o náhodu. Možná že výsledky se odlišují pouze proto (což se také stává), že někdo vytáhne z balíčku karet pět zelených a jiný z téhož balíčku pět červených karet. Z oddílu 5.4 známe již dvě „normalizované chyby", které mohou dát vysvětlení, zda střední hodnota (nebo četnost) nějakého výběru může být uvedena do souladu se srovnatelnými hodnotami jiného výběru, takže lze předpokládat, že oba výběry pocházejí z téhož základního souboru. Není to však pouze střední hodnota, která charakterizuje nějaké rozdělení. I rozptyl může být důležitý pro posouzení situace. Nejsou-li vzorky příliš velké, může se 324 325 10. Hledaní jistoty Princip rozloženi rozptylu zobrazený na terči. Jen chyby střelce vytvářej! při pěti střelách charakteristický vzorec kolem středu. Dalši chybou (např. chybou pušky) přesune se tento vzorec doprava a ještě další chybou (např. chybou dalekohledu) se přesune nahoru. Výsledek: zásahy se rozptylují o bod doprava nahoru od středu. střední hodnota z nich vypočítaná velmi podstatně odchylovat od skutečného průměru základního souboru, ale ani rozptyl vzorku nebude stejný jako u základního souboru. Již v šesté kapitole při výkladu „Studentova rozdělení t" jsme poukázali na to, že rozptyl vypočítaný z matého výběrového souboru je možno použít jako „odhad" pro rozptyl základního souboru jen tehdy, když součet kvadratic- kých odchylek se nedělil počtem měřených hodnot (n), nýbrž pouze počtem stupňů volnosti (n — 1). Nebo se součet dělený n násobí korekčním faktorem, tzv. „Besselovým faktorem" (podle astronoma Friedricha Wilhelma Besse-la, 19. století): n/(n — 1). Proč nám najednou tolik záleží na přesné znalosti (nebo pokud možno přesném odhadu) toho, snad jen smyšleného základního souboru? Především 326 proto, že nechceme porovnávat výsledky dvou nebo více výběrů pouze navzájem, nýbrž pokoušíme se vyjasnit, zda tyto výběry mohou vycházet ze společného základního souboru. Lze dosažené výsledky vysvětlit jako náhodné z jediného souboru, nebo je nutno předpokládat, že pocházejí z různorodých souborů? Tento hypotetický základní soubor můžeme ovšem zkoumat jen pomocí rozboru výsledků našich výběrů. Situace je tedy tato: máme dva nebo více výběrů a známe jejich střední hodnoty a rozptyly. Jako nulovou hypotézu předpokládáme nejdříve, že různé složení výběrů by bylo možno vysvětlit tím, že při náhodném výběru z hypotetického základního souboru se vyskytly obvyklé, náhodou podmíněné výkyvy. Tato náhoda má takříkajíc dvě tváře. V každém výběru je náhodný rozptyl kolem příslušné střední hodnoty souboru. Střední hodnoty výběrových souborů, které se od sebe liší, dávají možnost dvou různých výkladů: mohly vzniknout náhodným výběrem z jednoho a téhož hypotetického základního souboru (z téhož pytle ořechů vytáhnu jednou osm dobrých ořechů z desíti, pak jen šest z desíti), nebo má rozdíl hlubší význam (výběr osm z desíti pochází z jiného pytle než výběr šest z desíti). Výchozí situace, která je obvykle podkladem analýzy rozptylu, je tedy taková, že jsem zpravidla načal dvě nebo více pokusných sérií a chci zjistit, zda provedené pokusné obměny skutečně výsledky významně ovlivnily. Proto se někdy označuje rozptyl „uvnitř" jednotlivých výběrů jako „náhodný", rozptyl „mezi" výběry jako „vysvětlený" — vysvětlený totiž tím, že uspořádání po- __10.3 Analýza rozptylu kusu se úmyslně obměňuje, je tedy zcela „vysvěti/te/né", jestliže se výběry navzájem odlišují. Protože však ve statistice není možno být dostatečně opatrný při zacházení s pojmy, jako je „vysvětlený", zůstaňme raději u neutrálních pojmů rozptylu „uvnitř" a „mezi" výběry. A protože analýza rozptylu mimoto patří k obtížnějším metodám statistiky a my zde nechceme uvádět nekonečné matematické vývody, musíme se omezit na krajně jednoduché příklady, které však přesto vysvětlují zásady analýzy rozptylu. Předpokládejme proto, že bychom vytvořili tři výběrové soubory vždy stejného rozsahu nx = ns = n3 = 5 a přitom dostali těchto 15 měřených hodnot: Vzorek A Vzorek B Vzorek C 6 8 7 4 10 Proto: 10 í, = 2 15 í, = 3 35 i, = 7 Nejdříve se podíváme nastřední hodnotu onoho výběru, o kterém — protože nemáme nic lepšího — se domníváme, že je složen z uvedených tří vzorků. Všech patnáct měřených hodnot dohromady dává střední hodnotu tohoto pseudosouboru. průměr vyplývá z prú- 60 2 + 3 + 7 měrů vzorků x = = 3 " = Jak se nyní mají jednotlivé měřené hodnoty k celkovému průměru? 327 10. Hledáni jistoty výběr A výběr B výběr C rozptyl r 2 3 3 1 x=r2 odstranění rozptylu uvnitř výběru -r I-2-2+2-I-2--2-I _ 3 3 10 o •8- 7 i- H 7 7 7 7 7 průměr z A + B + C: i 4-24-2 4-24-2Í-2 I 1 tra • 7-4 7-4 7-4 7-4 7-4 1 7-4 -©-B3 70 rozptyl mezi výběry Zkoumáni tří výběrů z hlediska jejich rozptylu. Při prvním kroku (nahoře) se zjišťuje, |ak se odchyluji jednotlivé měřené hodnoty každého výběru od svého vlastního průměru vzorku. Pak (uprostřed) se všechny tři výběry jaksi „vnitřně očistí": každá měřená hodnota odpovídá nyní průměru svého výběru. Zatím byl vypočítán také (docela vpravo) průměr průměrů výběrů, tedy průměr všech patnácti měřených hodnot (zde: i = 4). Nyní se — třetí krok — vypočítá, o kolik se odchyluj! vnitřně očištěné měrné hodnoty výběrů od celkového průměru. Nakonec se tyto odchylky umocni; součet těchto odchylek dává rozptyl „mezi" výběry. 328 m+m+u]+[ij=4 = 14 20 4 + 14 + 20 rozptyl ►=3B uvnitř výběrů 10.3 Analýza rozptýlí Rozptyl uvnitř výběrů lze téměř pouhým okem vyčíst z první řady předchozího obrázku, jen se nesmí zapomenout umocnit. Výběr A vykazuje čtyřikrát odchylku + nebo —1, takže při umocňování se jen dvakrát mění zna-ménko. V B a C byly však větší odchylky, které se nyní projevuji přiměřeně silněji. Součet těchto mocnin dává rozptyl „uvnitř" výběrů. Výběr — 2 - 1 +2 — 1 0 +4 — 3 - 1 +3 — 1 + 1 0 — 3 - 4 +6 K tomu mocniny těchto rozdílů: A 8 C 4 1 4 1 0 16 9 1 9 1 1 0 9 16 46 24 + 19 + 65 = 108 V této druhé tabulce jsme vlastně neudělali nic jiného, než že jsme vypočítali rozptyl patnácti měření oproti jejich průměru, stejně jako již ve druhé kapitole této knihy. Vypočtený součet povýšený na druhou však nyní nedělíme počtem měření, abychom dostali rozptyl, nýbrž uvažujeme, z čeho se tento celkový rozptyl vlastně skládá. Především se v něm zrcadlí rozptyl „uvnitř" vzorků, dále však také rozptyl „mezi" jednotlivými vzorky (s jejich specifickými středními hodnotami) a průměrem celého souboru. Jestliže chceme oba od sebe pečlivě oddělit, nabízí se k tomu tento postup: rozptyl „mezi" zůstane nepochybně zachován, pokud zůstanou naše tři vzorky. Nyní budeme však postupovat tak, jako by každý výběr dal pětkrát střední hodnotu daného výběru: řekněme xl se rovná stále 2, ale vzniklo z pěti měřeni, která všechna dala 2. Dosadíme rovněž měřené hodnoty z výběru 8 rovné 3. 3, 3, 3 a 3 — s x„ i nadále 3, a x3 rovné 7 rovněž vzniklé z pětkrát 7. (Viz obr. na str. 328.) Nyní opakujeme dřívější postup: tyto „vnitřně vyrovnané" fiktivní hodnoty se porovnají s nezměněným celkovým průměrem x = 4. To dává v případě vzorku A pětkrát umocněnou odchylku (_2)« (= 20), pro 8 pětkrát (—1)1 (= 5) a pro C pětkrát (+3)2 (= 45). Součet dává 20 + 5 + 45 = 70. To je tedy onen podíl rozptylu, který připadá na rozdíly „mezi" vzorky a nepřihlíží k rozdílům uvnitř vzorků. Jestliže však byl celkový rozptyl 108 a z toho 70 se vysvětlilo rozdíly „mezi" vzorky, zbývá ještě 38 na podíl rozptylu „uvnitř". Toto tvrzení lze snadno dokázat. Je nutno jen vypočítat rozptyly „uvnitř" jednotlivých vzorků — tedy rozptyl pěti měření z A proti x, m 2. z 8 proti x„ = 3 a z C proti x3 = 7. To dává u A: í« + (-1)* + 1* + (-1)* = 329 10. Hledáni jistoty . 4; u B: 1s + 2« + (—3)* = Mi ° konečně u C: (-1)* + 12 + (-3)* + + 3S = 20. A to všechno dohromady dává jako součet odchylek „uvnitř": i +14 + 20 = 38. (Viz obr. na str. 329.) Všechny tyto, při těžších příkladech dost často obtížné výpočty nevyvolávají zvláštní zájem na takovém pseudový-běru a miniaturním výběru o 15 měřeních v našem příkladu, který je navíc slepen ze tří výběrů. Jsou spíše prostředkem k jinému účelu — ke zjištění, dá-li se vůbec rozumně předpokládat, že existuje jednotná populace, ze které by naše tři (obecně: k) výběry mohly pocházet. To je totiž naše nulová hypotéza. Tajně předpokládáme, že jsme našimi pokusnými obměnami vystopovali podstatné rozdíly. Musíme si však být vědomi, že všechno po nulové hypotéze je vlastně jen náhoda. Jako správní vědci zkoumáme tedy nejdříve nulovou hypotézu. Tuto nulovou hypotézu bude pak možno snadno zamítnout, jestliže je rozptyl „mezi" výběry velký nebo rozptyl „uvnitř" výběrů malý. Zkrátka: bude třeba zkoumat relativní poměr velikosti obou částí rozptylu. 10.31 Rozdělení F Tato zkouška se opět provádí s porovnávací tabulkou, a to se „Snedeco-rovým rozdělením F" (F k poctě sira Ronalda A. Fishera). Dříve než začneme tuto zkoušku provádět, musíme samozřejmě vypočítat zkušební veličinu. Proto musíme znovu mluvit o stupních volnosti. Pokud jde o soubor našich měření, máme (při n = 15 měřeni) n — 1 =14 stupňů volnosti. Každý jednotlivý výběr se však skládal jen z pěti měření, takže „uvnitř" každého z těchto výběrů jsou jen čtyři stupně volnosti. Tři (obecně: k) výběry vždy se čtyřmi stupni volnosti dávají celkem dvanáct stupňů volnosti. Máme tedy ještě dva zbývající stupně volnosti, které můžeme použít pro rozptyl „mezi". (Obecně: jestliže se vytvoří k výběrů, je k dispozici k — 1 stupňů volnosti pro rozptyl „mezi" výběry.) Jako celkový rozptyl jsme již zjistili 108, z toho připadlo 38 na rozptyl „uvnitř" a 70 na rozptyl „mezi". Nyní vypočítáme rozptyl „uvnitř" tím, že dělíme součet rozptylů počtem na něj připadajících stupňů volnosti: 38 Rozptyl „uvnitř": — = 3,17. Stejně postupujeme s rozptylem „mezi": 70 Rozptyl „mezi": — = 35. Již jsme uvažovali, že zkušební veličina by musela zjistit poměr mezi oběma typy rozptylu, a skutečně tomu tak je. Testovací veličinu pro test F vypočítáme podle tohoto schématu: zkušební veličina rozptyl „mezi" testu F =- rozptyl „uvnitř" V našem příkladu to dává zkušební veličinu 35/3,17 = 11,0, a protože jsme měli velkou varianci „mezi" a malou „uvnitř", doufáme, že pomocí relativně velké zkušební veličiny budeme moci zamítnout nulovou hypotézu. Je ovšem třeba uvážit, že rozsah našeho výběru byl velmi malý. Ale podívejme se, co říká tabulka F. Tabulka rozděleni F se zdá být ještě zmatenější než tabulka rozdělení chí kvad-drát — Studentovo t je proti tomu malá násobilka. Rozdělení F má totiž pro každou hladinu významnosti matici řádek a sloupců: v řádcích jsou stupně volnosti menšího rozptylu, ve sloupcích většího. Vyčerpávající soustava tabulek rozdělení F tvoří tedy celou knihu. Většinou je však možno se spokojit s tabulkami pro několik zvlášť důležitých hladin významnosti, zejména 95 % a 99 %. Platí zde, stejně jako u chí kvadrátu a Studentova t, že se nevyhledává přímo zjištěná testovací veličina, která slouží jen pro účely porovnání s tabulkovou hodnotou. Zkoumáme tedy nejdříve situaci na podkladě tabulky 10.31 Rozděleni F „rozdělení F" na úrovni 95 %: mohly by naše tři výběry pocházet z téhož základního souboru, jestliže náhodě vyhradíme 95% prostor (= dvě směrodatné odchylky)? Menší rozptyl (3,17) měl dvanáct stupňů volnosti. Hledáme vlevo řádek 12 a přejdeme dále ke sloupci 2 (neboť náš větší rozptyl měl dva stupně volnosti.) V tomto řádku najdeme hodnotu 3,89. Naše testovací veličina 11,0 je mnohem vyšší, odchylky jsou tedy určitě významné. Nyní zkontrolujeme ještě rozdělení F v tabulce 99 % a nacházíme tam v řádku 12 sloupec 2 hodnotu 6,93. Tedy i na Dvě krátké tabulky rozdělení F na úrovni 95 a 99 % (druhá na násl. str.). Protože se musí přihlížet vždy ke dvěma stupňům volnosti, jsou řádky i sloupce rozděleny podle stupňů volnosti. Rozdělení F; 95% úroveň 3 10 12 20 50 100 1 2 3 4 5 6 7 8 9 10 12 14 16 18 20 22 24 26 28 30 40 50 100 161 18,51 10,13 7,71 6,61 5.99 5.59 5.32 5.12 4.96 4.75 4.60 4,49 4,41 4,35 4.30 4.26 4,22 4,20 4.17 4.08 4.03 3,94 3,84 200 19,00 9,55 6,94 5,79 5,14 4,74 4.46 4,26 4.10 3,89 3.74 3,63 3,55 3.49 3.44 3,40 3.37 3.34 3.32 3,23 3.18 3.09 2,99 216 19,16 9.28 6,59 5,41 4.76 4,35 4.07 3,86 3.71 3.49 3,34 3.24 3.16 3.10 3,05 3.01 2,98 2,95 2,92 2.84 2.79 2.70 2.60 225 19,25 9,12 6,39 5,19 4.53 4,12 3,84 3,63 3,48 3,26 3.11 3,01 2,93 2,87 2,82 2.78 2,74 2.71 2,69 2,61 2,56 2.46 2.37 230 19,30 9,01 6,26 5.05 4.39 3,97 3,69 3.48 3.33 3,11 2,96 2,85 2.77 2.71 2.66 2.62 2.59 2,56 2,53 2,45 2,40 2.30 2,21 234 19,33 8.94 6,16 4.95 4,28 3.87 3,58 3.37 3,22 3,00 2.85 2.74 2,66 2.60 2.55 2.51 2.47 2,44 2.42 2.34 2,29 2,19 2,09 239 19.37 8.84 6,04 4,82 4,15 3,73 3.44 3,23 3.07 2.85 2,70 2,59 2,51 2.45 2.40 2.36 2,32 2.29 2,27 2,18 2.13 2.03 1.94 242 19,39 8.78 5.96 4,74 4.06 3,63 3.34 3.13 2.97 2.76 2,60 2,49 2.41 2.35 2.30 2.26 2.22 2.19 2.16 2,07 2,02 1.92 1,83 2a 19,41 8,74 5.91 4.68 4,00 3,57 3,28 3,07 2.91 2.69 2,53 2.42 2,34 2.28 2,23 2,18 2.15 2,12 2,09 2.00 1.95 1.85 1.75 248 19,44 8.66 5,80 4.56 3,87 3,44 3.15 2.93 2.77 2,54 2,39 2,28 2,19 2,12 2.07 2,02 1.99 1,96 1.93 1.84 1.78 1.68 1.57 252 19.47 8,58 5.70 4,44 3.75 3,32 3.03 2.80 2.64 2,40 2.24 2.13 2.04 1.96 1.91 1.86 1,82 1.78 1.76 1.66 1.60 1,48 1.35 253 19,49 8,56 5.66 4,40 3.71 3,28 2.98 2.76 2.59 2.35 2,19 2,07 1.98 1.90 1.84 1,80 1.76 1.72 1.69 1.59 1.52 1.33 1.24 254 19.50 8.53 5.63 4.36 3,67 3.23 2.93 2.71 2.54 2,30 2,13 2.01 1.92 1.84 1.78 1.73 1,69 1.65 1.62 1.51 1.44 1.28 1.00 330 331 10. Hledáni jistoty _ této hladině významnosti je naše testovací veličina 11,0 rozhodně větší. Můžeme tedy nulovou hypotézu prakticky zamítnout a konstatovat: naše tři výběry nepocházejí s největši pravděpodobností z téhož základního souboru. Ukázali jsme jen základní rysy nej-jednodušší analýzy rozptylu na krajně zjednodušeném příkladu, ale s trochou fantazie je možno vytvořit si představu, jaké jsou zde skryty možnosti. Vhodným vytvářením časových řad mohou být zkoumány, tříděny a analyzovány domnělé, žádoucí, obávané účinky i vedlejší důsledky všeho druhu z hlediska jejich pravděpodobnosti. Na analýze rozptylu je totiž podstatné to, že má umožnit poznání, jaká část rozdílu mezi výběry se má přisoudit na- hodilostem a jaká část se asi musí vykládat jinak, a poukazuje na více nebo méně významnou jinou druhovost dvou (nebo více) výběrů. Tato analýza nám teď také poskytuje_ pozdě, ale přece — matematické zdůvodněni „Besselovy korekce", případně toho, že se dnes v matematické statistice vypočítává rozptyl výběrového souboru s2 zpravidla nikoliv dělením součtu kvadratických odchylek číslem n, nýbrž pouze n — 1. S tímto problémem jsme se neustále potýkali od prvního popisu odchylky a směrodatné odchylky přes rozdělení t až do tohoto oddílu. Až dosud jsme také nemohli zcela jasně zdůvodnit, že u výběru malého rozsahu (např. n<100) se musí použít korekční faktor, resp. že se Rozdělení F; 99% úroveň 1 8 10 12 20 50 100 1 2 3 4 5 6 7 8 9 10 12 14 16 18 20 22 24 26 28 30 40 50 100 oo 4052 98.49 34.12 21.20 16.26 13.74 12.25 11.26 10.56 10.04 9,33 8,86 8.53 8,28 8,10 7.94 7.82 7.72 7,64 7,56 7.31 7,17 6.90 6.64 4999 99.00 30,82 18.00 13,27 10.92 9.55 8.65 8.02 7.56 6,93 6.51 6,23 6.01 5,85 5.72 5.61 5,53 5.45 5.39 5,18 5.06 4.82 4,60 5403 99.17 29.46 16.69 12,06 9.78 8.45 7.59 6,99 6.55 5,95 5.56 5,29 5,09 4,94 4.82 4.72 4,64 4.57 4.51 4.31 4.20 3.98 3,78 5625 99.25 28.71 15,98 11.39 9.15 7.85 7.01 6.42 5.99 5.41 5.03 4.77 4.58 4.43 4.31 4.22 4.14 4.07 4.02 3.83 3,72 3.51 3.32 5764 99,30 28,24 15.52 10.97 8,75 7.46 6.63 6,06 5.64 5.06 4.69 4.44 4.25 4.10 3.99 3.90 3,82 3,76 3.70 3.51 3.41 3.20 3.02 5859 99.33 27.91 15.21 10.67 8,47 7.19 6.37 5.80 5,39 4,82 4.46 4.20 4,01 3.87 3.76 3.67 3.59 3.53 3.47 3.29 3.18 2.99 2.80 5981 99,36 27,49 14.80 10.27 8.10 6.84 6,03 5.47 5.06 4.50 4,14 3.89 3,71 3.56 3,45 3.36 3.29 3.23 3.17 2.99 2.88 2.69 2.51 6056 99,40 27,23 14,54 10,05 7.87 6,62 5,82 5.26 4.85 4.30 3,94 3.69 3.51 3,37 3.26 3,17 3,09 3.03 2.98 2.80 2.70 2.51 2.32 6106 99.42 27,05 14.37 9.89 7.72 6.47 5,67 5.11 4.71 4,16 3.80 3.55 3,37 3.23 3.12 3,03 2,96 2.90 2,84 2.66 2.56 2.36 2.18 6208 99.45 26.69 14,02 9.55 7.39 6.15 5.36 4,80 4,41 3.86 3.51 3.25 3.07 2,94 2,83 2.74 2,66 2,60 2,55 2.37 2.26 2.06 1.87 6302 99,48 26.35 13,69 9.24 7.09 5,85 5.06 4.51 4,12 3.56 3.21 2,96 2.78 2.63 2.53 2,44 2.36 2,30 2.24 2.05 1.94 1.73 1.52 6334 99,49 26,23 13,57 9.13 6.99 5.75 4,96 4.41 4,01 3,46 3,11 2,86 2,68 2,53 2.42 2.33 2,25 2.18 2.13 1.94 1,82 1.59 1,36 6366 99.50 26.12 13.46 9.02 6,88 5.65 4.86 4.31 3.91 3.36 3.00 2,75 2,57 2.42 2.31 2.21 2.13 2,06 2.01 1.81 1,68 1.43 1.00 332 o tuto korekci postará již definice s2 a s. Skutečný (neznámý) rozptyl základního souboru, variance a2, sestává zřejmě ze dvou faktorů: z rozptylu měření výběrového souboru kolem průměru výběrového souboru x a z rozptylu četných možných x kolem skutečného průměru fi. Tímto druhým hlediskem jsme se zabývali již v oddílu 5. 4, kde jsme také popsali náhodnou chybu střední hodnoty výběru: činila a/j/n. Protože celkový rozptyl výběrového souboru tvoří souhrn vnitřního výběrového rozptylu a náhodné chyby průměru výběru, musíme od „naivně" vypočítaného rozptylu — jak by to bylo správné u jednoho souboru a jak jsme jej již ve druhé kapitole poznali a pak často používali — odečíst náhodnou chybu střední hodnoty a zbytek (právě rozptyl „uvnitř" výběru) použít jako odhad pro rozptyl souboru. Provedeme-li však tuto operaci, ode-čteme-li tedy od souhrnu kvadratické odchylky dělené n náhodnou chybu střední hodnoty (ff/j/n), dostáváme po několika úpravách korigovanou hodnotu rozptylu, rozptyl výběrového souboru očištěný od náhodné chyby střední hodnoty. Toto „korigované" s2, případně s, se zpravidla obecně používá v učebnicích matematické statistiky, protože výběrový soubor se vždy chápe jako směrový ukazatel pro odhad celku, není tedy uzavřeným základním souborem. Kdyby však skutečný průměr základního souboru (ji) byl znám — což se v praxi stěží stane — pak samozřejmě nedojde k náhodné chybě střední hodnoty a korekce odpadá. Rozdělení F také umožňuje poznat, zda se rozptyl dvou výběrových souborů od sebe liší, a tím tvoří důležitý doplněk 10.31 Rozdíleni f testu t, který má měřit odchylku od středních hodnot. Vzpomeňte si na příklad, který jsme uvedli v oddílu 6.41: z pěti měření jsme dostali hodnoty 82. 87. 104. 92 a 90 a průměr výběrového souboru x = 91. Tam nám šlo o zkoumán! otázky, zda má být nulová hypotéza^ = 100 zamítnuta či nikoliv. Nyní předpokládejme, že bychom byli vytvořili druhý výběrový soubor, z kterého by vyšla tato měření: 98, 88, 95, 89 a 100. Průměr výběrového souboru je nyní x2 = 94, ale náš zájem se teď ani tak nezaměřuje na tento průměr jako na otázku, zda rozptyl zůstane konstantní, tj. zda se změnil jen uvnitř prostoru volného pro náhodu. Pro první výběrový soubor vyšlo s,1 = = 67. Druhý výběrový soubor dává: 16 + 36 + 1 + 25 + 36 = 28,5. Větší rozptyl dělený menším dává 67/28,5 = 2,34. Vyhledáme porovnávací hodnotu v tabulce F vždy u čtyř stupňů volnosti a najdeme (úroveň 95 %) 6,39. Hypotéza o nezměněném rozptylu není zamítnuta. Nakonec můžeme ještě zkusit, zda se průměr výběrového souboru změnil pouhou náhodou nebo zda se za tím něco skrývá. To provedeme se Studentovým t a dostaneme: 94-91 t75 ^a^. J/67 + 28,5 9.77 Tabulka „rozdělení t" udává pro 8 stupňů volnosti (totiž po čtyřech ze dvou výběrů) na úrovni 95% ještě 1,86. na úrovni 80% pak ještě 0.89. Odchylka středních hodnot je zřejmě náhodná. Analýza rozptylu se používá často v lékařském výzkumu. Zde ovšem platí. 333 10. Hledáni jistoty 10.4 Tetty ooŕi*. jako bohužel u všech statistických metod, že všechny vypočítané zákonitosti se zakládají na předpokladu, že se provede náhodná volba ze stejného druhu. Je ovšem dobře možné vypěstovat myší kmeny, u kterých jsou jednotlivá individua téměř totožná co do organické konstituce: vstříkne-li se deseti z nich přípravek A a deseti jiným přípravek B, lze předpokládat, že by výsledek byl stěží jiný, kdyby se obě skupiny zaměnily. (K tomu ještě někdy přistupuje možnost oboustranného pokusu na jednom zvířeti.) Při léčbě lidí však ještě nejsme v „Krásném Novém Světě" Aldouse Huxleyho, aby bylo k dispozici 64 jednovaječných množenců Bokanovského jako pokusný materiál stejného druhu. V daném případě také nemůže být nemoc vyvolána stejnoměrnými dávkami bakterií nebo škodlivých látek, ale musí se brát, jak přijde — v počátečním i pozdějším stadiu, u staršího i mladšího člověka, u odolného stejně jako u citlivého pacienta. Jde-li o rozšířenou nemoc, je možno nanejvýš vytvořit skupiny a získat pomocí analýzy rozptylu cenné poznatky. Jde-li však o poměrně vzácnou nemoc, bude obtížné vytvořit stejné podmínky nutné pro teoretické úvahy o pravděpodobnosti. M. J. Moroney. na jehož znamenitou knihu „Facts from Figures" (Skutečnosti z čísel) zde chceme zvlášť upozornit, k tomu jednou řekl: „Žádná oblast není pro neopatrného tak nebezpečná a plná »vlčich jam« jako závěry z lékařské statistiky. Je spíše výjimkou než pravidlem, že jsou totožné všechny jiné porovnávané skupiny v každém významném ohledu — mimo ten, který má být ověřován. Každý statistik, který se kdy zabýval lékařskou statistikou, vl, jak často se musel vzdát, protože skupiny 334 nabízené pro porovnání nejsou prostě dostatečně nebo vůbec porovnatelné." K tomu přistupuje ještě jiný problém, o kterém jsme se již zmínili. Na kom se má ověřovat nový, avšak prozatím jen při pokusech na zvířatech vyzkoušený lék? Je možné, že nebezpečí bude větší, možná však i léčebný efekt lepší, jestliže se použije pro „beznadějné" případy, u kterých každé jiné léčení zklamalo, nebo když se použije pro lehčí případy, které v nejhorším snáze překonají neočekávaný vedlejší účinek? Výsledky pokusu budou mít rozdílné výsledky v závislosti na tomto rozhodnutí. Pro statistika by byl případ jasný: vybrat pokud možno pacienty stejného druhu se stejným průběhem nemoci a pak dělat pokusy, např. na základě schématu latinských čtverců. Latinské čtverce tvoří schéma pokusného zařízení, jehož se používá zejména při zemědělských experimentech a které umožňuje zcela zřetelně vyřadit náhodné výkyvy. Při pokusech s novými druhy rostlin, novými hnojivy atd. je vždy nebezpečí, že výsledky sklizní nedovolí spolehlivé závěry, protože i nepatrné rozdíly v jakosti půdy ovlivnily výsledky více než jakost nového druhu nebo nového hnojiva. (Vizobr. str. 335.) Proto se používá takového uspořádání pokusu, které podobné nahodilosti vyřadí tím. že při pokusech např. se třemi druhy se veliké pole vhodně rozdělí na devět čtverců a dané tři druhy se vysadí tak, že v každé řadě (řádku) a v každém „sloupci" je každý ze tří druhů. Jestliže druhy označíme písmeny A, B a C, vypadá schéma latinského čtverce takto: ABC B C A C A B Přiklad latinského čtverce: např. pouiljl se hnojiva ve čtyřech koncentracích nebo *r^™J* (A. B. C. D): tímto uspořádáním se do xnaíné míry vyrovna|l případné roidlly v |akost. pudy atd. Pro čtyři druhy by muselo být k dispozici 42 = 16 čtverců, pro 6 druhů 63 = = 36 čtverců. Pak se porovnají rozdíly „mezi" řádky, sloupci a druhy, a tím se může dalekosáhle rozlišit vliv půdních podmínek od vlivu druhů. Mimoto dává rozdíl z celkového rozptylu a rozptylů „mezi" ještě jako zbytek rozdíly „uvnitř", které vyjadřují náhodné faktory, k nimž se nepřihlíželo nebo které nebyly poznány. Schéma latinského čtverce není ovšem omezeno jen na zemědělství. Podobným způsobem lze mimo jiné provádět analýzu odchylek v továrnách, například tak, že se nový výrobní postup porovnává s dosavadním na třech různých strojích, které jsou střídavě obsluhovány třemi více nebo méně schopnými dělníky. Na základě tohoto pokusného schématu probíhají často také lékařské, biologické a psychologické experimenty a pomocí analýzy odchylek jsou pak vyhodnoceny. 10.4 Testy pořadí Jestliže střetnutí boxerů neskonči k. a. vyhlásí ringový rozhodčí jednoho z nich vítězem na body, nikdy i za projevu nesouhlasu diváků, kteří pokládají poraženého za lepšího. Když se pořádá soutěž krásy, nevoli porota jen jednu 333 „královnu krásy", ale zařadí do pořadí také další kandidátky, aniž se nejdříve provedla analýza odchylek v rozměrech boků nebo třetí odmocnina běloskvou-ciho chrupu. Když jsou vyřazováni mladí důstojníci amerických vojenských akademií, dostane každý absolvent pořadové číslo, a když později zemře jako generál, konstatuje se v nekrologu, že byl kdysi vyřazen jako 87. ze 453 svého ročníku. Zeptáme-li se známého, ve kterém z deseti měst by nejraději žil, udělá — snad po určitém váhání — preferenční seznam: od města svých snů až po to, ve kterém by nechtěl být ani pohřben. Schéma uspořádáni pokusu podle latinského čtverce: 4 léky A. B, C. D se zkouiejl u čtyř věkových skupin. V důsledku nevyhnutelných rozdílů v tělesném stavu a průběhu nemoci nepostačí ovšem 16 pacientů, spiše je nutno říci podle obrázkových statistik: „každá figurka znamená 10 (nebo ještě lépe vice) osob". Když... a tento výpočet by mohl pokračovat donekonečna. Jsou zkrátka nesčetné situace, události, předměty, které sice lze sestavit do určitého pořadí, jejich rozdíly je však možno jen obtížně zjistit s matematickou přesnosti, i když vědecké výzkumy vždy směřují k nalezení mnoha měřitelných, zvažitelných a vypočítatelných hodnot. (Dokonce i superkrálovnu krásy lze nechat zvolit počítačem pomocí zaprogramovaných ideálních měr.) Kromě toho existuje však mnoho případů, ve kterých by sice bylo zásadně možné provést přesně změřitelné rozlišení, kdy však je zařazení do pořadí jednodušší, méně nejisté a pro sledovaný účel plně postačuje. Při každé sportovní soutěži je jeden vítěz, jeden druhý a jeden třetí, případně mohou být rovným dílem obsazena dvě první nebo dvě druhá místa, ale nikoho nenapadne umocňovat rozdíly mezi časy nebo dálkami anebo je dokonce složitým způsobem uvádět do vztahu k jiným výkonům či rekordům. Na stupni vítězů stojí první, vedle druhý a třetí. Má-li čtvrtý smůlu, přišel jen o vlásek o stupeň a o medaili. Pro všechny je však rozhodující jen jedno: pořadí. V deváté kapitole při pojednání o korelaci jsme se zmínili o příkladu záporné korelace mezi odeslanými dopisy a telegramy a nyni seřadíme tam uvedených 13 zemí podle jejich „pořadí" v obou 336 druzích zasílání zpráv a pokusíme se zjistit, zda pomocí takto stanoveného pořadí můžeme vypočítat míru korelace. Kdybychom chtěli zjistit přesnou korelaci, musely by být nejdříve zjištěny střední hodnoty odeslaných telegramů a dopisů a pro každou jednotlivou dvojici měřených hodnot vypočítána odchylka a její mocnina atd. Korelace pořadí však nejdříve porovná, na kterém místě (v kterém pořadí) jsou jednotliví nositelé znaků v obou případech. V našem případě to vypadá takto: Pořadí Rozdíl- podle Pořadí nost tele- podle pořadí gramů dopisů (<0 ď NDR t ■' 11 —10 100 Řecko 2 13 —11 121 Španělsko 3 10 — 7 49 Itálie 4 9 — 5 25 Jugoslávie 5 12 — 7 49 Švédsko 6 6 0 0 Rakousko 7 7 0 0 Belgie 8 2 6 36 Francie 9 5 4 16 NSR 10 8 2 4 Švýcarsko 11 1 10 100 Velká Británie 12 4 8 64 Nizozemí 13 3 10 100 Ľ