ACTA UNIVERSITATIS PALACKIANAE OLOMUCENSIS FACULTAS PHILOSOPHICA PSYCHOLOGICA 32-1998 VARIA PSYCHOLOGICA VIII. PŘEHLED HISTORICKÉHO VÝVOJE STATISTIKY, JEJÍ VÝZNAM V SOUČASNÉ DOBĚ A VYUŽITÍ V PSYCHOLOGII Eva Reiterová Úvod Se statistikou se setkáváme na každém kroku - ve zprávách, informacích, a činnostech všeho druhu. Zároveň statistika tvoří základnu pro plánování, organizaci a celé moderní soužití. Ačkoliv se ve své moderní podobě zabývá i malými vzorky, poskytuje v zásadě návod k zacházení se soubory a četnostmi, s rozsáhlými údaji o věcech a lidech. Ve věcech plánování a systematické přípravy budoucnosti je základem nesčetných propočtů a rozhodnutí. Představy o světě dosažené moderní přírodovědou nebo poznatky sociologie jsou důležité i pro toho, kdo není přírodovědcem nebo sociologem. Stejně je tomu i se statistikou. V době, kdy roste význam statistických metod a informací, je znalost nej důležitějších zásad statistiky potřebná pro každého, koho povolání nebo i běžný život přivedou do styku se „statistikami", a to je dnes každý, jehož zájem jde i jen tak daleko, že pravidelně čte svůj denní tisk. Historický vývoj statistiky Lidé si často představují statistiku jako pouhé sbírání čísel. To byl skutečně její původní význam. Název vznikl z latinského „status" = stát, protože původně byl používán pro označení vědy zabývající se sběrem informací o státu, počtu obyvatel, ekonomice apod.. Historický vývoj statistiky lze rozdělit do několika etap, z nichž právě nejstarší je popis státu, který spočíval v zobrazení daného zeměpisného, hospodářského a politického stavu. První zmínky o statistice se objevují už ve starověku. Nařízení o sčítání lidu za císaře Augusta, při němž měl být každý sčítán ve svém domovském místě nebylo ani první v říši římské, ani první, o kterém je zmínka v bibli - a už vůbec ne první v dějinách lidstva. Již v 6. století př. n. 1. pamatovala ústava krále Servia Tullia na periodické sčítání všech občanů pro jejich zařazení do příslušných daňových skupin. Také v Helladě bylo členění do cenzovních tříd zcela obvyklé. Sčítání lidu má v bibli tak významnou úlohu, že čtvrtá kniha Mojžíšova se jmenuje „Numeri", protože se v ní od samého začátku podrobně mluví o „přehlídce národa". Jsou v ní dokonce jména prvních 75 cenzovních úředníků, po jednom příslušníku dvanácti kmenů izraelských pod vedením Mojžíše a Arona. Ve středověku se statistické šetření omezuje pouze na soupisy majetku. Tak Karel Veliký nařídil přesné zjištění stavu královských domén a velkých soukromých statků. O 250 let později dal Vilém Dobyvatel sestavit „Domesday Book", knihu, kterou je možno označit za první pozemkový katastr v západních zemích. Politická aritmetika Na počátku 16. století se v Anglii začíná na příkaz lorda kancléře Thomase Cromwella soustavně zaznamenávat narození a úmrtí v církevních matrikách. Věk začínajícího merkantilismu a osvíceného absolutismu urychlil další zkoumání o struktuře obyvatelstva proto, že rychlý růst obyvatelstva byl pokládán za záruku vzkvétajícího hospodářství. Toto spojení teorie o státě, dříve hospodářské vědy a matematiky, je chrakteristické pro počátky dějin statistiky. Vysvětluje i označení „politická aritmetika". Poprvé ji použil anglický národní hospodář sir William Petry v práci „Pět esejů o politické aritmetice". Poněkud bližší obsahovou podobnost s dnešní statistikou je možné sledovat i v práci jiných politických aritmetiků. Například Angličan John Graunt se zabýval zkoumáním některých společenských jevů, zejména demografických a hospodářských. Na základě shromáždění a studia číselných dat objevil celou řadu pravidelností a provedl mnoho propočtů. Politická aritmetika vycházela z údajů o narozeních a úmrtích a na tomto základě se pokoušela srovnávat a pozorovat číselný vývoj obyvatelstva za delší časové úseky. Určitou příbuznost dnešní statistiky s politickou aritmetikou je možno spatřovat zvláště v používání číselných dat jako opěrného bodu při zkoumání společenských jevů. Světská a hospodářská aritmetika V následujících letech se tato politickoaritmetická statistika změnila na světskou statistiku. Matematici a teoretici nacházeli v běhu života lidské společnosti stále více zákonitostí. Co začalo jako velebení boha, se stalo početním příkladem ostrovtipných matematiků a astronomů. Vliv základních teoretických koncepcí pravděpodobnosti na statistiku se začal projevovat stále výrazněji. O rozšíření slova statistika se nejvíce zasloužil německý profesor Gottfried Achenwall, který ho užíval pro označení vědy o tzv. státních pozoruhodnostech, tj. o skutečnostech, určujících sílu tehdejších států. Šlo o slovní popis státního území, obyvatelstva, armády, zemědělství, obchodu apod., doprovázený číselnými údaji. Statistika byla tenkrát disciplínou blížící se spíše dnešní hospodářské geografii než současné statistice. Gottfried Achenwall, který byl prvním velkým teoretikem statistiky, se již v polovině 18. století výslovně odvolává na etymologický původ slova „status" jako „stav" a jako „stát". Statistika podle něj měla ukazovat skutečné pamětihodnosti měšťanské společnosti - tedy důležité zvláštnosti státu. Poslední zbytky této nejstarší podoby statistické vědy dnes nalézáme na prvních stránkách statistických ročenek řady států, kde se uvádí řada geografických údajů jako například délka hranic, počet ostrovů a jejich rozloha, nejvyšší hory a místa s nejnižší 76 nadmořskou výškou, délka toků řek, klimatické údaje apod. Jako první země na světě provádějí Spojené státy americké již od svého založení pravidelné sčítání lidu. První z těchto sčítání se konalo v roce 1790, rok po zvolení George Washingtona prezidentem Spojených států amerických. Mezitím byly také v kontinentální Evropě shromážděny podklady pro statistiku obyvatelstva. Poprvé ji vyhodnotil proslulý anglický astronom Edmond Halley v knize „Zjišťování stupňů pravděpodobnosti úmrtí lidí, sestavené podle tabulek narození a úmrtí města Vratislavi, spojené s pokusem zjistit výši pojistného pro životní pojištění". Za několik let později začala své vítězné tažení i úřední statistika. V roce 1741 byla ve Švédsku zřízena „tabulková komise", jejímž úkolem bylo sestavovat podklady pro statistiku obyvatelstva. Normální rozdělení Adolphe-Lambert Quételet, byl všestranný belgický vědec, který objevil normální rozdělení pro biometrii. Quételet, který se stal jedním ze zakladatelů Královské statistické společnosti v Londýně, byl hlavním povoláním astronom a statistikou se zabýval pouze ze záliby. Jeho vášeň však přecházela až do rozvernosti, když jednou prý spočítal celkovou váhu bruselského obyvatelstva. Quételet, který se často a tak přesně zabýval statistickými tabulkami, během studia zjistil, že překvapivě mnoho výsledků sčítání a měření vykazuje takové rozdělení četností, jaké je charakteristické pro „křivku chyb", která mu byla jako astronomovi dobře známa. Provedl proto mnohá měření na vlastní pěst, mezi nimi jako jedno z prvních proslulé měření obvodu prsou skotských vojáků. Na tomto základě dospěl k závěru, že nepřihlíží-li se k poměru mezi střední hodnotou a rozptylem, pak uspořádání četností vykazuje při těchto měřeních skutečně přesně stejnou strukturu, jaká je v tabulkách chyb měření - křivku normálního rozdělení. Quételet byl první, kdo mluvil o tomto rozdělení. Normální rozdělení podle Quételeta neznamenalo nic jiného než to, že se příroda snaží vytvořit ideální typ člověka, „homme moyen", avšak v různé míře chybuje. „Homme moyen" se může doslova přeložit jako průměrný nebo střední člověk. Je to vlastně ideální typ člověka, o který se příroda snaží, a který je v podstatě nereálný. Je to nejen matematicko-mystická bájná bytost, ale i důležitá základna pro celou budoucí statistiku, koncept normálního rozdělení, normální křivky, střední hodnoty a rozptylu. Karl Pearson, otec moderní statistiky, byl rovněž obdivovatelem normální křivky, ačkoliv znal i její nedostatky. Stanovil, že v přírodě jsou i nenormálně rozdělené veličiny, a také se pokusil vypracovat specifická schémata rozdělení pro tyto případy. Přitom však zjistil, že z mnohých, na první pohled nenormálních rozdělení se po pečlivém rozboru vyklubou spletence dvou i více normálních rozdělení. Vášnivé debaty o významu, oprávněnosti a nesmyslnosti normální křivky utichly až ve 20. století, i když úplně nevymizely. Přijímá se taková jaká je - jako cenná pomůcka statistické práce. Mezi nejoblíbenější vysvětlení normální křivky patří stále ještě Gaussovo. Ten říká, že nesčetné dílčí vlivy vyvolávají větší nebo menší odchylky od průměru, který všude nacházíme, a tato náhodná kombinace náhodných vlivů podléhá nakonec zákonům hazardní hry, pravidlům binomického rozdělení s téměř nekonečným počtem pokusů. 77 „Přesnost" statistiky Pro státovědnou statistiku 18. a 19. století měla pečlivá a přesná zjištění a úzkostlivě exaktní početní operace podstatný význam. Dnešní matematická statistika je naproti tomu převážně uměním určit, za jak nepřesné lze pokládat takové vypočtené údaje, jako je pravděpodobný výsledek, hypotéza či tvrzení. Počátky tohoto poznání sahají daleko do minulosti. Quételet již před více než 100 lety varoval před přehnaným přeludem přesnosti. Laici, statističtí amatéři vždy znovu podléhali pokušení předstírat přesnost výsledků, která je ve statistice prostě nedosažitelná. Není pochyb o tom, že statistická výpověď může být uvedena přesně až na destinná místa, ale skutečně dobré statistice někdy nebude chybět odkaz na to, jak velká je pravděpodobnost pro přibližnou správnost údajů. Jestliže statistik nechce říct „asi 1600", řekne: „s 95 % pravděpodobností ne méně než 1583 a ne více než 1631". Bylo by nesprávné jen statistice přisuzovat takové zdůrazňování pravděpodobnosti a poukazování na nepřesnosti. Zde se jen otevřeně vyslovuje to, co nechceme přiznat v denním životě, v běžném hovoru a často i ve vědě - totiž, že i naše „ano" i „ne" jsou zatížena často nejistotou a snad i zcela nepatrnou pochybností. Pro zjednodušení a také proto, abychom se vyhnuli nenapravitelnému zmatku, nevšímáme si zpravidla náhod, překvapení a vzniklých nepravděpodobností. Matematická statistika to však činí viditelným, vymezuje hranice pravděpodobnosti a za to platí zpochybněním přesnosti. Pravděpodobnost a náhoda Někdy se říká, že statistika je užitý počet pravděpodobnosti. Statistiku lze rozdělit na statistiku popisnou a induktivní. Popisná (deskriptívni) statistika se zabývá především tím, jak přehledně uspořádat nepřehledné množství údajů, jak vyjádřit jejich znaky a provést zjednodušení všude tam, kde se tím nezmenší její vypovídací schopnost. Až do 20. století se statistika pěstovala převážně v tomto smyslu jako popis veřejného života, politická aritmetika a matematická věda o státě. Stále více však nyní vystupuje do popředí zájmu induktivní statistika a statistická analýza. Ta sice také pracuje s měřením, sčítáním, šetřením, ale nemá k dispozici celkové soubory, často ani větší části těchto souborů. Opírá se o vzorky, které představují malé nebo někdy velmi malé podíly z daného základního souboru, jehož struktura a náplň mají být zjištěny a zobrazeny na základě výsledků získaných z výběrových vzorků. Pojmu „náhoda" byl přisuzován v různých historických obdobích vývoje lidské společnosti různý význam. V řecké filozofii se lze setkat s antropocentrickou koncepcí náhody jako něčeho co zasahuje do života a jednání člověka bez jeho přičinění. Reálná existence nahodilých jevů byla popírána. To, že se některé jevy a dílčí souvislosti j e ví jako nahodilé, bylo považováno za projev neznalosti skutečných příčin, skutečné podstaty. Tato interpretace nahodilého je typická i pro stanovisko materialistů 18. století. Idealističtí filosofové tvrdili, že nahodilé je to, u čeho nelze prokázat směřování k určitému cíli. Jediným pojmem „náhoda" bylo tedy v průběhu historie označováno několik rozdílných pojetí. Důsledky těchto skutečností se promítají i do současných představ o nahodilém. Pokus zachytit náhodné jevy matematicky učinili v 16. a 17. století Geronimo Cardano a Galileo Galilei. V 17. století 78 se již objevuje spojení pravděpodobnostních představ se statistikou. Matematickou teorii pravděpodobnosti rozvíjeli Carl Friedrich Gauss, Pierr Simon Lapiace a další vynikající matematikové 18. a 19. století. Jejich výsledky umožnili rozšířit pojetí pravděpodobnosti náhodného jevu na pojem náhodné veličiny. Axiomatický systém teorie pravděpodobnosti, z něhož se dnes vychází, dobudoval ve 30. letech tohoto století ruský matematik Andrej Nikolajevič Kolmogorov. Vynikající výsledky teorie pravděpodobnosti v průběhu posledních sta let patří ruským matematikům. Jejich práce bylo využito při budování matematické teorie statistiky rozvíjené anglosaskou školou. Statistika a hromadné jevy Před více než sto lety napsal německý vědec Gustav Růmelin, že existuje nejméně 63 definic pojmu „statistika". Od té doby jich přibylo daleko více, neboť v Růmelinově době ještě nenastala proměna, která úplně změnila strukturu statistiky. Nynější obsahový význam slova statistika je značně vzdálen od slovního popisu jevů, vztahujících se ke státu. Pro dnešní statistiku je totiž charakteristické číselné vyjadřování zkoumaných skutečností. Přitom se statistika nezabývá jednotlivými skutečnostmi izolovaně, ale zkoumá je v jejich celkovosti - zkoumá jevy hromadné. Kromě toho se neomezuje na pouhý číselný popis skutečností, ale provádí i jejich rozbor, zejména rozbor vzájemných souvislostí. Téměř celá statistická činnost v 19. století a na začátku 20. století je charakteristická tím, že se statistika zabývá hromadnými jevy. Pořizovala se šetření, která znamenala přesné zachycení veškerého obyvatelstva pomocí pečlivě připraveného sčítání lidu a pokud možno vyčerpávající záznamy o demografických a hospodářských jevech. Heslem bylo: čísla, stále více a stále úplnější. To byla statistika, jak šiji představuje laik ještě dnes. Moderní statistika Na přelomu století a zejména pak ve 30. letech našeho století přichází nová proměna ve vývoji statistiky. Zrodila se moderní statistika, analytická statistika a induktivní statistika. Je nutné zdůraznit podstatný rozdíl oproti dřívější statistice: jestliže dříve byla snaha namáhavou a nekonečnou prací zjistit každý jednotlivý detail, nyní se hledají metody, které by umožnily tvořit závěry o celku na základě výběru a dílčích šetření. Heslo moderní statistiky zní: výběr. Tato proměna způsobila úplný převrat ve statistické teorii a praxi. Matematika více než kdy jindy ovládla pole, a to nikoliv pomocí čtyř základních početních úkonů, které postačovaly pro státovědnou statistiku a ještě i pro statistiku hromadných vyčerpávajících šetření. Matematická statistika se vyvinula v samostatný vědní obor vyšší matematiky, s vlastními postupy, jako jsou analýza rozptylu, korelační počet a ověřování hypotéz s četnými pracovními metodami. Základy k tomuto vývoji položili na začátku 20. století Rusové Cebyšev a Markov. Brzy po tom se tato disciplína stala doménou Angloameričanů a v menší míře také Skandinávců. Převažující postavení Angloameričanů je především zásluhou velké osobnosti sira Ronalda A. Fischera, který sám nebo spolu s jinými vytvořil většinu dnes obvyklých 79 pracovních metod statistické analýzy, mezi které patří známý Fischerův F-test. K nej významnějším statistikům v angloamerické oblasti patří Karl Pearson a Američan Jerzy Neymann, který společně s Pearsonovým synem E. S. Pearsonem, rozvinul teorii výběru. Dnes se slova statistika používá nejméně ve dvou významech. Většina lidí si pod statistikou představuje číselné údaje o jakýchkoliv skutečnostech, popřípadě práci spojenou se získáváním číselných dat, tedy praktickou činnost, spočívající v jejich zaznamenávání, setříďování a shrnování. Již méně je těch, kterým je známo, že statistika je i určitou ucelenou teoretickou disciplínou, jejímž předmětem zkoumání je stav a vývoj číselně vyjádřitelných hromadných jevů. Běžná představa, která považuje za statistiku číselné údaje o jakýchkoliv, a tedy i o jednotlivých skutečnostech, není zcela správná. Záznamy (evidence) a zaznamenávání (evidování) jednotlivých skutečností jsou totiž pouze nezbytnými výchozími předpoklady statistické činnosti. Statistika se však zabývá hromadnými jevy, tj. jevy vyskytujícími se u celých kolektivů osob, zvířat, věcí, organizací, institucí, událostí apod.. Tento charakteristický rys vtiskl statistice Belgičan Adolphe Jacques Quételet. Po vydání jeho děl, v nichž je možno pozorovat snahu po postižení příčinných vztahů mezi hromadnými jevy, se statistika rozvíjela převážně jako věda o hromadných jevech. Pro statistiku je charakteristické číselné zkoumání hromadných jevů. To však neznamená, že by se statistika zajímala pouze o kvantitativní stránku hromadných jevů, pokud ji lze nějak převést na číselné vyjádření. Statistický popis V současnosti je možno statistikou rozumět jednak číselné údaje o hromadných jevech a jejich praktické opatřování, jednak teoretickou disciplínu, zabývající se metodami zkoumání stavu a vývoje kvantitativní stránky hromadných jevů. Statistika zkoumá jednak stav hromadných jevů, jednak jejich vývoj. Podle toho se člení na dvě části. První z nich, zkoumající stav hromadných jevů, můžeme nazvat statistickou statikou, druhou pak statistickou dynamikou. Při zkoumání stavu a vývoje hromadných jevů jde především o jejich popsání určitými zhušťujícími statistickými charakteristikami. Statistický popis se zdaleka neredukuje na pouhý popis. Jeho podstatnou složkou je statistický rozbor, směřující k poznání pravidelností, souvislostí a vývojové tendence hromadných jevů. Odkrytých pravidelností a poznaných souvislostí ve stavu i vývoji hromadných jevů se pak využívá k úsudkům z části na celek, z dílčího na obecné, k odhadům budoucího vývoje hromadných jevů. Tu část, která se zabývá usuzováním z části na celek, ze zvláštního na obecné, z dosavadního vývoje na další vývoj hromadných jevů, nazýváme statistickou indukcí. Statistika se dříve musela omezit na prostý empirický popis, dnes může posloužit při posuzování situací, protože byla vhodně rozvinuta její matematická základna. Moderní statistika klade ve své teoretické i praktické práci hlavně důraz na analýzu výběrových šetření. Proto je statistika dnes více než kdykoli jindy ve všech životních situacích a povoláních - od domácnosti až po světovou politiku - především pomocí při rozhodování. Je to vlastně soubor metod, který nám umožňuje činit rozumná rozhodnutí v případě nejistoty. Můžeme dnes říct, že moderní statistika tvoří základ teorie rozhodování. Je však nutné dodat, že starší způsoby statis- 80 tické práce nebyly ještě plně překonány a zatlačeny novými metodami a teoriemi, ale spíše přeformulovány a obohaceny. Statistický rozbor umožňuje například mnohem rozsáhlejší a z části dokonce přesnější odhady s menšími náklady než dřívější způsoby vyčerpávajících hromadných šetření. Dnešní statistika znamená mnohem víc. Stala se z ní rozvinutá vědecká metoda analýzy, která nachází široké uplatnění v podnikání a všech společenských a přírodních vědách. Metody matematické statistiky jsou dnes všeobecně uznávaným nástrojem vědeckého usuzování - zejména v procesu abstrakce a generalizace, při ověřování vhodnosti navrženého modelu reálné situace. Hranice jejich použitelnosti se neomezuje jen na některé obory, jsou to metody univerzální. Ukazuje se totiž, že při hledání obecných zákonitostí, jimiž se řídí studovaný jev, je třeba brát v úvahu elementy náhody. Ty jsou projevem vlivu všech faktorů, které nejsou v dané situaci jako podstatné kontrolovány. Základem celé moderní statistiky je počet pravděpodobnosti také proto, že dílčí výsledky výběrových šetření mají především poskytnout pomůcku pro budoucí jednání. Jde tedy vždy o odvození závěrů z dílčích poznatků, závěrů, které nesmějí nikdy být nesprávně chápány jako nesporné předpovědi, ale jako předpovědi, které jsou vždy obklopeny pojmy „pravděpodobnost", „obor spolehlivosti", „očekávaná hodnota", „rozptyl", „hypotéza" a „odhadovaná hodnota". Jednoznačně může být poznatelná nanejvýš minulost, nikdy budoucnost. Poznání (znalost) daného vzorku (výběrového souboru) však opravňuje k výpovědi o základním souboru, z něhož byl výběr proveden jen v přesně určených mezích. K tomu, aby se ze vzorků a podobných dílčích výsledků mohly odvodit závěry, jejichž vypovídací schopnost lze popsat, je nezbytné, aby výběr ze základního souboru byl proveden nahodile a nikoliv na podkladě záměrné volby. Jen v tomto případě je náhoda ponechána sama sobě, náhoda, kterou sice počet pravděpodobnosti dovede vymezit a podchytit, která je však falšována a křivena, jakmile se ji snažíme obejít subjektivně provedenou volbou. Z tohoto důvodu tvoří vždy úvod do studia statistiky studium počtu pravděpodobnosti a obráceně. Je velice obtížné vymezit přesnou hranici mezi počtem pravděpodobnosti a moderní statistikou. Neustále se objevují formulace, že statistika je jen aplikovaný počet pravděpodobnosti. Mezi statistikou a pravděpodobností však existuje velmi úzké sepětí. Propočet pravděpodobnosti, kvantitativní výpovědi o hypotézách, odhady a domněnky, to jsou dnes hlavní úkoly statistiky. Statistika a psychologie Matematicko-statistické metody se stále více užívají v dílčích psychologických šetřeních. Slouží zde dnes už nejen pro popisnou statistickou charakteristiku, ale užívá se jich i pro zachycení vztahu mezi jevy, například metodami korelační analýzy. Z hlediska rozvoje formalizace můžeme říct, že psychologie už přesáhla etapu počáteční kvantifikace a vkročila do etapy modelování vztahů. Hodnocení vývoje psychologie podle úrovně formalizace a matematizace nelze provádět odděleně od hodnocení podle úrovně analýzy. Klasifikace vztahů v empirických psychologických výzkumech bývá někdy příliš ovlivněna formálními hledisky. Většina tradičních psychologických výzkumů j e založena na zjišťování někdy i velmi značného počtu ukazatelů v souboru zkoumaných osob. 81 Například může jít o dotazník, baterii testů a podobně. Ty slouží pro sběr dat, jimiž se charakterizuje početný soubor sledovaných prvků. Při hledání vztahů se pak formuluje jeden či několik cílových ukazatelů a snahou výzkumníka je najít mezi ostatními ukazateli ty, které jsou k cílovým ukazatelům v co nejužším vztahu. Z hlediska statistiky se pak cílové ukazatele ztotožní se závisle proměnnou a ostatní s nezávisle proměnnou. Stanovením závisle a nezávisle proměnných je pak v takovém případě problém aplikace matematicko-statistických metod zdánlivě vyřešen. Můžeme říct, že jeho řešení je posunuto do formální oblasti. Hledá se pak jen vhodný aparát, který by uvedené vztahy číselně zachytil. Při takovém formálním přístupu a zjednodušeném příkladu termínů psychologie do termínů matematických však zůstává zcela stranou obecně metodologický aspekt, jaký druh vztahu je tímto způsobem zachycen. Ze statistického hlediska se považuje pro určení typu vztahu i charakter variability sledovaných hodnot. Za podstatné se považuje rozlišení variability na interindividuální a intraindividuální. Interindi-viduální synchronní vztah je značně vzdálen od představy kauzálního vztahu. Můžeme jej označit za statistickou synchronní koexistenci jevů. Předpokládejme, že daný soubor individuí představuje reprezentativní náhodný výběr z nějakého homogenního základního souboru individuí. Pak můžeme použít metod statistické indukce, abychom zjištěný vztah zobecnili i na subjekty, které jsme v daném souboru, tj. v daném reprezentativním výběru nezkoumali. Zde můžeme například stanovit interval spolehlivosti korelačního koeficientu, regresních koeficientů, střední chybu odhadu a podobně. Jedná se tedy o statistickou interindividuální indukci synchronního vztahu. Matematizace oblastí psychologie Pokud jde o počínající fázi matematizace některých oblastí psychologie, působí zde určité módní vlny v uplatňování specializovaných matematických a statistických metod. Za jeden z modelů aplikovatelných při uplatňování testů a psychodiagnostických metodik můžeme považovat psychometrickou teorii testů. Navíc i testy je nutné považovat za jeden z možných obecnějších metodologických přístupů. Přínos matematicko-statistické teorie testů lze vidět v precizaci pojmů z oblasti testů a ve stanovení jasných požadavků ve formě číselných charakteristik na kvalitu testů jako informačních zdrojů, jako obdoby metrologických norem ve fyzikálních měřeních. Naproti tomu samoúčelná matematická formalizace sama neumožní hlubší obsahové pochopení ani nezvýší využitelnost získaných informací pro společenskou potřebu. Dosavadní přístup k aplikaci matematicko-statistických metod na nějaký problém vychází převážně ze subjektivních zkušeností a do značné míry i z intuice toho, kdo aplikaci provádí. Existují sice i oblasti aplikací, které jsou už značně rozvinuté, některé se přibližují i úrovni mezioborové teorie se znaky celkové formalizace (například matematicko-statistická teorie testů). Na druhé straně jsou však oblasti, kde aplikace jsou spíše částečné povahy. Systémový pohled na tyto aplikace, zvláště druhé skupiny, by měl nejen přispět k celkové koncepci aplikací matematicko-statistických metod v psychologii a společensko-vědní sféře, zvláště pro využití k potřebám řízení. Tato koncepce může být i východiskem pro zpracování obecné teorie aplikace matematicko- 82 statistických metod. Každá aplikace těchto metod by měla být nejdříve formulována v rámci systémového pojetí a pak teprve uskutečněna. Systémová formulace může být základem obecného metodologického sjednocení aplikací matematicko-statistických metod jak v psychologickém, tak i ve společenskovědním výzkumu obecně. Mohou se ovšem vyskytnout i případy, kdy určitá aplikace je v daném výzkumném problému velmi přesně a velmi specificky vymezena psychologickou teorií. Vzhledem k univerzálnosti systémového přístupu je i v takových případech možné danou aplikaci zasadit do systémového pojetí na vhodné rozlišovací úrovni. Z typických statistických metod pro aplikace na okruh psychologických problémů se jedná především o tradiční vícerozměrné statistické metody, jako jsou mnohonásobné korelace a regrese, korelační analýza, komponentní a faktorová analýza. Kvantifikace psychologických dat Problematika zavádění psychologických dat úzce souvisí s teorií měření ve společenských vědách. V historickém pohledu na teorii měření ve společenských vědách první typologie druhů a škál vznikala ve vazbě na vhodný výběr statistických metod. Teorie měření by mezi své praktické vyústění pro psychologické výzkumy měla zařadit i doporučení týkající se vhodnosti použití různých druhů statistických metod a data získaná různými způsoby kvantifikace. Příslušná úroveň kvantifikace je vymezena stanovením typu škály pro danou proměnnou. Typ škály souvisí i s příslušnými transformacemi, jejichž provádění na daném typu škály má věcný empirický smysl. Teorii měření je třeba chápat jako prostředek napomáhající objektivizaci v určité společenskovědní oblasti, v daném případě k optimalizaci aplikací matematicko-statistických metod do empirických výzkumů v psychologické problematice. V psychometrii padesátých let vzniklo hnutí fundamentalistů, kteří se zabývali důsledky teorie měření pro aplikaci statistických metod do psychologie. Za fundamentální mělo být uznáno jen takové měření, kde aditivnost jednotek je stanovitelná pouze zrakem nebo hmatem. Jen taková škála by byla intervalová a umožňovala by operaci sčítání, a tedy i výpočet statistických charakteristik jako průměr, rozptyl atd. Protože i ve fyzikálním měření splňuje takové požadavky v podstatě jen měření délky a hmotnosti, byly tyto přístupy kritizovány. Nicméně toto období vedlo ke kritice kvantifikace ve společenských vědách. To mělo za následek značné rozšíření neparametrických statistických metod v padesátých letech a do určité míry podnítilo i práci statistiků v této oblasti. Vznik formalizovaných teorií měření byl jednou z reakcí na toto období. Matematická statistika a teorie pravděpodobnosti jsou formální a abstraktní obory, i když historicky vznikly v daleko užší vazbě na empirické výzkumy v psychologii než jiné obory matematiky. Některé oblasti matematické statistiky byly bud' simulovány, nebo dokonce vytvořeny pro potřeby psychologie. 83 Psychologická proměnná V současnosti patří matematický pojem náhodná proměnná k základům matematické statistiky. Z hlediska empirických psychologických výzkumů je však třeba jej vidět jako formální model pro psychologickou empirickou vlastnost. Často se hovoří už přímo jen o psychologických proměnných. V metodologicky fundované teorii se psychologické proměnné dělí na osobní, situační a intervenující proměnné. V aplikované statistice se hovoří o rozdělení proměnných nebo také statistických znaků na kvantitativní a kvalitativní-jakoby pojem statistického znaku ležel někde mezi empirickou vlastností a matematickou náhodnou proměnnou. Když v psychologickém výzkumu získáváme data, pak, abychom na ně mohli aplikovat matematicko statistické metody, musíme vyjít z předpokladu, že tato data vznikla realizací náhodné proměnné. Nestačí předpokládat, že je vymezena korespondence empirické jevy - data, ale je nutné předpokládat, že je vymezena i korespondence empirické jevy - realizace náhodné proměnné. Náhodnou proměnnou v psychologické koncepci proměnné můžeme realizovat nominální náhodnou proměnnou, ordinální náhodnou proměnnou veličinou nebo intervalovou - kvantitativní, metrickou - náhodnou proměnnou veličinou. Tyto uvedené tři typy dat vznikají jako realizace náhodné proměnné příslušného typu. Klasifikaci empirických relací v psychologických datech rozpracoval C. H. Coombs, přední představitel matematické psychologie. Tato klasifikace je známá v matematické psychologii jako tzv. teorie dat. Coombsova klasifikace je obecná, vznikala však se zaměřením na metody psychologické diagnostiky a psychofyzikálního měření, kde se už tradičně rozlišovaly dva přístupy. První byla takzvaná metoda jednoho podnětu, druhá byla metoda více podnětů. U metody jednoho podnětu je osoba vystavena standardní situaci - úkolu, jako podnětu, v němž se hodnotí její určitá vlastnost vzhledem k podmínkám situace jako reakce. Například osobě se zadá senzomotorický úkol. Výsledek vyjadřuje vzájemný vztah vlastnosti - schopnosti osoby a podmínek - obtížnosti úkolu. U metod s více podněty se zjišťuje preference jednotlivých podnětů nebo osoba provádí vzájemné srovnávání dvou popřípadě i více podnětů téhož druhu a určuje, který podnět je silnější, nebo se hodnotí vzájemná podobnost několika podnětů téhož druhu. V rámci metody s více podněty se preferenční a podobnostní hodnocení souhrnně označují jako metoda výběru, kterou charakterizuje relace proximity. Data vyjadřující proximitní relaci označujeme jako relativní, protože informace o daném podnětu je relativní vzhledem k ostatním podnětům v dané množině. Data vyjadřující relaci dominance se označují jako irelativní nebo absolutní. Vyjadřují informaci o jednom podnětu nebo o dvojici podnětů nezávisle na ostatních podnětech. Výzkumné a diagnostické metody v psychologii Výzkumné a diagnostické metody v psychologii by měly být konstruovány tak, aby bylo jasné, jaký typ relace vyjadřují data, získaná při jejich použití. Pokud není jasné, jaký typ relací je reprezentován danými daty, není možné provést jejich adekvátní statistickou analýzu. V psychologické diagnostice je obvykle záměrem stanovit úroveň některých obecných - globálně generických vlastností, mezi které patří například 84 schopnosti, postoje, rozvoj osobnosti atd. Užší pojetí zjišťování generických psychologických vlastností pomocí psychodiagnostických metodik se může označit jako testování schopností. Z hlediska obecné metodologie jsou chápány schopnosti jako teoretické, popřípadě dispoziční vlastnosti. Naproti tomu vlastnosti diagnostikované pomocí testů můžeme chápat jako empirické. Testy pak považujeme za diagnostické metodiky, které umožňují kvantifikaci či alespoň numerizaci uvedených empirických vlastností a tedy jejich reprezentaci jako proměnných v širším smyslu. Z hlediska teorií měření můžeme testování schopností považovat za měření na základě konvence, popřípadě za asociační měření, kde testy slouží jako empirické indikátory teoretické vlastnosti - schopnosti. Hranice mezi měřením na základě konvence a měřením asociačním nemusí být zcela ostrá, je to dáno vymezením zákonitých vztahů mezi indikující a indikovanou proměnnou. K vyjádření těchto vztahů mohou přispět matematicko-statistické modely se skrytými proměnnými jako například faktorová analýza. Nejstarší a nejvýznamnější z nich je model s jednou skrytou proměnnou pro stanovení úrovně schopnosti pomocí testů - tzv. klasický model teorie testů. Testovací schopností je tedy podle definice metrická reprezentace nepřímo pozorovatelné úrovně schopností pomocí reálných čísel za použití matematických vztahů některého statistického modelu se skrytými (latentními) proměnnými, zvoleného podle teoretických poznatků příslušné teorie schopností, aplikovaného na testové výsledky tří nebo více testů podle zvoleného modelu. Je-li jedním ze základních cílů psychologického výzkumu poznání zákonitostí, a to především kauzálních - využitelných pro potřeby řízení, pak aplikace statistických metod do psychologie může podstatně přispět k plnění jejího podílu při realizaci sociálně formativní úlohy všech společenských věd. Obecně metodologickým cílem těchto aplikací v psychologii, kde podíl pravděpodobnostní složky je výrazný, je identifikace zákonitých statistických vztahů a jejich forem. Úloha statistických metod je přitom bud' exploratorní - objevující, nebo verifikační - tam, kde vyšší úroveň poznatků umožňuje přesné hypotézy. Tak se přispívá ke zvýšení úrovně formalizace psychologie, k precizaci jejího teoretického aparátu, a tím i k plnění explanační funkce psychologické teorie. Použitá literatura Helmut Swoboda - Moderní statistika, Nakladatelství Svoboda, Praha 1977 Petr Blahuš - K metodologii použití statistických metod v psychologii, Akadémia Praha, 1988 V. I. Mereste - Struktura statistické vědy a postavení statistiky mezi ostatními vědami ve světle nových poznatků obecné systematické teorie a metavědy Statistická revue 5 - sborník, Praha 1977 I. Cyhelský, I. Novák - Statistika, SNTL Praha 1967 S. Komenda, J. Klementa - Analýza náhodného v pedagogickém experimentu a praxi SPN, Praha 1981 85 Survey of the historical evolution of statistics, its meaning today and their advantage in psychology Summary This article reviews the history of statistics divided into several stages. The first references about the statistics come from the Romans due to their concern about the census (addition of people). In the Middle Ages the statistical inspection was reduced to the registration of possesion and then, in the 16th century the political statistics appeared to be come the basic of the recent world statistics. Next chapter talks about A. L. Quetelet, who was the first one to describe the normal distribution curve. Statistics closely relates to the concepts of probability and deals with coincidence. Analytic and inductive statistics are in the basis of the contemporary statistics. Also, the mathematic statistics as independent scientific approach with its own methods is in common use in sociology, psychology and other social disciplines. Some parts of mathematic statistics were developed just for special needs in psychology as factor analysis. 86