BPM.STAE: Sbírka úloh - cvičení 12, kapitola 11 Příklad 1 Farmaceutická společnost chce zjistit, zda má barva obalu vliv na prodej. K tomu účelu použila pět různých barev (modrá, zelená, oranžová, červená a žlutá) pro obaly volně prodejných léků proti bolesti místo tradiční bílé barvy. Následující tabulka ukazuje počet prodaných balení každé barvy během prvního měsíce. Otestujte na hladině významnosti 1 % nulovou hypotézu, že počet prodaných balení v každé z těchto pěti barev je stejný Barva obalu Modrá Zelená Oranžová Červená Žlutá Počet prodaných balení 340 246 295 189 284 Příklad 2 Během posledních 3 let supermarket Art pozoroval následující distribuci platebních metod na pokladních frontách: hotovost (H) 41 %, šek (S) 24 %, kreditní nebo debetní karta (K) 26 % a ostatní (O) 9 %. Ve snaze zefektivnit rychlou pokladnu, Art právě zahájil nabídku 1% slevy za platbu v hotovosti na pokladní frontě. Následující tabulka uvádí rozdělení četností platebních metod pro náhodný vzorek 600 zákazníků po zavedení této slevy. Na hladině významnosti 1 % otestujte, zda se rozdělení četnosti platebních metod na rychlé pokladně změnilo po zavedení slevy. Způsob platby H S K O Počet zákazníků 265 129 136 70 Příklad 3 Společnost Home Mail Corporation prodává produkty poštou. Vedení společnosti chce zjistit, zda je počet objednávek, které přijdou do kanceláře společnosti v každý z 5 dnů v týdnu, stejný. Společnost provedla vzorek 400 objednávek, které byly přijaty během 4týdenního období. Následující tabulka obsahuje rozdělení četností těchto objednávek podle dne v týdnu. Otestujte na hladině významnosti 5 %, zda je nulová hypotéza, že objednávky jsou rovnoměrně distribuovány přes všechny dny v týdnu, pravdivá. Den v týdnu Po Ut St Ct Pá Počet přijatých objednávek 98 68 52 86 96 Příklad 4 Ze všech studentů zapsaných na univerzitě je 19 % čtvrťáků, 23 % třeťáků, 27 % druháků a 31 % prváků. Vzorek 200 studentů, který byl vybrán senátem studentů k provedení průzkumu na této univerzitě, zahrnuje 50 čtvrťáků, 46 třeťáků, 55 druháků a 49 prváků. Využívajíce hladiny významnosti 2.5 %, otestujte nulovou hypotézu, že tento vzorek je náhodným výběrem. (Nápověda: Tento vzorek bude náhodným výběrem, pokud obsahuje přibližně 19 % čtvrťáků, 23 % třeťáků, 27 % druháků a 31 % prváků.) Příklad 5 Anketa Shopping on the Job z roku 2016 se zaměřovala na zaměstnance a tázala se: "Kolik celkového času si myslíte, že průměrný zaměstnanec ve vaší firmě tráví nakupováním online pomocí pracovního počítače nebo chytrého telefonu, během vánoční sezóny (listopad a prosinec)?"Mezi odpovídajícími uvedlo 3 %, že 0 hodin, 24 % uvedlo 1 až 2 hodiny, 22 % uvedlo 3 až 5 hodin a 51 % uvedlo 6 a více hodin. Předpokládejme, že nedávný průzkum položil stejnou otázku 215 náhodně vybraným výkonným pracovníkům, což vyprodukovalo četnosti uvedené v následující tabulce. Otestujte na hladině významnosti 2.5 %, zda se rozdělení odpovědí z průzkumu výkonných pracovníků liší od distribuce z průzkumu zaměstnanců v říjnu 2016. Odpověď/Kategorie 0 hodin 1-2 hodiny 3-5 hodin 6 nebo více hodin Četnost 2 41 55 117 1 Příklad 6 Sevřete své ruce dohromady. Který palec je nahoře? Věřte nebo ne, palec, který dáte nahoru, je určen geneticky. Pokud má jeden z vašich rodičů gen, který vám říká, abyste dávali levý palec nahoru, a předá vám ho, dáte levý palec nahoru. Gen levého palce je nazýván dominantním genem, což znamená, že pokud vám ho předá jeden z rodičů, budete také mít tuto vlastnost. Pokud dáváte pravý palec nahoru, obdrželi jste recesivní gen od obou rodičů. Pokud oba rodiče mají jak gen levého, tak pravého palce (označeno jako Lr), mendelovská genetika poskytuje pravděpodobnosti uvedené v následující tabulce o genech dětí. Zdroj: http://humangenetics.suitel01.com/article.cfm/dominantJiuman_genetic_traits Geny dítěte LL (gen levého palce) Lr (gen levého palce, ale také získán gen pravého palce) rr (gen pravého palce) Pravděpodobnost 0.25 0.50 0.25 Předpokládejme, že náhodný vzorek 65 dětí, jejichž oba rodiče měli geny Lr, byl testován na tyto geny. Následující tabulka uvádí výsledky tohoto experimentu. Otestujte na hladině významnosti 5 %, zda jsou geny získané vzorkem dětí signifikantně odlišné od předpovědí mendelovské genetiky. Geny dítěte LL Lr rr Četnost 14 31 20 Příklad 7 Mnoho studentů v USA ukončuje vysokou školu s vysokým dluhem ze studentských půjček, dluhů na kreditní kartě a podobně. Sociolog provedl náhodný vzorek 401 svobodných osob, rozdělil je podle pohlaví a zeptal se: „Zvažoval(a) byste sňatek s někým, kdo má dluh ve výši $25,000 nebo více?" Výsledky této ankety jsou uvedeny v následující tabulce. Otestujte na hladině významnosti 1 %, zda existuje vztah mezi pohlavím a odpověďmi. Ano Ne Nevím Zeny 130 59 18 Muži 96 82 16 Příklad 8 Televizní soutěž Deal or No Deal zahrnuje sérii příležitostí pro soutěžícího buď přijmout částku peněz od bankéře pořadu nebo ji odmítnout a otevřít určitý počet kufříků s nadějí odhalit a tím eliminovat nízké částky peněz ze hry. To by vedlo bankéře k navýšení následující nabídky. Předpokládejme, že bylo náhodně vybráno 700 lidí ve věku 21 let a starších. Každý z nich sledoval jeden díl pořadu, dokud nezůstaly přesně čtyři neotevřené kufříky. Částky peněz v těchto čtyřech kufřících byly 750 $, 5000 $, 50 000 $ a 400 000 $, v tomto pořadí. Nabídka bankéře soutěžícímu byla 81 600 $, pokud by soutěžící zastavil hru a přijal nabídku. Pokud by soutěžící nabídku odmítl, vybral by si jeden z těchto čtyř kufříků k otevření, a poté by byla učiněna nová nabídka. Všech 700 osob bylo dotázáno, zda by přijali nabídku (Deal) 81 600 $ nebo ji odmítli (No Deal), a také byl zjištěn jejich věk. Odpovědi těchto 700 osob jsou uvedeny v následující tabulce. Otestujte na hladině významnosti 5 %, zda jsou rozhodnutí přijmout nebo nepřijmout nabídku (Deal nebo No Deal) a věková skupina závislá. Věková skupina (léta) 21-29 30-39 40-49 50-59 60 a více Deal 78 82 89 92 63 No Deal 56 70 60 63 47 Příklad 9 Během nedávné ekonomické recese se mnoho rodin setkalo s finančními obtížemi. Některé studie pozorovaly, že více lidí přestalo kupovat produkty známých značek a začalo nakupovat levnější výrobky vlastních značek. Data získaná z 2 nedávného vzorku 700 dospělých, zda obvykle kupují výrobky vlastních značek nebo značkové produkty, jsou zaznamenána v následující tabulce. Můžete na hladině významnosti 1 % zamítnout nulovou hypotézu, že atributy pohlaví a nákup výrobků značkové nebo vlastní značky, jsou nezávislé? Častěji kupují Značkové Vlastní značky Muži Zeny 150 160 165 225 Příklad 10 Sto řidičů, kteří byli policií zastaveni kvůli nějakému přestupku, bylo také kontrolováno, zda mají zapnuté bezpečnostní pásy. Následující tabulka obsahuje výsledky této studie. Otestujte na hladině významnosti 2.5 %, zda jsou pohlaví a zapnutí bezpečnostního pásu vzájemně provázány. Měli zapnutý pás Neměli zapnutý pás Muži Zeny 35 33 20 12 Příklad 11 Národní elektronická společnost nakupuje součástky od dvou dceřiných společností. Oddělení kontrola kvality této společnosti chtělo zkontrolovat, zda je distribuce dobrých a vadných součástí stejná pro dodávky součástí od obou dceřiných společností. Kontrolor kvality vybral vzorek 300 součástek od Dceřiné společnosti A a vzorek 400 součástek od Dceřiné společnosti B. Tyto součástky byly kontrolovány, zda jsou dobré nebo vadné. Následující tabulka zaznamenává výsledky této analýzy. Otestujte na hladině významnosti 5 % nulovou hypotézu, že distribuce dobrých a vadných součástí jsou stejné pro obě dceřiné společnosti. Dceřinná společnost A Dceřinná společnost B Dobré Vadné 286 14 379 21 Příklad 12 Průzkum veřejného mínění se ptal: „Která z následujících možností se nejvíce blíží vašemu názoru na to, jak by měla vládní politika vůči nelegálním přistěhovalcům v současné době vypadat ve Spojených státech?" Tři možnosti byly (A) Poslat všechny nelegální přistěhovalce zpět do jejich domovské země, (B) Zřídit program pro hostující pracovníky, který umožní přistěhovalcům zůstat ve Spojených státech a pracovat, ale pouze po omezenou dobu, a (C) Umožnit nelegálním přistěhovalcům zůstat v zemi a postupně získat občanství USA, ale pouze pokud splní určité požadavky, jako je zaplacení daní, naučení se anglicky a úspěšné absolvování bezpečnostní prověrky. Následující tabulka uvádí stranickou příslušnost respondentů a jejich odpovědi. Čísla v tabulce jsou přibližně stejná jako uváděná v procentech v průzkumu. Otestujte na hladině významnosti 5 %, zda jsou distribuce odpovědí signifikantně odlišné pro alespoň dvě politické příslušnosti. A B C Nevím Demokrat 55 43 288 8 Nezávislý 19 25 107 6 Republikán 86 52 196 7 Příklad 13 Následující tabulka udává rozdělení známek pro tři profesory ve vybraných náhodných kurzech, které každý z nich vyučoval během posledních 2 let. Otestujte na hladině významnosti 2.5 % nulovou hypotézu, že distribuce známek se neliší pro tyto tři profesory. 3 Profesor Miller Smith Moore A 16 36 24 Známka B 25 44 12 C 85 81 82 D a F 20 12 8 Příklad 14 Lesní úředník porovnává příčiny lesních požárů ve dvou oblastech, A a B. Následující tabulka ukazuje příčiny požárů pro 79 náhodně vybraných nedávných požárů v těchto dvou oblastech. Otestujte na hladině významnosti 5 %, zda jsou příčiny požárů a regiony požárů vzájemně provázány. Úmyslně Nehoda Blesk Neznámá Oblast A 8 9 7 12 Oblast B 7 18 12 6 Příklad 15 Výrobci směsi na lívance Flippin' Out tvrdí, že jeden šálek jejich směsi obsahuje 11 gramů cukru. Nicméně směs není jednotná, a tak se množství cukru liší šálek od šálku. Z každé z 24 náhodně vybraných krabic byl vybrán jeden šálek směsi. Výběrový rozptyl měření cukru z těchto 24 šálků byl 1,47 gramu. Předpokládejte, že rozdělení obsahu cukru je přibližně normální. a. Sestrojte 98% intervaly spolehlivosti pro rozptyl a směrodatnou odchylku populace. b. Otestujte na hladině významnosti 1 %, zdaje rozptyl obsahu cukru na šálek větší než 1,0 gramu. Příklad 16 Automobilová výrobní společnost chce odhadnout rozptyl počtu mil na galon pro svůj automobilový model AST727. Náhodný vzorek 24 vozidel tohoto modelu ukázal, že rozptyl počtu mil na galon pro tato vozidla je 0,64. Předpokládejte, že počet mil na galon pro všechna taková vozidla je (přibližně) normálně rozdělen. a. Sestrojte 95% intervaly spolehlivosti pro rozptyl a směrodatnou odchylku populace. b. Otestujte na hladině významnosti 1%, zda ukazatel vzorku naznačuje, že rozptyl populace se liší od 0,30. Příklad 17 Níže jsou ceny (v dolarech) stejné značky videokamer v osmi obchodech v Los Angeles. 568 628 602 642 550 688 615 604 a. Pomocí vzorce z kapitoly 3 najděte výběrový rozptyl s2 pro tato data. b. Sestrojte 95% intervaly spolehlivosti pro rozptyl a směrodatnou odchylku populace. Předpokládejte, že ceny této videokamery ve všech obchodech v Los Angeles pochází z normálního rozdělení. c. Otestujte na hladině významnosti 5 %, zda se rozptyl populace liší od 750 dolarů2. 4 Příklad 18 Předpokládejte, že máte dvourozměrnou tabulku s následujícími celkovými hodnotami pro řádky a sloupce. Pozorované hodnoty v buňkách musí být čísla, která jsou celá a nezáporná. Vypočítejte očekávané hodnoty pro buňky za předpokladu, že proměnné jsou nezávislé. Na základě vašich výpočtů vysvětlete, proč není možné, aby testovací statistika měla hodnotu nula. Proměnná 1 A B C Součet X 120 Proměnná 2 Y 205 Z 175 Součet 165 140 195 500 Příklad 19 Byl vybrán náhodný vzorek 100 osob z každého ze čtyř regionů ve Spojených státech. Těmto lidem byla položena otázka, zda podporují určitý program dotací pro farmy. Výsledky průzkumu jsou shrnuty v následující tabulce. Vysvětlete, proč je test hypotéz testem homogenity spíše než testem nezávislosti. Jaká vlastnost dat by se změnila, pokud byste shromažďovali data k testování nezávislosti? Podporuji Nepodporuji Nejistý Northeast 56 33 11 Midwest 73 23 4 South 67 28 5 West 59 35 6 Příklad 20 Provádíte test dobré shody se čtyřmi kategoriemi, z nichž každá by měla mít stejnou pravděpodobnost. Celkový počet pozorování je 100. Pozorované frekvence jsou 21, 26, 31 a 22 pro jednotlivé čtyři kategorie. a. Ukažte, že byste pro tato data nezadmítli nulovou hypotézu pro jakoukoli rozumnou hladinu významnosti. b. Součet absolutních rozdílů (mezi očekávanými a pozorovanými četnostmi) pro tato data je 14 (tj. 4+1+6+3=14). Je možné mít různé pozorované četnosti tak, aby součet byl 14 a získali jste p-hodnotu 0,10 nebo nižší? Příklad 21 Shromáždili jste data o proměnné a chcete zjistit, zda je normální rozdělení rozumným modelem pro tato data. Následující tabulka ukazuje, kolik hodnot spadá do určitých rozsahů z-hodnot pro tato data. Proveďte test hypotézy, abyste zjistili, zdaje normální rozdělení vhodným modelem pro tato data. Použijte hladinu významnosti 5 %. Kategorie Počet z-hodnota pod 2 48 z- hodnota od 2 do méně než 1.5 67 z- hodnota od 1.5 do méně než 1 146 z- hodnota od 1 do méně než 0.5 248 z- hodnota od 0.5 do méně než 0 187 z- hodnota od 0 do méně než 0.5 125 z- hodnota od 0.5 do méně než 1 88 z- hodnota od 1 do méně než 1.5 47 z- hodnota od 1.5 do méně než 2 25 z-hodnota 2 nebo více 19 Celkem 1000 5