Příklady k řešení - prázdné tabulky na doplnění (ZS 2014) rough draft version Genetika kvantitativních znaků Příklady k řešení 1. ročník navazujícího Mgr. oboru Živočišné biotechnologie 3 Praktické příklady odhadů genetických parametrů kvantitativních vlastností......................38 3.1 Výpočty odhadu koeficientu dědivosti.....................................................................................38 3.2 Výpočet odhadu koeficientu opakovatelnosti.....................................................................53 3.3 Příklady výpočtu odhadu genetických korelací.................................................................56 Pozn.: Zde naleznete základní typy příkladů, které jsou k řešení (správnost si můžete ověřit podle výsledku výpočtu ze statistického programu SAS, popř.je výsledek uveden). Výsledky konzultujte mezi sebou -nejlepší kontrola! - stupně volnosti jsou označeny písmenem ř(popř. df, pokud se jedná o výstup z programu SAS) Doc. Inq. Tomáš Urban, Ph.D \^ Pracoviště genetiky ÚMFGZ AF MENDELU /j http://user.mendelu.cz/urban/ V/ 37 Příklady k řešení - prázdné tabulky na doplnění (ZS 2014) 3 Praktické příklady odhadů genetických parametrů kvantitativních vlastností 3.1 Výpočty odhadu koeficientu dědivosti Kategorie metod: I. regrese potomek - rodič: h = 2.bp r II. regrese potomek - střední hodnota rodičů: h = bpír III. analýza variance příbuzných jedinců s výpočtem korelace polosourozenců či úplných sourozenců IV. neparametrické metody V. realizovaný koeficient dědivosti h2 = 3.1.1 Výpočet odhadu koeficientu dědivosti pomocí prosté regrese potomek - rodič lze využít v případě, když otci byli pářeni s několika matkami a každá z matek měla jednoho potomka. Předpokládáme, že populace není inbrední a je náhodně pářena. Model statistický: Zi = 0Xi + ti střední hodnota potomka i-tého otce P - regrese Z na X Xi - pozorovaná hodnota u i-tého otce e; - náhodná chyba spojená s Zi Model genetický: covxz = Ví Va + Vi Vaa +1/8 Vaaa a) Ve velké neinbrední populaci slepic byla zjišťována ve věku osmi týdnů živá hmotnost kohoutů s přesností najeden gram. V pohlavní dospělosti bylo 17 kohoutků náhodně pářeno se slepicemi a u jejich potomků samčího pohlaví byla opět zjišťována živá hmotnost ve stejném věku. Zjišťovaný genetický parametr, koeficient dědivosti, se bude vztahovat na populaci otců. Živé hmotnosti otců a jejich potomků jsou v následující tabulce: n Xi Zi Xl2 Zl2 Xi . Zi 1 601 910 361201 828100 546910 2 733 983 537289 966289 720539 3 793 976 628849 952576 773968 4 795 1050 632025 1102500 834750 5 818 1080 669124 1166400 883440 6 838 1040 702244 1081600 871520 7 854 1040 729316 1081600 888160 8 880 1025 774400 1050625 902000 9 882 994 777924 988036 876708 10 895 1030 801025 1060900 921850 11 952 1021 906304 1042441 971992 12 953 1078 908209 1162084 1027334 13 961 964 923521 929296 926404 14 979 976 958441 952576 955504 15 995 1110 990025 1232100 1104450 16 997 1041 994009 1083681 1037877 17 1040 1035 1081600 1071225 1076400 I 14966 17353 13375506 17752029 15319806 • varx je variance nezávisle proměnné (u otců) 38 Příklady k řešení - prázdné tabulky na doplnění (ZS 2014) Výpočet vstupních hodnot regresního stavu: ss^ =Xxí-zí-x* z* = i n ssx=2>f- i ssz=2>f- i Zxi-zi X n t2 X. z. Z2 X. *i-- i n h2=2.bzx = Střední chyba: SS, (ssj2 SS. (n-2) SS, (ssxz)2 ss„ SSx.(n-2) h2 ±seh2 = ± Zjištěný odhad koeficientu dědivosti živé hmotnosti kohoutků ve věku osmi týdnů za pomoci prosté regrese otec - syn byl svou hodnotou.............A jeho střední chyba byla............. v důsledku sledování...................................................................otec - syn. Následuje výsledek této regresní analýzy (variance a kovariance), který byl získán v programu SAS. The REG Proceduře Dependent Variable: y Analysis of Variance Source Model Error Corrected Total DF 1 15 16 Sum of Squares 9256.15665 29443 38699 Mean Square 9256.15665 1962.86015 F Value Pr > F 4.72 0.0463 Root MSE 44.30418 R-Square 0.2392 Dependent Mean 1020.76471 Adj R-Sq 0.1885 Coeff Var 4.34029 Parameter Estimates Parameter Standard Variable DF Estimate Error t Value Pr > |t| Intercept 1 831.44274 87.84239 9.47 <.0001 x 1 0.21505 0.09903 2.17 0.0463 39 Příklady k řešení - prázdné tabulky na doplnění (ZS 2014) b) U některých druhů hospodářských zvířat může být otec připařován na několik matek a každá matka může mít několik potomků. Vliv otců může být odstraněn na základě výpočtu regrese potomků na matku uvnitř otců podle modelu: Model' Zij - OCi = |J, + |3(Xij - x..) + ei ^ti - střední hodnota potomků z páření i-tého otce a j-té matky ocí - vliv i-tého otce (x - obecný střed populace P - regrese Z na X Xíj - pozorovaná hodnota j-té matky pářené s i-tým otcem x..- fenotypový průměr e; - náhodná chyba spojená s zy (odchylka od zy) Tabulka analýzy variance a kovariance: Zdroj proměnlivosti Součet čtverců odchylek SSx SSz Stupeň volnosti Průměrný čtverec MSx MSz Součet Střední produktů xz produkt xz SP MP Mezi otci SSSx Mezi matkami uvnitř otců Celková SScx SSsz fs = S-l tato data nejsou třeba k výpočtům SSdx SSdz fd = d-s MSdx MSdz SPdxz MPdx SScz fc=d-l s - počet otců (sire), d - počet matek (dam), S - součet čtverců, MS - střední čtverec, SP - součet produktů, MP - střední produkt SP, cov, MP, Odhad dvojnásobku genetické kovariance podle matek a dcer uvnitř otců: 2 cov dzx = Va + V2 Vaa + Vi Vaaa + Vm (maternální efekty) + efekty vázané na pohlaví Odhad regrese a dědivosti mezi matkami a dcerami uvnitř otců: cov, MP, var, d-s d-s SP, 2.b Odhad střední chyby koeficientu regrese a dědivosti: (SPdzxľ Sbzx ~' d-s-1 se. Př. Šest kohoutů bylo připařováno k různému počtu matek a v osmi týdnech byla sledována živá hmotnost u potomků - slepiček. Hmotnost matek v osmi týdnech věku a průměrná hmotnost slepiček jsou uvedeny v tabulce. Jaké jsou genetické variance, kovariance a koeficient dědivosti, které se vztahují k populaci, ze které byly vybrány matky. 40 Příklady k řešení - prázdné tabulky na doplnění (ZS 2014) Otcové Matky xy Potomci Zij s*. ni 4 4 Xij . Zy 1 754 808 568516 652864 609232 1 648 700 2283 2228 3 419904 490000 453600 1 881 720 776161 518400 634320 2 740 725 547600 525625 536500 2 712 840 2264 2365 3 506944 705600 598080 2 812 800 659344 640000 649600 3 3 765 807 780 840 1572 1620 2 585225 651249 608400 705600 596700 677880 4 969 850 938961 722500 823650 4 849 802 2550 2482 3 720801 643204 680898 4 732 830 535824 688900 607560 5 5 740 741 806 835 1481 1641 2 547600 549081 649636 697225 596440 618735 6 831 830 690561 688900 689730 6 639 800 2203 2134 3 408321 640000 511200 6 733 504 537289 254016 369432 S 12353 12470 16 9643381 9830870 9653557 Analýza variance pro záznamy Mezi otci y X,. matek (výpočet součtu čtverců odchylek pro vlastnost X): Xi Mezi matkami uvnitř otců 9 563 436 - X Analýza variance pro záznamy dcer (výpočet součtu čtverců odchylek pro vlastnost Z): Mezi otci ^ Z2 Z2 72 "4" n, " Mezi _VV matkami SSdz-ZJžJz uvnitř otců i-2 Analýza kovariance (výpočet součtu produktů (součinů) vlastností X a Z): Mezi otci X Z SP = > —-—— - korekční koeficient = SZX i—t „ 1 n! = 9 645 542,50 - korek. koef. = není třeba dopočítat1 Mezi matkám „ „ Xi# Zi# uvnitř otců SPdzx = 2^ Z- x«' zu ~ Žj ZT i j 1 Tato hodnota není třeba pro další výpočty! 41 Příklady k řešení - prázdné tabulky na doplnění (ZS 2014) Výpočet odhadu kovariance mezi matkami a dcerami uvnitř otců: covd 2 cov MP, SP, d-s dz Výpočet odhadu koeficientu dědivosti na základě regresního koeficientu mezi matkami a dcerami uvnitř otců: SR zx SSd h2=2.b„ = Střední chyba koeficientu dědivosti: ssd- (SPdJ2 ss se d-s-1 1 ss dx se, i — 2. SGu h °z Hodnocení: h2 ±se. Zjištěný odhad koeficientu dědivosti na základě regresního koeficientu mezi matkami a dcerami uvnitř otců byl svou hodnotou.............. jeho střední chyba byla ............ v důsledku sledování................................ Následuje výsledek této analýzy variance a kovariance, který byl získán v programu SAS. The GLM Proceduře Dependent Variable: P Source Model Error Corrected Total Sum of DF Squares Mean Square 6 31134.0501 9 80929.6999 15 112063.7500 5189.0083 8992.1889 F Value Pr > F 0.58 0.7409 R-Square Coeff Var Root MSE P Mean ). 277 324 12.1670 3 94 .82715 779.3750 Source DF Type I SS Mean Square F Value Pr > F 0 5 30330 58333 6066 11667 0 . 67 0.6534 M 1 303 46673 803 46673 0.09 0.7718 Standard Parameter estimate Error t Value Pr > 11 1 Intercept 637 .7152160 B 252 . 2943565 2 . 53 0.0324 0 1 28 .6599564 B 77 . 9408706 0 . 37 0 . 7216 0 2 74 .9615501 B 77 . 7257832 0 . 96 0.3600 0 3 93 .4869989 B 88 . 2822372 1.06 0.3172 0 4 104 .4042276 B 86. 6005504 1.21 0.2587 0 5 108 .5484483 B 86. 5896538 1. 25 0 . 2416 0 6 0 .0000000 B M 0 .1002516 0 . 3353824 0 . 30 0.7718 P - užitkovost potomků; M - užitkovost matek; O - otcove 42 Příklady k řešení - prázdné tabulky na doplnění (ZS 2014) 3.1.2 Výpočet odhadu koeficientu dědivosti pomocí analýzy variance užitkových hodnot u příbuzných j edinců. a) Analýza variance skupin polosourozenců V jednom chovu byl sledován přírůstek živé hmotnosti u býčků - polosourozenců ze strany otce, ve věku tří měsíců. Náhodně bylo z této neinbrední populace vybráno 40 polosourozenců, po pěti otcích (vybalancovaný design pokusu). Zjistěte pomocí analýzy variance skupin polosourozenců odhad koeficientu dědivosti a jeho střední chybu. n Oi 02 03 04 Os 1 717 732 603 648 690 2 704 694 731 669 650 3 753 691 737 693 788 4 700 631 678 718 678 5 675 683 747 606 611 6 793 592 763 669 674 7 691 680 687 657 658 8 687 618 618 600 717 Z 5720 5321 5564 5260 5466 Statistický model jednofaktorové analýzy variance: yij = n + ai + eij vy - užitkovost j-tého potomka po i-tém otci (x - obecný průměr populace a; - vliv i-tého otce ey - ostatní nahodilé vlivy skupina Y, Y2 Y2/ni !>« 1 5720 32718400 4089800,00 4100638 2 5321 28313041 3539130,13 3554379 3 5564 30958096 3869762,00 3894894 4 5260 27667600 3458450,00 3469684 5 5466 29877156 3734644,50 3753878 X. = 27331 18691786,63 18773473 Y.2. = 746983561 SY2/ni £2>Š p: n : ni = no 5 40 Výpočet součtu čtverců odchylek od průměru: mezi otci r2 Y^ = n uvnitř skupin podle otců (reziduální) p mj p v2 i=i j=i í=i n; SSa SSe p v/ Z- 1=1 rij pro celý pokus p mj SSc=££y 1=1 j=i Y^ n 17197,3 81386,37 98883,975 43 Příklady k řešení - prázdné tabulky na doplnění (ZS 2014) Tabulka analýzy variance: Proměnlivost SS F MS složení MS Mezi skupinami (a) 17197,3 P- 1 4299,4 =ae2+n0aj Uvnitř skupin (e) 81386,37 n - P 2333,8 = a2 Celková (c) 98883,975 n - 1 Výsledek analýzy variance z programu SAS. The GLM Procedure Dependent Variable: potomek Sum of Source DF Squares Mean Square F Value Pr > F Model 4 17197.60000 4299.40000 1.84 0.1428 Error 35 81686.37500 2333.89643 Corrected Total 39 98883.97500 Výpočet odhadu variance genetické podle otců: MS. MS, -MS„ n. ^2 _l^2 ■ G „ + G ■ MSe+n0G 2 2 o: +o: 245,7 2579,58 0,095 4p = 4 ^2 i ^2 0,38 Výpočet střední chyby odhadu koeficientu dědivosti: a) jako čtyřnásobek střední chyby intraklasního korelačního koeficientu (při stejném počtu pozorování ve skupinách): se. 4.sr "Ti 2.(l-p)2(l + (n0-l)p)2 no(no - 1)(P -1) b) na základě jeho velikosti váženém počtu jedinců ve skupině polosourozenců a počtu skupin polosourozenců: se. h2+- h2 ±se,2 = 0,38 + 0,56 Odhad koeficientu dědivosti na základě výpočtu analýzy variance polosourozenců byl svou hodnotou................a jeho střední chyba byla................Tento příklad je nereprezentativní z důvodu nízkého počtu sledování polosourozenců. Vypočítaný odhad koeficientu dědivosti je nepoužitelný pro svou vysokou střední chybu odhadu. 44 Příklady k řešení - prázdné tabulky na doplnění (ZS 2014) b) Analýza variance skupin vlastních sourozenců a polosourozenců Metoda analýzy variance skupin vlastních sourozenců a polosourozenců umožňuje simultánní výpočet odhadu koeficientu dědivosti, protože lze nezávisle na sobě odhadnout ze stejného sledování koeficienty dědivosti mezi polosourozenci ze strany otce nebo matky, a úplnými sourozenci na základě obou rodičů: nO+M Byl sledován snáškový test nosnic v určitém chovu Otec Matka Užitkovost potomků Y, nij 1 1 78, 55, 50, 79, 46, 91, 54, 79, 63, 47 642 10 2 55, 66, 53, 75, 73, 63, 71, 61 517 8 3 62, 81, 45, 60, 72, 63, 53 436 7 4 69, 89, 58, 90, 65, 73, 95 539 7 5 78, 76, 81, 80, 82, 49, 85, 91, 64 686 9 2 3 Y, =2820 m = 41 21 72, 68, 88, 51, 47, 52, 71, 87 536 8 22 95, 56, 73, 76, 91, 53, 91 535 7 23 75, 92, 58, 50, 52, 87, 88, 69, 51 622 9 24 87, 77, 66, 93, 56, 84, 94, 97 654 8 25 75, 47, 77, 63, 62, 78, 85 487 7 26 66, 52, 64, 66, 64, 92, 74, 63, 58, 84 683 10 Y. =3517 m = 49 Y„ 15 904 počet otců: p = 5 počet matek: m = 26 počet potomků: n = 218 Model dvoufaktorové hierarchické analýzy variance: yij = n + ai + bij + eij 1 216 770 yij - užitkovost j-tého potomka po i-tém otce (x - obecný průměr populace a; - vliv i-tého otce by - vliv j-té matky pod i-tým otcem ey - ostatní nahodilé vlivy n = 218 Výpočet mezihodnot: Y2 1 175 398,79 V2 1 165 967,12 1 160 262,46 45 Příklady k řešení - prázdné tabulky na doplnění (ZS 2014) Výpočet součtu čtverců odchylek od průměru: - mezi skupinami otců p v2 v2 SSa=ý^-^ = i~í ni n - mezi skupinami matek uvnitř otců p m, v2 p Y2 SSb=EE—-E = i=l j=l nij i=l ni - reziduálni (mezi sourozenci uvnitř rodin) p '" nij p " v2 SSe=III>p-II-f = 1=1 j=i k=i 1=1 j=i ny pro celý pokus p mj "ij ^2 ijk i=l j=l k=l n Tabulka analýzy variance: t, . „ ,. x. Součet čtverců Stupeň Průměrný „, „ ,AJ02 Zdroj promenhvost! odchylek (Sg) volno^tl (f) čtverec (MS) Složeni MS -mezi otci SSa= fa = k-l= MSa= a2 +(m2aJM) + (n3 +ajj - mezi matkami uvnitř cc ŕ , „ i ,sn „2 \ otců ssb = fe = P - k = MSb = ae + (niagM) - mezi potomky uvnitř gg _ f - n _ MS _ a2 skupin podle matek e e n p e e - celková SSC = fc = n - 1 = - průměrný počet potomků pro matku: ni = 218/26 = 8,38 - průměrný počet matek pro otce: im = 26/5 = 5,20 - průměrný počet potomků pro otce: m = 218/5 = 43,60 Výsledek analýzy variance z programu SAS. The GLM Procedure Dependent Variable: y Sour ce DF Sum of Squar es ^an Square F Val ue Pr > F IVbdel 25 15136. 32859 605. 45314 2. 81 <. 0001 Er r or 192 41371. 21270 215. 47507 Cor r ect ed Tot al 217 56507. 54128 R- Squar e Coef f Var Ftoot IVBE y ľvean 0. 267864 20.12096 14.67907 72.95413 Sour ce DF Type I V SS ^an Square F Val ue Pr > F ot ec mat ka( ot ec) 4 21 4903. 082747 9431.669144 1225.770687 449. 127102 5. 69 2. 08 0. 0. 0002 0051 2 ni-vážený počet potomků na jednu matku m2 - vážený počet matek na jednoho otce n3 - vážený počet potomků na jednoho otce 46 Příklady k řešení - prázdné tabulky na doplnění (ZS 2014) Výpočet odhadu komponent variance: a) genetická variance podle matek MSb-MSe n, b) genetická variance podle otců ivi — ivi — m _ f 2 MSa -MSe -m2aí n, T^ ~ ,2 MSa-MSb Když ni = im, pak o =-i-- c) variance prostředí a2e = MSe d) fenotypová variance: dp =a2 Výpočet odhadu koeficientů dědivosti a) podle otců 2 2 5m e ho =4p0 ^2 _l^2 SO e Střední chyba koeficientu dědivosti: se. b) podle matek n3y Vp /i ^2 5m e Střední chyba koeficientu dědivosti: se. li. m c) podle matek i otců *0+m 2p 2 2 o; +a: 2 2 o; +a: o+m '2 .2 .2 Střední chyba koeficientu dědivosti: se h1 4Vh 2 o+m 1 h0±sehä = hM±seK = h 2 + se 11 o+m — ach2 Zjištěné odhady koeficientů dědivosti na základě analýzy variance skupin úplných sourozenců a polosourozenců byly svými hodnotami............ a jejich střední chyby byly............ v důsledku sledování.......................... 47 Příklady k řešení - prázdné tabulky na doplnění (ZS 2014) 3.1.3 Vypočtěte hodnoty odhadů koeficientu dědivosti na základě zjištěných korelací a regresí, za předpokladu, že podobnost v důsledku vlivu prostředí nebo dominance bude nepatrná! Tr A , . ...... Hodnota regrese , , 12 Vztah mezi príbuznými ledinci , , f násobeno n ___J J_nebo korelace_ 1. regrese potomka na otce 0,21 2. regrese potomka na matku 0,27 3. korelace úplných sourozenců 0,34 4. regrese potomka na střední hodnotu obou _ rodicu 5. korelace polosourozenců 0,02 6. regrese dcer na sestru matky 0,03 7. regrese dcer na matky uvnitř otců_0,09_ 3.1.4 Jako třetí kategorie metod výpočtu odhadu koeficientu dědivosti se používají neparametrické metody na základě příbuznosti jedinců. a) Použití pořadového korelačního koeficientu podle Spearmana u matek a dcer. Sledujeme obsah tuku v procentech v mléce matek a jejich dcer na prvních laktacích. Určete pořadí dcer jednotlivých matek jednotlivých matek podle jejich výše užitkovosti, zjistěte rozdíl v pořadí matek a dcer a vypočtěte hodnotu součtu čtverců těchto diferencí. matky dcery rozdíl pořadí_v pořadí (di) % tuku pořadí % tuku 4,6 1 4,4 4,5 2 4,0 4,4 3 3,6 4,3 4 3,9 4,2 5 4,6 4,1 6 4,3 4,0 7 4,5 3,9 8 4,2 3,8 9 3,5 3,7 10 4,1 3,6 11 3,7 3,5 12 3,8 i=l Opakuje-li se některá naměřená hodnota u matek a dcer vícekrát, přiřadíme všem stejné pořadové číslo, tj. jejich průměrné pořadí. Na základě zjištěných hodnot v tabulce vypočítejte pořadový koeficient korelace (R) a určete odhad koeficientu dědivosti. Zjistěte, zda vypočítaný pořadový korelační koeficient je průkazný nebo neprůkazný. Výpočet pořadového korelačního koeficientu: 48 Příklady k řešení - prázdné tabulky na doplnění (ZS 2014) 61 d? R = l--^-= 1-AR Vdf = n(n2-l) \=\ Hodnota AR =-j- pro n = 12 je Ar = n(n -1) Zjištění průkaznosti vypočteného koeficientu pořadové korelace t-testem: R i - t = -F Vl-R2 Tabulkové hodnoty: t(i0; o,os) = 0,576 t průměr selektovaných rodičů rodičovské populace 2*AG («lf+