Heritabilita II - metody odhadu koeficientu heritability doc. Ing. Tomáš Urban, Ph.D. urban@mendelu.cz Genetika kvantitativních znaků4. 4. 2011 Variance kvantitativní vlastnosti Projev kvantitativní vlastnosti je ovlivněn genetickými a protřeďovými faktory Základní ? Kolik z celkové variance v populaci je způsobeno genetickými příčinami a kolik prostřeďovými Odhalení genetické komponenty variance (určuje stupeň, kterým vlastnosti odpovídají na selekci) Genetika kvantitativních znaků 04/04/2011 1 Komponenty (~ složky) variance Odhad genetických parametrů je synonymem pro odhad komponent pozorovatelné variance (včetně kovariancí) mezi příbuznými jedinci do příčinných komponent (VA, VD, VI, VEP, VET) Využití znalosti stupně příbuznosti mezi jedinci a z toho vyplývající očekávané kovariance mezi nimi Proč předpokládáme, že komplexní vlastnost může mít genetický základ? Protože je podobnost mezi příbuznými jedinci pro tu vlastnost! Genetika kvantitativních znaků 04/04/2011 2 Chtěl kvantifikovat tyto rodinné podobnosti. Založil biometrický přístup ke genetice (regrese a korelace) Francis Galton F.R.S. 1822-1911 Vymyslel korelační koeficient (r) - Možno měřit stupeň asociace pro proměnnou mezi 2 příbuznými jedinci Pro vlastnost, která je kompletně geneticky determinovaná, s malým nebo bez vlivu prostředí, se očekává, že r bude stejný jako koeficient příbuznosti Genetika kvantitativních znaků 04/04/2011 3 Příklady koeficientů příbuznosti 1. stupeň (rodič, sourozenci, dítě) ½ 2. Stupeň (strýc, neteř, vnuk) ¼ 3 . stupeň (bratranec, pra-) 1/8 4 . stupeň (bratranec z 2. kolena) 1/16 Koeficient příbuznosti vyjadřuje podíl genů sdílených 2 jedinci. Metody pro rozdělení fenotypové variance do dílčích komponent Princip: fenotypová podobnost mezi příbuznými jedinci poskytuje informaci o stupni genetických rozdílů mezi jedinci aditivní komponenta primárně určuje stupeň, kterým se potomci podobají rodičům tak ovládá míru odpovědi vlastnosti na selekci (G) VA ~ VPH Genetika kvantitativních znaků 04/04/2011 4 Genetická podobnost Aditivně genetická podobnost ‘additive genetic relationship (A)’ mezi jedinci x a y je aXY Podíl alel, které x a y mají společné (IBD) Rodič – potomek a = 0,5 polosourozenci a = 0,25 Příbuznost ½ h2½Potomek ¼ h2¼Polosourozenec ½ h2½Vlastní sourozenec h21Vl. sourozenci – dvojče 1/8 h21/8Praprarodič ¼ h2¼Prarodič ½ h2½Rodič h21Vlastní užitkovost bR Regresní koeficient Stupeň příbuznostiZdroj Genetika kvantitativních znaků 04/04/2011 5 Aditivně genetická příbuznost X A X D C B DCBA X A X D 0,5C B DCBA aCD = (0,5*0,5) + (0,5*0,5) = 0,5 = 0,5(aCA + aCB) = 0,5(0,5 + 0,5) = 0,5 aXX = 1 + (acd/2) = 1,25 1,25 0,75 0,75 0,5 0,5 X 0,50,501A 0,750,750,50,5X 10,50,50,5D 0,510,50,5C 0,50,510B DCBA aii = 1 + 0,5(aom) aij = 0,5(ajo + ajm) 1,25 Genetická podobnost koeficient příbuznosti („coefficient of relationship“) (rxy) Podobný k axy, ale je upraven pro inbriding rodičů (0 – 1) )F1)(F1( a r yx xy xy   Genetika kvantitativních znaků 04/04/2011 6 Podobnost mezi příbuznými jedinci Měření stejné vlastnosti na dvou příbuzných jedincích PX = AX + EX PY = AY + EY Korelace mezi fenotypy stejné vlastnosti existuje pro pár příbuzných jedinců v důsledku podobnosti genů a podobného prostředí Kovariance mezi PH stejné vlastnosti příbuzných jedinců = genetická příbuznost x genetická variance covAxAy = rXY . VA yx yx xyr  ,cov  A AXY A AA AA AA AA V Vr r YX YX YX YX  2 covcov  2 covcovcov hr V Vr V r XY P AXY P AA PP EEAA PP YX YX YXYX YX     Obecný vzorec korelace Korelace mezi PH příbuzných jedinců je rovna koeficientu příbuznosti Korelace mezi fenotypy příbuzných jedinců je rovna koeficientu příbuznosti x heritabilita 0cov YX EE Předpoklad: zvířata jsou chována v různém prostředí bez prostře. korelace Genetika kvantitativních znaků 04/04/2011 7 Závěr Fenotypová podobnost mezi příbuznými jedinci závisí na stupni příbuznosti (podobné geny) a heritabilitě Genetická podobnost mezi příbuznými jedinci závisí na stupni přibuznosti: kovariance mezi PH: 2 hrr XYPP YX  AXYAA VrYX cov Způsoby odhadování heritability Odpověď na selekci: Regrese potomek – rodič: Regrese potomek – střed rodičů: Korelace polosourozenců: Korelace vlastních sourozenců: VCE s AM: d G hˆ2   RP 2 b2hˆ  OMP 2 bhˆ  ˆ4hˆ2  ˆ2hˆ2  2 P 2 A2 ˆ ˆ hˆ    Genetika kvantitativních znaků 04/04/2011 8 Metody • podobnost rodičů a potomků • rozklad proměnlivosti • neparametrické metody • selekční experimenty 1. podobnost rodičů a potomků • regrese potomka na rodiče: h2 = 2.bxy • regrese potomka na průměr rodičů: h2 = bxy • regrese průměru potomků na průměr rodičů: h2 = bxy • korelace mezi sourozenci: h2 = 2.rxy • korelace mezi polosourozenci: h2 = 4.rxy Genetika kvantitativních znaků 04/04/2011 9 Regrese potomek – rodičModel statistický: Zi = Xi + ei Zi – střední hodnota potomka i-tého otce  - regrese Z na X Xi – pozorovaná hodnota u i-tého otce ei – náhodná chyba spojená s Zi Př.: Ve velké neinbrední populaci slepic byla zjišťována ve věku osmi týdnů živá hmotnost kohoutů s přesností na jeden gram. V pohlavní dospělosti bylo 17 kohoutků náhodně pářeno se slepicemi a u jejich potomků samčího pohlaví byla opět zjišťována živá hmotnost ve stejném věku. Zjišťovaný genetický parametr, koeficient dědivosti, se bude vztahovat na populaci otců. rpbh . 2 .2ˆ  Výpočet vstupních hodnot regresního stavu  Zzi n ZX zxSS i iixz    . .    i ix n X xSS 2 2    i iz n Z zSS 2 2        i i i ii zx n X x n ZX zx b 2 2 . . zxbh .22  i 1531980617752029133755061735314966 1076400107122510816001035104017 10378771083681994009104199716 11044501232100990025111099515 95550495257695844197697914 92640492929692352196496113 10273341162084908209107895312 9719921042441906304102195211 9218501060900801025103089510 8767089880367779249948829 902000105062577440010258808 888160108160072931610408547 871520108160070224410408386 883440116640066912410808185 834750110250063202510507954 7739689525766288499767933 7205399662895372899837332 5469108281003612019106011 xi . zi zi 2 xi 2 zi xi n  Xxi Genetika kvantitativních znaků 04/04/2011 10 Následuje výsledek této regresní analýzy (variance a kovariance), který byl získán v programu SAS. The REG Procedure Dependent Variable: y Analysis of Variance Sum of Mean Source DF Squares Square F Value Pr > F Model 1 9256.15665 9256.15665 4.72 0.0463 Error 15 29443 1962.86015 Corrected Total 16 38699 Root MSE 44.30418 R-Square 0.2392 Dependent Mean 1020.76471 Adj R-Sq 0.1885 Coeff Var 4.34029 Parameter Estimates Parameter Standard Variable DF Estimate Error t Value Pr > |t| Intercept 1 831.44274 87.84239 9.47 <.0001 x 1 0.21505 0.09903 2.17 0.0463 Střední chyba odhadu   )2.( 2 2    nSS SS SS SS SS s se x x xz z x zxb zxb ZXbh sese .22  Genetika kvantitativních znaků 04/04/2011 11 • U některých druhů hospodářských zvířat může být otec připařován na několik matek a každá matka může mít několik potomků. Vliv otců může být odstraněn na základě výpočtu regrese potomků na matku uvnitř otců podle modelu: • Model: Zij - i =  + (Xij – x..) + ei • Zij – střední hodnota potomků z páření i-tého otce a j-té matky • i – vliv i-tého otce  - obecný střed populace   - regrese Z na X  Xij - pozorovaná hodnota j-té matky pářené s i-tým otcem  x.. - fenotypový průměr  ei – náhodná chyba spojená s zij (odchylka od zij) Tabulka analýzy variance a kovariance: --fc = d – 1SSczSScxCelková MPdxzSPdxzMSdzMSdxfd = d – sSSdzSSdx Mezi matkami uvnitř otců tato data nejsou třeba k výpočtůmfs = s-1SSszSSsxMezi otci MPSPMSzMSxfSSzSSx Střední produkt xz Součet produktů xz Průměrný čtverec Stupeň volnosti Součet čtverců odchylek Zdroj proměnlivosti s – počet otců (sire), d – počet matek (dam), S – součet čtverců, MS – střední čtverec, Sp – součet produktů, MP – střední produkt ZX ZX ZX d d d d MP f SP cov Odhad regrese a dědivosti mezi matkami a dcerami uvnitř otců: X ZX ZXd ZXd X ZX X ZX d d sd S sd SP d d d d zx S SPMP b    2 var cov  zxbh .22  Odhad střední chyby koeficientu regrese a dědivosti: 1 )( 2 2    sd S SP S s X ZX Z ZX d d d b X ZX ZX d b b s s se 2  ZXbh sese .22  2 2 h seh  Genetika kvantitativních znaků 04/04/2011 12 965355798308709643381161247012353Σ 3694322540165372895047336 5112006400004083218006396 689730688900690561 321342203 8308316 6187356972255490818357415 596440649636547600 216411481 8067405 6075606889005358248307324 6808986432047208018028494 823650722500938961 324822550 8509694 6778807056006512498408073 596700608400585225 216201572 7807653 6496006400006593448008122 5980807056005069448407122 536500525625547600 323652264 7257402 6343205184007761617208811 4536004900004199047006481 609232652864568516 322282283 8087541 xij . zij z2 ij X2 ij ni Zi• Xi• Potomci zij Matky xij Otcové     i i i i j ijd n X xSS X 2 2 SS pro X SS pro Y     i i i i j ijd n Z zSS Z 2 2 Výpočet součtu produktů (součinů) vlastností X a Z mezi matkami uvnitř otců    i i ii i j ijijd n ZX zxSP ZX . . sd SP MP ZX ZXZX d dd  covX ZX d d zx SS SP b zxbh .22  Následuje výsledek této analýzy variance a kovariance, který byl získán v programu SAS The GLM Procedure Dependent Variable: P Sum of Source DF Squares Mean Square F Value Pr > F Model 6 31134.0501 5189.0083 0.58 0.7409 Error 9 80929.6999 8992.1889 Corrected Total 15 112063.7500 R-Square Coeff Var Root MSE P Mean 0.277824 12.16708 94.82715 779.3750 Source DF Type I SS Mean Square F Value Pr > F O 5 30330.58333 6066.11667 0.67 0.6534 M 1 803.46673 803.46673 0.09 0.7718 Parameter Estimate Stdr. Error t Value Pr > |t| Intercept 637.7152160 B 252.2943565 2.53 0.0324 O 1 28.6599564 B 77.9408706 0.37 0.7216 O 2 74.9615501 B 77.7257832 0.96 0.3600 O 3 93.4869989 B 88.2822372 1.06 0.3172 O 4 104.4042276 B 86.6005504 1.21 0.2587 O 5 108.5484483 B 86.5896538 1.25 0.2416 O 6 0.0000000 B . . . M 0.1002516 0.3353824 0.30 0.7718 P – užitkovost potomků; M – užitkovost matek; O - otcové Genetika kvantitativních znaků 04/04/2011 13 2. Rozklad proměnlivosti • z analýzy variance • teoreticky vychází z předpokladu podobnosti příbuzných • Čím si jsou příbuzní podobnější náhodní jedinci v populaci, tím pro danou vlastnost odhadujeme vyšší hodnotu koeficientu heritability Využití užitkovostí rodin k odhadu heritability • Vysoká heritabilita –nízká variance v rodinách –vysoká variance mezi rodinami • Nízká heritabilita –vysoká variance v rodinách –nízká variance mezi rodinami Genetika kvantitativních znaků 04/04/2011 14 3 3 3 3 2 2 2 2 3 3 1 3 2 1 2 2 3 2 1 3 3 2 1 2 Nízká Velká 1 1 1 1 Vysoká Střední Střední 1 2 3 1 Střední Velká Nízká 3 2 1 1 Žádná Typ podobnosti rodiny Var v rodinách Var mezi rodinami Hodnota jedinců Otec CelkovCelkováá var = var mezi rodinami + var v rodinvar = var mezi rodinami + var v rodinááchch Stená jako cov v rodinách nízká vysokástředníh2 Odhad dědivosti Nutná variance mezi a v rodinách Více rodin > větší přesnost odhadu Variance mezi rodinami = kovariance v rodinách Vysoká variance mezi rodinami (jsou odlišné) = vysoká kovariance v rodinách (členové v rodinách jsou podobní) Genetika kvantitativních znaků 04/04/2011 15 Špatný odhad Dobrý odhad Odhad h2 u rodin polosourozenců • Variance mezi rodinami polosourozenců = kovariance mezi polosourozenci = ¼ VA • Variance v rodinách polosourozenců = reziduální varianci = VP – ¼ VA = ¾ VA + VE + VD P S P A V V V V h 42  Genetika kvantitativních znaků 04/04/2011 16 • Komplikovanější odhad > společné prostředí > VEC (efekt maternálního prostředí) a VD (efekt dominance) • Variance mezi rodinami úplných sourozenců = kovariance mezi úplných sourozenci = ½ VA + VEC + ¼ VD • Variance v rodinách úplných sourozenců = reziduální varianci = VP – (½ VA + VEC + ¼ VD) = ½ VA + VE + ¾ VD Často bývá h2 přeodhadnuto, protože je obtížné oddělit genetické a ostatní efekty Odhad h2 u rodin vlastních sourozenců Metody odhadu genetických parametrů Analýza variance (ANOVA) – nejmenší čtverce Balancovaná data Nebalancovná data Hendersonovy metody (SAS, Harvey, SPSS, …) Věrohodnostní metody – maximální věrohodnost Maximální věrohodnost (ML) Restringovaná maximální věrohodnost (REML) Bayesian Methody Monte Carlo, Gibbs Sampling Genetika kvantitativních znaků 04/04/2011 17 Korelacekovariance OpakovatelnostVEP VE HeritabilitaVA Odhadované parametry Komponenty variance Genetika kvantitativních znaků 04/04/2011 18