Odhad genetické/plemenné hodnoty
prof. Ing. Tomáš Urban, Ph.D.
urban@mendelu.cz
Genetika kvantitativních znaků
Genetická variabilita > jedinci s různými genotypy
> různí jedinci mají různou genetickou hodnotu
Pro šlechtitele je důležitá plemenná hodnota >
ovlivněna efekty alel v lokusu, interakcemi…
Gamety = 1 alela >>> PH závisí na efektech
individuální alely, ne na efektech alelického páru
na lokusu
Plemenná hodnota – hodnota genů zvířete,
které jsou předány jeho potomkům
(součet efektů všech jeho genů pro danou
vlastnost)
Plemenná hodnota – pravděpodobnost, že
potomstvo bude vykazovat dobré genetické
založení
Plemenná hodnota a genetické založení
Kvantitativní charakter užitkových vlastností
Lze zjistit rozdíly mezi užitkovostmi způsobené různými genotypy.
Tyto rozdíly jsou odhadnutelné
PH - odhad genetického založení jedince (jeho jedinečný
genotyp) vyjádřené odchylkou v užitkové vlastnosti od průměru
vrstevníků
Odhad plemenné hodnoty (OPH)
- je proces očištění genetických vlivů působících na
užitkovost od činitelů NEGENETICKÉ povahy a vše
ostatní „odstranit“ z vlivu
Na základě závisle proměnné užitkovosti chci
odhadnout genetické založení jedince  testace
zvířat a jejich matematické vyhodnocení
Stanovit přímý účinek genotypu jedince na vlastní
užitkovost a to genů s aditivním účinkem
OPH – odhad odchylky genetického založení.
Genetické založení je „neodhadnutelné“, ale odhadnutelné
jsou rozdíly v genetickém založení pomocí PH
přímé změření: h2 =1, nebo ∞ potomků
OPH = odhad rozdílů genetického založení (nejde o
absolutní užitkovost)
- vychází z fenotypové odchylku od průměru vrstevníků
(referenční populace):
D = yi - 
Kontrola užitkovosti a výkonná výpočetní technika  přesto
získáváme jen odhady
Prostřeďové efekty
Náhodné prostřeďové efekty (nesystematické)
Nezjistitelná proměnlivost
U každého jedince v různém směru (+ -) a velikosti
Působí krátkodobě a na jedince (nelze kvantifikovat)
Nelze fenotypovou hodnotu od těchto efektů očistit
Systematické efekty pevné
Působí na celou skupinu jedinců a dlouhodobě
Většinou jsou prostřeďové
Můžeme je eliminovat
uspořádáním podmínek (standardizace)
Matematicky – efekty v modelech
u BLUP se rozlišují pevné a náhodné systematické efekty
Vnější (oblast, podnik, stáj, rok, období, výživa, ošetřovatelé, …)
Vnitřní (věk jedinců, věk matky, pohlaví, četnost vrhu, pořadí vrhu, pořadí laktace, …)
Eliminace – pomocí korekčních faktorů se očišťují data pro OPH či genetických
parametrů (h2, rop, rG) – v metodě MNČ
Fenotypová hodnota: P = A + E* E* (D, I, náhodné prostředí) A (aditivní efekt)
Odhad PH
Př. Býk měl výrazně lepší (350 kg) hmotnost v 1 roce) než
populační průměr (300 kg).
Jeho fenotyp jako odchylka je +50 kg.
Je však tato fenotypová odchylka způsobena jen genetickými
rozdíly?
Býk by mohl být dobrý podle svých genů, ale také z důvodu,
že se vyvíjel v lepších podmínkách.
Otázka zní, jaká část fenotypových odchylek je způsobena
genetickými, tzn. plemennou hodnotou?
OPH = heritabilita + fenotypová odchylka
Větší část fenotypových rozdílů je připisována plemenné hodnotě, je-li
heritabilita vyšší.
Plemenná hodnota je odhadována regresí. Směrnice regresní přímky je
heritabilita, která nám říká, jak velký rozdíl plemenné hodnoty lze očekávat za
jednotku rozdílu fenotypu.
Při informaci o vlastní užitkovosti zvířete je váha informace b = h2
Více informací → zvýšení přesnosti OPH, tj. informace o korelovaných vlastnostech
nebo o příbuzných jedincích, a lze vypočítat více vah mnohonásobným
regresním modelem.
Jednoduché vyjádření OPH
OPH = b . D D = yi - 
a
r
b
2

r2 – spolehlivost odhadu PH (reliability  R – v katalozích) –
determinační koeficient; umocněná korelace
r – přesnost (odmocnina spolehlivosti), korelace mezi genotypem
(skutečnou PH) a fenotypem (OPH); spolehlivost je větší než
přesnost
a – aditivní příbuznost ke zdroji informací
Regrese PH na
fenotypovou hodnotu
jedince
 
  2
2
2
,,
2
,
,
var
cov
var
cov
hb
y
a
y
eaa
y
ya
y
ya
ya 





Přesnost OPH - r
hbr
a
y
ya
ya
ya
ya 




.,
,
,
aa,ya, rr Při odhadu PH na základě fenotypu platí:
ya
ya
ya,
ya
ya,
yba
yba,
aa
aa,
aa, r
σσσbσ
b
σσσσ
r ,
)(
)(
ˆ
ˆ
ˆ
cov
..
cov.covcov





Zvíře s  r2 má  D - nízká spolehlivost JE LEPŠÍ
 obě mají stejnou
PH
Zvíře s  r2 má  D
Spolehlivost OPH – r2
2
r
Přesnost: kolik
rozdílů mezi SPH
jsme schopni
vysvětlit na základě
OPH
Přesnost:
korelace mezi
SPH a OPH
Porovnání OPH zvířat s různými
skupinami vrstevníků
jedinec
Hmotnost v
1 roce
Průměr
vrstevníků
Fenotypová
odchylka
OPH
Karel 330 300 +30 +12
Rudolf 300 260 +40 +16
40,02
h
OPH = b . D = h2 .D
PHp = ½ (PHO + PHM)
PH rodičů ½ + ½ = 1 potomek
Up = U + PHp
otec PH + 500 ½
matka PH + 100 ½
PHp
Cíl: růst genetické úrovně ve
stádě; chceme, aby posun od
U k Up byl co nejvyšší -
maximální.
Př.
+ 300 1
průměrná užitkovost rodičů (stáda) 5000 kg mléka
? Průměrná užitkovost potomků ?
Spolehlivost selekce ( OPH)
Předpovídáme PHP se
spolehlivostí 25 %.
2
2
2
G
I
r


 2
2
2
2
G
A
G
OPH





Spolehlivost potomstva (PHp)
)( 22
4
12
MO rrr 
PH r2 (%)
otec + 500 80
matka + 100 20
PHp + 300 25 (100:4)
Př.
222
. GOPH r  
PH zvířete je vyjádřena vzhledem k vrstevníkům
v konkrétním čase a místě!
Genetický zisk na základě OPH
Genetický zisk: G = ½ (dotce + dmatky) (popř. G = d)
Genetický zisk na základě vlastní užitkovosti
rIA = h a pak
22
AOPH  
phiG .. 2

Aph  .
AIAriG ..
A
matekotcu
matekIAmatekotcuIAotcu
rok
LL
riri
G .
..



Př.
Selekce na r
Očekávaný
genetický zisk
Realizovaný
genetický zisk
OPH – průměru
rodičů 0,45 +6,8 +5
OPH – vlastní
užitkovost 0,63 +9,5 +11
Skutečná PH 1 +15 +17
σA = 19 i = 0,80
AIAriG ..
Historie vývoje metod OPH
Selekční indexy pro OPH jedince
Vypočítaná hodnota > selekční kritérium (obsahovaly váhy pro různé informace); jedinci s nejvyšší hodnotou > pro
plemenitbu
Hazel a Lush (1942), rozvinul Henderson (1963) – metodu nejmenších čtverců
Problém vychýlenosti pro nebalancovanost údajů pro systematické efekty prostředí
OPH plemeníků na základě užitkovosti potomků
Robertson a Rendel (1954) – dcery plemeníka se porovnávaly se současnými vrstevnicemi
(contemporary comparison)
Henderson et al. (1954) – dcera plemeníka se všemi stádovými vrstevnicemi po jiných plemenících (s
průměrnou užitkovostí stáda v daném období)
Těžko splnitelné podmínky – neexistence interakcí mezi plemeníky a stádem, nezohlednění genetické
úrovně skupin dojnic
BLUP pro OPH
Lineární smíšené modely (korekce na fixní systematické efekty, pak odhad genetických parametrů a PH)
Spolehlivý odhad variance a kovariance; system. efekty – fixní a náhodné
Henderson (1963, 1973) – sire model, dam model
BLUP – AM (komplexnější přístup) – individuální model (animal model)
(Henderson 1988)
(Quaas a Pollak (1980)
Hodnotí se každé zvíře samostatně a současně v závislosti na příbuzných jedincích
Každé zvíře má svou rovnici
Spojení rovnic pomocí matice aditivní genetické příbuznosti A
Zpřesnění odhadu plemenné
hodnoty
 opakování užitkovosti
 počty jedinců
 počty vrstevnic
 zohlednění příbuzenských vztahů
 korelované vlastnosti
 korekce na vlivy prostředí (systematické)
),,( iiii eGFfy 
iiii eGFy 
1. Teoretický model (nemusí být vyhodnotitelný)
y = f(x)
2. Praktický model –lineárně kombinujeme efekty
ovlivňující veličinu
y = a + b + …
3. Proveditelný model
y = SRO + J + …další efekty

přesnost
stoupá
LSM - metoda nejmenších čtverců (MNČ)
BLUP
- nejlepší lineární nestranná předpověď
(NLNP) (dokáže pracovat s náhodnými
efekty, nemusí být na sobě nezávislé,
ale mohou být i příbuzní jedinci
AM
- individuální model (IM) (zahrnuje
každého jedince, využívá kompletně
vzájemnou příbuznost zkoumaných
zvířat)
Nejlepší předpovědi
BLUP
- Best Linear Unbiased Prediction
- nejlepší lineární nevychýlená předpověď NLNP (metoda
nejmenších čtverců)
- metoda odhadu nejmenších čtverců náhodných nebo
smíšených modelů
smíšený model:
y = Xb + Zu + e
X, Z – incidenční matice , udávající, které efekty jsou
obsaženy v pozorování
b – vektor obsahující všechny fixní efekty (fixní genetické
rozdíly a systematické vlivy prostředí)
u – vektor všech náhodných efektů (stádo, rok, sezóna);
obsahuje také OPH
e – náhodné nesystematické zbytkové efekty
Odhad PH - BLUP AM
BLUP - AM se provádí pomocí distribuční funkce f(T/y)
T – hledané veličiny (vektor)
y – naměřené užitkovosti (vektor)
parciální derivací fce  hledáme průběh a extrém funkce  pomocí soustavy normálních rovnic 
(maticová soustava) – Mixed Model Equation (MME)
(W´R-1W + H-1)T = W´R-1y
W – matice plánu experimentu, incidenční, designová (odhad PH) – rozepisuje se na matice X a Z !
R – kovarianční matice reziduí (chyb v datech)
H – kovarianční matice mezi hledanými veličinami
T – hledaná veličina
u  PH
• modelová rovnice (maticový zápis):
smíšený lineární model yijk = bi + uj + eijk
užitkovost = součet faktorů, které ji ovlivňují
y = Xb + Zu + e
• Aditivní plemenné hodnoty jsou náhodnými efekty se známou VCV maticí.
• U vektorů u a e se předpokládá N a E(u) = E(e) = 0
• Vektor pozorování y má multivariátní normální rozdělení s průměrem Xb (E(y) = Xb) a variancí V
V = V(Zu + e) = ZGZ` + R
G je variančně kovarianční matice vektoru náhodných efektů u  V(u)
R je variančně kovarianční matice reziduálních chyb  V(e)
Nejsou-li otcové příbuzní pak je G = I σ2
O (σ2
O = ¼ σ2
A)
Jsou-li otcové příbuzní pak G = A σ2
O (~ animal model)
BLUE a BLUP jsou nejlepší, protože minimalizují výběrovou varianci; lineární
v tom smyslu, že jsou lineárními funkcemi pozorovaných fenotypů y;
nevychýlené ve smyslu, že E[BLUE(b)] = b a E[BLUP(u)] = u.
BLUE pro pevné efekty b:
BLUP pro náhodné efekty u:
~ OPH
yVXXVXb 111
)(ˆ 

)ˆ(ˆ 1
bXyVZGu  
(Henderson, 1963)










-
HZRZXRZ
ZRXXRX
11
11






u
b








 

yRZ
yRX
1
1
LS T PS
LS .T = PS
T = LS-1.PS
• modelová rovnice (maticový zápis):
y = Xb + Zu + e
• soustava normálních rovnic
y – vektor naměřených užitkovostí (n) (n x 1)
X – incidenční matice udávající plán pokusu pevných efektů X (n x p)
Z – incidenční matice udávající plán pokusu náhodných efektů Z (n x q)
b – vektor odhadů pevných efektů (odhad úrovní p) (p x 1)
u – vektor odhadů náhodných efektů; u ~ PH (odhad úrovní q) (q x 1)
e – vektor nekontrolovatelných náhodných reziduálních efektů (vektor reziduálních odchylek, u kterých se předpokládá,
že jsou nezávislé na náhodných genetických efektech (n x 1)
H- – kovarianční matice inverzní
(Henderson, 1950)
• Když jsou rezidua nekorelována a mají stejnou, konstantní varianci
pak:
2
eIR 
21
/ eIR 








2
e
-
1
GZZXZ
ZXXX






u
b
ˆ
ˆ








yZ
yX
=








K-1
AZZXZ
ZXXX






u
b
ˆ
ˆ








yZ
yX
=





 2
2
2
2
A
e
u
e
K
2
2
1
h
h
K

 2
2
4
h
h
K


BLUP AM










-
HZRZXRZ
ZRXXRX
11
11






u
b








 

yRZ
yRX
1
1
BLUP
Postup řešení BLUP AM
• stanovit modelovou rovnici
• ujasnit si teoretický model (vezmu v úvahu všechny faktory,
které by mohly podle mě působit na výslednou užitkovost)
• sestavit praktický model - proveditelný (tj. vyloučíme z vlivů
ty, které nejsme schopni evidovat; SRO – snaha aby období
bylo co nejkratší, protože krmení se může změnit během 14
dnů)
• sestavit soustavu normálních rovnic, které se řeší:
metoda nejmenších čtverců MNČ (LSM) – nejméně vhodná, protože řeší jen
pevné efekty (X´X a b)
body 2. a 3. závisí na konkrétním případě (každá země počítá AM trochu
jinak – různé podmínky)
lepší je metoda BLUP (NLNP)
nejlepší je AM (IM)
BLUP AM: yijkl =  + Si + Lj + gk + eijkl
y = Xb +Zu + ePř.








KAZZXZ
ZXXX
1- 





u
b









YZ
YX
2
2
h
h1
K























15,0005,00
5,010025,00
001000
000100
5,025,00010
000001
A
1. stádo: 5472 kg 2. stádo: 7352 kg
1. laktace: - 574,4 kg 2. laktace: + 861,6
kg
PH jedinců (krav):
1. –88 kg
2. 47 kg
3. 53 kg
4. – 53 kg
5. 62 kg
PH otce: 44 kg mléka
pořadí 5  3  2  4  1
jedince stádo laktace užitkovost
1 1 1 4500
2* 1 1 5000
3 1 2 6500
4 2 2 8000
5* 2 1 7000
pořadí kráva OPH užitkovost
1 5 +62 7000
2 3 +53 6500
3 2 +47 5000
4 4 -53 8000
5 1 -88 4500
yijkl [~ y] - naměřená užitkovost
 [~ X] - populační průměr
Si , Lj [~ b] - stádo a laktace- působení chovatele na zvířata, na jejich
užitkovost
gk [~ u] – efekt jedince (genetický) – ten chceme určit - PH !
eijkl [~ e] – reziduum
Systém genetického hodnocení pomáhá při
navrhování šlechtitelských programů
Systém genetického hodnocení pomáhá při
navrhování šlechtitelských programů
Selekce na fenotyp Selekce na OPH
Year of Birth
1992
1993
1994
1995
1996
1997
Phenotype
Year of Birth
1992
1993
1994
1995
1996
1997
BLUP EBV
Rok narozeníRok narození Rok narozeníRok narození
fenotypfenotyp BLUP OPHBLUP OPH
Principy genetického zlepšení pomocí
selekce
P
fm
fm
rok h
LL
ii
G 2



AapriG 
L
ri
G Aap
rok


P
p
d
i


Kvantitativně molekulární přístup – genomická selekce
32
Typy molekulárně genetických dat
(z hlediska aplikace)
Kandidátní geny
Funkční markery (Funkcional marker)
Přímé markery (Direct marker)
Lokusy kvantitativních znaků, QTL
LD markery (Linkage Disequilibrum markers)
LE markery (Linkage Equilibrum markers)
SNP označují alelickou diferenci mezi
dvěma homologními chromozomy
Nukleotidové sekvence obou chromozomů jsou
identické kromě markeru SNP a alely QTL.
Genetické markery
I. typ - kódující geny, kandidátní geny
II. typ - mikrosatelity (MS), krátkodobé tandemové
sekvence bazí (STR1)
III typ - bi-alelický jednonukleotidový
polymorfismus (SNP) v kódujících nebo častěji v
nekódujících intronových či intergenových
regionech
Molekulární genetika ve šlechtění
MAS – marker assisted selection (vazba s QTL)
GAS – gene assisted selection (QTN – quantitative trait nucleotide – použití
kandidátních genů)
Genomická selekce (GS) – Genomic selection (tisíce SNP rovnoměrně po
celém genomu)
Využívání znalosti skutečné genetické variability (mutace v genech nebo v
jejich blízkosti) detekovatelné metodami molekulární genetiky
Jejich aplikace ve šlechtění v systémech selekce
GS – začlenění matice genomických SNP markerů do
rovnic BLUP-AM (různé varianty) a odhadnutí GEBV
(genomická OPH)
• Současná selekce většiny quantitative trait loci (QTLs)
determinující selektovanou vlastnost
• GS umožňuje výrazné snížení nákladů oproti tradiční
selekci a je efektivnější.
Náklady na sekvenování 1 Mb DNA
2001: 5,292.39 $
2003: 2,230.98 $
2005: 766.73 $
2007: 397.09 $
2009: 0.78 $
2011: 0.19 $
Zdroj: NHGRI
Metody předpovědi genomické plemenné
hodnoty
Bylo vyvinuto několik různých metod pro zahrnutí
informací z genetických čipů do hodnocení jedinců
vycházející z metody BLUP.
Metody lze jednoduše dělit na metody jednokrokové
a vícekrokové.
Nebo na metody založené na předpovědi
regresních koeficientů jednotlivých SNP a na
metody založené na nahrazení matice
příbuznosti, nebo její úpravě. (Jiménez-Montero
et al., 2013)
40
y = Zu + Qq + e
-> MA-BLUP -> MEBV
u – vektor polygenních efektů
q – vektor QTL efektů
Použití metody BLUP pro odhad
genomické plemenné hodnoty