Výukový materiál: Model rozložení citlivosti druhů (Species Sensitivity Distribution; SSD)
(Soňa Smetanová, RECETOX)
1) Úvod do SSD
SSD model byl poprvé představen v roce 1989, ale všeobecné známosti se dočkal až
s rozvojem výkonnějších počítačů (kolem roku 2000). Je hojně využívaný pro hodnocení
účinků a rizik toxických látek v ekosystémech a pro stanovení limitů toxických látek
v prostředí a uplatňuje se ve směrnicích EU (např. v rámcové směrnici o vodách).
Model je založen na předpokladu, že různé druhy organismů žijící v určitém ekosystému
(např. řeka, jezero či půda) jsou různě citlivé na určitou toxickou látku (např. korýš Daphnia
magna je na rozdíl od řasy Raphidocelis subcapitata velmi citlivý na insekticidní látku
chlorpyrifos). Tyto citlivosti jsou vyjádřené nejčastěji jako NOEC či EC50 hodnoty.
Základním předpokladem SSD je, že pokud se vezmou citlivosti (logaritmy NOEC či EC50
hodnot) všech druhů organismů (žijících v daném ekosystému) na určitou toxickou látku, pak
jejich rozložení (distribuce) je normální - Gaussovo (obr. 1).
Obr. 1. Princip SSD
1A: Různé druhy jsou různě citlivé na toxickou látku (tj. mají různé hodnoty NOEC či EC50). Citlivost se
může výrazně lišit mezi druhy a také mezi vyššími taxonomickými skupinami (zde jsou například nejvíce
citlivé řasy a naopak nejméně citliví jsou obratlovci – ryby a obojživelníci); zelená kolečka značí různé
druhy organismů, osa y značí různé taxonomické skupiny.
1B: Distribuce (rozložení) těchto citlivostí (resp. logaritmů EC50 nebo logaritmů NOEC hodnot) má
vlastnosti rozložení normálního (Gaussova); sloupce značí počet druhů s daným rozmezím logEC50 (či
logNOEC) hodnot, zelená čára označuje proložení Gaussovou funkcí.
3.5 3.8 4.1 4.5 4.8 5.1 5.5 5.8 6.1
log(NOEC or ECx)
0
5
10
15
20
25
30
35
Numberoforganisms
log(NOEC or EC50)
Početdruhů
3.2 3.6 4.0 4.4 4.8 5.2 5.6 6.0 6.4
log(NOEC or ECx)log(NOEC or EC50)
Taxony
1A
1B
Toto rozložení je symetrické a definované pouze dvěma parametry – aritmetickým
průměrem a směrodatnou odchylkou a proto je velmi jednoduché s ním pracovat (rovn. 1 a
2, obr. 2):
Rovnice pro výpočet aritmetického průměru µ a směrodatné odchylky σ pro SSD:
(1)
(2)
µ … aritmetický průměr
σ … směrodatná odchylka
n … celkový počet druhů
xi … sensitivita i-tého druhu (logEC50 či logNOEC hodnota) na konkrétní toxickou látku
Obr. 2. Parametry normálního (Gaussova) rozložení
Směrodatná odchylka (σ) popisuje míru variability dat a aritmetický průměr (µ) jejich střední hodnotu
Výše popsané Gaussovo rozložení se dá vyjádřit také jako kumulativní distribuční funkce
(ukazuje totéž s tím rozdílem, že na ose y nejsou četnosti druhů s danou kategorií citlivosti,
ale procento organismů s danou nebo vyšší citlivostí (např. danou nebo nižší hodnotou
EC50). A z této kumulativní distribuční funkce se mohou lehce vypočítat hodnoty HCp či PAF
(obr. 3).
HCp (Hazard Concentration for p-percent of species) je taková koncentrace dané toxické
látky, která podle SSD modelu negativně ovlivní p-procent druhů organismů (například HC15
𝜇𝜇 =
1
𝑛𝑛
� 𝑥𝑥𝑖𝑖
𝑛𝑛
𝑖𝑖=1
𝜎𝜎 = �
1
𝑛𝑛
�(𝑥𝑥𝑖𝑖 − 𝜇𝜇)2
𝑛𝑛
𝑖𝑖=1
3.5 3.8 4.1 4.5 4.8 5.1 5.5 5.8 6.1
0
5
10
15
20
25
30
35
g
σ
µ
metanolu je taková koncentrace metanolu, která má negativní efekt na 15 % všech druhů
organismů žijících v jednom ekosystému).
Oproti tomu PAF (Potentially Affected Fraction) označuje frakci (nebo procento) organismů,
která bude negativně ovlivněna působením určité koncentrace dané toxické látky (tudíž při
působení metanolu v koncentraci rovné HC15 bude PAF rovno 15 %).
Obr. 3. Zobrazení SSD jako kumulativní distribuční funkce a odvození PAF (Potentially Affected Fraction) a
HCp (Hazard Concentration for p procent of species).
Oba tyto údaje se tedy týkají stejné věci (negativní efekt na různě velkou část druhů), ale
popisují ji z opačných konců.
HCp se používá pro prospektivní analýzu rizik, a sice pro stanovení PNEC (Predicted no-effect
concentration) limitů – maximálních koncentrací toxických látek, které ještě nebudou mít
významné negativní účinky na ekosystémy. V Evropě byla dohodnuta tato hranice na 5 %.
Limitní „bezpečná“ koncentrace určité toxické látky v životním prostředí je tedy taková, která
negativně ovlivní 5 % druhů a je označována jako HC5.
Stanovení PNEC hodnot SSD metodou má oproti ostatním metodám výhodu v menších
nejistotách (limit odvozujeme za použití velkého množství taxonů a druhů, nejen z otestování
tří standardních organismů, jak tomu je v případě klasických postupů). Proto i faktory
nejistoty (Assessment factors) aplikované na hodnoty HC5 pro zisk PNEC hodnot jsou řádově
nižší (tab. 1).
3.5 4.0 4.5 5.0 5.5 6.0
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
Fractionoforganisms
PAF
HCp
Procentodruhů
3.5 3.8 4.1 4.5 4.8 5.1 5.5 5.8 6.1
0
5
10
15
20
25
30
35
NumberoforganismsPočetdruhů
log(NOEC or EC50)
Tab. 1. Faktory nejistoty, kterými musí být poděleny maximální „bezpečné“ zjištěné koncentrace látek pro
zisk PNEC hodnot; tyto faktory se liší podle zvolené metody. (tabulka převzata z guidance dokumentu EU
CIS-WFD No. 27 pro stanovení norem environmentální kvality).
Hodnoty PAF se naopak používají pro kvantitativní zhodnocení ekotoxikologického stavu
ekosystému (tj. pro retrospektivní analýzu rizik). Po změření koncentrace určité toxické látky
(např. v řece) se aplikuje model SSD a vypočítá se hodnota PAF. Výstupem je nejen
informace, jestli tato hodnota přesáhla onen stanovený limit 5 %, ale také informace o míře
poškození (např. látka A mající PAF = 6 % sice přesahuje limit, ale rozhodně páchá méně škod
než látka B s PAF = 62 %), což je opět velká výhoda oproti tradičnímu hodnocení, které je
pouze kvalitativní („koncentrace látky v prostředí je pod/nad PNEC hodnotou“).
SSD je tedy statistický model velice vhodný pro hodnocení ekotoxikologických rizik a účinků
toxickýxh látek v prostředí. V následující kapitole se dozvíme, jaká vstupní data musíme mít,
abychom takový model mohli vytvořit.
2) Ekotoxikologická data vhodná pro SSD
Jak je již zmíněno výše, vstupními daty pro vytvoření SSD modelu jsou nejčastěji hodnoty
NOEC či EC50. Původně byly využívané spíše hodnoty NOEC, které označují takovou
koncentraci látky, která nemá statisticky významný chronický účinek na organismy. Pokud se
vytvoří SSD model z NOEC hodnot, pak např. PAF = 5 % tedy znamená, že 5 % druhů je
chronicky ovlivněno „více než nevýznamně“. V poslední době se ovšem od používání NOEC
hodnot všeobecně upouští a proto se stále více i v SSD modelech využívají akutní EC50
hodnoty. EC50 je taková koncentrace látky, která akutně způsobuje 50% efekt na
organismech. Pokud se vytvoří SSD model z EC50 hodnot, pak např. PAF = 5 % znamená, že 5
% druhů je akutně ovlivněno „minimálně z padesáti procent“. Tyto rozdíly si je nutné vždy
uvědomit. V následujícím textu již bude vše vysvětlováno na příkladu použití akutních EC50
hodnot.
Data ekotoxicity se nejčastěji získávají z online databází (např. US EPA ECOTOX:
http://cfpub.epa.gov/ecotox či IUCLID Chemical Data Sheets: http://esis.jrc.ec.europa.eu) a
publikovaných vědeckých článků. Není tedy třeba další testování organismů, což je výhodné
jak z hlediska ochrany organismů, tak finančně a časově.
Pouhé použití všech (nezkontrolovaných) EC50 hodnot z online databází pro tvorbu SSD
modelu však může vést k velkému zkreslení a proto je nutná jejich kontrola a přebrání.
Databáze vhodná pro tvorbu SSD modelu akutních toxických účinků určité látky na
sladkovodní druhy může vzniknout například následujícím postupem:
• Stažení základní databáze EC50 (včetně LC50 a IC50) hodnot pro všechny sladkovodní
druhy z US EPA ECOTOX online databáze.1
• Výběr pouze akutních EC50 hodnot (obvykle se používají EC50 hodnoty získané
z testů s délkou expozice 1-4 dny či 1-7 dní).2
• Výběr pouze vhodných akutních efektů, které mají přímý vliv na změnu abundance a
složení společenství organismů (např. efekty na růst a biomasu rostlin a mortalita a
imobilizace u živočichů).3
• Výběr pouze takových EC50 hodnot, které byly odvozeny z testování čistých látek, ne
směsných produktů (důležité zejména v případě pesticidů). Rozumná hranice čistoty
je 90%.
Důležitá je také kontrola a odstranění opakujících se stejných záznamů v databázi (replikací)
a významně podezřelých EC50 hodnot. Například pokud se v databázi vyskytuje deset
různých EC50 pro druh Daphnia magna (od různých autorů), které mají hodnotu kolem 5 µg/l
a jednu EC50 o hodnotě 1000 µg/l, pak je nutné se nad touto podezřele vysokou hodnotou
zamyslet. Doporučuje se nahlédnout do vědeckého článku, ze kterého byla hodnota do
databáze vložena a po úvaze ji buď z databáze vypustit, opravit nebo ji tam ponechat.
V dalším kroku je nutné v databázi přepočítat všechny hodnoty EC50 na stejné jednotky
(obvykle µg/l).
Protože do SSD modelu vstupují druhové hodnoty EC50 (vždy pouze jedna EC50 pro jeden
druh), je také potřeba rozhodnout, co udělat v případě přítomnosti více hodnot pro jeden
druh. Obecně jsou používané dva postupy – buď se pro daný druh použije ta EC50, která má
nejnižší hodnotu nebo se použije geometrický průměr všech EC50 hodnot pro tento druh.
Tento krok významně ovlivní výsledek i smysl celého SSD modelu a proto je vždy důležité
uvážit výběr správného postupu a uvést ho spolu s výsledky.
1
V případě tvorby SSD modelu chronických toxických účinků se používají NOEC, LOEC a EC10 hodnoty.
2
V případě tvorby SSD modelu chronických toxických účinků se používají naopak chronické NOEC, LOEC a EC10
hodnoty.
3
V případě tvorby SSD modelu chronických toxických účinků se může použít i změna reprodukce.
3) Tvorba SSD modelu
Když máme vytvořenou databázi vhodných EC50 hodnot pro určitou toxickou látku, pak
můžeme vytvořit SSD model a použít ho pro predikci efektů látky na ekosystém a pro
odvození limitních koncentrací (PNEC hodnot).
Za tvorbou modelu se skrývá (jak již vyplývá z předchozího textu) statistika. Naštěstí není
důvod k velkým obavám těch, kteří s ní velkou zkušenost nemají, protože existuje software
vytvořený přímo za tímto účelem. Jmenuje se ETX 2.0 a je zdarma ke stažení. Více o práci
s tímto softwarem bude vysvětleno ve cvičení. Zde bude následovat především stručné
vysvětlení teorie.
3a) Základní princip tvorby SSD modelu:
• Data z připravené databáze se zobrazí jako histogram (tj. zobrazení jejich četností) a
proloží se Gaussovou (normální) distribuční funkcí. Rovnice hustoty Gaussovy
distribuční funkce je:
(3)
µ … aritmetický průměr Gaussovy distribuční funkce
σ … směrodatná odchylka Gaussovy distribuční funkce
x … hodnota na ose x (v našem případě log(EC50)), pro kterou funkce vypočítá hustotu
pravděpodobnosti f(x)
Toto proložení je vlastně základní SSD model s potřebnými parametry µ (průměr) a σ
(směrodatná odchylka).
𝑓𝑓(𝑥𝑥) =
1
𝜎𝜎√2𝜋𝜋
𝑒𝑒
−(𝑥𝑥−𝜇𝜇)2
2𝜎𝜎2
Obr. 4. Proložení histogramu log(EC50) hodnot pro insekticid karbofuran Gaussovou hustotní distribuční
funkcí v softwaru ETX 2.0, parametry této funkce a celkový počet hodnot v databázi. Graf: na pravé ose y
jsou četnosti jednotlivých kategorií hodnot log(EC50), na levé pak jejich hustoty pravděpodobnosti -
f(log(EC50)).
• V dalším kroku bychom si měli ověřit, zdali proložení četností log(EC50) hodnot touto
Gaussovou funkcí je smysluplné. K tomu nám slouží tzv. testy normality. Pro SSD se
nejčastěji využívá Anderson-Darling nebo Kolgomorov-Smirnov test. Zjednodušeně
řečeno tyto testy porovnávají, jak moc se rozložení četností prokládaných hodnot
(sloupce v histogramu na obr. 4) liší od rozložení „modelově normálního“ (zelená
křivka na obr. 4). Pro jejich bližší pochopení je možné prostudovat některou
z početných statistických učebnic a jiných zdrojů. Nicméně jejich výpočty jsou
zahrnuty v téměř všech statistických softwarech včetně ETX 2.0. Důležité je však
dodat, že data se od normálního rozložení statisticky významně neliší, pokud je
výsledkem takovýchto testů hodnota p < 0,05.
Pokud je tato hodnota vyšší, je vhodné se podívat na histogram a opticky a selským
rozumem posoudit, jestli jsou rozdíly opravdu tak markantní nebo zda-li se jedná
pouze o přílišnou „přísnost“ testů normality (ke kterému může dojít, pokud je
v databázi velké množství dat). Pro takové optické posouzení mohou posloužit i tzv.
Q-Q ploty či P-P ploty. Důležité je všímat si nesymetričnosti v histogramu a
přítomnosti „dvojitých“ vrcholů (obr. 5).
Pokud i optické posouzení potvrdí, že data opravdu normální nejsou, je nutné se
zamyslet nad možným důvodem a případné výsledky vycházející z takového SSD
modelu brát s rezervou.
Obr. 5. Normální rozložení (zelená křivka) versus rozložení dat (šedé sloupce):
Rozložení dat je normální (A), nenormální s příliš vysokou četností středních hodnot (B), nenormální se
dvěma vrcholy (C), nenormální nesymetrické (D)
Nyní, když je sestaven SSD model, může být použit pro výpočet HCp a PAF hodnot.
3b) Výpočet HCp a PAF:
Pro výpočet hodnot HCp a PAF nám tedy stačí znát pouze průměr a směrodatnou odchylku
SSD modelu. Samotný model však musí být vyjádřený (jak je již uvedeno výše) jako
kumulativní Gaussova distribuční funkce:
(4)
Je důležité si uvědomit, že pro účel následujících výpočtů hodnoty na ose x přestávají mít
význam log(EC50), ale jsou chápány buď jako logaritmy koncentrace studované toxické látky
v prostředí (v případě odvozování hodnot PAF) nebo jako „koncentrace způsobující daný
efekt na společenství organismů“ (v případě odvozování hodnot HCp).
𝐹𝐹(𝑥𝑥) = �
1
𝜎𝜎√2𝜋𝜋
𝑒𝑒
−
(𝑥𝑥−𝜇𝜇)2
2𝜎𝜎2
𝑥𝑥
−∞
𝑑𝑑𝑑𝑑
Obr. 6. Různý význam osy x při odvození HCp a PAF hodnot
Výpočet HCp a PAF hodnot z uvedeného vzorečku není úplně triviální, naštěstí lze opět využít
softwaru ETX 2.0 (jedním z jeho základních výstupů je hodnota HC5 i s intervaly spolehlivosti)
a také Excelu. Tam existuje funkce „NORMDIST“ pro výpočet PAF a funkce „NORMINV“ pro
výpočet libovolné hodnoty HCp. Jediné, co stačí znát je zmiňovaný průměr a směrodatná
odchylka SSD modelu pro danou toxickou látku.
4) Limitace a modifikace SSD metody
Uvedená stručná teorie a postup tvorby základního SSD modelu jsou nutné k pochopení
principů této metody. Praxe je však ještě o něco složitější.
Pro tvorbu modelu z dat sensitivity organismů se nepoužívá pouze vysvětlená Gaussova
distribuce, ale častá je například distribuce logistická, triangulární a jiné. V poslední době se
navíc začínají uplatňovat i neparametrické techniky či Bayesovská statistika.
V poslední době se také čím dál víc začíná diskutovat o různých limitacích či omezeních této
metody. Např. není zcela prokázané, že limit HC5 je opravdu dostatečně bezpečný, aby nebyl
poškozen ekosystém. Dále se neustále hledá minimální počet hodnot druhových sensitivit
pro danou toxickou látku (např. EC50), který je dostatečný pro tvorbu nezkreslujícího SSD
modelu (EU doporučuje alespoň 10 druhových hodnot z různých taxonomických skupin).
V neposlední řadě se vede i diskuze nad tím, že specificky působící látky (např. herbicidy či
insekticidy) jsou výrazně toxické pouze pro určité taxony a jiné taxony by měly být víceméně
necitlivé. Proto je často narušena normalita takového rozložení a kvalitní SSD model je těžko
vytvořitelný. Často se proto tvoří model jen z cílových taxonů (např. SSD křivka pro herbicid
glyfosát pouze z primárních producentů). Výstupy z tohoto modelu pak mají samozřejmě i
jinou interpretaci.
3.5 4.0 4.5 5.0 5.5 6.0
log(NOEC or ECx)
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
Fractionoforganisms
PAF
log(změřenákonc.látky v prostředí)
3.5 4.0 4.5 5.0 5.5 6.0
log(NOEC or ECx)
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
Fractionoforganisms
HCp
log(teoretická konc.látky v prostředí)
Procentoovlivněnýchdruhů
SSD modely se mohou dále používat nejen pro hodnocení účinku jednotlivých látek, ale i pro
hodnocení účinků celých směsí.
Všechny tyto „nadstavbové“ informace jsou k nalezení v níže uvedené literatuře, která je
zatím všechna pouze v anglickém jazyce.
Doporučená literatura pro hlubší zájemce o téma:
Posthuma L, Traas TP, Suter GW (2002) Species sensitivity distributions in ecotoxicology.
Lewis, Boca Raton
EC (2011) Technical guidance for deriving environmental quality standards. Guidance
Document No. 27:204
… a vědecké články (např. na Web of Science) …