Hf evropský sociální fond v ČR EVROPSKÁ UNIE MINISTERSTVO ŠKOLSTVÍ MLÁDEŽE A TĚLOVÝCHOVY OP Vzdělávání pro konkurenceschopnost > S/J IM) INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ Seminář z finanční matematiky ■R Martin Řezáč 2G13 evropský sociální fond v ČR EVROPSKÁ UNIE MINISTERSTVO ŠKOLSTVÍ, MLÁDEŽE A TĚLOVÝCHOVY OP Vzdělávání pro konkurenceschopnost INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ Tento učební text vznikl za přispění Evropského sociálního fondu a státního rozpočtu ČR prostřednictvím Operačního programu Vzdělávání pro konkurenceschopnost v rámci projektu Univerzitní výuka matematiky v měnícím se světě (CZ.1.07/2.2.00/15.0203). Obsah: 1. Metody průzkumové analýzy 4 2. Aplikace logistických regresních modelů 85 3. Neuronové sítě. 120 4. Bayesovské sítě. 152 5. Bayesovské sítě - aplikace. 174 6. Výpočet pojistného v životním pojištění 210 7. Investování do akcií 238 8. Fundamentální analýza 278 9. Technická analýza 313 10. Oceňování nemovitého majetku 365 11. Black-Scholesův model 398 12. Oceňování derivátů, opce 415 13. Reference. 442 1. Metody průzkumové analýzy 4 7 Explorační analýza - PROČ? □ Je třeba pochopit data: > najít chyby v datech > najít vzory v datech > najít porušení statistických předpokladů, testování hypotéz > „.a především proto, že pokud to neuděláme, budeme mít velké problémy později. 5 Explorace dat - jednorozměrná Frekvenční tabulky, histogramy: pocet podil badrate Muz 248 768 55,0% 13,08% Zena 203 194 45,0% 7,69% Total 451 962 100,0% 10,66% delka zamestnani pocet podil badrate 0 20 825 4,6% 4,69% 1 163 144 36,1% 13,43% 2 67 462 14,9% 12,80% 3 43 778 9,7% 10,97% 4 26 256 5,8% 10,01% 5 27 526 6,1% 9,32% 6 15 893 3,5% 8,16% 8 18 036 4,0% 8,39% 10 17 195 3,8% 6,72% 20 33 641 7,4% 5,60% 24 5 176 1,1% 4,48% 48 12 934 2,9% 4,28% 666 96 0,0% 3,13% Total 451 962 100,0% 10,66% 60,0% 50,0% 40,0% 30,0% 20,0% 10,0% 0,0% 40,0% 30,0% 20,0% 10,0% 0,0% pohlavi Muz Zena i i podi I badrate I 14,00% 12,00% 10,00% 8,00% 6,00% 4,00% 2,00% 0,00% delka_zamestnani podil I Dadratel n nrinnnn„n 15,00% 0,00% 0 1 2 3 4 5 6 8 10 20 24 48 666 6 Explorace dat - jednorozměrná □ výše úvěru vs. bad rate OK? Nebo je to způsobeno jiným faktorem??? 25,0% 20,0% 15,0% 10,0% 5,0% 0,0% vyse_uveru v...___- n ľ! n n n I-1 podil I -Eadrate| 20,00% 0,00% * # c? x$> ^ 7 Explorace dat - jednorozměrná □ spojité proměnné: > Průměr > Modus > Kvantily > Rozptyl > Min./maximální hodnota □ je vhodná kategorizace 8 Explorace dat - jednorozměrná n Histogramy, box ploty □ Stabilita v čase ] B AD I GOOD Počet návrhů smluv - typ zboží M Ji 27.2. - 5.3. 6.3. - 12.3. 13.3. - 19.3. 20.3. - 26.3. 27.3. - 2.4. 3.4. - 9.4. Počet návrhů smluv - typ zboží □ VT □ OT □ NA □ MT □ FK □ CT □ BT 27.2. - 5.3. 6.3. - 12.3. 13.3. - 19.3. 20.3. - 26.3. 27.3. - 2.4. 3.4. - 9.4. 9 60 000 100% 50 000 80% 40 000 60% 30 000 40% 20 000 20% 10 000 0 0% 4994 Explorace dat - vícerozměrná □ Kontingenční tabulky do 5 000 5 000 - 10 000 10 000 - 15 000 víc než 15 000 BT 4 291 8 581 9 176 9 044 CT 7 587 12 493 6 500 7 236 FK 258 1 017 851 557 MT 27 191 39 551 16 524 5 992 NA 426 1 088 1 114 2 737 OT 2 478 3 689 2 103 3 475 VT 384 1 001 963 9 086 row% do 5 000 5 000 - 10 000 10 000 - 15 000 víc než 15 000 BT 13,8% 27,6% 29,5% 29,1% CT 22,4% 36,9% 19,2% 21,4% FK 9,6% 37,9% 31,7% 20,8% MT 30,5% 44,3% 18,5% 6,7% NA 7,9% 20,3% 20,8% 51,0% OT 21,1% 31,4% 17,9% 29,6% VT 3,4% 8,8% 8,4% 79,5% 1 col% | do 5 000 5 000 - 10 000 10 000 - 15 000 víc než 15 000 BT 10,1% 12,7% 24,6% 23,7% CT 17,8% 18,5% 17,5% 19,0% FK 0,6% 1,5% 2,3% 1,5% MT 63,8% 58,7% 44,4% 15,7% NA 1,0% 1,6% 3,0% 7,2% OT 5,8% 5,5% 5,6% 9,1% VT 0,9% 1,5% 2,6% 23,8% 10 Explorace dat - vícerozměrná Počet návrhů smluv - typ zboží n F¥F as CT FK MT NA OT VT Počet návrhů smluv - typ zboží .1 O 17 a víc ■ 12-16 □ 10-11 O 8-9 ■ 6-7 □ 4-5 □ víc než 15 000 □ 10 000 - 15 000 ■ 5 000 - 10 000 □ do 5 000 BT CT FK MT NA OT 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% Počet návrhů smluv - typ zboží _ _ — 1 1 1 1 m - 4-5 6-7 10-11 12-16 17 a víc Počet návrhů smluv - typ zboží do 5 000 5 000 - 10 000 10 000 - 15 000 víc než 15 000 □ VT □ OT □ NA □ MT □ FK □ CT □ BT □ VT □ OT □ NA □ MT □ FK □ CT □ BT 11 100% 100% 80% 80% 60% 60% 40% 40% 20% 20% 0% 0% 8-9 BT 100% 80% 60% 40% 20% 0% VT Explorace dat - vícerozměrná □ Věk vs. délka zaměstnání počet pozorováni 5 let ...defaultní hodnota??? délka zamestnaní 12 Explorace dat - vícerozměrná < CD Cyclical Linear cn cn O 01 o o cn cn o -J O O —1 —1 fO CJ b cn o oi o cn o J_I_I_I_I_I_L X P r1 r*- !° !° ^ cn o cn b cn b J_I_I_I_I_L CD None Quadratic cn cn O M cn PO cn Cn O cn cn cn o to cn o o cn cn o cn Correlation Zero # * ^ Pos/t/ve STRONG Negative weak -1 0 STRONG Positive 1 Correlation Coefficient Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 15 Extréme Data Values Odlehlé (extrémní) hodnoty mohou zcela zkreslit výsledky analýzy. X Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. XX J 16 Diskriminační síla proměnných pro prediktivní modely Weight of evidence, information value r ... number of levels (categories) of the categorical variable g ... number of "goods" the in i-th category bj ... number of "bads" the in i-th category G := I gi ... total number of "goods" B := I bj ... total number of "bads" Weight of evidence for the i-th category: woe,- = In (g-/ G) - In (b,-/ B) Information value for the i-th category: Inf_ val- = [(g-/ G) - (b-/ B)] • woe j Total information value for the corresponding variable: Inf_val = I lnf_vali 17 Diskriminační síla proměnných Incorporation Date Raw RegVar Percant B G TOT G/B Odds %Good %Bad Bad Rate WoE IV O&NOI inc 1 12% 139 952 1091 7 11% 19% 12,7% -0,557 0,046116 1 inc 2 13% 133 1073 1206 8 12% 19% 11,0% -0,394 0,023731 2-7 miss 42% 299 3601 3900 12 42% 42% 7,7% 0,007 2,04E-05 8-15 inc_3 22% 108 1942 2050 18 23% 15% i- — — — — — -i 5,3% 0,408 0,030887 16+ inc 4 11% 39 1019 1058 26 12% 5% 3,7% 0,781 0,050288 Total 718 8587 9305 12 7,7% 0,151 > <0.02 unpredictive > 0.02 - 0.1 weak > 0.1 - 0.3 medium > 0.3 - 0.5 strong > > 0.5 too high „.je třeba prověřit, pravděpodbně je něco špatně 18 Diskriminační síla proměnných □ Lorenzova křivka, Giniho index X — Fm.BAD (a) y — Fn.GOOD (a\ a G [L> H] . 0 0.1 0.2 0.3 0.4 05 Ů.6 0.7 O.fl 09 1 A Gini —-— 2 A A + B n+m Gini — 1 — (FmBADk ~ Fm.BADk—1 ) * (Fn.GOOD k + Fn.GOODk—1 ) k—2 19 Diskriminační síla proměnných □ Lorenzova křivka „.kontrola monotónnosti vysvětlované proměnné (def. rate) na dané vysvětlující proměnné 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Kategorizace (WOE) 20 Diskriminační síla proměnných □ Giniho index > 0.05 - 0.1 > 0.1 - 0.2 > 0.2 - 0.5 > > 0.5 něco špatně unpredictive weak medium strong too high ...je třeba prověřit, pravděpodbně je 21 Diskriminační síla proměnných Ipohlavi" |Gini: I 0,14011 lInfo.Value: | 0,0828| pocet podil badrate Muz 248 768 55,0% 13,08% Zena 203 194 45,0% 7,69% Total 451 962 100,0% 10,66% delka zamestnani hrube Gini: 0,1611 pocet podil badrate 0 20 825 4,6% 4,69% 1 163 144 36,1% 13,43% 5 165 022 36,5% 11,29% 666 102 971 22,8% 6,45% Total 451 962 100,0% 10,66% delka_zamestnani_jemne Gini: 0,1762 delka_zamestnani pocet podil badrate 0 20 825 4,6% 4,69% 1 163 144 36,1% 13,43% 2 67 462 14,9% 12,80% 3 43 778 9,7% 10,97% 4 26 256 5,8% 10,01% 5 27 526 6,1% 9,32% 6 15 893 3,5% 8,16% 8 18 036 4,0% 8,39% 10 17 195 3,8% 6,72% 20 33 641 7,4% 5,60% 24 5 176 1,1% 4,48% 48 12 934 2,9% 4,28% 666 96 0,0% 3,13% Total 451 962 100,0% 10,66% lInfo.Value: | 0,1100| lInfo.Value: | 0,1285| 60,0% 50,0% 40,0% 30,0% 20,0% 10,0% 0,0% 40,0% 35,0% 30,0% 25,0% 20,0% 15,0% 10,0% 5,0% 0,0% delka_zamestnani_hrube delka_zamestnani 40,0% 30,0% 20,0% 10,0% 0,0% pohlavi 1 1 podil -badrate 14,00% 12,00% 10,00% 8,00% 6,00% 4,00% 2,00% 0,00% r 16,00% 14,00% 12,00% 10,00% 8,00% 6,00% 4,00% 2,00% 0,00% podil badrate podil badrate r/ / / n ^—'—^ n II nnnnnľl rn" 0 1 2 3 4 5 6 8 10 20 24 48 666 Muz Zena 0 5 666 15,00% 10,00% 0,00% 22 SAS: the FREQ Procedure •The FREQ procedure can do the following: produce one-way to n-way frequency and crosstabulation (contingency) tables compute chi-square tests for one-way to n-way tables and measures of association and agreement for contingency tables automatically display the output in a report and save the output in a SAS data set •General form of the FREQ procedure: PROC FREQ DATA=SAS-data-set ; TABLES variable(s) ; RUN; Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 23 The FREQ Procedure A FREQ procedure with no TABLES statement generates one-way frequency tables for all data set variables. proc freq data=orion.sales; run; This PROC FREQ step creates a frequency table for the following nine variables: • Employee_ID • Job_Title • First_Name • Country • Last_Name ^ Birth_Date • Gender ^ Hire_Date • Salary Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 24 The TABLES Statement The TABLES statement specifies the frequency and crosstabulation tables to produce. proc freq data=orion.sales; tables Gender Country; ^-[ run; An asterisk between variables requests a n-way crosstabulation table. proc freq data=orion.sales; tables Gender*Country; —[ run; one-way frequency tables two-way frequency table Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 25 The TABLES Statement A one-way frequency table produces frequencies, cumulative frequencies, percentages, and cumulative percentages. proc freq data=orion.sales; tables Gender Country; run; The FREQ Procedure Gender Frequency Percent Cumulative Frequency Cumulative Percent F M 68 97 41.21 58.79 68 165 41.21 100.00 Country Frequency Percent Cumulative Frequency Cumulative Percent AU US 63 102 38.18 61.82 63 165 38.18 100.00 Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 26 The TABLES Statement An n-way frequency table produces cell frequencies, cell percentages, cell percentages of row frequencies, and cell percentages of column frequencies, plus total frequency and percent. proc freq data=orion.sales; tables Gender*Country; i it i run; V V rows columns Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 27 The TABLES Statement The FREQ Procedure Table of Gender by Country Gender Country Frequency Percent Row Pct Col Pct AU US Total F 27 41 68 16.36 24.85 41 .21 39.71 60.29 42.86 40.20 M 36 61 97 21.82 36.97 58.79 37.11 62.89 57.14 59.80 Total 63 102 165 38.18 61.82 100.00 Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 28 Additional SAS Statements •Additional statements can be added to enhance the report. proc format; value $ctryfmt fAUf=fAustraliaf fUSf=fUnited States1; run; options nodate pageno=l; ods html file=fp112d01.htmlf; proc freq data=orion.sales; tables Gender*Country; where Job Title contains fRepf; format Country $ctryfmt.; title 'Sales Rep Frequency Report1; run; ods html close; Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 29 Additional SAS Statements •HTML Output Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 30 Options to Suppress Display of Statistics •Options can be placed in the TABLES statement after a forward slash to suppress the display of the default statistics. Option Description NOCUM suppresses the display of cumulative frequency and cumulative percentage. NOPERCENT suppresses the display of percentage, cumulative percentage, and total percentage. NOFREQ suppresses the display of the cell frequency and total frequency. NOROW suppresses the display of the row percentage. NOCOL suppresses the display of the column percentage. Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 31 Additional TABLES Statement Options •Additional options can be placed in the TABLES statement after a forward slash to control the displayed output. Option Description LIST displays n-way tables in list format. CROSSLIST displays n-way tables in column format. FORMAT= formats the frequencies in n-way tables. Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 32 LIST and CROSSLIST Options Cumulative Cumulative Gender Country Frequency Percent Frequency Percent F Australia 27 16.36 27 16.36 F United States 41 24.85 68 41.21 M Australia 36 21.82 104 63.03 M United States 61 36.97 165 100.00 tables Gende r*Country / list; Gender F Table of Gender by Country Country Frequency Percent Row Percent Column Percent Australia United States Total 27 41 68 16.36 24.85 41.21 39.71 60.29 100.00 42.86 40.20 Australia United States Total 36 61 97 21.82 36.97 58.79 37.11 62.89 100.00 57.14 59.80 tables ..............................................................._______ Total Australia 63 38.18 100.00 United States 102 61.82 100.00 Total 165 100.00 Gender*Country / crosslist; M Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 33 PROC FREQ Statement Options •Options can also be placed in the PROC FREQ statement. Option Description NLEVELS displays a table that provides the number of levels for each variable named in the TABLES statement. PAGE displays only one table per page. COMPRESS begins the display of the next one-way frequency table on the same page as the preceding one-way table if there is enough space to begin the table. Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 34 NLEVELS Option proc freq data=orion.sales nlevels; tables Gender Country Employee_ID; run; Partial PROC FREQ Output The FREQ Procedure Number of Variable Levels Variable Levels Gender 2 Country 2 Employee_ID 165 Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. SAS: the MEANS Procedure •The MEANS procedure provides data summarization tools to compute descriptive statistics for variables across all observations and within groups of observations. General form of the MEANS procedure: PROC MEANS DATA=SAS-data-set ; VAR analysis-variable(s); CLASS classification-variable(s); RUN; Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 36 The MEANS Procedure •By default, the MEANS procedure reports the number of nonmissing observations, the mean, the standard deviation, the minimum value, and the maximum value of all numeric variables. proc means data=orion.sales; run; The MEANS Procedure Variable N Mean Std Dev Minimum Maximum Employee_ID 165 120713.90 450.0866939 120102.00 121145.00 Salary 165 31160.12 20082.67 22710.00 243190.00 Birth_Date 165 3622.58 5456.29 -5842.00 10490.00 Hire_Date 165 12054.28 4619.94 5114.00 17167.00 pll2d05 Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 37 The VAR Statement The VAR statement identifies the analysis variables and their order in the results. proc means data=orion.sales; var Salary; run; The MEANS Procedure Analysis Variable : Salary N Mean Std Dev Minimum Maximum 165 31160.12 20082.67 22710.00 243190.00 Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 38 The CLASS Statement •The CLASS statement identifies variables whose values define subgroups for the analysis. proc means data=orion.sales; var Salary; class Gender Country; run; The MEANS Procedure Analysis Variable : Salary Gender Country N Obs N Mean Std Dev Minimum Maximum F AU 27 27 27702.41 1728.23 25185.00 30890.00 US 41 41 29460.98 8847.03 25390.00 83505.00 M AU 36 36 32001.39 16592.45 25745.00 108255.00 US 61 61 33336.15 29592.69 22710.00 243190.00 Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 39 The CLASS Statement i classification va ri a b l es proc means data=orion.sales; var Salary; class Gender Country; run; J J The MEANS Procedure Analysis Variable : Salary Mean N Gender Country Obs N F AÜ 27 ^ 27702.41 analysis variable Std Dev Minimum Maximum 1728.23 25185.00 30890.00 M ÜS AÜ 41 36 41 36 29460.98 32001 .39. art a-7 r\o 83ff0ff,Q0 sta ti stics fo r a n alysis va ri at0l^ US 61 61 33336.15 29592.69 22710.00 243190.00 2222222222222222222222222222222222222222222222222222222222222222222222222222222222222222222 Í The CLASS statement adds the N Obs column, which is the number of observations for each unique combination of the class variables. Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 40 PROC MEANS Statistics •The statistics to compute and the order to display them can be specified in the PROC MEANS statement. proc means data=orion.sales sum mean range; var Salary; class Country; run; The MEANS Procedure Analysis Variable : Salary Country N Obs Sum Mean Range AU 63 1900015.00 30158.97 83070.00 US 102 3241405.00 31778.48 220480.00 Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. SAS: the SUMMARY Procedure •The SUMMARY procedure provides data summarization tools to compute descriptive statistics for variables across all observations and within groups of observations. General form of the SUMMARY procedure: PROC SUMMARY DATA=SA S-data-set ; VAR analysis-variable(s); CLASS classification-variable(s); RUN; Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 43 The SUMMARY Procedure •The SUMMARY procedure uses the same syntax as the MEANS procedure. •The only differences to the two procedures are the following: PROC MEANS PROC SUMMARY The PRINT option is set by default, which displays output. The NOPRINT option is set by default, which displays no output. Omitting the VAR statement analyzes all the numeric variables. Omitting the VAR statement produces a simple count of observations. Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 44 SAS: the TABULATE Procedure •The TABULATE procedure displays descriptive statistics in tabular format. General form of the TABULATE procedure: PROC TABULATE DATA=SAS-data-set ; CLASS classification-variable(s); VAR analysis-vahable(s); TABLE page-expression, row-expression, column-expression ; RUN; Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 45 The TABLE Statement •The TABLE statement describes the structure of the table. table pa g e exp rese o n row exp ressio n column exp i-essio n t J dimension expressions Commas separate the dimension expressions. Every variable that is part of a dimension expression must be specified as a classification variable (CLASS statement) or an analysis variable (VAR statement). Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 46 The TABLE Statement page row column table expression , expression ' expression ; •Examples: table Country; table Gender , Country; table Job_Title , Gender , Country; Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 47 The CLASS Statement •The CLASS statement identifies variables to be used as classification, or grouping, variables. •General form of the CLASS statement: CLASS classification-variable(s); • N, the number of nonmissing values, is the default statistic for classification variables. • Examples of classification variables: Job Title, Gender, and Country Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 48 The VAR Statement •The VAR statement identifies the numeric variables for which statistics are calculated. •General form of the VAR statement: VAR analysis-variable(s); • SUM is the default statistic for analysis variables. • Examples of analysis variables: Salary and Bonus Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 49 One-Dimensional Table proc tabulate data=orion.sales; class Country; table Country; run; Country AU US N N 63.00 102.00 Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 50 Two-Dimensional Table proc tabulate data=orion.sales; class Gender Country; table Gender, Country; run; Country AU US N N Gender F 27.00 41.00 M 36.00 61.00 Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 51 Three-Dimensional Table proc tabulate data=orion.sales; class Job_Title Gender Country; table Job_Title, Gender, Country; run; Job_Title Sales Rep. I Gender F M p112d08 Country AU US Job_Title Sales Rep. II Country AU US N N Gender F 10.00 14.00 M 8.00 14.00 Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 52 Dimension Expression •Elements that can be used in a dimension expression: • classification variables • analysis variables • the universal class variable ALL • keywords for statistics •Operators that can be used in a dimension expression: • blank, which concatenates table information • asterisk *, which crosses table information • parentheses (), which group elements Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. Dimension Expression proc tabulate data=orion.sales; class Gender Country; var Salary; table Gender all, Country*Salary; run; Country AU US Salary Salary Sum Sum Gender F 747965.00 1207900.00 M 1152050.00 2033505.00 All 1900015.00 3241405.00 Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. PROC TABULATE Statistics proc tabulate data=orion.sales; class Gender Country; var Salary; table Gender all, Country*Salary*(min max); run; Country AU US Salary Salary Min Max Min Max Gender F 25185.00 30890.00 25390.00 83505.00 M 25745.00 108255.00 22710.00 243190.00 All 25185.00 108255.00 22710.00 243190.00 Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 56 Additional SAS Statements •Additional statements can be added to enhance the report. proc format; value $ctryfmt ,AU'=,Australia' 'US'='United States'; run; options nodate pageno=1; ods html file='p112d08.html'; proc tabulate data=orion.sales; class Gender Country; var Salary; table Gender all, Country*Salary*(min max); where Job_Title contains 'Rep'; label Salary='Annual Salary'; format Country $ctryfmt.; title 'Sales Rep Tabular Report'; run; ods html close; p112d08 Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 57 Additional SAS Statements •HTML Output Sales Rep Tabular Report Country Australia United States Annual Salary Annual Salary Min Max Min Max Gender M All 25185.00 30890.00 25390.00 32985.00 25745.00 36605.00 22710.00 35990.00 25185.00 36605.00 22710.00 35990.00 Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 58 Více o PROC TABULATE: • In the SUGI 28 proceedings: • "The Simplicity and Power of the TABULATE Procedure", by Dan Bruns http://www2.sas.com/proceedings/sugi28/197-28.pdf • Online (from the SUGI 27 proceedings): • "Anyone Can Learn PROC TABULATE", by Lauren Haworth, http://www2.sas.com/proceedings/sugi27/p060-27.pdf 59 SAS: the UNIVARIATE Procedure •The UNIVARIATE procedure produces summary reports that display descriptive statistics. •General form of the UNIVARIATE procedure: PROC UNIVARIATE DATA=SAS-data-set; VAR variable(s); RUN; •The VAR statement specifies the analysis variables and their order in the results. Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 60 The UNIVARIATE Procedure The following PROC UNIVARIATE step shows default descriptive statistics for Salary. proc univariate data=orion.nonsales; var Salary; run; •Without the VAR statement, SAS will analyze all numeric variables. Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 61 The UNIVARIATE Procedure •The UNIVARIATE procedure can produce the following sections of output: • Moments • Basic Statistical Measures • Tests for Locations • Quantiles • Extreme Observations • Missing Values Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 62 Explorace - Vizualizace • Na prvním místě se obvykle citují knihy prof. Tufteho, např. Tufte E.R. (1983) The Visual Display of Quantitative Information, Graphic Press, Chesire, Conn. • Weby o vizualizaci, např. • http://www.math.yorku.ca/SCS/Gallery/noframes.html - galerie s poučným výkladem a příklady i nezdařených či lživých grafů • http://www.agocg.ac.uk/ - John Lansdown (1992) Aspects of Design in Computer Graphics: Some Notes -http://www.agocg.ac.uk/train/hitch/hitch.htm • Jiné weby, např. stránky různých vizualizačních programů a organizací • http://www.cybergeography.org/atlas/atlas.html nebo http://miner3d.com/products/gaUeryhtml 63 Vizualizace - historie □ William Playfair, 1786: první publikovaná prezentační grafika □ Dr. John Snow, 1845: epidemie cholery v Londýne t_:_«•***-_s. 64 Vizualizace - historie □ Florence Nightingale, 1858: důvody úmrtí v průběhu Krymské války (1853-1856) tuECAlSESoiMORTALITř in the ARMY k the EAST PKKV»vi hü i- ihx» vs* n Harry Beck, 1931: schéma Londýnského metra es Vizualizace - investigativni analyza □ http://www.i2inc.com/ Law Enforcement » Counterterrorism Narcotics investigations Organized crime Intelligence analysis Fraud Missing persons Major investigations Counterfeiting Immigration control » Major event security Money laundering Gang investigations » » Government Commercial ifSSI^i » Criminal prosecutions » Forensic accounting » National security » Money laundering » Military intelligence » Insider trading violations » Embassy security » Corporate security » Postal inspection and fraud » Anti-pirating investigations » Prison investigations » Entertainment copyright violations » Park and wildlife services » Competitive intelligence » Antitrust investigations » Civil lawsuits » Tax fraud investigations » Fraud: » Customs investigations » Credit card » Insurance » Retail » Health care » Commercial » Telephone 66 Vizualizace - investigativní analýza □ osobni kontakty, pojistné podvody 67 Vizualizace - investigativní analýza □ Praní špinavých peněz, kriminální gangy 68 Vizualizace - risk management 69 Vizualizace - dendrogram 7Q Vizualizace - ekonomie 71 Meteo-vizualizace 72 Kartogram □ Obce s počtem 500 a více obyvatel s vysokorychlostním připojením k 73 Kartodiagram 74 Grafy -další typy 75 Měřítko grafu Měřítko grafu □ Pohled tvůrce grafu: > Zvýraznění trendu - pozitivní výsledky. > Potlačení trendu - negativní výsledky. □ Pohled uživatele grafu: > Grafy bez uvedeného měřítka jsou silně podezřelé. > Nepodléhat podsouvané informaci o růstu/poklesu. 77 What Is SAS/GRAPH Software? •SAS/GRAPH software is a component of SAS software that enables you to create the following types of graphs: • bar, block, and pie charts • two-dimensional scatter plots and line plots • three-dimensional scatter and surface plots • contour plots • maps • text slides • custom graphs Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 78 Základní typy grafů •Bar Charts (GCHART Procedure) •Pie Charts (GCHART Procedure) Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 79 Základní typy grafů •Scatter and Line Plots (GPLOT Procedure) Budget Plot of Budget by Month for 2006 and 2007 «5,000,000 - (4,000,000 - / (3,000,000 - // \\ // (2,000,000 - (1,000,000 - 1 2 3 4 5 6 7 S 9 10 11 12 Month •Bar Charts with Line Plot Overlay (GBARLINE Procedure) Costs and Personnel for Western Regions Total Cost # of Employees Beaumont Cheyenne Portland Rockford Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 80 Three-Dimensional Surface and Scatter Plots (G3D Procedure) Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 81 Maps (GMAP Procedure) •Maps (GMAP Procedure) •Multiple graphs on a page (GREPLAY Procedure) Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 82 Producing Bar and Pie Charts with the GCHART Procedure •General form of the PROC GCHART statement: PROC GCHART DATA=SAS-data-set; •Use one of these statements to specify the chart type: HBAR chart-variable . . . ; HBAR3D chart-variable . . . ; VBAR chart-variable . . . ; VBAR3D chart-variable . . . ; PIE chart-variable . . . ; PIE3D chart-variable . . . ; Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 83 Producing Plots with the GPLOT Procedure •You can use the GPLOT procedure to plot one variable against another within a set of coordinate axes. •General form of a PROC GPLOT step: PROC GPLOT DATA= SAS-data-set; PLOT vertical-variable*horizontal-variable ; RUN; QUIT; Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 84 2. Aplikace logistických regresních modelů 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 B5 Logistická regrese Simultánní efekt nezávislých (explanačních) proměnných na šanci Odds = P/1-P = e P° + PiXi + + ...+PiXk Jestliže logaritmujeme obě strany Logit P = P0+piX1+P2X2+..+pkXk 86 Logit Transformation •Logistic regression models transform probabilities called logits*. r \ logit( pi) = ln J where i indexes all cases (observations) Pi is the probability the event (a default, for example) occurs in ln the 1th case is the natural log (to the base e). * The logit is the natural log of the odds. Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 87 Logit link function 5 0 -5 Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. The logit link function transforms probabilities (between 0 and 1) to logit scores (between and +°°). —00 88 Logit Transform logit link function Logistic Regression Model logit (p) = p0 + P1X1 + . . . + pkXk where • logit (p,)= logit of the probability of the event • P0=intercept of the regression equation • pk= parameter estimate of the kth predictor variable Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 89 Logistic Regressions -example Find parameter estimates by maximizing Zlog(P/)+ Xlog(1-p,) secondary primary outcome training cases outcome training cases log-likelihood function 1.0 0.9 0.8 0.7 0.6 X2 0.5 0.4 0.3 0.2 0.1 0.0 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 91 Logistic Regressions -example wy ji logit( p ) =-0.81+ 0.92 ^ + 1.11 x2 0.9 0.8 0.7 0.6 X2 0.5 0.4 0.3 0.2 0.1 0.0 Using the maximum likelihood estimates, the prediction formula assigns a logit score to each x1 and x2. Další příklad na: http://support.sas.com/documentation/cdl/en/statug /63033/HTML/default/viewer.htm#statug_logistic_se ct002.htm Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 92 Odhad parametrů • Metoda maximální věrohodnosti vede na soustavu nelineárních rovnic. • Tuto soustavu řešíme Netwon-Raphsonovou iterační metodou. • Více na: • http://www.stat.cmu.edu/~cshalizi/402/lectures/14-logistic- regression/lecture-14. pdf • http://czep.net/stat/mlelr.pdf • http://www.stat.psu.edu/~jiali/course/stat597e/notes2/logit.pdf 93 Maximálně věrohodný odhad (MLE) MLE is a general purpose method for parametric model estimation. We will make use of it to estimate the logistic regression. If we have a model with parametric structure G, we can compute the likelihood that the model will generate a sequence of n observations L(6|D) = P(D\&) The model which best fits the data is selected as the one which maximizes this likelihood. 8 = argmaxL(9|D) If we assume independence between the observations, this then gives m 8 = argmax]^[p(^|e) Zdroj: http://www2.imperial.ac.uk/ ~abellott/Credit%20Scoring%202.pdf 94 Maximálně věrohodný odhad This MLE can be expressed more conveniently in terms of log-likelihoods (since log is monotonie on its argument): m 0 — arg max^ log P(dí 16) Remember: • We do not know the true value of the parameter 9, but we want to estimate it. • To distinguish the estimate from the true value, in our notation, we put a "hat'' on the estimate: 9. MLE has several nice asymptotic properties: o Consistency o Asymptotic normality o Efficiency. 95 Maximálně věrohodný odhad 96 Maximálně věrohodný odhad Assuming independence between observations, this gives the log-likellhood function for p: ji logí(p|Dtrain) = 2i1-^>1°g(1 + e-(ft+p.xj)) + yilog(i + e/Jo+pJ 1=1 Differentiating by each coefficient in p and setting the derivative equal to zero to find the maxima gives n X i1 -yi - d+=0 1=1 v 7 and Z^(1_%"(iT7Í5*=ď)) = 0 for each attribute ;' = 1 to m. These are non-linear equations that can be solved by computer intensive processes such as Newton-Raphson methods. 97 Standard errors on the MLE Since 9 is only an estimate of the best model to explain the data, it is possible to derive standard errors s on the estimates. Asymptotic normality for MLE is such that 2^^(0,1) asu^oo where 0j, 8j and sj are the yth components of 9, 9 and s respectively and N(Orl) is the standard normal distribution. This property then allows us to generate:- • Generate a hypothesis tests using the Wald chi-square statistic; • Generate confidence intervals around the estimate. 98 MLE- testování hypotéz We test the hypothesis that an estimated coefficient is not zero against the null hypothesis that it is zero. That is, we testing if a parameter has a genuine effect in the model. • Null hypothesis: Ho:0j = G • Alternative hypothesis: H^: Oj ^ 0 The Wald test says reject H0 if ^ > zaj2 for some significance level a, where za/2 = 4>-1(l - a/2) and Is the CDF for the standard normal distribution. 99 MLE - konfidencni intervaly The asymptotic normality property also allows us to compute confidence intervals (CIs): - za/2$j < Qj < Qj + za/2Sj) -> 1 - a This is a range of possible values of the parameter within a given confidence level 1 — a. Note: the larger the confidence level, the broader the confidence interval. 100 Likelihood Ratio Test The maximized likelihood gives a measure of how well the model fits the data (l = perfect fit, 0 = no fit). The ratio of likelihoods between two models, A "nested" in B, can be used to test whether the fit of A improves on B. Definitions Suppose we have two models A and B with the same structure except A has more parameters than B: ) and QB = (e1.....0m) Then A is nested in B. The likelihood ratio statistic is A = 2 log 101 Newton-Raphsonova metoda • Základní princip metody: 1 n ■■ d2L{(3)dL(P) i=i r r- ^n^nT Maticový zápis: pne. = (XTWX)-1 (xpolä + w-1(y - p)) y ... vektor pozorování vysvětlované proměny X ... matice plánu, typu n x (p +1) p ... vektor pravděpodobnostíp(", P°W) W... n x n diagonální matice vah, s diag. prvky p(", P°M) • (1 - (", P°ld)) Jde o numerickou iterační metodu -> je třeba zkontrolovat, zda byla splněna podmínka konvergence (metoda „dokonvergovala" k optimálnímu řešení) 102 Výhody logistické regrese • Málo parametrů • Snadné použití i interpretace • Lze snadno začlenit i diskrétní prediktory • Funguje dobře i na datech, která se poměrně značně liší od gaussovských směsí • A především většinou dobře funguje, pokud věnujeme odpovídající pozornost přípravě dat • praktická zkušenost: ve čtyřech případech z pěti je logistická regrese na datech, která analyzuji, buď nejlepší nebo zhruba stejně dobrá jako jiné metody. 103 Interpretace, rozdíly proti OLS • Regresní koeficienty b: kladné znamenají, že proměnná svým růstem zvyšuje šanci zařazení do skupiny kódované číslem 1, a naopak záporné indikují pokles této šance • Často se používá exp(bř): je to faktor, kterým se násobí šance při jednotkovém nárůstu xt a neměnných ostatních xk • Pozor na různá měřítka, v nichž xt mohou být měřena; • Místo F-testu celkové validity nyní máme chí-kvadrátový test pro totéž • Místo t-testu signifikance proměnných v modelu jsou Waldovy statistiky; je to v podstatě totéž a čteme to stejně • Místo R2 jsou jen pseudo-R2 104 Příklad The following logistic regression output was produced on a data set of 40,000 credit cards. Likelihood Ratio = 1819 (p-value < 0.001) Variable Coefficient Estimate Standard error Wald chi-square P > chi-square Intercept ßo -0.181 0.084 4.6 0.032 Age ßi + 0.0353 0.0013 757.6 <0.001 Income (log) ß2 -0.0164 0.0100 2.67 0.10 Residential phone ßi + 0.622 0.030 430.8 <0.001 Home owner * 0 Renter A -0.155 0.039 15.6 <0.001 Lives with parents ßs + 0.256 0.045 32.1 <0.001 Months in residence ßs -0.00025 0.00011 5.4 0.020 Months in current job ßv + 0.00210 0.00025 72.9 <0.001 * Notice that the Home owner category is set as base residency category and so has no coefficient estimate. We will discuss this in a later lecture. Zdroj: http://www2.imperial.ac.uk/ ~abellott/Credit%20Scoring%202.pdf 105 Příklad We have used logistic regression to model the negative outcome (le y = 0). • This may seem odd given that the outcome of interest is the positive one (eg default). • However, this model ensures the log-odds scores are the right way round: ie increasing scores imply Increasing creditworthiness. • There is no material difference. If we had modelled y = 1, the signs on the coefficient estimates would be reversed but everything else would be the same. Interpretations: • The estimates (highlighted) form the scorecard. • Estimates greater than 0 indicate relative decrease in risk. • Estimates less than 0 indicate relative increase in risk. • Small p-values indicate coefficients that are statistically significantly different to zero (how small?). • Large p-values indicate coefficients that have a good chance of actually being zero. 106 Příklad Remember in the exercise in Chapter 1 we gave details of six borrowers. You were asked to select three to accept and three to reject. Here the scores assigned by the model above are shown. The observations with the three lowest scores are rejected by the model. The actual outcome in each case is also shown. How does your performance compare with the model? Age Monthly Residential Residence Months in Months Score Model Actual Income phone? type? residence in current accept or outcome (£) job reject? 22 1,145 Yes Home owner 48 12 1.11 Reject Good 46 15,500 Yes Renter 48 192 2.14 Accept Good 71 900 Yes Renter 96 12 2.6S Accept Good 32 5,000 Yes Renter 48 168 1.61 Accept Bad 25 1,3S5 Yes Renter 12 0 1.05 Reject Bad 43 3,145 No Home owner 96 36 1.25 Reject Bad 107 Příklad Variable Value Coefficient Estimate Value x Estimate Intercept n/a ft -0.181 -0.181 Age 22 ft + 0.0353 +0.777 Income (log) log(1145) = 7.04 ft -0.0164 -0.116 Residential phone 1 ft +0.622 + 0.622 Home owner * 1 0 0 Renter 0 ft -0.155 0 Lives with parents 0 ft +0.256 0 Months in residence 48 ft -0.00025 -0.012 Months in current job 12 ft + 0.00210 0.025 Score (sum) + 1.115 108 Multinomiální logistická regrese • Taktéž polytomická regrese • Závisle proměnná má M kategorií, více než dvě. Např.: kterou stranu respondent volí? • Základní idea: • Prohlásit jednu kategorii za referenční • Spočítat M-i obyčejných logistických modelů pro každou ze zbylých kategorií oproti referenční • A predikovat tu kategorii, kde vyšla největší pravděpodobnost přes všechny modely 109 Logistic Regression with Sequential Steps • Forward regression • starts with a baseline model (intercept-only) • searches all variables and finds the strongest one • keeps adding variables in order of strength until no significant improvement is achieved in the model. • Backwards regression • starts with a full model using all variables • removes the weakest input variable provided that taking it out does not cause a significant reduction in the fit of the model • continues removing the weakest input variables in order unless there is a significant reduction in the fit of the model; at which point the algorithm stops. Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 111 Logistic Regression with Sequential Steps • Stepwise regression • is a combination of forward and backward regression • begins the same way as forward • re-evaluates the statistical significance of all included variables after each new variable is added. • f If a previously included variable becomes statistically insignificant when a new variable is added, that variable is then removed. • f The algorithm stops when no more variables can be found that add significantly to the fit of the model and all variables remaining in the model are statistically significant. Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. The Logistic Regression Task Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 113 Which link function, which response Level to Model? Volba funkce. linkovací the level response that you Specify of the variable want to model. For example, do you want to model the probability of a 0 or a 1? 114 Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. LOGISTIC Procedure •General form of the LOGISTIC procedure: PROC LOGISTIC DATA=SAS-data-set ; CLASS variables ; MODEL response=predictors ; UNITS independent1=list... ; ODDSRATIO <'label'> variable ; OUTPUT OUT=SAS-data-set keyword=name ; RUN; Více např. na: http://www.okstate.edu/sas/v8/sashtml/onldoc.htm http://www.okstate.edu/sas/v8/saspdf/stat/chap39.pdf Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. LOGISTIC Procedure - příklad ods html file="logistic_vyvoj.html" style=sasweb; proc logistic data=dm1.data_vyvoj descending; model good4=goods_type_w phone_w a_uver_w fam_state_w income_w credit_w vek_w ; run; ods html close; 116 LOGISTIC Procedure - příklad proc logistic data=dm1.score_base outest=work.model_def; CLASS AGE_d EDUCATION_d CAR_AGE_d / param=glm; MODEL def_bad = AGE_d EDUCATIONd CAR_AGE_d total_income_d(init_pay_by_INCOME_d) / SELECTION=FORWARD HIERARCHY=MULTIPLECLASS; score out=work.tab_scored_def; run; 117 LOGISTIC Procedure - příklad proc logistic data=dm1.score_base outest=work.model_def namelen=200; where client_type="1-Novy"; CLASS sex_k child_num_k fam_state_k age_k; MODEL def_bad = AGE_w EDUCATIONw AGE_w*EDU CATIONw sex_k|child_num_k|fam_state_k|age_k@4 LOGISTIC Procedure - příklad proc logistic data=dm1.score_base inest=hc.modelSU namelen=200; CLASS sex_k child_num_k fam_state_k age_k; MODEL def_bad = AGE_w EDUCATION_w AGE_w*EDU CATIONw sex_k|child_num_k|fam_state_k|age_k@4 /selection=none maxiter=0; output out=dm1.data_all_scr (keep=id_credit score def_bad compress=yes) prob=score; run; 119 3. Neuronové sítě 120 Neuronové sítě (Neural Networks) • Někdy se také uvádí název Artificial Neural Networks (ANN), tj. umělé neuronové sítě. • Založené na pozorované funkcionalitě lidského mozku. • Ovšem v porovnání s mozkem jde o velmi zjednodušený matematický model. • Často jde u NN o adaptivní systém, který mění svou strukturu na základě vnějších či vnitřních informací získaných v průběhu učící fáze. • Využívají se např. při vyhledávání vzorů v datech, rozpoznávání řeči nebo klasifikačních problémech. • http://en.wikipedia.org/wiki/Artificial_neural_network 121 Příklad neuronové sítě Height (výška) Gender (pohlaví) (malý) mall (střední) Medium (vysoký) [Tall vstup skrytá vrstva výstup (input) (hidden layer) (output) 122 The Neuron c v( ~~~ dendrite (input) J cell body \_ axon- \ neurotransmitter (output) 2 synapse • Excitatory (+) and inhibitory (-) inputs, arriving at the dendrites, are weighted by adaptable synapses. • The weighted inputs are added together. • If the sum is greater than an adaptable threshold (bias) value, the neuron sends activation down its axon. Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 123 The McCulloch-Pitts Neuron w0 E(y) d i=1 Wi m m m W A McCulloch-Pitts neuron with d inputs is formally defined by the following equation: • The step function, /(.), turns each McCulloch-Pitts neuron into a linear classifier/discriminator. Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 124 The Hebb Rule • The strength of the connection between neurons i and j should be adjusted in accordance with the equation: Aw!J = tj • The eta (tj) term is the neuron's learning rate, which scales the amount of weight adjustment. • Permitted learning rate values range from o to 1. • Large learning rate values risk divergence. Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. The Widrow-Hoff Delta Rule • Hebb's learning rule is unstable. • Widrow and Hoff proposed a variant of Hebb's rule, one that is stable under a range of learning rates: Awff = 7](y - y,)Xj • They called their learning model the delta rule. • Because the delta rule reduces the sum of squared error, it is also known as the least mean squares rule. Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. The Perceptron The perceptron is a pattern-recognition machine invented in the 1950s for optical character recognition. »1 »2. Each processing unit is a McCulloch-Pitts neuron. A perceptron with n outputs is a discriminator function that divides the input space into n distinct regions. Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 127 The Limitations of a Simple Perceptron The simple (linear) perceptron can only solve linearly separable problems. The EXLUSIVE OR truth table (below) is an example of a problem that is not linearly separable. Output F T T F X2 T F T F ? Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 128 Inputs x1 x2 F T F F T F T F F T T T Výhody NN • Schopnost učení. • Snadná parametrizace. • Robustnost. • Řeší mnoho problémů. 129 The Impact of Noisy Data Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 130 Nevýhody NN • Nesnadné porozumění/interpetace. • Můžou trpět přeučením (overfitting). • Vstupy musí být numerické. • Obtížná verifikace. 131 Typy neuronových sítí • Existuje celá řada typů neuronových sítí, přičemž každý z nich se hodí na jinou třídu úlohy. • Podle přítomnosti „učitele" dělíme neuronové sítě na • sítě s učitelem (srovnávání výstupu s požadovaným) • sítě bez učitele (bez vnějšího arbitru). 132 Typy neuronových sítí podle zpracování signálu Symbol Způsob zpracování signálu — chybí vrstva zadně L lineární kombinace V vzdálenost Z znaměnko S sigmoida G Gaussova funkce E exponenciála MIN nejmenší vyhrává MAX největší vyhrává 133 Typy neuronových sítí podle zpracování signálu Typ sítě Vrstvy Autoři Vstupní Skrytá Výstupní OLAM * - L(+Z) Haykin HEBB * - L+Z Hopfield HAMM * L+MAX L+Z Lipmann MLPi * L+Z L+Z Widrow, Hoff MLP2 * L+S L+S Rummelhart SOM * - V+MIN Kohonen RBF * V+G L Poggio, Girosi MOD * L+E L Jacobs, Jordan COUNT * V+MIN L Nielsen 134 Typy neuronových sítí podle zpracování signálu • V předchozí tabulce je základních devět typů sítí: • optimální lineární asociativní paměť (Optimum Linear Associative Memory - OLAM), • Hebbova síť (HEBB), • Hammingova síť (HAMM), • vícevrstvá síť s bipolárními neurony (Multi Layer Perceptron 1 - MLP1), • vícevrstvá síť se spojitým chováním (MLP2), Kohonenovy mapy (SOM), • síť s radiální bází (RBF), • modulární síť (MOD) a • síť se zpětným šířením (counterpropagation - COUNT). • Další sítě lze vytvářet jejími kombinacemi. 135 Asociativní neuronové sítě • U asociativní paměti probíhá vybavení příslušné informace na základě její částečné znalosti (asociace). • Rozlišujeme sítě s pamětí • autoasociativní (upřesnění či zúplnění vstupní informace na základě již naučeného) • heteroasociativní (vybavení si sdružené informace na základě vstupní asociace) 136 Učení neuronových sítí • Algoritmus učení je různý, nicméně obecně má tyto kroky: • inicializace vah (malé náhodné hodnoty) • předložení nového vzoru (vektor reálných hodnot X) • výpočet aktuálního vstupu (podle f aktivační funkce) • přizpůsobení vah (přepočtení vah podle zjištěné odchylky) • opakování procesu učení (až do stabilizace vah wi) • Fáze učení sítě se nazývá adaptivní a po naučení je síť ve fázi vybavování (aktivní fázi). 137 Využití neuronových sítí Úloha Vhodné neuronové sítě logické obvody HEBB, HAMM, MLPi odstranění šumu MLPi, MLP2, RBF, MOD řeč a výslovnost MLP2, SOM komprese COUNT data mining OLAM, HEBB, SOM optické rozpoznávání znaků HEBB, OLAM, HAMM, MLPi, MLP2, RBF, SOM 138 Linear Perceptron d g ~1(E (y)) = w0 +^ wixi i=1 Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. Activation Functions Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 140 Multilayer Perceptron h g -'(E (y)) = w0 wg i=1 d 7=1 hidden layer Wh w1 g-' (E (y)) Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 141 K w01 ■ ■ ■ ■ ■ ■ w d1 Shaping the Sigmoid w0 + WjtanhO01 + wnx) —w01 X Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 142 Sigmoidal Basis Functions Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 143 Skip-Layer Perceptron h d d + 1 wkxk k=1 hidden layer skip layer w1 g-1 E (y)) Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 144 g~l(E(y)) = w0 +Yw,g, w0, +Yw x — 0 0/ j j =1 j=1 i W01 w0 ■ ■ ■ ■ ■ ■ 1 MLP with Two Hidden Layers m g _1( E (y)) = w0 + 2 wkgk k=1 x n V d A _J wo k + 2 wjk gj (w Y V nested hidden layers g—1 (e (y)) Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 145 ■ ■ ■ How Many? • A single hidden layer network models any continuous relationship between the inputs and outputs. • Two hidden layers model discontinuous relationships. • The number of hidden units that will be required in each defined hidden layer is problem specific. Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 146 Overview of Radial Basis Functions • Ordinary Radial Basis Functions (ORBF). • Normalized Radial Basis Functions (NRBF). Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 147 Ordinary Radial Basis Functions h g ~1(E (y)) = w0 +^ wl exp i=1 w 0i d Xj — Wy )2 hidden unit 11 w1 g 1 (E (y)) wdn wh Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 148 ( V J=1 K w01 w0 ■ ■ ■ ■ ■ ■ wd d1 Shaping the Gaussian w0 + w1 exp (— w0)](x - w11)2) Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 149 RBF Combination Functions • XRADIAL • EQRADIAL • EWRADIAL • EHRADIAL • EVRADIAL Unequal Heights and Widths. Equal Heights and Widths. Equal Widths. Equal Heights. Equal Volumes. Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 150 Normalized Radial Basis Functions i=1 where e = exp hidden unit d v J=1 w1 g 1 (e (y)) Reprodukováno se svolením společnosti SAS Institute Inc., Cary, NC, USA. 151 ( h k e v ^ J=1 J j [ + A" J w11 —-—K w01 w0 ■ ■ ■ ■ ■ ■ w 4. Bayesovské sítě Bayesian Networks (Belief Networks) 152 Bayesův vzorec: Typický příklad využití Bayesova vzorce (test na TBC): Test má senzitivitu 90%, spefificitu 1% a TBC trpí 5 lidí z 10 000. Jaká je pravděpodobnost, že osoba, které test určil přítomnost TBC, touto chorobou skutečně trpí? [0,043] ~> Vidíme, že (ne)přítomnost TBC má vliv na výsledek testu. • V reálném světě jsou komplikovanější závislosti. Např. fakt zda osoba kouří má vliv na to, zda trpí bronchitidou nebo rakovinou. Každá z těchto chorob má vliv na kondici a navíc (ne)přítomnost rakoviny plic má vliv na výsledky RTG. Otázkou tedy je, jak tuto situaci řešit. 53 Zdroj: Neapolitan, R.E. (2004) • Pojem Bayesovské sítě jako první použil Judea Pearl v roce 1985. • Za základní práce na toto téma lze považovat: • Pearl, J.: Probabilistic Reasoning in Intelligent Systems (1988) • Neapolitan, R.E.: Probabilistic Reasoning in Expert Systems (1989) 154 • Formalizmus na podporu rozhodování pod vlivem nejistoty. • Reprezentuje sdružené rozdělení pravděpodobnosti vektoru náhodných veličin. • Při volbě pravděpodobnosti kombinuje historická data (např. zpoždění vlaku) a názor odborníka (např. kvalita testu). • Uplatňují se v Risk managementu v oblastech s nedostatečnými nebo žádnými daty, např. při určování rizika teroristického útoku nebo selhání nového systému. • Využití v medicínské diagnostice, vyhodnocování rizika, chyb materiálu, kvality softwaru,... • Komerční software: Agenarisk, BayesLab, BNet,... • Freeware/ open source: MSBNx, OpenBayes, Powersoft,... 155 • Orientovaný acyklický graf (DAG). • Uzel vyjadřuje náhodnou veličinu (diskrétní nebo spojitou). • Orientovaná hrana vyjadřuje závislost mezi danými uzly. • Každý uzel je závislý na svých „rodičích", jinak jsou uzly navzájem podmíněně nezávislé (D-separované). • Zjednodušení: z Y, Z) = P(X) * P( Y\X) * P(Z\ Y, X) na P(XÍY,Z) = P(X) * P(Y\X) * P(Z\Y) • Pro Y platí: X je jeho „rodič" (přímý předchůdce) Z je jeho „dítě" (přímý následovník) 156 Sdružené rozdělení pravděpodobnosti vektoru náhodných veličin PsÍXl X2?... ,Xn) = J] Fs(X/|7r/) = 0X: Síť B=, kde G je DAG s uzly X1, X2,...,Xn a 0 je možina parametrů 0Xi|ni pro všechny náhodné veličiny Xj. Podmíněné rozdělení pravděpodobnosti každého uzlu Xi je závislé na množině jeho rodičů ni. Diskrétní případ: podmíněné rozdělení pravděpodobnosti (CPD) náhodné veličiny Z obsahuje parametry 0Z|Y uspořádané v pravděpodobnostní tabulce (NPT, CPT): 157 • Zpětné vyhodnocování podmíněných pravděpodobností při pozorování skutečné hodnoty některé náhodné veličiny. • Bayesovská síť obsahuje skryté i pozorované uzly • Máme dané P(Xi), P(X2) a P(Y|Xi, X2). • Při pozorování skutečné hodnoty Y=y se změní P(Xi) na P(Xi|y) a P(X2) na P(X2|y). • Pomocí Bayesova vzorce P(Xl\y) = ^MXi)P(Xi) 158 1S9 0 = Martin oversleeps M = Martin late T = Train strike N = Norman late Node Name State 0 State 1 Martin late 'res No ],4460 0,5540 Martin oversleeps Yes No 0,4000 0,6000 Norman late True False 0,1700 0,8300 Train strike Yes No 0,1000 0,9000 P(N)=P(/V| T)P(T) + P(N\^T)P(-^T) = 0.8 * 0.1 + 0.1 * 0.9 = 0.17 P(M)=P(M|7ř 0)P(T)P(0) + P(M\T^0)P(T)P(-nO) + + P(M\^T: 0)P(^T)P(0) + P{M\^T. ^0)P(^T)P(-^0) = 0.8 * 0.1 * 0.4 + 0.6 * 0.1 * 0.6 + 0.6 * 0.9 * 0.4 + 0.3 * 0.9 * 0.6 = 0.032 + 0.036 + 0.216 + 0.162 = 0.446 Pravděpodobnost, že bude mít Martin zpoždění je 44,6%. Pravděpodobnost, že bude mít Norman zpoždění je 17%. Node Name State 0 I State 1 Martin late Yes No 0,5424 0,4576 Yes No 0,4000 0,6000 Yes No 1,0000 0,0000 Yes No 0,4706 0,5294 Martin oversleeps Norman late Train strike Pozorujeme, že Norman měl zpoždění, tj. P(N)=i. r,/^.^ P(N\T)P(T) 0.8*0.1 n m , , v , v , P(T\N) = v P(N) = 0 17 = (výrazně více než 0.1) P(M) = P(M\(T\N): 0)P(T\N)P(0) + P(M\(T\N).^0)P(T\N)P(-^0)+ + P{M\^(T\N), 0)P(-n(T\N))P(0) + + P(M|-.(T|/V)í-.0)P(-.(r|/V))P(-.0) = 0.8 * 0.471 * 0.4 + 0.6 * 0.471 * 0.6 + 0.6 * 0.529 * 0.4 + 0.3 * 0.529 * 0.6 = 0.151 + 0.169 + 0.127 + 0.095 = 0.542 Pokud má zpoždění Norman, roste pravděpodobnost, že bude mít zpoždění i Martin. 161 • Objektově orientované BNs. • Určování NPTs pro rozsáhlé BNs. • Bayesovské sítě učící se z dat. • Dynamické bayesovské sítě. • Hybridní bayesovské sítě. 162 • V klasické BN je množina uzlů a vazba mezi nimi fixní a použitelná jen pro daný případ. • Programátorské řešení přes abstraktní datové typy a objektově orientované programovaní. • ADT = implementačně nezávislá specifikace struktury dat s operacemi na této struktuře, např. zásobník. • Objektově orientované programování = organizování ADT. • Základním prvkem OOBNs je objekt. • Nejzákladnější objekt je náhodná veličina (jako u klasické BN). • Např. objekt auto má atributy barva, majitel, motor,.... Barva je tedy základní objekt (nabývá konečného množství hodnot), ale majitel má své další atributy. 163 • Komplexní objekt je definovaný přiřazením stochastických funkcí každému jeho atributu a propojením atributů pomocí BN, tj. vytvoření pravděpodobnostního modelu. • „Bayesovská síť bayesovských sítí". • Stochastická funkce pro všechny hodnoty vstupů přiřadí rozdělení pravděpodobnosti hodnot vstupů. • Třída objektů = množina objektů popsaných stejným pravděpodobnostním modelem. • Třídy umožňují sestavit obecnou strukturu, kterou je možné použít při řešení různých problémů. • Používají se při modelování dynamických BNs. 164 • U rozsáhlých sítí je problém s ručním plněním NPTs, především pro uzly s mnoha možnostmi (časová náročnost, riziko překlepu) . • Uspořádané uzly reprezentují kvalitativní proměnné, chápeme je jako disktretizaci intervalu [0, 1]. • Např. X1, X2, Y g {velmi nízká, nízká, vysoká, velmi vysoká} X1 : kvalita testovacích nástrojů X2 : kvalita testovacích postupů Y : efektivnost testu => NPT pro Y bude mít přes 125 položek. • Možnost zjednodušení pomocí Noisy-OR nebo Noisy-MAX • Jen pro dikrétní náhodné veličiny. • Noisy-OR pro binární proměnné, Noisy-MAX je rozšířený model pro vícehodnotové proměnné. • Předpokládá se, že „rodiče" jsou navzájem nezávislí při ovlivňování „dítěte". • Logaritmická redukce rozsahu NPTs. • Deterministický OR model předpokládá, že Xi = True => Y =True nezávisle na hodnotách ostatních rodičů. • U Noisy-OR modelu tato implikace nemusí nastat: P(Yf = True\Xj = True) = p,-P(Y; = True\Xi = Falše) = 0 • V i : Xi = False => Y = False reálně nemusí platit... Leaky Noisy-OR. 166 • Možnost naučit se kvantitativní, ale i kvalitativní část. • Naučená pravděpodobnost vyjadřuje relativní četnost (ne subjektivní pravděpodobnost). • Učení využívá bayesovský princip: 7r(0|y) oc f{y\9)ii{9) • Neinformativně apriorní rozdělení - jakákoli pravděpodobnost je stejně možná. • Informativně apriorní rozdělení - např. Beta rozdělení. • Vytvoření rozšířené BN s uzly reprezentující naše přesvědčení o relativní četnosti (rodič daného uzlu). 167 • Rozšíření BNs pro modelování rozdělení pravděpodobnosti nekonečné posloupnosti náhodných veličin Zi, Z2,... • Nejčastěji jde o časovou řadu (např. při rozpoznávání hlasu) nebo posloupnost znaků (např. proteiny). • Stochastické procesy s diskrétním časem. • Modelace dynamických systémů, samotná BN se v čase nemění. • DBN je definovaná jako dvojice (Bi, B^), kde Bi je BN definující apriorní P(Zi) a je 2TBN, která definuje PÍZJZtJ jako N P(Zt\Zt_1) = l[P(ZÍ\Pa(Z')l i=i • kde Zti je i-tý bod v čase t a Pa(Zti) jsou jeho rodiče. 168 Prior Water Level Statická BN, nutnost replikovat celou síť při každé iteraci I River Flooding T1 Flood Defences Prior Water Level Flood Defences Post Water Level River Flooding T2 Flood Defences Prior Water Level Flood Defences Post Water Level River Flooding T3 Flood Defences Prior Water Level Flood Defences Post Water Level Obr.: Dynamická BN, zdroj: Fenton a Nei 169 Hybridní Bayesovské sítě: • Obsahují diskrétní i spojité náhodné veličiny. • Nejčastěji je používaný podmíněný lineární Gaussův model: dítě má normální rozdělení se střední hodnotou závislou na spojitých i diskrétních rodičích a s rozptylem nezávislým na spojitých rodičích. • Není možné, aby diskrétní dítě mělo spojité rodiče. • Je ale možná diskretizace. • Příklad: cash-flow společnosti (spojitý bod) ovlivní pravděpodobnost kapitálové investice (diskrétní bod). 170 Skryté Markovské modely (HMMs): • Nejjednodušší typ dynamických a zároveň hybridních BNs. • Pro každý časový okamžik má jeden diskrétní skrytý bod a jeden diskrétní nebo spojitý pozorovaný bod. • Kruh je spojitý bod, čtverec bod diskrétní. Bílý bod je skrytý, šedý bod pozorovaný. 171 HMM wilh Gajssiüh oulpul Lhpul-oulpĽl HMM V O ö HMM wilh inixTuLt of Gaussiins oulpul Ô Aulo Reglemive HMM Coupled HMM Faťtohal HMM Obr.: Některé varianty HMMs, zdroj: Murphy 172 Lineární dynamické systémy (LDSs): • Další příklad DBNs; stejná topologie jako HMMs. • Navíc předpoklad lineárního Gaussova rozdělení všech bodů. AutoR&grtssiv&moddAR(l) Switching AR mc del Switching KaJman filter K aim an filter model Obr.: Některé varianty LDSs, zdroj: Murphy 173 5. Bayesovské sítě - aplikace 174 • První pracovní aplikace BNs ° Období 1988- 1995 ° Diagnostika • Lékařství - MUNIN HUGIN Diagnostika poruch (závad) 175 MUNIN Dokončen jako systém pro podporu rozhodování lékařů. Je těžké odhadnout, do jaké míry byl v té době použit. Lékaři byli vůči němu skeptičtí - nevěřili těmto Ul aplikacím. 176 BNs a Microsoft • Rok 1996 - "Konkurenční výhodou Microsoftu jsou jeho odborné znalosti v Bayesovských sítích." • Vysoké investice do výzkumu ° Eric Horvitz ° David Heckerman • Oblasti využití ° uživatelská podpora ° automatizovaná diagnostika chyb 177 178 179 Farmaceutické společnosti • Vysoké využití - možnost vyšší účinnosti a správnosti jejich testů. Snížení nákladů. • Rok 2006 - FDA (Food and Drug Administration) oznámila svou snahu využívat Bayesianské techniky. ° Cíl - urychlení procesu schvalování a zvýšení celkové bezpečnosti. 180 Vývoj softwaru • Pro nový software je důležité, aby obsahoval co nejméně chyb. Ale i přes mnoho testů, tam stále nějaké chyby budou. • Cíl - aby uvolněný software obsahoval co nejméně chyb a aby případné chyby měly na koncové uživatele co nejmenší vliv. • BNs se využívají pro tvorbu předpovědí o zbytkových chybách. • Důležité především pro bezpečnostní software. 181 Systém TRACS • Systém pro předpovídání spolehlivosti pozemních vozidel. • QinetiQ (Společnost, která poskytuje technické poradenství zákazníkům v celosvětovém letectví, obraně a bezpečnosti trhu). • Výběr vozidla pro Ministerstvo obrany (UK) < Obtížné, časově náročné a náchylné k chybám <> Původně: kombinace testování prototypů a modelování analýz - velmi drahé a neuspokojivé > Následně vyvinut BNs model. 182 Systém TRACS • Vytvořen na základě šablon bayesovských modelů založených na konkrétních subsystémech architektury dané specifikace vozidla. • Možnost komunikovat s modelem BNs prostřednictvím jednoduchého dotazníku GUI (Graphical User Interface) • Systém TRACS šetří čas i peníze - předpovědi jsou přesnější, protože jsou schopné s pevnými daty kombinovat i subjektivní údaje. 183 Meteorologie Místo studie - Pyrenejský poloostrov 100 pozorovacích stanic Vyšší počet dostupných dat - vývoj statistických a data miningových technik (a) Zdroj: Cano, FĽ Sordo, C, Gutierrez, J.M.: Applications of Bayesian Networks in Meteorology, 2004 184 Meteorologie • Proč používat BNs? ' Jsou schopny podat kompaktní a srozumitelné znázornění pravděpodobnostní informace. ° Jsou schopny pracovat s velkým počtem proměnných. > Uzel = proměnná hrana = závislost 185 Meteorologie • Využití BNs Doplňování chybějících dat ° Nutnost úplných údajů Problém s daty s vysokou odchylkou ° Chybějící údaje musí být nahrazeny při zachování hlavních vlastností původních dat ° Regresní modely X Gaussovské BNs Možnost využití všech informací 186 Adaptivní testování • Adaptivní testy - automaticky se přizpůsobují zjištěné úrovni znalostí zkoušeného. • Po získání odpovědi na položenou otázku systém automaticky vybere následující otázku s využitím znalosti získané na základě předchozích odpovědí zkoušeného. 187 1SS Adaptivní testování • Model složený ze dvou modelů: Model studenta - popisuje vztahy mezi znalostmi a dovednostmi studenta Pozorovací modely - pozorovací model odpovídá jedné otázce Testové znalosti a dovednosti: y = {Yi...., Yfc} Soubor otázek: X — {X\.. .., Xm} Model studenta - připravené papírové testy, které řešili studenti prvního ročníku střední školy Testovány čtyři základní dovednosti a čtyři operační dovednosti na zlomcích. Shrnutí výsledků do datových záznamů o jednotlivých studentech. Objeveno několik typických špatných přístupů k řešení některých operací. Pomocí PC-algoritmu vytvořena struktura modelu studenta. Některé vztahy mezi veličinami vysvětleny pomocí latentních veličin. 189 Adaptivní testování • Výsledný model studenta Zdroj: Vomlel, J.: Dvě aplikace bayesovských sítí, VŠE Praha 190 191 Adaptivní testování ♦ Výsledek a porovnání Klasický přístup pro testování znalostí - teorie odezvy (vícerozměrná teorie odezvy) - od 60.let 20.století Není schopen poskytnout podrobnější diagnostiku. : Výhody Bayesovských sítí: BN lépe modeluje přemýšlení studenta. Možnost kratší doby testování. Výsledky ukázaly, že testy využívající BNs mají vysokou úspěšnost. Více než 90% dovedností bylo odhadnuto již po 7 otázkách. V papírových testech bylo potřeba 20 otázek. 192 Technická diagnostika • Diagnostika odhalující technické problémy zařízeni. • Pomoci počítačových systémů může být podstatně urychlena. • Uvedený příklad má tři typy veličin: Poruchy zařízení: p £ ° Akce (opravné kroky): A £ A > Pozorování: Q £ Q 193 Technická diagnostika • Příklad: Předpokládejme, že tiskárna vytiskne stránku, která je príliš světlá. Tento problém může mít mnoho príčin. Uvažujme zjednodušený model obsahující pouze 4 možné příčiny světlého tisku: F1 distribuční problém toneru, F2 vadný toner, F3 narušený tok dat a F4 špatné nastavení ovladače. Nechť akce, které mohou vyřešit rento problém jsou: A1 "vyjměte toner, zatřeste s ním a uložte ho zpěťs cenou c1 = 5, A2 "zkuste jiný toner" s cenou c2 = 15 a A3 "vypněte a zase zapněte tiskárnu" s cenou c3 = 1. Pro každou akci expert zadal podmíněnou pravděpodobnost P(Ai = Yes I Fj). Například, akce A2 "zkuste jiný toner" vyřeší distribuční problém toneru a vadný toner s pravděpodobností 0.9, t.j. P(A2 = yes | Fi) = 0.9, i = 1, 2, ale nevyřeší spatné nastavení ovladače, t.j. P(A2 = yes / F4) = 0. 194 195 196 Technická diagnostika • Mějme hodnotící funkci CR(bi) a její dvě složky t(ee) a c(ei). • Dostaneme kritérium, které nazýváme očekávaná cena opravy. % (*) - 2Wfo) • )=Y.ump^> • 0fo)+)) • Základní úlohou pak je najít takovou strategii s, která minimalizuje ECR(s). 197 Technická diagnostika • Dosažené výsledky Z důvodu jednoduchosti modelu je možné provádět větší počet výpočtů podmíněných pravděpodobností. Diagnostické strategie byly porovnány s optimálními strategiemi a hodnoty ECR\\m byly velmi blízké. Průměrná odchylka byla méně než 2%. 198 Právní argumentace • Uvažujme tento případ - u soudu byly předloženy dva možné scénáře autonehody. • Fakta: Havárie jednoho automobilu se stala kolem 3:00, kdy auto narazilo do stromu. Policisté, kteří dorazili na místo nehody zjistili následující: Řidička seděla na zemi vedle auta, a uvedla, že „on" zatáhl ruční brzdu. Těžce zraněný cestující seděl na předním sedadle spolujezdce. ° Ruční brzda byla v zatažené pozici. Auto projelo správně zatáčku, do chvíle než nabouralo. Na silnice byly stopy brzdění v zatáčce. Byly tam stopy smyku vedoucí k místu nehody. 199 Právní argumentace • Co následovalo: Ani jeden si nemohl na nehodu pořádně vzpomenout. Vraceli se z párty a spolujezdec byl opilý. Spolujezdec podal na řidičku žalobu o náhradu škody. Řidička se hájila tím, že ruční brzdu zatáhl spolujezdec. Nizozemské právo: povinností řidiče je, aby měl auto pod kontrolou. Závěr vrchního soudu: vzhledem k pravděpodobnosti s jakou pasažér zatáhl ruční brzdu, nemůže být fakt, že se jedná o nehodu jednoho auta, použit jako důkaz ve prospěch navrhovatele. 200 201 Právní argumentace ♦ Stejná struktura zakreslena jako BN Zdroj:P.E.M. Huygen: Use of Bayesian Belief Networks in legal reasoning, 2002,Free University, Amsterdam. 202 t— t— Právní argumentace Počáteční pravděpodobnosti • Objektivní hodnoty Zadána skutečnost „crash Zdroj:P.E.M. Huygen: Use of Bayesian Belief Networks in legal reasoning, 2002,Free University, Amsterdam. 203 Právní argumentace • Z modelu vyplývá, že je více pravděpodobné, že srážka nastala zatáhnutím ruční brzdy než překročením rychlosti. • Pokud se zadaly hodnoty výhodné pro žalobce, byly výsledné pravděpodobnosti zavinění srovnatelné. 204 PATERNITIES SEARCH WITH OBJECT-ORIENTED BAYESLAN NETWORKS AXDRADE Marina. (TT). FE ERE IRA. Manuel Alberto M.t (PT) At strict. Paternity dispute problems are example; of situations in. whici forensLC approach ETNA profiles study is 3 common procedure. To implement this approach an efficient tool tie object-oriented Bayesiar. nettvori: (OOBN). Alanj ihis pipe: ire presented the varii OOBX adequate to :olve the '.imp a paternity dispute and mote comp.es. paternity disp problem: with incomplete DNA profile-; data about the putative farther such as: only putat grandfather information, only putative ancle im^ormadon. only putative father 's on information and only simultaneously putative uncle and putative father'; uncle informati Here it is exhibited am algebraic treatment for the simple problem and with those tie use of object-oriented Bayesian networks is shown. Then the most complex kind of problems that it occur is presented. Although these are not the most common cases there is notice of occurence a: lea'.t in Porta ziue'.^ ;oiu7",. 205 In facr. knowing chic the marker: are hi different chromosome: (linkage equilibrium) and assuming random matins; (Hard}-Weinberg equilibrium} there is independence between and within marker:. Thus, it is possible to obtain the LR for each marker separately and finally multiply the values to determine the oxtail likelihood ratio based on the data available for aU markers. To determine algebraic ally the probability of the triplet E. under the ctvo hypotheses, it is reasonable to consider that before knowing any data on the child it is reasonable to assume that the identity of the true father is independent of the mother's and the putative father's. And supported on that, it is easily seen that it is possible to detennine the conditional probability of the child's genotype, given the other two available genotypes. Thus, to detramine P(E \ HF) one has only to apply Mendel's laws. But the calculus of P(E \ SD ) necessarily demand.: the knowledge of the population allele frequencies for the considered marker:. If for a certain marker che triplet E = (mgr. cgr.pfgt) is E = ({A. BY [B.B\IA. B)), and/ij andp& are the population allele frequencies then WE H,) = P[(mg1;cgt;pjgt)\(mgt,pfgi)\ = P\cgt {mgt;pfgt)} = 0.5 k 0.5 .: ::i P{E Ha)=P[(mgt-,cgi;pJgt) (mgi.rgt)] = P\cgt\(mgt;rgt)\ where rgi assigns the genotype of a random individual of the population, not related to the mother or the putative father. Therefore. The con:idered problem is. as shown, easily algebraically solved. It is used to illustrate the simplicity and the advantages of this tool in more complex situations. Given the freedom of choice for the variables to include in the graphical approach, different representations can he obtained. Some of them simpler than others. To get a 'good' representation is very important to the efficiency and the viability of the computational routine:. These are extremely sensible to the organization of the graphical structure. The first step consist: on the identification and definition of the nodes for all die var.jl: It; c: inte:e;t to die prcl [en: Then the graphical representation can be obtained. According to Dawid et al. (200Q), in order to maximize ihe efficient? of the calculations as well as the logical clarity of the representation we chose to disaggregate each individual's genotype inio its constituent, unobserved, paternally and maiernalfy inherited genes-. Figure 1 exhibit: the OOB1S for a paternity ca:e as the discussed above considering a single marker. Each node {instance) in the network represents itself a Bayesian network. Figure 1: Simple paternity neftvorV In Chi: simple paternity case instances pfraj. pfpj. mp°; and mmg are all of class founder a single node gene, having for its space of stares all the possible alleles that can be presented for the specific case, and the correspondent population gene frequencies. Instance: mgt. cgt and pfst are of class genotype, an unordered pair of alleles inherited from paternal, pg. and maternal, mg. genes, here represented by gitit!n:=min{pg. mg} and gtmax:=iRsx{pg. mg}. where pg and mg are input nodes identical to the gene node of founder. Instances thus; and tips are of class nhoin. describing the true father's allele origin. If tf=pf has true for value then the true father's allele, tfg. will be identical with the putative father's.pfg. otherwise the true father': allele is randomly chosen from another man in the population. And cpg and cmg instances are of class inherit, modelling the Mendel's inheritance in which the child's allele i: chosen at random from the two parent:, pg and mg. here as the :equence of the observed outcome of a fair coin toss. For illustration according to Dawid et al. (2002). the data for marker FES are child genotype eg! = {B, 8], mother's genotype mgt- {A, B) and putative father's genotype = {A, B}. The population allele frequencies arepA = 0.2842; andpl: = 0.2 5342. After specifying the network, put it to run and then m:ert the evidence. Considering equal prior probabilities for the query node repre :euting the hypotheses, the likelihood is got after in:ening the evidence. The likelihood ratio, based on the data for this marker, is obtained from the marginal posterior distribution of the query node. Thus, P{tf = pf?^ ime\ E)=0.o"5E4 andP(j/' = f^?:=/fliiff| E)=0.3416. andiil = 1.9274, being these results in agreement with the algebraic approach (note that 0 5 0 2 5942« 1.9274). 3 Paternities search in in ore uncommon situations When the data E are not in the form [mgt.cgt, pfgt) it is not possible to determine in algebraic form the likelihood function for the various hypotheses, i.e. to determine the weight of the generic 206 connection of the child with the putative father ancestors). The use of Bayesian networks allow to overcome these problems. These networks are a good tool to compute the likelihood functions. Forwarding and bnckwardhig the information a measure of the "strength" of the information available in each ?a:e is obtained In the sequence the networks for the uncommon cases described in the introduction are presented each one together with a numerical example. The data considered are the same for the whole cases and are in Table 1 where five different markers are considered and the respective genotypes for the mother, the child, the grandfather, the uncle and the grandfather brother, where * indicates rare alleles, and (a) signs alleles considered as good discriminate markers, with more than 10 alleles in each marker. Marker mgt sfgt ungt D3S135S 16. is 13*, 16 13*. 17 13*, 16 13*. IS VWA 16.17 13*. 16 13*. 16 16. IS 13*. 15 D16S539 11.12 12. 12 9. 12 10. 12 11.13 D8S1179 12.13 13,17* 14. 17* 14. 15 12.17* m is 11(a) 29,31.2 29,31.2 29. 31.2 28.31.2 29. 30 Of neric profiles In Table 2 the respective allelic frequencies are presented: pj is the e allele frequency in the population. Marker Frequencies D3S135S pa pu pit pn PIB 0.0032 0.2611 0.2477 0.2065 0.1606 VWA pa pu pis pn pis 0.0023 0.1216 0.2300 0.2649 0.1859 D16S539 Pi PlO Pn Pa Pa 0.1431 0.0545 0.3009 0.2876 0.1654 D8S1179 pa pu pu Pn 0.1351 0.3028 0.2178 0.1223 0.0031 D21Sll(a) F:b Pis pin 0.1674 0.2136 0.2437 0.1138 Table 2: Allele frequencies The allelic frequencies used were collected in www.uni.duesseldorf de "V.IVW MedFak Serology dua.hai for Portugal (Azores and Madeira archipelagos not included:'. 4 Only putative siaudfathei'infoririation Bayesia:: nerv.orks for more complex problems '^e b.iilt cu: c: -Jie :anie fundamental [ocaJ modules that we have already described for the simple paternity dispute problem, Dawid et al. (2002). The object-oriented Bayesian network for the "only putative grandfather infonrjation" case is shown in Figure 2. Note, for example, the node gfgt [grandfather genotype) and the respective connections with the other nodes. Figure 2: Only putative srandfather network The results obtained are in Table 3. In the last column Rescaled - corrected so that the sum of the entries is equal to 1 - is presented the result for the 5 markers. Since the markers are independent the final result is obtained by multiplying the result obtained for each marker. vwa d16sj39 b-5s1p9 d:isii Rescaled n.H=\E\ 0.9874 0.0126 0.9909 0.0091 0.5779 0.4221 0.9s7s 0.0122 0.6255 0.3745 0,999999 6.33e-07 Table 3: Analysis results frith only putative srnudfarheL information 5 Only putative uncle information The object-oriented B ay esian network for the "only putative uncle information'" case is shown in Figure 3. .07 Figure 3: OnJy putative uncle network The result: obtained are in Table 4 following the same methodology as in section 5. yyva DSS1L-9 d:isii Rescaled 0.9874 0.3333 0.5779 0.3333 0 5582 0.97133 0.012« 0.6667 0.4221 0.6667 0.4418 0.02867 Table 4: Aualysis results with only putative uncle information 15 Only putative farher rs uncle inioi'inntion In Figure 4 the objeet-orieuDed B ayesian network for the "only putative father's uncle information" case is shown. It is a network more compleK than the former ones owing to the further parentage relationship considered, that implies more complex genetic connections. Figure 4: Only putative father's uncle nenvork The results obtained are in Table 5. D3S1351 YWA Repealed n(jr„|£) 0.9755 0.0245 0 0178 0.5425 0.4577 0.9762 0.023 S 0.5309 0.4691 0,999992 B.2SE-06 Table 5: Analysis results with only putative fiitker 's uncle information 7 Duly simultaneously putative und? and putative fathers uncle infoi matron 208 Figure ~y. Only siiniutiineoiijly putative uncle and pucTLtive fathers unci? The "Old}" iiiniLtzneously putative uncle and putative fitbei": uncle irforaiatLQn" case network i: the la:t ooe pte:ented. (in. FiEure- 5} and :be fe:iiLt= aire presetted in Table 6. DíSlííS vwa d:isii Repealed 0.9875 Ů.W50 Ů.5764 0.9Í3S C i 70 7 0,999983 0.0125 Q.O350 0.4236 0.0464 0.4293 1.23E-05 Table 6: Analysis tesulfs Trifh only simultaneously putntÍT* tmele nud putative tatler'1? uark information £ Cone In don; The paternities search in more uncommon cases demands the calculation of probabilities in the contest of numerous and complex successive uses of Bayes Law. This situation is impossible to be treated algebraically. It was shown that the object-oriented Bayesian networks are a very powerful tooL very simple to use. that allows the referred calculations in an efficient way. The major problem is to build the network taking in account the various and complex connections that may occur in parents re relationships. Then the use of an adequate software as Hngiii or SPSS makes easy to apply it in practical cases. In this work Hugin was the chosen. Inspecting the tables of results one can note that, as expected, rare alleles shared lead to greater probabilities of true paternity. On the contrary, more frequent alleles shared lead to lesser probabilities With the particular data used the final probabilities for true paternity were in general great. References [1] ABRANTES, D.; PONTES. M. L.. PINHEIRO, M. F, ANDRADE. M. and FERREIRA. ML A. M.: Towards a systematic probabilistic evaluation of parentage casework in forensic genetics: A modest aitempi io deßtie a general standardized approach to simple and complex cases.Forensic Science International: Genetics Supplement Series 1. pp. 635-637. 2008. [2] ANDRADE, M.: A Estatüiica Bayesiana na identifica^äo Forense - analise e avaliacao de vestigios de DNA com redes Eayesianas. PhD Thesis. ISCTE. lisboa. 2007. [3] ANDRADE, M.: A Note on Foundations of Probability. Journal of Mathematics and Technology: vol.. 1 (1), pp 96-93, 2010. [4] ANDRADE, M, FERREIRA, M. A. M. and FUJPE, J. A.: Evidence evaluation in DNA mixture iraces. Journal of Mathematics, Statistics and Allied Fields (Scientific Journals International-Published online), vol. 2 (2), 2008. [5] ANDRADE, M, FERREIRA. M. A. M, HLIPE; J. A. and COELFKX M.: Paternity dispute: is it important to be conservative?. Aplimat - Journal of Applied Mathematics, vol. 1 (2). 200&. [6] ANDRADE, M. and FERREIRA, M. A. M.: Bayesian networks in forensic identification problems. Aplirnat - Journal of Applied Mathematics, vol. 2 (3), pp. 13-30, 2009. [7] ANDRADE, M. and FERREIRA. M. A. M.: Civil Identification Problems, -with Bayesian Networks Using Official DNA Databases. Aplimat-Journal of Applied Mathematics. vol. 3 (3): pp. 155-162, 2010. [8] ANDRADE, M. e FERREIRA, M. A. M.: Sotving civil identification cases mtn DNA profiles-databases using Bavesian networks. Journal of Mathematics and Technoloiv. 1(2), pp. 37-40, 2010 [9] ANDRADE, M. e FERREIRA, M. A. M.: Evaluation of Paternities with less usual Data using Bavesian Networks. lEEEXplore tBMEI 2010 IEEE Catalog Number CFP1G93D-PRI, ISBN 97S-1-4244-Ó496-S), 2010. [10] ANDRADE, M.: FERREIRA, M. A. M..ABRANTES, D.. PONTES, M. L. e PINHETRO: M. F.: Object-oriented Bayesian Networks in the evaluation of paternities in less usual environments. Journal of Matieamtics and Technolog;7. 1(1). pp. 1Ů1-1Ó4. 2010. [11] DAWTD. A. P, MORTERA, J., PASCAL! V. L. and van BOXEL, D. UT: Probabilistic expert systems for forensic inference from genetic markers. Scandinavian Journal of Statistics vol. 29. pp. 577-595, 2002. [12] FERREIRA, M. A. M. and ANDRADE, M.: A note on Dawnie Wolfe St&adman, Bradley J. Adams, and Lyle W. Königsberg', Statistical Basis for Positive Identification in Forensic Anthropology. American Journal of Physical Anthropology 131 r 15-26 í20Oó/. International Journal of Academic Rjesearch, vol. 1 (2), pp. 23-26. 20O9. [13] LAURITZEN, 3. L.: Bayesian networks for forensic identification Problems. Tutorial 19th Conference cn Uncertainty in Artificial Intelli seuce. Mesico. 2003. 209 6. Výpočet pojistného v životním pojištění Dělení životního pojištění • pojištění riziková - jedná se o pojištění, u kterých se předem neví, zda dojde k pojistné události a následně výplatě pojistného plnění. • pojištění rezervotvorná - v případě tohoto druhu pojištění musí pojišťovna počítat s výplatou pojistného plnění vždy. Ať dříve v případě smrti nebo později při dožití konce pojištění. Pojištění pro případ úmrtí - rizikové pojištění - výplata pouze v případě úmrtí Smíšené životní pojištění • pojištění pro případ smrti nebo dožití • pojistná částka je vyplacena vždy • může být kladen větší důraz na jedno z rizik a podle toho mohou být nastaveny pojistné částky pro každé riziko zvlášť • může být sjednáno na zvyšující se pojistnou částku při dožití se v průběhu pojistné doby, nebo může být sjednáno pro dvojici osob apod. • varianty smíšeného pojištění, kdy oprávněným osobám je vyplaceno plnění v případě úmrtí pojištěného a poté ještě jedno plnění v době smluveného konce pojištění • bývá rozšiřováno o krytí dalších pojistných rizik neživotního charakteru (úraz, invalidita, vážná nemoc apod.) Důchodové pojištění • kryje pouze riziko dožití • výplata jednorázově nebo pravidelné důchodové splátky • varianty - Základní doživotní důchod - vyplácen od data nároku na starobní důchod - Dočasný důchod - výplata v případě trvalé invalidity Finanční matematika v pojištění a) Spojité úročení b) Hodnota důchodů - systém opakujících se plateb, jejichž výše zůstává v čase stejná nebo se mění dle určitého schématu - ocenění důchodu vztažením všech jeho plateb ke stejnému časovému okamžiku s použitím úrokové míry Pojistné = úplata za poskytnutou pojistnou ochranu a) Netto pojistné b) Brutto pojistné Netto pojistné • označované taky jako ryzí, představuje hodnotu veškerých závazků pojišťovny, které připadají na všechny klienty vzhledem k jejich předpokládaným pojistným událostem. Při stanovování výše netto pojistného se přihlíží zejména k následujícím faktorům: • výši sjednané pojistné částky • ohodnocení rizika • výši technické úrokové míry Faktory ovlivňují výši netto pojistného • výši sjednané pojistné částky Platí zde vztah přímé úměry mezi pojistnou částkou a pojistným, tzn. čím vyšší pojistná částka, tím vyšší pojistné. Předcházení jejího znehodnocování by mělo zabránit sjednání dynamizace pojistné smlouvy. • ohodnocení rizika - riziko úmrtí nebo dožití Výše pojistného se odvíjí především od pohlaví a věku pojištěného. Do ceny pojištění vstupuje taky zohlednění zdravotního stavu, výše pojistné částky a délka trvání pojištění. Ohodnocování rizika slouží k určení velikosti netto pojistného v životním pojištění, v některých případech může vést k odmítnutí sjednání životního pojištění ze strany pojišťovny. K určení pravděpodobnosti dožití určitého věku a pravděpodobnosti úmrtí před dosažením určitého věku slouží pojišťovnám úmrtnostní tabulky. Faktory ovlivňují výši netto pojistného • výše technické úrokové míry V případě technické úrokové míry se jedná o garantovanou výnosnost pro klienta, se kterou musí pojistní matematici počítat, aby se nestala situace, že v případě pojišťovny, která bude počítat s vyšším zhodnocením rezerv se dostane do nerovnovážné situace v důsledku toho, že od klientů vybírá nižší pojistné. V současné době je horní limita výše technické úrokové míry regulovaná státem vyhláškou č. 303/2004 Sb., kterou se provádí některá ustanovení zákona o pojišťovnictví, ve znění pozdějších předpisů. - Aktuálně 2,4 % p.a. Úmrtnostní tabulka Skládá se ze sloupců a řádků. Ve sloupcích jsou uvedeny jednotlivé veličiny (počet osob, počet žijících osob v daném věku,...). Řádky představují hodnoty veličin uvedených ve sloupcích pro konkrétní věk. Úmrtnostní tabulka X k P* D. cs N. Hi K* L* I. 3 99SS4 25 0,9997488800 0.0002511200 93 811,96 23.10 3 609 095,24 23 045.38 103 437 600,62 1 580 906.99 99 541 7208 709 72,41 4 99529 14 Í,999S5933~5 0,0001406625 SI S-S=-l 12,63 3 315 283,23 23 022,29 99 328 505,38 1 557 861,61 99 522 7 109 16S 71,-1-3 5 99515 13 0,9998693664 0,0001306336 90 133,80 11,54 3 423 333,87 23 009,61 96313 222,10 1534 83932 99 509 7009 646 70,44 6 995S2 11 0.9993394495 0.0001105505 33 354.93 9.53 3 333 200.07 22993.06 92 3S9S33.23 1 511 829.71 i$- 6910 137 69.-5 7 99491 13 0,0001306651 86 612,90 11.10 3 244 845,14 22 988.49 89 556 688,16 1 488 831.65 99 484 6 810 640 68.45 S 99-~S 16 0,9993391604 0,0001603396 34903,52 13,39 3 153 232,24 22977,39 S6 311 S43:02 1 465 843,16 99 :"C 6 711156 9 99462 15 0,9998491886 0.0001508114 83 225,35 12.31 3 073 328,72 22 964.00 83 153 610,78 1 442 865.77 99 454 6 611 686 66,47 10 99--" 14 0.9993592215 0.00014077 85 S15S1.1S 11.26 2 990 103,37 22951.70 80 OSO 282.06 1419 901.76 99 6 512232 65.-3 11 99433 14 0,9998592017 0,0001407983 79 970,29 11,04 2 908 522,19 22 940,44 77 090 178,69 1396 950,06 99 426 6 412 792 64,49 12 99-19 16 0,9993390650 0,0001609350 73 391:20 12,37 2S23 551:91 22929,40 74 131 656:50 1374 009,62 99 -11 6313 365 63:50 13 9940? 19 0.9998088589 0.0001911411 76 841,75 14.40 2 750 160,70 22 917,03 71353 104,59 1351 080 22 99m 6 213 954 62,51 14 ss:s- 20 0,9997987604 0:0002012396 ~5 32C,65 14,86 2 673 318,95 22902,63 68 602 943,89 1328 163,19 99 374 6114 560 61,52 1S 99364 25 0,9997483998 0,0002516002 73 828,92 18,21 2 597 998,30 22 887,77 65 929 624.94 1305 260,56 99 352 6 015186 60.54 16 29 0.0002919297 72 363.03 20.71 2 524 169.33 22 869.56 63 331 626.64 1232372.78 99 325 5 915 S35 59.55 17 99310 43 0.9995670124 0,0004329876 70 923,48 30,11 2 451 806,30 22 848.85 60 807 457,26 1259 50322 99 288 5 816 510 58,57 1S 99267 52 0,9994761603 0,0005233397 69 502,72 35,69 2 3S0SS2:S2 22 813,74 5S 355 650,95 1236 654,37 99 2-1 5 717 222 57,59 19 99215 58 0,9994154110 0.0005845890 68 104,23 39.03 2 311380,10 22 783.05 55 974 768.13 1213 835.63 99 186 5 617981 56.62 20 99157 62 0:0OO625271O 66 "25,82 40,91 2243 275,37 22 744,02 53 663 333,03 1 191 052,58 99 126 5 518 796 55,66 21 99Q9t 63 0,9993642464 0,0006357536 65 380,48 40,75 2 176 546,05 22 703,11 51 420 112,16 1 168 308,56 99 064 5419 669 54.69 22 99S32 67 0.9993234510 0.0OO6765490 64057,76 42.49 2111 165.57 22 66236 49243 566.10 1 145 605.45 9S 999 5 320606 53.73 23 9S9É5 71 0,9992825746 0,0007174254 62 759,24 44.14 2 047107,81 22 619.87 47132 400,54 1122 943,09 98 930 5 221 607 52,76 24 9SS94 69 0,9993022833 0,0006977167 61 484,52 42,06 1 984348,57 22 575,73 45 085 292,73 1 100 323,22 98 859 5 122677 51,80 2S 9SS25 67 0,9993220339 0,0006779661 60 236,89 40,04 1 922 864,04 22 533,67 43 100 944,16 1077 747,49 98 791 5 023 818 50,84 26 93758 65 0.9993418255 0.0006581745 59015.74 38.03 1 862 627.15 22493.63 41 178 080.12 1 055 213.82 98 725 4925 027 49.37 27 9869? 63 'J.999Í616569 0,0006383431 57 820,48 36,19 1 803 611,42 22 455,55 39 315 452,97 1 032 720,18 98 662 4 826 301 48,90 2E 98630 67 0,9993206935 0,0006793065 56 650:56 37,73 1 745 790,93 2241937 37 511 S4L55 1010264,63 98 597 4 727 640 :":93 29 98563 69 0.9992999401 0,0007000599 55 502,04 38.09 1 689 140,37 22 381.64 35 766 050,62 98784526 98 52S 4 629 043 46,97 Popis úmrtnostní tabulky qx je pravděpodobnost úmrtí x-letých (před x + 1 narozeninami) px je pravděpodobnost dožití se x + 1 narozenin (přežití věku x) lx je počet osob dožívajících se věku x (pojištění na doživotní důchod) dx je počet zemřelých ve věku x » lx - lx+1 (pojištění na dožití a pro případ úmrtí) Komutační čísla Slouží pro zrychlení výpočtů z důvodu často se opakujících součtů a součinů Dx - diskontovaný počet osob dožívajících se věku x Cx - diskontovaný počet zemřelých ve věku x Nx - součet Dx až do konce tabulky Ol—X OÚ—X Mx - součet Cx až do konce tabulky nx = ^ dx+k = ^ ix+K • v* K=0 K=Q Sx - součet Nx až do konce tabulky Rx - součet Mx až do konce tabulky Brutto pojistné Brutto (celkové) Pojistné Netto (íyzi) pojistné správní náklady rezervotvomá (spona) složka riziková složka správní náklady Brutto pojistné PB = PN + a + ß + y + 5 + £ PB - brutto pojistné PN - netto pojistné a - jednorázové počáteční náklady p - běžné správní náklady po celou dobu pojištění Y - běžné inkasní náklady 5 - běžné správní náklady spojené s výplatou důchodu Náklady pojištění • jednorázové počáteční náklady (a)- bývají vynakládány pojišťovnou hned na počátku pojistné doby, při sjednání pojistné smlouvy. Těmito náklady pojišťovna pokrývá provize prodejců životního pojištění, výdaje na vystavení pojistné smlouvy, lékařskou vstupní prohlídku apod. a zpravidla bývají úměrné sjednané pojistné částce nebo důchodu ve formě nějaké výše procenta z pojistné částky, • běžné správní náklady (P) - vynakládány během celého trvání pojištění nezahrnuté v ostatních nákladových položkách a jsou spojeny s udržováním daného pojištění, korespondenci s pojištěným, administrativou apod. a udávají se opět jako procenta z pojistné částky nebo důchodu, ale bývají o řád nižší než náklady počáteční • inkasní náklady (y) - jsou spojené s inkasem běžného pojistného ale tentokrát jsou stanovena jako procenta z ročního brutto pojistného, • náklady při výplatě důchodu (S) - týkají se pouze pojištění, kde dochází k výplatě důchodu a tedy souvisí pouze s výplatami důchodu. V současné době dochází ke zmenšování y a S nákladů díky bezhotovostním platbám. • Bezpečnostní přirážku si pojišťovna většinou připočítává pro případ nepříznivých výkyvů náhodné povahy v souboru pojištěných, kterými mohou být např. náhlé zvýšení úmrtnosti v některých věkových kategorií, hromadné rušení pojistných smluv klienty, epidemie atd. Pojišťovna by měla dbát na to, aby se tato bezpečnostní přirážka nestávala dodatečným zdrojem nadměrných zisků pojišťovny. Principy při výpočtu netto pojistného Fiktivní soubor pojišťovna předpokládá, že všechny osoby se narodily 1.1. a zemřeli 31.12. předpoklad, že počet osob, které ve věku x uzavřou stejný typ pojištění, je Ix z použité úmrtnostní tabulky. Tedy, že daný typ pojištění uzavřou všechny osoby, které jsou ve věku x naživu. Ačkoliv je skutečnost zcela jiná, jde o značné zjednodušení, které vede k dostatečně přesným výsledkům a k jeho praktickému využití. Princip ekvivalence příjmy a výdaje pojišťovny jsou v rovnováze zohlednění: a) časové rozložení příjmů a výdajů - finanční matematika finanční toky rozložené v čase se vztáhnou diskontováním do jejich počáteční hodnoty nebo naopak b) náhodný charakter fin. toků - očekávání (stř. hodnota) Princip ekvivalence očekávaná počáteční hodnota pojistného očekávaná počáteční hodnota pojistného plnění Předpoklady: P - jednorázové pojistné O - běžné pojistné PC = 1 v .... Diskontní faktor=1/(1+i) Pojištění pro případ smrti Pravděpodobnostní vzorec - vznik vydělením lx Ů3-X ^ Vzore P S *Px ^1 ísel - vznik vynásobením vx Pojištění pro případ dožití a) X-letá osoba dostane PČ v případě, že bude naživu Rovnice ekvivalence Vzorec pomocí komutačních čísel b) Pravděpodobnostní vzorec Doživotní důchod předlhůtní X-letá osoba dostane vyplacenu PČ v případě, že je vždy na začátku období naživu • Vzorec pomocí komutačních čísel Pravc Dx zorec P í=0 Doživotní důchod polhůtní Výpočet pomocí komutačních čísel Doživotní důchod s garancí vyplácení n let x-letá osoba se pojistí tak, že po dobu n let mu bude vyplácena PČ, ať už je na živu nebo ne Doživotní důchod rostoucí lineárně x- leté osobě je 1. rok vyplacena 1 p.j., 2.rok 2 p.j.,... Smíšené pojištění PČ je vyplacena v případě že kdykoliv do doby x+n zemře nebo se dožije věku x+n Běžné netto pojistné Předpokládáme, že doba placení je kratší než doba trvání pojištění Pojištění na dožití Motivační příklad Jaké bude běžné netto pojistné pokud budete 15 let platit pojistné a chcete od 40. roku prvních 10 let garanci důchodu 12 000 Kč ročně, poté chcete, aby 10 let důchod rostl o 500 Kč, poté chcete opět garanci 10 let ve výši narostlého ročního důchodu a poté chcete, aby od 70. roku života důchod 5 roků klesal o 5 % z výše důchodu, kterou obdržíte v 69. roku života? (výpočet viz tabule) 7. Investování do akcií Akcie • Akcie je majetkový cenný papír • S držením akcie vzniká majiteli • Vlastnické právo na určitý podíl firmy, • Právo podílet se na chodu společnosti, tj. účastnit se valných hromad, • Právo na likvidační zůstatek • Je to dlouhodobý cenný papír, bez pevné doby splatnosti • Převoditelný na jinou osobu • Musí obsahovat: • Obchodní jméno a sídlo společnosti • Jmenovitou hodnotu • Označení formy akcie • U akcie na jméno i jméno akcionáře • Datum emise Výnos z akcií • Dividenda • Peněžitý podíl z čistého zisku akciových společností vyplácený akcionářům • Není pevně daná • Prodání akcie na trhu cenných papírů • Zisk nebo ztráta je rozdíl mezi cenou, za kterou jsme akcii koupili a cenou, za kterou ji prodáváme • Cena jednotlivých akcií je dána střetem poptávky a nabídky, nedá se určit její budoucí hodnota • Jako každá komodita na trhu je i cena akcie tím vyšší, čím větší je poptávka • Efektivní mechanismus převodu volných finančních prostředků investorů ke společnostem Druhy akcií • Dle formy: • Akcie na majitele (doručitele) • Na jméno • Na řád • Dle účasti na řízení společnosti • Kmenové akcie • Prioritní akcie • Dále specifické akcie • Zaměstnanecké akcie • Zlaté akcie (zakladatelské) • Požitkové akcie • Další investiční instrumenty, zajišťující nárok na budoucí cash flow jsou finanční investiční instrumenty (např. cenné papíry, finanční deriváty), reálné investiční instrumenty (např. nemovitosti, umělecké sbírky, drahé kovy) Výhody spojené s akciemi z hlediska emitenta • Získaný kapitál má společnost na neomezeně dlouhou dobu, akcie jsou nesplatitelné • Akciová společnost může shromáždit velké množství kapitálu • Možnost získávat další kapitál emisí nových akcií • Nemusí vyplácet dividendy, pokud tak rozhodne valná hromada • Obchodováním na sekundárním trhu je zabezpečena likvidita akcií, snížení nákladů emitenta • Rostoucí prestiž eminenta, pokud jsou akcie obchodovány na sekundárním trhu • Obchodováním na sekundárním trhu dochází k dennímu oceňování hodnoty společnosti připadající na jednu akcii • Emisí akcií dochází k diverzifikaci rizika mezi větší počet akcionářů[l] [1] Veselá, Jitka. Investování na kapitálových trzích. Nevýhody spojené s akciemi z hlediska emitenta • Akcionáři mají právo zasahovat a podílet se na řízení společnosti • Informační povinnosti spojené s vysokými informačními náklady • Vysoké emisní náklady s novými akciemi • Za porušení závazků ručí celým svým majetkem • Dividendy vypláceny až ze zisku po zdanění • Přísná regulace právní formy v podobě akciové společnosti ve snaze zabránit vzniku monopolní či oligopolní tržní struktury • Společnosti, u kterých jsou akcie veřejně obchodovatelné, musí provádět transparentní a kontinuální dividendovou, investiční a finanční politiku • Ve společnosti může docházet ke konfliktu zájmů mezi managmentem a akcionáři společnosti[l] Výhody spojené s akciemi z hlediska akcionáře (investora) • Investicí do akcie může investor dosáhnout kapitálového zisku • Inkasuje důchod ve formě dividendy, pokud je vyplácena • Existuje omezené ručení, akcionář neručí za závazky akciové společnosti • Má možnost podílet se na řízení akciové společnosti, účastnit se valné hromady a hlasovat • Má právo na likvidační zůstatek • Má předkupní právo na nákup nových akcií • Investování do akcií představuje anonymní investováníNemá právo podílet se na řízení společnostiU obchodovatelných akcií je zajištěna likvidita[1] Nevýhody spojené s akciemi z hlediska akcionáře (investora) • Investicí do akcie může investor dosáhnout kapitálové ztráty • Získává nulový důchod, pokud dividenda vyplácena není • Ve společnosti může docházet ke konfliktu zájmů mezi managmentem a akcionáři společnosti • Minoritní vlastník má z praktického hlediska omezenou možnost zasahovat do řízení firmy • Nemá nárok na vrácení svého vkladu • Může docházet k vysokému zdanění kapitálových zisků či dividend • S neobchodovatelnými akciemi je spojena nízká likvidita • Obchodování s malým počtem kusů akcií je spojeno s vysokými transakčními náklady[l] Oceňování akcií • Spolehlivá metoda stanovení správné hodnoty akcie neexistuje • Cena akcie je následkem mnoha událostí a nelze ji předvídat • Nelze pokrýt všechny faktory, které cenu akcie ovlivňují • Existuje mnoho teorií, které vysvětlují chování cen akcií (např. náhodná procházka) • Pro oceňování akcií je důležitým parametrem především zisk společnosti Dlouhodobý vývoj cen akcií • Odráží trendy fundamentálních veličin a to • Makroekonomických (HDP, inflace, zaměstnanost, ...) • Odvětvových (dostupnost surovin, vývoj technologií, ...) • Individuálních (zadlužení, úroveň vedení, ...) Metody oceňování akcií • Fundamentální analýza • Technická analýza • Psychologická analýza Kritéria investičního rozhodování • Investice je záměrné obětování dnešní hodnoty za účelem získání vyšší hodnoty v budoucnu • Výnos plyne z nároku na plynoucí cash flow, nebo cena podkladového aktiva stoupne a prodáme ho za vyšší cenu, než za kterou jsme ho nakoupili • Existují 3 základní investiční faktory tvořící tzv. magický trojúhelník • Výnosnost • Rizikovost ^^^^^ • Likvidita [2] Patria.cz [online]. 2000-2011. 2012 [cit. 2012-3-12]. Burza cenných papírů Praha v datech. Dostupné z WWW: Výnosnost, riziko, likvidita • Výnosnost udává míru zhodnocení peněžních prostředků • ex post (již zrealizovaná) • ex ante (očekávaná výnosnost) • Riziko je nebezpečí, že nedosáhneme očekávaného výnosu. Za vyšší riziko investor zpravidla požaduje vyšší výnos • Riziko změn tržní úrokové míry, inflační, měnové, právní, události, ztráty likvidity předmětného finančního instrumentu, ... • Riziku lze předcházet diverzifikací portfolia, tj. „nevsázet vše na jednu kartu" • Likvidita je rychlost, s jakou je možnost přeměnit finanční instrument bez ztráty zpět v hotové peníze Akciové indexy • Akciový index je skupina konkrétně vybraných jednotlivých akciových titulů. Jeho hlavní úlohou je okamžitě prozradit investorovi, jak si vedou akciové tituly, jež jsou v indexu zahrnuty, jako celek. • Při změně vah se vychází z aktuálních cen za tu kterou akcii k danému dni, maximální váha může být vždy maximálně jen 25%, u akcií, které jsou mimo pražskou burzu obchodované i na jiné burze v zahraničí, se počítá dále poměr zobchodovaných akcií Česká republika: zahraničnímu trhuJ3] PX(t)= K(t)^Ů\xlOOO w wm(o) • M(t) tržní kapitalizace báze v čase t • M(o) = 379 786 853 620,0 Kč představuje tržní kapitalizaci báze indexu PX ve výchozím dni 5. 4. 1994 • K(t) faktor zohledňující změny uskutečněné v bázi indexu, s účinností od 19. 3. 2012 hodnota faktoru zřetězení K(t) = 0,4680501949 • Dow Jones Industrial Average (DJIA) • National Association of Securities Dealers Automated Quotations 100 (NASDAQ) • S&P 500 • Nikkei 225 • Index PX, což je oficiální index Burzy cenných papírů Praha. [3]IHNED.CZ [online]. 1998-2011. 2012 [cit. 2012-3-11]. Váha indexu pro výpočet PX. Dostupné z WWW: . Index PX • Dlouhodobý vývoj PX indexu [4] [4]Burza cenných papírů Praha [online]. 1998-2011. 2012 [cit. 2012-3-11]. Index PX. Dostupné z WWW: . Obchodování na sekundárním trhu • Akcie nejsou prodávány pouze jejich konečným majitelům (primární trh), ale běžně se s nimi obchoduje a to prostřednictvím sekundárního trhu Burzy New York Stock Exchange Euronext • V roce 2007 fúze NYSE a Euronext (Francie, Belgie, Holansko, Portugalsko, Luxembursko, Velká Británie) • Tokyo Stock Exchange (Japonsko) • National Association of Securities Dealers Automated Quotations (NASDAQ, USA) • London Stock Exchange (Velká Británie) • Shanghai Stock Exchange (Čína) • Frankfurt Stock Exchange (Německo) ^^^^^b^s^z ■ ^— ^Wikipedie [online]. 2012 [cit. 2012-3-11]. Pohled na obchodování v roce 2008. Dostupné ^S^j^li http://upload.wildmedia.org/wildpedia/commo Burza cenných papírů Praha (BCPP, ČR) Burza cenných papírů Praha, a. s. • Založena na členském principu, tj. přístup do burzovního systému a právo obchodovat mají pouze licencovaní obchodníci s cennými papíry, kteří jsou zároveň členy burzy • 24.11.1992 Vznik BCCP, a.s. • 5.4.1994 Zahájení výpočtu oficiálního burzovního indexu PX 50, dnes již nahrazeno PX • 15.3.1996 Zahájení obchodování v systému KOBOS (průběžné obchodování při proměnlivé ceně) s 5 emisemi akcií a 2 emisemi obligací • 25.5.1998 Zahájení obchodování v systému SPAD (Systém pro podporu trhu akcií a dluhopisů) • 8.12.2005 Objemy obchodů v průběhu roku poprvé překročili bilionovou hranici, celkový objem obchodů za rok 2005 dosáhl 1041,2 mld. korun[6] [6] Miras.cz [online]. 2000-2011. 2012 [cit. 2012-3-12]. Burza cenných papírů Praha - historie. Dostupné z WWW: [7] Wikipedie [online]. 2000-2011. 2012 [cit. 2012-3-12]. Burza cenných papírů Praha v datech. Dostupné z WWW: Investiční doporučení Titul Sektor Doporučení Cílová cena Měna ČEZ Energetika akumulovat 970 CZK NWR Těžba uhlí akumulovat 310 CZK KB Bankovnictví koupit 4 150 CZK TELEFONICA Telekomunikace držet 387 CZK FORTUNA Sázkové služby koupit 145 CZK [8]Cyrrus [online]. 1998-2011. 2012 [cit. 2012-3-11]. Aktuální doporučení. Dostupné z WWW: . Portfolio Titul Kupní hodnota^ Množství Akcie dohromady ČEZ 829,00 40 33 160,00 KB 3 782,00 10 37 820,00 NWR 145,60 210 30 576,00 Telefónica 02 C.R. 395,80 51 20 185,80 Fortuna 98,70 300 29 610,00 Hodnota portfolia 151 351,80 Vývoj akcií a příslušného portfolia byl sledován od 24. 2. 2012 do 9. 3. 2012 [9]Bunza cenných papírů Praha [online]. 1998-2012. 2012 [cit. 2012-3-11]. Index PX. Dostupné z WWW: . České energetické závody (ČEZ), a. s. • Založeny roku 1992 • Hlavním předmětem činnosti je výroba a prodej elektřiny • Dále se zabývá výrobou, rozvodem a prodejem tepla • V roce 2003 se ČEZ spojila s distribučními společnostmi SeČ energetika, SeM en., StČ en., VČ en., a ZČ en. a vznikla Skupina ČEZ • Postupně akvizice v mnoha státy Evropy • Skupina ČEZ patří do evropské desítky největších energetických koncernů • V České republice je Skupina ČEZ největším výrobce elektřiny a tepla Hlavní akcionáři ČEZ stav k 31.12.2007 stav k 31.12.2008 stav k 31.12.2009 stav k 31.12.2010 Česká republika 65,99 % 93,39% 99,79 % 99,79 % Ostatní právnické osoby 19,04% 12,97% 4,02% 2,34% domáci 10,24 % 11,59 % 2,73 % 1,22 % zahraniční 8,80 % 1,38 % 1,29 % 1,12 % Fyzické osoby 4,14% 4,55 % 5,41 % 5,13% domáci 4,04 % 4,43 % 5,26 % 4,43 % zahraniční 0,10 % 0,12 % 0,15 % 0,70 % [10] ČEZ, a. s. [online]. 1998-2012. 2012 [cit. 2012-3-11]. Struktura akcionářů. Dostupné z WWW: Dlouhodobý vývoj akcií ČEZ [lij ruti iu [uiiinicj. iyyo-zuiz. zuiz [lil. zuiz-3-14J. ucidii gidi. uusiupiic z, w w w .<-.http://www.patria.ez/akcie/CEZPsp.PR/cez/graf.html> Vývoj akcií ČEZ v průběhu měsíce Titul - ČEZ 14.3.2012 22:23 ■ Closing Price: 815,00 14peb 16 20 22 24 28 1 Mar 5 7 9 13 [í^j ^ «....« Lv.u...H. L^iL. ^j. Ľ^u.i, ^v»Luť..^ ^ ,,,,,,. -.http://www.patria.cz/akcie/detail/graf.html> Vývoj akcií ČEZ v průběhu 14 dní [13] Investiční web [online]. 2012 [cit. 2012-3-14]. Kurzy. Dostupné z WWW: KB • Založena v roce 1990 jako státní instituce • V roce 1992 byla transformována na akciovou společnost • KB je univerzální bankou se širokou nabídkou služeb v oblasti podnikového a investičního bankovnictví • Nabízejí další specializované služby, mezi něž patří penzijní připojištění, stavební spoření, spotřebitelské úvěry a pojištění, dostupné prostřednictvím sítě poboček KB, přímého bankovnictví a vlastní distribuční sítě • Služby samotné Komerční banky využívá 1,59 milionu zákazníků prostřednictvím 395 poboček a 677 bankomatů po celé České republice Vývoj akcií KB v průběhu 14 dní NWR • Společnost NWR je předním středoevropským producentem černého uhlí a koksu • V současné době společnost těží na území České republiky • NWR zaměstnává 18 553 lidí • Společnost NWR sídlí v Nizozemsku a jejím majitelem je jeden z nejbohatších Čechů Zdeněk Bakal Vývoj akcií NWR v průběhu 14 dní Telefonica C.R. • Vznikla 1. července 2006 spojením společností ČESKÝ TELECOM, a.s. a Eurotel Praha, spol. s r.o. • Je předním telekomunikačním operátorem na českém trhu • V současnosti provozuje téměř 7mil. mobilních a pevných linek Vývoj akcií Telefonica C.R. v průběhu 14 dní Fortuna • Zakládající společnost tohoto seskupení Fortuna sázková kancelář, a. s. vznikla v roce 1990 v Praze • V roce 2009 vznikla Fortuna Entertainment Group a stala se největším středoevropským provozovatelem kurzových sázek • Vzestup online sázení jak v Česku, tak i na Slovensku Vývoj akcií Fortuna v průběhu 14 dní Vývoj portfolia v průběhu 14 dní 155000 154000 153796 5 153549,5 153069,5 ♦452199,5 ' 151571,9 050853 150501,3 149928,9 ♦150186 149842,6 27.2. 28.2. 27.2. 28.2. 29.2. 1.3. 2.3. 5.3. 6.3. 7.3. 8.3. 9.3. 152199,5 151571,9 153796,5 153549,5 153069.5 150853 149928,9 149842.6 150501,3 150186 153000 152000 151000 150000 149000 148000 147000 29.2. .3. 2.3. 5.3. 6.3. 7.3. 8.3. 9.3. Vyhodnocení portfolia Titul Množství Prodejní hodnota Změna(%) Akcie dohromady Změna v korunách ČEZ 40 806,9 -2,74 32 276 -884 KB 10 3745 -0,99 37 450 -370 NWR 210 146 -0,41 30 660 -84 Telefonica 51 395 -0,20 20 145 -40,8 Fortuna 300 98,85 -0,15 29 655 -55 Hodnota portfolia 150 186 -1 433,8 Vývoj indexu PX v průběhu 14 dní 8. Fundamentální analýza Typy analýz: • Technická analýza • Psychologická analýza je založena na předpokladu, že investování je ve značné míře ovlivněno emocemi • Fundamentální analýza: • Globální FA • Odvětvová FA • Firemní FA Globální FA • jde o celkové zhodnocení hospodářské situace na daném trhu a její vliv na vývoj akciového trhu jako celku • působí zde celá řada faktorů, z nichž za nejdůležitější můžeme považovat zejména: • Vývoj HDP • Vývoj úrokových měr • Změna Inflace • Vývoj peněžní zásoby Vývoj HDP • vztah HDP a akciových kurzů je kladný • jedná se o předbíhající faktor, a to o 3 až 9 měsíců • pokud předpokládáme růst HDP, investoři nakupují akcie, což ve výsledku pozitivně ovlivní reálný výstup ekonomiky Vývoj úrokových měr • negativní vztah • při růstu úrokových měr dochází k poklesu kurzů akcií a naopak, což může být vysvětlováno například jako: • změna budoucí vnitřní hodnoty akcií • odliv peněžních prostředků z akciových trhů Změna inflace • její vliv na vývoj akciových kurzů není zcela zřejmý, avšak spíše budeme mluvit o slabém negativním vztahu • růst inflace je velice často doprovázen růstem úrokových měr a taktéž v inflačním prostředí roste nejistota v ekonomice, tudíž pro investory stoupá riziko investic do cenných papírů Vývoj peněžní zásoby • kladný vztah, hlavně v krátkém období • předbíhající faktor • při růstu peněžní zásoby je více peněz investováno do jednotlivých akciových titulů, což způsobuje růst jejich ceny Odvětvová FA • odvětvová analýza zkoumá specifika a vztahy v odvětví, ve kterém daná společnost působí a jejich vliv na kurzy • důležitou roli zde hrají faktory jako: • citlivost odvětví na hospodářský cyklus • životní cyklus daného odvětví • struktura trhu • regulace v odvětví Citlivost odvětví na hospodářský cyklus • Cyklická odvětví • firmy produkující statky zbytné spotřeby, tedy výrobky a služby, jejichž spotřeba není nutná a lze ji odložit do budoucna. Cena akcie se poté vyvíjí podobně jako hospodářský cyklus. • např.: stavebnictví, automobilový průmysl, cestovní ruch, elektrotechnika • Neutrální odvětví • společnosti produkující statky nezbytné spotřeby (nulová cenová elasticita), či návykové produkty • např.: potravinářské produkty, farmaceutický průmysl, tabákový průmysl a výroba alkoholických nápojů. • Anticyklická odvětví • odvětví, která profitují během recese • firmy z anticyklických odvětí produkují levnější substituty drahých produktů, • např.: levné oděvy, obuv a potraviny nahrazující drahé výrobky Životní cyklus v odvětví • Pionýrská fáze • společnost produkuje nové, či silně inovované produkty • po těchto statcích prudce narůstá poptávka, firmy mohou dosahovat nadprůměrných zisků • to způsobuje rostoucí konkurenci a může docházet ke krachu některých podniků • investor může dosahovat mimořádných výnosů, avšak za vyššího rizika • např.: boom ve výpočetní technice v průběhu 90. let • Fáze rozvoje • stabilizace odvětví, firmy, které přečkaly pionýrskou fázi • upevňování pozice na trhu • Fáze stability • na trhu se nacházejí silné firmy, které mají zavedené jméno • stabilní vývoj tržeb, marží a zisku • tato fáze se vyznačuje nízkými výnosy a postupně rostoucími náklady, zejména na marketing a propagaci produktů • některé společnosti zde již nevidí budoucnost a odvětví postupně opouštějí. • Období útlumu • odvětví zastarává, objem produkce pozvolna klesá a firmy zde ukončují činnost Firemní FA • věnuje se samotné akciové společnosti • zkoumá, jak firma hospodaří • jaký je její očekávaný vývoj v budoucnosti • zda je příslušný cenný papír správně ohodnocen -pomocí vnitřní hodnoty akcie • cílem je najít na trhu nadhodnocené a podhodnocené akcie a následně provádět případný nákup či prodej Vnitřní hodnota Vnitřní hodnotu počítáme v různých časových periodách: v delším období - abychom zjistili, jak se mění a jakým směrem můžeme očekávat další pohyb kurzu v krátkém období - je možné považovat vnitřní hodnotu za konstantní a tudíž schopnou porovnání se skutečným kurzem akcie Pro budoucí použití označíme aktuální vnitřní hodnotu cenného papíru jako V0 a skutečný tržní kurz P0. P0 > V0 - nadhodnocený cenný papír P0 = V0 - relativně správně ohodnocený cenný papír • P0 < V0 - cenný papír je podhodnocený Metody stanovení vnitřní hodnoty akcie • Dividendové diskontní modely - DDM • Ziskové modely • Cash Flow modely • Další ohodnocovací modely Vstupní hodnoty pro modely • Míra růstu dividend • Požadovaná výnosová míra Míra růstu dividend Historická data • Průměr hodnot za delší období • aritmetický • geometrický • Nevýhoda - nezahrnuje žádné předpoklady do budoucna Míra růstu dividend Z firemních ukazatelů • Míra růstu dividend se rovná míře růstu zisku na akcii Budeme vycházet z následujících vztahů: ® Dosazením získáme: Požadovaná výnosová míra • Nejznámější CAPM • (Capital Asset Princing Model) • patří mezi nejpoužívanější modely • zahrnuje celou řadu faktorů r = rf + Pri r = ry + - ry) Metody stanovení vnitřní hodnoty akcie • Dividendové diskontní modely - DDM • Ziskové modely • Cash Flow modely • Další ohodnocovací modely Dividendové diskontní modely • nejčastěji používané modely • diskontováním budoucí očekávané hodnoty akcie i jednotlivých dividendových výnosů v jednotlivých letech Dividendové diskontní modely • Modely s nulovým růstem • Jednostupňové DDM • Gordonův model • Vícestupňové modely Dividendové diskontní modely Jednostupňové DDM a Gordonův model • Jednostupňové • Gordonův model • Musí být splněr x r s r s • (r - g) > o, tudíž g < r Dividendové diskontní modely Vícestupňové DDM DoCl+sji DQ(l+gZ)n(l+g2)Í , cn+m va-hi=1 , + iJ=i (1+r)-- + n-l-ni n-l-m Růstová nadprůměrná míra růstu dividendy je způsobena růstovými faktory firmy • Přechodná během této fáze je nadprůměrná míra růstu postupně snižována až na normální míru růstu pro dané odvětví • Finální zde již počítáme s průměrnou mírou růstu dividendy v našem odvětví po celou dobu, tedy v našem případě nekonečnou dobu držby akcie Ziskové modely • počítají se samotným ziskem - ziskové m. • bývají považovány za přesnější než dividendové • zaměřují se na kratší investiční horizont - přibližně tři roky, maximálně pět let • 3 základní typy: • P/E ratio • P/BV ratio • P/S ratio Ziskové modely - P/E ratio nejčastější ukazatel • kolika násobek zisku si člověk cení porovnává se v rámci odvětví ne napříč trhem Ziskové modely - P/BV ratio • využívá účetní hodnotu vlastního kapitálu • P/BV (price-to-book-value ratio) • očekávaný zisk v příštím roce nahradíme součinem rentability vlastního kapitálu a očekávané účetní hodnoty vlastního kapitálu na akcii • hodnota vyšší než 1 - tak si investoři cenní akcií více než podílu hodnoty majetku společnosti, který připadá na jednu akcii • vypovídající schopnost je nízká a často opožděná • účetnictví jednotlivých společností bývají odlišná TTTI „ EhXVP BVhXROEXVP VH = P = —-= —-- r-g r-g Ziskové modely - P/S ratio vyjadřuje, jak moc si investor cenní jedné koruny z tržby podniku můžeme použít i v případě, kdy podnik dosahuje nízkého zisku či ztráty lze lépe porovnávat podniky navzájem Sx - očekávané tržby na akcii v prvním roce Mj - očekávaná zisková marže na akcii v prvním roce Příklad - společnost ČEZ • České Energetické Závody. • v roce 2009 byla největší českou firmou podle tržeb • 32 tisíci zaměstnanců - třetí největší • Struktura vlastníků: • Ministerstvo financí ČR - 69,369 % • Ostatní právnické osoby - 4,427 % • Fyzické osoby - 5,416 % • Správci celkem - 20,788 % Požadovaná výnosová míra ČEZ Bezriziková výnosová míra rf 6,55 % Tržní výnosová míra 14,25 % Beta faktor B 0,73 P\Jm ~ rf) — Pri 0,73 * ( 0,1425 - 0,0655 ) = 0,05621 rf + Pri = r 0.0655 + 0.05621 = 0.12171 Míra růstu dividend Rok 2 1 2 i 2 2 2 3 2004 2 5 2 6 2 7 2 8 2 9 20i0 ■ ■ ■ ■ Dividenda 2,00 2,50 4,50 8,00 9,00 15,0 20,00 40,00 50,00 53,00 50,00 Míra růstu dividendy v % x 25 % 80 % 78 % 13 % 67% 33% 100% 25 % 6 % -6% Aritmetický prumer - 42,06 % Geometrický prUmer - 37,97 % Jednot. Zkratka Vztahy 2 000 2 001 2 002 2 003 2 004 2 005 2 006 2 007 2 008 2 009 2 010 Dividend a Kč D Bloomber g 2 3 5 8 9 15 20 40 50 53 50 Čistý zisk mil. Kč e Bloomber g 7 237 9 123 8 421 8 869 13 213 21 438 27 697 41 555 46 510 51 547 47 232 Počet akcií mil a Bloomber g 592,0 590,1 590,3 591,5 592,2 589,8 588,8 541,8 533,0 533,4 533,9 Zisk na akcii E E=e/a 12,23 15,46 14,27 14,99 22,31 36,35 47,04 76,69 87,25 96,63 88,47 Vlastní kapitál mil. Kč VK Bloomber g 129 442 136 726 143 675 171 075 178 447 191 289 207 653 184 226 185 410 206 675 227 051 Rentabilit a vl. kapitálu % ROE ROE=(e/V K)*100 5,59 6,67 5,86 5,18 7,40 11,21 13,34 22,56 25,08 24,94 20,80 Div. výplatní poměr % VP VP=(D/E) *100 16,36 16,17 31,54 53,35 40,34 41,27 42,51 52,16 57,30 54,85 56,52 Podíl zadržené ho zisku % b b=100-VP 83,64 83,83 68,46 46,65 59,66 58,73 57,49 47,84 42,70 45,15 43,48 Míra růstu dividend % g g = ROE *b 4,68 5,59 4,01 2,42 4,42 6,58 7,67 10,79 10,71 11,26 9,05 Míra růstu dividend Způsob výpočtu Míra růstu dividend Aritmetický průměr 42,06 % Geometrický průměr 37,97 % Udržovací růstový model 7,25 % DDM ČEZ Požadovaná výnosová míra r 12,171 % Míra růstu dividend g 7,25 % Poslední vyplacená dividenda D 50 Ziskové modely D V P = - = - E 88,47 P/E ratio 50 = 0,57 ČEZ Požadovaná výnosová míra r 12,171 % Míra růstu dividend g 7,25 % Dividendový výplatní poměr VP 0,57 Očekávaný zisk v dalším roce Ei 81,02 Ziskové modely P/BV ratio ČEZ Požadovaná výnosová míra r 12,171 % Míra růstu dividend g 7,25 % Dividendový výplatní poměr VP 0,57 Rentabilita vlastního kapitálu ROE 20,8 % Očekávaná účetní hodnota vlastního kapitálu na akcii BV 431,43 Shrnutí ČEZ Současný kurz 787,5 Kč DDM 1089,72 Kč KOUPIT Ziskový model - P/E ratio 930,53 Kč KOUPIT Ziskový model - P/BV ratio 1030,77 Kč KOUPIT Doporučení KOUPIT 9. Metody technické analýzy Technická analýza • analytický přístup zabývající se vývojem kurzů cenných papírů či cen komodit. Je to způsob rozhodování o koupích a prodejích finančních instrumentů na základě minulého vývoje jejich tržních cen a objemu obchodů. • postavena na analýze publikovaných tržních dat, kterými jsou kurzy nebo objemy obchodů. • Hlavním cílem je prognózování krátkodobých pohybů akcií nebo akciových indexů. Zaměřuje se na změny tržních cen jako na indikátory nabídky a poptávky. • je založena na předpokladu, že všechno, co potřebuje investor vědět, je obsaženo v tržních cenách. Dává nám doporučení, kdy provést obchod. Základní předpoklady technické analýzy • Tržní ceny odrážejí a zahrnují veškeré informace. • Ceny se pohybují v trendech. • Historie se opakuje. DOW THEORY • odvozena z článků, které publikoval Charles H. Dow ve Wall Street Journal v letech 1900 až 1902 . • Podle Ch. Dowa se většina akcií chová podobným způsobem. Nemusíme tedy zkoumat každou akcii zvlášť, ale situaci na trhu by měla dostatečně popisovat průměrná tržní cena akcií. • Vytvořil indexy: Dow-Jones-Rail-Average (DJRA) a Dow-Jones-Industrial-Average (DJIA) Principy Dowovy teorie I. • Akciové indexy v sobě zahrnují všechny relevantní informace. • Pohyby akciových kurzů lze rozložit na tři základní trendové pohyby, kterými jsou primární (1 rok a déle), sekundární (3 týdny až 3 měsíce) a terciární trend (méně než 3 týdny). • Primární trendy obsahují tři fáze - akumulační, rostoucí a fáze distribuce. • Akciové indexy se musí navzájem potvrzovat. To, co je vyrobeno, musí být též dopraveno, proto by měl být vývoj obou indexů (DJIA a DJTA) stejný. • Objem obchodů musí potvrzovat trend. Nastoupený trend na trhu je potvrzen, pokud ho doprovází rostoucí objem obchodů. Oproti tomu klesající objem obchodů naznačuje pravděpodobnou změnu trendu. • Nastoupený trend trvá až k jasné změně trendu. Principy Dowovy teorie II. • Budoucí vývoj kurzů (pokračování trendu nebo jeho změnu) lze odvodit z minulé tržní situace. Býčím, neboli rostoucím trendem (Bull Trend) nazýváme trend, jehož každý vrchol je vyšší než předchozí, a taktéž každé dno je vyšší než dno předchozí. Naopak, pokud je každý vrchol nižší než vrchol předchozí a každé dno je nižší než dno předchozí, mluvíme o medvědím neboli klesajícím trendu (Bear Trend). Změna trendu z býčího na medvědí nastane, pokud nový vrchol nedosáhne úrovně předchozího vrcholu a nové dno leží níž než předchozí dno. Jestliže byl doposud na trhu medvědí trend a nový vrchol leží výše než předchozí vrchol, zatímco nové dno je výš než předchozí dno, značí to změnu trendu na býčí trend. Kritika Dowovy teorie • Signály k nákupu a prodeji přicházejí příliš pozdě a můžou být falešné nebo nejednoznačne interpretovatelné. • Pomáhá pouze při analýze primárního trendu, přičemž na sekundárním a terciárním trendu lze též docílit vysokých zisků. • Soustředí se pouze na trh jako celek, a proto není schopna umožnit výběr jednotlivých akcií. Metody technické analýzy • Grafické metody - hledají opakující se formace, které vznikají na grafech ceny nebo objemu akcie. • Technické indikátory - Indikátor je funkce času, vektoru parametrů, historických cen a objemů, která konkrétním hodnotám přiřazuje vektor reálných čísel. Grafické metody • Grafy - pomocné nástroje technické analýzy ■ Čárový graf ■ Úsečkový graf ■ Graf typu svíce ■ Graf objemu obchodů ■ Znakový graf (Point & Figure) Grafický znak typu svíce (Japonské svíčky) ^ 1^ ^ \si\fi rrtr^f If; . > I : 5DD0D [tIäžÍä |d 1h [□ U ' [kt ' IA |ut IJ |s |o |h Grafické metody a formace • Hranice podpory (Support Level) a hranice odporu (Resistance Level) • Konsolidační formace (signalizují pokračování původního trendu po jeho dočasném přerušení) - trojúhelníky, vlajky, praporky a klíny, atd. • Reverzní formace (signalizují změnu trendu) - hlava a ramena, vrcholy, dna, atd. • Trendové kanály • Mezery Hranice podpory • Podpora je taková úroveň ceny akcie, při které je poptávka tak silná, že zastaví pokles ceny. • Linie podpory znázorňuje hladinu, od které by se měl kurz cenného papíru odrazit směrem vzhůru. • Pokud kurz linií podpory propadne a vzroste přitom objem, je to známka změny trendu. Prolomená linie podpory se pak stává linií odporu. Hranice podpory Hranice odporu • Odpor je úroveň ceny akcie, při které je nabídka taková, že zastaví růst ceny. • Linie odporu znázorňuje hladinu, od které by se měl kurz cenného papíru odrazit směrem dolů. • Pokud je linie odporu prolomena za rostoucího objemu, je to známka změny trendu a linie odporu se obvykle mění v linii podpory. Trojúhelník Vlajka a praporek Klíny Hlava a ramena Dvojitý vrchol první vrchoí^(TT) Dvojité dno proražení neckline a pohyb ceny nahoru trend dolů neckline \ dvojité dno U Trendový kanál O čas Mezery II. Fibonacciho studie • Fibonacciho řada se skládá z členů, kde každý následující člen je roven součtu dvou předchozích: 1, 1, 2, 3, 5, 8, 13, 21, 34, 55,... • Následující člen je vždy přibližně 1,618 násobek předcházejícího a zároveň 0,618 násobek členu následujícího. • Fibonacciho oblouky - zakreslení trendové linie mezi dva extrémní body a dále zobrazení tří oblouků se středem v druhém extrému o poloměrech 38,2%, 50,0% a 61,8% délky trendové linie. • Cílem je najít úrovně podpory a odporu v blízkosti Fibonacciho oblouků. • Používají se i Fibonacciho vějíře, hladiny návratu a časové zóny jako svislé linie zobrazené v intervalech rovnajících se jednotlivým hodnotám Fibonacciho čísel. Fibonacciho oblouky Cl: Cigna Coip (Weekly bars) wwwG«r>«sisřT.com u / 06.2002 = 102.30 (3.75) 275 150 0 1886 2000 2001 2002 Technické indikátory • Klouzavé průměry a metody na nich založené • Oscilátory • Objemové indikátory • Sentiment indikátory • Indikátory šíře trhu Klouzavé průměry a metody na nich založené • „trend-following metody" - svými signály a doporučeními zpravidla následují trend. • Nejlépe fungují v dobře trendujících trzích. • Nejčastějším vyhodnocováním signálů je sledování situace, kdy se indikátor protne s cenou. • Protne-li indikátor cenu zezdola nahoru - signál k nákupu. • Protne-li indikátor cenu shora dolů - prodejní signál. Klouzavé průměry a metody na nich založené • Druhy klouzavých průměrů se liší podle váhy přiřazované údajům různého stáří: ■ Jednoduchý ■ Vážený ■ Exponenciální ■ Trojúhelníkový ■ Proměnlivý • Metody založené na klouzavých průměrech: ■ MACD ■ Obálky ■ Bollingerovy pásy ■ Procentní pásy ■ Klouzavá regrese Jednoduchý klouzavý průměr MACD • Moving Average Convergence Divergence • je tvořen dvěma křivkami. První křivku dostaneme po odečtení dlouhodobého exponenciálního klouzavého průměru od krátkodobého exponenciálního klouzavého průměru a označujeme ji jako MACD. Druhou, nebo-li signální křivku získáme vyhlazením MACD pomocí dalšího exponenciálního klouzavého průměru. Oscilátory • Hodnota kolísá zpravidla buď kolem nějaké úrovně nebo v rámci pásma. ■ Momentum ■ Price Rate of Change ■ Moving Average Spread (MAS) ■ Cenový oscilátor (Price Oscillator) ■ Trix ■ Index relativní síly (RSI) ■ Stochastik Momentum • Zjišťuje velikost změny kurzu za určité období, čímž měří zrychlení nebo zpomalení trendu. • Hodnoty indikátoru se pohybují kolem oscilační linie o v případě absolutního Momenta nebo kolem oscilační linie 1 (popř. 100) v případě relativního Momenta. • Protne-li oscilační linii zezdola nahoru - signál k nákupu. • Protne-li oscilační linii seshora dolů - signál k prodeji. • Na silně trendujícím trhu může vysílat ukvapené signály. Momentum Index relativní síly (RSI) / 100 \ RSI = 100 - - \1 + RSJ • kde RS je podíl průměrných kladných změn v kurzu a průměrných záporných změn v kurzu během stanovené časové periody. • RSI vyjadřuje vnitřní sílu jednotlivého cenného papíru. • Hodnoty RSI se pohybují v intervalu 0 až 100. • Dá se dobře využít k analýze překoupeného a přeprodaného trhu. Index relativní síly (RSI) C2KCASH,Daily 1119.8 1122.5 1113.0 1115.7 V f RSI(14 its .72; 9 XTB-T ader, ( |i 2001- 2009 H ehaQuo :es Sofl ware C □rp. 29 Dec 2006 14 Feb 2007 30 Mar 2007 18 May 2007 3 Jul 2007 17 Aug 2007 3 Oer 2007 16 Nov 2007 8 Jan 2008 21 Feb 2008 8 Apr 2008 26 May 2008 9 Jul 2008 22 Aug 2008 7 Oer 2008 24 Nov 2008 14 Jan 200 Objemové indikátory • Pracují s údaji o objemech obchodů, které jsou doplňovány údaji o vývoji kurzů. • Pokud objem obchodů roste, značí to větší aktivitu investorů. Při upadající aktivitě na trhu je málo obchodníků ochotných za tuto cenu obchodovat, tudíž můžeme očekávat změnu trendu. • Využití především na trzích s malou likviditu. Objemové indikátory • On Balance Volume (Bilance objemu) • Price and Volume Trend (PVT) • Volume Rate-Of-Change (ROC) • Volume Oscillator (Oscilátor objemu) • Indexy PVI a NVI (Volume indexes) • Volume Accumulation/ Distribution Indicator (AD) • Chaikinův oscilátor • Money Flow Index (MFI) On Balance Volume • kde p je kurz akcie a v je objem obchodů. • Vychází z předpokladu, že na trhu obchodují dva typy investorů - smart money (profesionální investoři) a general public. • Nákupní signál - indikátor začne stoupat, zatímco cena klesá. • Prodejní signál - indikátor začne klesat, zatímco cena roste. • Indikátor, který předbíhá trend. On Balance Volume CEZ.CZ..M1 862 862 860 861; 14 Dec 2009 IE Dec 10:32 IE Dec 13:13 IE Dec 1E:4S 16 Dec 11:13 16 Dec 1E:33 17 Dec 11:4E 17 Dec 14:29 IS Dec 11:00 IS Dec 15:10 21 Dec 12:0E 21 Dec 1E:3S 22 Dec 14:E8 23 Dec 1E:2( Sentiment indikátory • Mají blízko k psychologické analýze. • Předmětem jejich zkoumání jsou nálady, očekávání a mínění investorů. • Investoři jsou ovládáni optimismem či pesimismem a podle toho, která nálada na trhu převládá, kurz roste nebo klesá. • Podle výkladu se dělí na: ■ Anticyklické ■ Cyklické Anticyklické sentiment indikátory • Snaží se zachytit chování široké investorské veřejnosti, která své obchody většinou uzavírá v nevhodné tržní situaci a se zpožděním. • Proto by investor měl jednat opačně, než signalizuje anticyklický indikátor. ■ Odd-lot Theory ■ Short Sales Ratio ■ Doporučení investičních poradců ■ Put/Call Ratio Cyklické sentiment indikátory • Snaží se zmapovat chování profesionálních investorů, kteří představují obzor úspěšného investorského chování. • Doporučení - chovat se v souladu s indikátory. ■ Barron's Confidence index (BCI) neboli Barronův index důvěry ■ Struktura portfolia fondů Indikátory šíře trhu • Sledují kvantitativní pohyb celého trhu, a to na základě údajů o počtu akcií, které klesly a počtu akcií, které stouply. • Snaha zmapovat výkonnost vybrané akcie, odvětví či jistého tržního segmentu - vždy však k relaci k jinému odvětví či segmentu. • Dobré pro předpověď pravděpodobné extrémní změny trendu, kterou odhalí s dostatečným předstihem. • Kvůli svému pohledu na celkový trh nejsou určeny pro analyzování jednotlivých akcií. Indikátory šíře trhu • Advance/ Decline Line (A/D) • Advance-Decline-Ratio • Advance-All-Ratio • McClellanův Sumation index (MSI) • McClellanův oscilátor • Relativní síla Advance/ Decline Line (A/D) ADLt = ADLt-± + (AI - DI~) • vyjadřuje číselně kumulativní rozdíl mezi počtem emisí akcií, jejichž kurz stoupá a klesá na dané množině akcií (báze indexu) v čase. • reaguje na změnu podmínek dříve než akciový index. • Tržní index roste, zatímco A/D Line již klesá - signál k prodeji. • Tržní index klesá, zatímco A/D Line již roste - signál k nákupu. Advance/ Decline Line (A/D) Advance-Decline-Ratio (ADR) • vyjadřuje číselně kumulativní podíl mezi počtem emisí akcií, jejichž kurz stoupá a klesá na dané množině akcií (báze indexu) v čase. • reaguje na změnu podmínek dříve než akciový index. • Tržní index roste, zatímco A/D Line již klesá - signál k prodeji. • Tržní index klesá, zatímco A/D Line již roste - signál k nákupu. 10. Oceňování nemovitého majetku Oceňování majetku představuje soubor činností, kdy je určitému předmětu nebo souboru předmětů přiřazována určitá peněžní hodnota Účel ocenění • Převod, přechod, dělení nebo navyšování vlastnictví • Financování a úvěrování • Škody na majetku • Účetnictví • Daně a poplatky • Investiční, arbitrážní a tržní poradenství • Pojišťovnictví Oceňování majetku v ČR • Oceňování administrativní ze zákona č. 151/1997 Sb., o oceňování majetku, prováděcí vyhlášky Ministerstva financí • Oceňování tržní Administrativní ocenění • Založeno na přesně definovaných postupech a krocích • Slouží účelům a potřebám státní správy:daňové účely, ocenění majetku investičních a penzijních fondů, vyvlastnení apod. • Zajištění spravedlivého ocenění • Striktně dáno zákonem, není zde žádný prostor pro individuální přístup • Výsledná cena při řádném dodržení metodiky by měla být jednoznačná a pokud možno jediná Negativum úředního oceňování Vzniká cena uměle vytvořená, která se skutečnou objektivní hodnotou majetku přijímanou trhem má jen málo společného! Tržní oceňování • Systematický, ale zároveň individuální tvůrčí proces, spočívající v hledání cenotvorných faktorů, v jejich analýze a následném vážení všech vlivů, které na hodnotu věci působí • Neurčujeme cenu, ale pouze její ODHAD! • Výběr metodiky ocenění je čistě na odborném a zodpovědném uvážení odhadce nebo soudního znalce Postup při oceňování • Zadání - přesná charakteristika předmětu a účelu ocenění, datum, místo, kde se nemovitost nachází, identifikace zadavatele, cena posudku a datum jeho plnění • Ověření existence nemovitosti • Provedení místního šetření • Určení a použití oceňovacích metod • POSUDEK Příklad posudku http://www.mmdrazby.cz/data/auctions/8/znalecky-posudek-varvazov_132670241932.040.pdf Základní dokumenty potřebné k ocenění nemovitosti • Výpis z katastru nemovitostí • Kopie příslušné části katastrální mapy • Výpisy z pozemkové knihy • Cenová mapa pozemků - pokud je v dané obci vypracovaná • Výkresová dokumentace • Stavební povolení, územní rozhodnutí a projektová dokumentace k němu • Kupní, nájemní a další převodní smlouvy • Smlouvy či doklady o správě, službách, pojištění, odpisech, nákladech na opravy a údržbu, daních • Fyzická i právní břemena vztahující se k nemovitosti, přehled a současný stav úvěrů • Fotodokumentace • Výsledky místního ohledání nemovitosti provedeného osobně odhadcem Základní metody oceňování nemovitého majetku • Nákladová • Výnosová • Porovnávací • Jejich kombinace Nákladová metoda • Vychází z vynaložených nákladů na výrobu či sestavení dané věci Založena na fyzických a technických vlastnostech oceňovaného předmětu Historicky nejstarší a nejpracnější způsob oceňování • Kolik by stálo postavení této nemovitosti dnes? (započítává se materiál i práce) Opotřebení Metody založené na nákladovém principu Individuální cenová kalkulace • Podrobný položkový rozpočet • Použitím technicko-hospodářských ukazatelů • Podle vyhlášky č. 504/2002 Zjištění věcné hodnoty pomocí THU Výnosová metoda • Ekonomický pohled na nemovitost • Vlastníkovi nemovitosti patří i veškeré požitky z vlastnictví nemovitosti • vychází z hrubého nájemného, které je potřeba dále snížit o náklady na jeho dosažení • Čisté příjmy se diskontují na současnou hodnotu kapitalizační mírou Věčná renta 0) Dočasná renta Konstantní výnos po určitou dobu, s prodejem na konci Pomocí diskontovaných peněžních toků #1 Míra kapitalizace • Významně ovlivňuje výslednou hodnota nemovitosti • Výše úroku je přímo úměrná riziku, které sebou přináší daná investice • Její určení závisí pouze na úvaze odhadce či soudního znalce Jak určit míru kapitalizace • Odvozením od úrokové sazby v bankovních institucích • Zjištěním z již realizovaných prodejů staveb, které jsou následně pronajímány • Použitím míry kapitalizace podle cenového předpisu Míra kapitalizace podle cenového předpisu Číslo Název Míra kapitalizace položky položky % 1 Nemovitosti pro výrobu a garážování 10 2 Nemovitosti pro obchod a administrativu Nemovitosti pro hromadné ubytování a stravování 4 Nemovitosti pro dopravu, spoje a školství 9 ^ Nemovitosti pro kultům 6 Nemovitosti pro zdravotnictví 7 Nemovitosti pro zemědělství ■ 8 Nemovitosti pro skladování 6 9 Bytové domy 10 Ostatní nemovitosti 11 Majetková práva 12 Závislost výnosové hodnoty na použité míře kapitalizace o = ■a o o O = 10 000 000 8 000 000 6 000 000 4 000 000 2 000 000 0 l 123456789 10 Míra kapitalizace (% p.a.) Příklad Zjistěte výnosovou hodnotu obytného domu • 6 bytů: 5X byt 1+1 a ix byt 2+1 • Dobrý technický stav, postaven v roce 1940 • Pozemek pod domem není ve vlastnictví majitele • Byt 1+1 obývá chronický neplatič, jeden byt 1+1 je volný, ostatní byty jsou pronajímány na základě nájemní smlouvy na dobu neurčitou za regulované nájemné • Rohový dům, který se nachází v Ostravě Přívozu na ulici Jílová (jedná se o méně atraktivní lokalitu) • Dům má 3NP a 1PP, sedlovou střechu • Obestavěný prostor činí 1 9911113, základní cena je 3870^/1113. • Míra kapitalizace činí 5%. Identifikace výnosů Jednotka Počet pokojů Kategorie Cena za m2 Výmera Nájem za vyb. bytu (Kč) Celkem nájem v Kč Poznámka 1 1+1 n 18,55 49,50 25,- 918,- 2 1+1 50,00* 45,50 2275 Volný byt 3 1+1 n 18,55 48,00 50,- 890,- 4 1+1 n 18,55 44,00 Neplatič 5 1+1 n 18,55 42,34 45,- 785,- 6 2+1 n 18,55 63,44 150,- 1177,- Celkem měsíční nájem 270,- 6045,- Celkem roční nájem z provozu domu 75780,- Identifikace nákladů Položka Náklad roční Poznámka Daň z nemovitostí 1 764,- Pojištění stavby 4 506,- Provoz a údržba 38 525,- Náklady na pronájem pozemku 4 500,- 1 Náklady na správu nemovitostí 0,- neuvažujeme Odpisy 0,- neuvažujeme Celkem 49 295,- Výpočet výnosové hodnoty Položka Míra kapitalizace v % Výnosová hodnota Diskontní sazba 1,25 1 958 800,-Kč Bežný úrok v bance 2,00 1 324 250,-Kč Porovnávací způsob č.m. 5,00 529 700,-Kč Porovnávací způsob h.m. 8,00 947 250,-Kč Cenový předpis 4,00 757 800,-Kc Porovnávací metoda • nejpoužívanější oceňovací princip • Setkáváme se s ní v každodenním životě • Nemovitost je výrazně heterogenní věcí • Předpoklad: shodné fyzické vlastnosti a stejná kombinace vlastnických práv • Založena na porovnání s již prodanými nemovitostmi - prodány za poslední rok • nejspolehlivější a nejobjektivnější nástroj sloužící k určení tržní hodnoty • nutné mít k dispozici databázi s dostatečným počtem nemovitostí, u nichž jsou známy základní technické parametry a také cena, za kterou se obchod realizoval Metody založené na principu porovnání • Odbornou rozvahou • Pomocí koeficientu prodejnosti • Metoda přímého porovnání • Metoda nepřímého porovnání Příklad Zjistěte porovnávací hodnotu bytu • lokalita: předměstí • 3+1, výměra je 601112, balkon, cihla • průměrný technický stav • osobní vlastnictví • Byt není zatížen žádnými zástavními ani jinými právy, které by mohly omezovat nové vlastníky v nakládání s bytem Výpočet porovnávací hodnoty odbornou rozvahou Číslo bytu Typ vl. Pramen Lokalita bytu Technický popis Cena nabídková Koeficient Upravená Cena (Ke) 1 osv inzerce Centrum 2+1, 65m2, balkon, panel 650 000 0,90 585 000 2 dr inzerce Centrum 1+1, 35m2, panel 550 000 0,90 * 1,15 569 000 3 id kupní smlouva Okrajová oblast 2+1, 55m2, balkon, cihla 640 000 1,00 640 000 4 osv inzerce Předměstí (navazující centrum) 3+1, 70m2, balkon, panel 900 000 0,90 810 000 5 osv inzerce Úpadková oblast 3+1, 100m2, balkon, cihla 450 000 0,90 405 000 Průměrná hodnota 601 800 Metoda přímého porovnání Stanovení koeficientů: • koeficient polohy Kp • Koeficient velikosti bytu Kv • Koeficient konstrukce Kk • Koeficient balkonu Kb Výpočet porovnávací hodnoty přímým porovnáním Byt Cena Koef. na pramen ceny Kor. Vlastnictví Kor. Cena m Kv Kk Kb I Cena (tis. Kč)| 1 650 0,90 1,00 585 U 1,035 0,9 1,0 1,02465 570 2 550 0,90 1,15 570 0,825 0,9 0,95 0,7759 734 3 640 1?00 1,05 672 0,9 0,965 1,0 1,0 0,8685 773 4 900 0,90 1,00 810 1,0 1,07 0,9 1,0 0,963 841 5 450 0,90 1>00 405 0,5 1,28 1,0 1,0 0,64 632 Průměr 710 11. Black-Scholesův model, jištění, citlivosti BS model - otcové myšlenky Fischer Black (1938-1995) Myron Scholes (1941-) BS model - pojmy = model pro oceňování opcí ■ ST ... cena podkladového aktiva v čase T ■ S0 ... cena podkladového aktiva v čase o (spotová) ■ K ... realizační cena ■ a ... volatilita ■ T ... doba expirace ■ r ... bezriziková úroková míra ■ c ... cena evropské call opce ■ p ... cena evropské put opce BS model - předpoklady • neexistence transakčních nákladů • neměnné zdanění opcí • úroková míra stejná pro půjčku a výpůjčku • trhy fungují nepřetržitě (odstraňují arbitráž okamžitě) • ceny akcií jsou spojitou náhodnou veličinou • akcie nenese dividendy • opce je evropského typu • akcie lze prodávat i na krátko • můžeme obchodovat i s částí akcie BS model - tvar c = 50Af(di) - Ke-rTN(d2) p = Ke-rTN(-d2) - SoJVC-di) • kde • N je distribuční funkce standardizovaného normálního rozdělení Citlivost - Greeks • A ... delta • 0 ... theta • ľ ... gamma • V ... vega • p ... rho Delta a delta-neutrální portfolio • Delta vyjadřuje rychlost změny ceny opce vzhledem ke změně ceny akcie: dc • Delta-neutrální portfolio: A = o • Výhoda: Při malých změnách ceny akcie se hodnota celého portfolia nemění. • Platí: Ac = N(d1), Ap = N(d1) - 1, Aport. = suma(niAi), A(akcie)=1 • Pozor na vysoké transakční náklady. Theta • Theta vyjadřuje rychlost změny ceny opce vzhledem ke změně času: oc • Proti času nemá smysl se jistit - víme, jak se mění. • 0 v praxi náhražka za ľ • 0c získáme derivací podle T Gamma a gamma-neutrální portfolio • Gamma vyjadřuje rychlost změny ceny opce vzhledem ke změně delta: „ ~ _ dA _ d2c T ~dŠ~dŠž • Čím je ľ větší, tím častěji musíme rebalancovat portfolio. • ľ-neutrální portfolio: ľ = o • Výhoda: I při velkých změnách ceny akcie se hodnota celého portfolia nemění. • Platí: ľ(akcie)=o, ľc dostaneme druhou derivací podle S Vega Vega vyjadřuje rychlost změny ceny opce vzhledem ke změně volatility: • Platí: V (akcie) = 0 • Obvykle pokud ľ = 0 <-> V * 0 • Pro ľ = 0 A V = 0 potřebuje dva různé deriváty na stejné podkladové aktivum Rho • Rho vyjadřuje rychlost změny ceny opce vzhledem ke změně úrokové míry: ^c P = dr • pc získáme derivací podle r Jištění - možnosti investora • nicnedělání (naked position) • prodej akcií Jištění pomocí opcí: • krytý call • ochranný put • dynamické jištění (delta hedging) • Jištění = chránění investice v akciích. - sklada se z short call opce a long akcie - případná ztrata z akcií je kryta výnosem z opcí - sklada se z long put opce a long akcie - garance minimální hodnoty investice Dynamické jištění • utvoříme delta-neutrální portfolio => je imunní vůči malým výkyvům ceny akcie • za daný časový úsek měníme svou pozici v opcích tak, aby portfolio zůstávalo delta-neutrální • existuje delta-hedging s call a s put Příklad • Vypočítejte cenu evropské call opce pomocí BS vzorce, když znáte: • doba expirace 1 rok • spotová cena je 2Kč • úroková míra 82%, • realizační cena je 2Kč • volatilita 0,6 • nápověda: N(i,666)=o,952i, N(i,366)= 0,9141, N(i,o66)=o,85Ó9, exp(-o,82)=o,44 • výsledek c = 1,15Kč Zdroje • Hull, J.C. Options, futures and other derivatives. 8. vyd. Boston: Pearson, 2012, 847 s. ISBN 9780273759072. • Ambrož, L. Oceňování opcí. Vyd. 1. Praha: C.H. Beck, 2002, xvi, 313 s. ISBN 8071795313. • přednášky do MF003 12. Oceňování derivátů, hraniční opce, opce závislé na cestě Spůsoby oceňování derivátů Black-Scholesov vzorec a jeho modifikácie c = kS0 N (kdl) - kXe~rTN (kd2 ) d = ln(S0f X)+(r + a2 /2)T = ln(s„ /X) + (r-a2/2)T 1= a4T d2= *4T c - cena kúpnej opcie r - tržná úroková miera So - cena podkladového aktíva v čas o T - doba do expirácie opcie X - realizačná cena ct - volatilita podkladového aktíva N() - distribučná funkcia normálneho štandardizovaného rozdelenia k - je i pre call opciu a -i pre put opciu Predpoklady: 1. Log-normálne rozdelenie podkladového aktíva 2. Úroková miera sa nemení 3. Nevyplácajú sa dividendy 4. Opcia je európska 5. Žiadne transakčné náklady 6. Nekonečná deliteľnosť podkladového aktíva 7. Obchodovanie je spoj ité 8. Short-sale je povolený Spůsoby oceňování derivátů • Risk - neutrálne oceňovanie • Binomické a trinomické stromy • 3D binomické a trinomické stromy • Spread opcie resp. tam kde sa využívajú 2 procesy súčasne Spůsoby oceňování derivátů • Simulácia Monte Carlo • Určenie strednej hodnoty z určitého počtu náhodných pokusov • Vhodná pre path-dependend opcie • Opcie s viac podkladovými aktívami • Opcie ktoré neboli analyticky ocenené • Náchylná na vysoké chyby pri nízkom počte opakovaní Opční formace Bull a Bear spread (short a long call/put s rôznymi realizačnými cenami) I'|jí!| t ^ ■ŕ > Profil • Combo (long OTM call a short OTM put) Profit Opční formace • Butterfly, Condor (long call+2 short call+long call) call/put Profil \ \ \ Opční formace Ladder (short call+2 long call) alebo (2 long put+shor put) Exotické opce • Path-depended opcie (závislé na ceste) - Ázijské opcie - Forward-start opcie - One-clique option - Barirové opcie - Roll-up/Roll-down opcie - Lookback opcie - Shout opcie - Lock-in opcie • Korelačné opcie - Výmenné opcie - Best-of/Worst-of and cash opcie - Korelačné binárne opcie - Kvocientné opcie - Produkčné opcie - Opcie zahraničného kapiálu - Quanto opcie - Rainbow opcie - Spread opcie - Dual-strike opcie - Out-performance opcie - Basket opcie • Ostatné - Opcie s nelineárnou výplatou - Zložené opcie - Chooser opcie - Opcie s podmienenou prémiou - Explodujúce opcie - Reset opcie - Konvexné opcie Kombinace • Kanárské opcie • Bermudské opcie • Havajské opcie • Ruské opcie • Parížske opcie • Izraelské opcie • Napoleonské opcie Barierové opce • Opcie závislé na ceste, ktoré sa spustia resp. ukončia svoju platnosť pri prerazení vopred stanovenej hranice, ktorá je buď pod alebo nad spotovou cenou v dobe vypísania opcie • Opcia môže vyplácať rabat, ak nedôjde k spusteniu, alebo zanikne • Delenie » Put/Call » Knock-ln/Knock-Out » Up/Down • Ocenenie A = x^ - 4>Xe-rTN(X2) - cf>Xe-rrN( H Hodnota n * Ak X < H Hodnota n * Down-In Call C+E 1 1 Down-In Call A-B+D+E 1 1 Down-Out Call A-C+F 1 1 Down-Out Call B-D+F 1 1 Up-In Call A+E -1 1 Up-In Call B-C+D+E -1 1 Up-Out Call F -1 1 Up-Out Call A-B+C-D+F -1 1 Down-In Put B-C+D+E 1 -1 Down-In Put A+E 1 -1 Down-Out Put A-B+C-D+F 1 -1 Down-Out Put F 1 -1 Up-In Put A-B+D+E -1 -1 Up-In Put C+E -1 -1 Up-Out Put B-D+F -1 -1 Up-Out Put A-C+F -1 -1 Bariérové opce • Bariérové up opcie Barrier 5trik9 Price Sarrier strike, Price Ázijské opce Opcie kde je výplata závislá na rozdiele medzi priemerom cien podkladového aktíva za určité vopred stanovené obdobie a vopred stanovenou realizačnou cenou. Môže byť aj rozdiel medzi spotovou cenou a priemerom (fluktuujúca realizačná cena) Aritmetický a geometrický priemer Výhody: lacnejšie než vanilla opcie, nižšia volatilita Ocenenie Geometrickej call opcie: Geometrický priemer: Časové funkcie: Bsa (0) = 1, b u )= n V 1=1 S 0 j Tsa = r ,n—j n — j n n — j (n — j )(n — j — l)(4n — 4 j +1) Pomocné funkcie: As a (j) = e : ^ Bs a (j) ln e Cena opcie: d V X j V n j f 6n3 g V 1 a2 2 j Tsa + ln [B'a (j )]j n j C sa kS0Asa (j)e"gTZ—j N(kdsna_j + ka^TŤj ) sa n j n—j k N (kd^ ) n - celkový počet prvkov z ktorých sa počíta priemer j - priebežný počet prvkov z ktorých sa počíta priemer k - 1 pre call a -1 pre put t - doba do expirácie opcie j 2 Lookback opcie Opcie závislé na ceste, ktorých payoff je závislí na maxime resp. minime, ktorý vývoj ceny podkladového aktíva dosiahol za určité obdobie. Delenie . Fixný strike - payoff je určený ako rozdiel medzi maximálnou cenou a fixnou realizačnou cenou pre call opciu a rozdielom fixnej realizačnej ceny a minimom podkladového aktíva pre put opciu . Pohyblivý strike - payoff je daný rozdielom maxima a spotovej ceny v rozhodný deň pre call a spotovej ceny a minima pre put opciu. Vždy dôjde k realizácií. Relatívne drahé, vhodné na komodity Ocenenie: Fixed strike Lookback call ak X>Max(S) C = Se -gTN{a,)- Xe ~rT N{a2 )+ Se -rT a2 2(r - g) e(r-g)TN(a,)-[ S 2(r - g ) " a2 f N a 2(r - g)4T J Lookback opcie Fixed strike Lookback Put ak XMin(S) a2 2(r g) V X j 2(r - g ) ' a2 f N a 2(r - g)VF a (r g)T N( a1 ) P = e-rT [(X - SMN )+ SMINN (- c2)]-Se- gT N (- c1)+ Se-rT a2 2(r g) Kde - 2(r - g) f S ^ a2 C N c1 + 2(r-g VT a Tn ( c1) ln a1 = V X j + r g+ 1 a2 V 2 T ln a 4T b1 = v SMAX j + 1 a r-g + V 2 j T S- spotová cena pri uzatváraní kontraktu X- realizačná cena Smax- historicky maximálna cena Smin- historicky minimálna cena a4T r - tržná úroková miera T - doba do maturity opcie g - miera rastu dividend a - volatilita ln S c1 = V Smin j í + 1 a r- g + V_2 j T a Lookback opcie C = Se -gT N (c1)- SMINe ~rT N (c2 ) + Se -rT • Lookback s pohyblivou realizačno P = SMAX e -rTN (d2 )- Se - gT N (- d1) + Se -rT a 2Urceig)u a - 2(r - g ) V SMIN J N — cx + 2(r - g )VT V a 2(r - g) ( S \ a2 ( N V Smax J V d1 + 2(r - g )VT a + e- gTN (d1) In ( + r V Smin J V 1 a2 2 j T In fSmax^ d1 = a í 4T 1 a r - g + V 2 j T a ■ d2 = d1 -a4T Shout opcie • Sú to modifikácie európskej opcie. Ako bonus má majiteľ opcie právo "zakričať" na vypisovateľa jedenkrát (prípadne viac krát) na vypisovateľa v priebehu životnosti opcie v čase T, keď predpokladá, že je cena dostatočne vysoko (nízko). • Payoff je väčšia hodnota z výplaty z európskej vanilla opcie alebo z rozdielu spotovej ceny pri shout-e a realizačnej ceny. • Podobná lookback opcií, ale lacnejšia • Kombinácia vlastností lookback a americkej opcie • Využívajú sa v ako súčasť úrokových produktov a v segregovaných poistných fondoch • Payoff: call max( 0, ST — ST ) + (ST — X) Sp - cena pri expirácií put ST - cena pri shout-e max( 0, ST— ST ) + (X — S T) X - realizačná cena • Oceňujú sa simuláciami, napríklad Monte Carlo. Prípadne binomickými a trinomickými stromami. Presné analytické riešenie neexistuje. Zložené opcie m Opcie na opcie m Vysoko volatilné v porovnaní s vanilla opciami m Využíva sa distribučná funkcia dvojrozmerného normálneho rozdelenia M(a,b,p) m Payoff je daný ako: max (0, kPVTi [max (o, hS* - hXl \Tl)] - kX2 ) m Kde m h - je pre podkladovú opciu i ak je call -1 ak je put m k - je pre compound opciu 1 ak je call -1 ak je put m X1 realizačná cena podkladovej opcie m X2 realizačná cena compound opcie m T1 doba expirácie podkladovej opcie m T2 doba expirácie compound opcie Zložené opcie Call na call opciu Call na put opciu Put na call opciu Put na put opciu CC = Se~s Ti M f a1, b1; T Xe-rTi M f Cp = Se ~8T M v 1 1 "iT1 i j v \ T j Xe~rTi M i j PC = X1e~rTi M - a2, b2;- v f a2,-b2;-^ T 2 Se - 8Ti M i j - a1, b1;-„ T1 e~rT2 X2 N (a2 ) + e~rT2 X2 N (a2 ) 1 j 1 j PP = X1e~rTi M v a2,-b2; 2 2 V ti j ■a1,-b1;_ e~rT2 X2 N (- a2 ) e~rT2 X2 N (- a2 ) ln f S ^ v S j 1 a r - 8 + v 2 j T 1 o ln b1 = v X2 j r - 8 + v 2 j T J i a2 = a1 - aJT2 a1 = • Pre kritickú hodnotu S* musí platiť že hodnota európskej call/put opcie v čase T2 je X2 Chooser opcie • Tieto opcie majú vlastnosť, že v určitom vopred stanovenom čase v budúcnosti Ti sa držiteľ opcie rozhodne či je daná opcia call alebo put. • Drahšie ako vanilla opcie • Lacnejšia alternatíva obchodovania straddlov • Hodnota v čase T1 je: Max(c,p) kde c - je hodnota kúpnej opcie v čase T1 s realizáciou v čase T2 p - je hodnota predajnej opcie v čase T1 s realizáciou v čase T2 • Ocenenie: Na základe call-put parity dostaneme max (c, p ) = max (c, c + Xe - (T -T ) - Sxe~g (T -T ])= c + e~g (72 ~Tl} max( 0, Xe ~{r ~g ~Tl ]- Sx) S1 je cena podkladového aktíva v čase volby typu opcie T1 doba do volby typu opcie T2 doba do maturity opcie Chooser opcie • Cena chooser opcie je určená ako: Ch = Se -gT N(d1)- Xe -rT2 N(d2)- Se~gT N(- e1) + Xe -rT2 N(- d2 ) ln d1 = ŕ S ^ r — g + V 2 j T d2 = dl — aJT2 ln r S ^ + (r - g)T2 + 1 aT 2 e2 = e1 - a T1 kde ^/ri S - cena podkladového aktíva pri oceňovaní opcie X - realizačná cena opcie S1 - je cena podkladového aktíva v čase voľby typu opcie T1 - doba do voľby typu opcie T2 - doba do maturity opcie r - tržná úroková miera a - volatilita g - miera rastu dividend Binárne/Digitálne opcie • Opcie, ktoré majú binárnu výplatnú funkciu. Ak podkladové aktívum prekročí realizačnú cenu, držiteľ opcie získa podkladové aktívum alebo vopred stanovenú sumu peňazí. • Relatívne drahé opcie Cash-or-nothing • Call - držiteľ získa sumu K ak cena podkladového aktíva je vyššia ako realizačná cena (S>X), inak nezíska nič • Put - držiteľ získa sumu K ak cena podkladového aktíva je nižšia ako realizačná cena (SX), inak nezíska nič • Put - držiteľ získa podkladové aktívum ak cena podkladového aktíva je nižšia ako realizačná cena (Shttp://archive.ics.uci.edu/ml/ >http://kdd.ics.uci.edu/ >http://sede.neurotech.com.br:443/PAKDD2009/ >http://www.dataminingbook.corn/ >http://www.stat.uni-muenchen.de/service/datenarchiv/welcome_e.html 444