PV210 Kvantitativní analýza internetového provozu

Fakulta informatiky
podzim 2008
Rozsah
2/0/1. 3 kr. (plus ukončení). Ukončení: zk.
Vyučující
Ing. Ladislav Lhotka, CSc. (přednášející), doc. RNDr. Eva Hladká, Ph.D. (zástupce)
Garance
prof. RNDr. Václav Matyáš, M.Sc., Ph.D.
Katedra počítačových systémů a komunikací – Fakulta informatiky
Kontaktní osoba: doc. RNDr. Eva Hladká, Ph.D.
Rozvrh
Po 12:00–15:50 B411
Předpoklady
základní kurs matematické analýza, pravděpodobnost a statistika
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
předmět má 37 mateřských oborů, zobrazit
Cíle předmětu
Přednáška se zabývá matematickými a vizualizačními metodami analýzy agregovaných charakteristik datového provozu TCP/IP ve vysokorychlostních sítích. Kromě objemových veličin (počty přenesených paketů a bajtů, počty toků) budou studovány zejména datové toky se zaměřením na detekci anomálií (poruch v síti, masivních útoků apod.). Probírané metody budou ilustrovány na vzorcích provozu z páteřní sítě CESNET2.
Na konci kurzu bude student schopen:
porozumět struktuře dat přenášených na páteřních okruzích;
používat základní metody analýzy agregovaných dat o internetovém provozu;
Osnova
  • Principy komunikace TCP/IP a hlavní kvantitativní charakteristiky datového provozu.
  • Datové toky IP, způsoby měření, nástroje na jejich analýzu a vizualizaci.
  • Charakteristické rysy hlavních aplikačních protokolů (HTTP, FTP, SSH, P2P, XMPP aj.)
  • Objemové veličiny (počty bajtů a paketů), statistická analýza časových řad, metody predikce
  • Rozložení klíčových položek IP toků (adres a portů) v časových vzorcích: entropie a principal component analysis
  • Kvantitativní charakteristiky vícerozměrných vzorků: fraktální a korelační dimenze, multifraktální míry
Literatura
  • Quittek J. et al. Requirements for IP Flow Information Export (IPFIX). RFC 3917, IETF, 2004.
  • Cook D., Swayne D. F.: Interactive and Dynamic Graphics for Data Analysis. Springer, 2007.
  • Kohler E. et al. Observed structure of addresses in IP traffic. IEEE/ACM Trans. Networking 14(6):1400-1412, 2006.
  • Peitgen H.-O., Jürgens H., Saupe D.: Chaos and Fractals: New Frontiers of Science. Springer, 1992.
  • Venables W. N., Ripley B. D.: Modern Applied Statistics with S. Springer, 2002.
  • Lakhina A., Crovella M., Diot C. Mining anomalies using traffic feature distributions. In: Proc. ACM SIGCOMM'05, p. 217-228, 2005.
  • Wei W. W. S. Time Series Analysis, Second Edition. Pearson, 2006.
Metody hodnocení
Klasická přednáška s průběžnými domácími úkoly, písemná zkouška.
Další komentáře
Studijní materiály
Předmět je vyučován každoročně.
Předmět je zařazen také v obdobích podzim 2009, podzim 2010, podzim 2011, podzim 2012, podzim 2013, podzim 2014, podzim 2015, podzim 2016, podzim 2017, podzim 2018, podzim 2019, podzim 2021, podzim 2022, podzim 2023.