JIRSÍK, Tomáš, Milan ČERMÁK, Daniel TOVARŇÁK, Jakub Samuel PAULOVIČ and Michal ŠTEFÁNIK. Stream4Flow: Software for mining and analysis of the large volumes of network traffic. 2016.
Other formats:   BibTeX LaTeX RIS
Basic information
Original name Stream4Flow: Software for mining and analysis of the large volumes of network traffic
Name in Czech Stream4Flow: Software pro analýzu a dolování informací ze síťových dat velkého rozsahu
Authors JIRSÍK, Tomáš (203 Czech Republic, guarantor, belonging to the institution), Milan ČERMÁK (203 Czech Republic, belonging to the institution), Daniel TOVARŇÁK (203 Czech Republic, belonging to the institution), Jakub Samuel PAULOVIČ (703 Slovakia, belonging to the institution) and Michal ŠTEFÁNIK (703 Slovakia, belonging to the institution).
Edition 2016.
Other information
Original language English
Type of outcome Software
Field of Study 10201 Computer sciences, information science, bioinformatics
Country of publisher Czech Republic
Confidentiality degree is not subject to a state or trade secret
WWW Domovská stránka nástroje
RIV identification code RIV/00216224:14610/16:00087653
Organization unit Institute of Computer Science
Keywords (in Czech) proudové zpracování dat; síťové toky; analýza; monitorování zařízení;
Keywords in English data stream processing; IP flows; analysis; host monitoring
Technical parameters Stream4Flow je možné využít v odvětvích zabývajících se bezpečnostním monitorování počítačových sítí. Framework umožnuje přijmout, analyzovat a zobrazit výsledky analýz síťového provozu v reálném čase. Framewokr obsahuje aplikace, které umožnují detekovat různé druhy síťových útoků a vypočítávat základní charakteristiky o jednotlivých zařízeních v síti. Tyto aplikace je možné využít pro odhalení podezřelého chování zařízení v dlouhodobém horizontu či následně pro tvorbu reputace daného zařízení. Software je primárně distribuován mezi týmy zabývající se síťovou bezpečností, ale je možné ho využít i v jiných oblastech zabývajích se zpracováním velkého objemu dat. Kontaktní osoba: Mgr. Tomáš Jirsík Ústav výpočetní techniky, Masarykova Univerzita Botanická 68a, Brno 602 00 e-mail: jirsik@ics.muni.cz tel:+420 549 494 271
Tags rivok
Changed by Changed by: RNDr. Tomáš Jirsík, Ph.D., učo 211086. Changed: 22/2/2017 09:04.
Abstract
A framework for the real-time IP flow data analysis built on Apache Spark Streaming, a modern distributed stream processing system. The basis of the Stream4Flow framework is formed by the IPFIXCol collector, Kafka messaging system, Apache Spark, and Elastic Stack. IPFIXCol enables incoming IP flow records to be transformed into the JSON format provided to the Kafka messaging system. The selection of Kafka was based on its scalability and partitioning possibilities, which provide sufficient data throughput. Apache Spark was selected as the data stream processing framework for its quick IP flow data throughput, available programming languages (Scala, Java, or Python) and MapReduce programming model. The analysis results are stored in Elastic Stack containing Logstash, Elasticsearch, and Kibana, which enable storage, querying, and visualizing the results. The Stream4Flow framework also contains the additional web interface in order to make administration easier and visualize complex results of the analysis. Due to above-described architecture, the framework is suitable for host monitoring and long-term malicious behavior discovery, description of the behavior of individual entities in the network and building its reputation record. It is also suitable for real-time attack detection, network monitoring, and overall situational awareness.
Links
TA04010062, research and development projectName: Technologie pro zpracování a analýzu síťových dat velkého rozsahu
PrintDisplayed: 9/10/2024 08:07