Detekce anomálií pomocí algoritmů založených na častých itemsetech

Název práce: Detekce anomálií pomocí algoritmů založených na častých itemsetech
Autor(ka) práce: Flégl, Jaroslav
Typ práce: Diplomová práce
Vedoucí práce: Kliegr, Tomáš
Oponenti práce: Chudán, David
Jazyk práce: Česky
Abstrakt:
Tato diplomová práce se zabývá metodami k detekci anomálií, které jsou založené na častýchitemsetech. Cílem práce je implementovat metodu FPI v programovacím jazyce Python a otestovatji na zvolených datech ze síťového provozu. K naplnění tohoto cíle vede několik kroků.V první části práce se jedná zejména o definiční vymezení anomálií a jsou uvedeny systémy,které se v sítích reálně využívají. Následuje stručný přehled metod strojového učení a jejichmožnosti využití k detekci anomálií. Dále jsou zmíněny metody pro detekci anomálií založenéna častých itemsetech. Ve druhé části je popsána implementace metody FPI v Pythonu.Následuje srovnání této implementací s implementací v programovacím jazyce R a testovánítéto metody na trénovacích datech. Na závěr je metoda vyzkoušena na testovacích datechvčetně evaluace výsledků.
Klíčová slova: anomálie; FPI; časté vzory; detekce anomálií; itemset
Název práce: Anomaly detection with algorithms based on frequent itemsets
Autor(ka) práce: Flégl, Jaroslav
Typ práce: Diploma thesis
Vedoucí práce: Kliegr, Tomáš
Oponenti práce: Chudán, David
Jazyk práce: Česky
Abstrakt:
This master’s thesis focuses on anomaly detection methods that are based on frequent itemsets.The aim of this thesis is to implement method FPI in Python and test it on chosendata from network traffic. Several steps are needed to fulfill this aim. First part of this thesisfocuses on defining anomalies and introduces network detection systems, that are used inreal world. Then follows overview of machine learning methods and its usability in anomalydetection. Next the anomaly methods based on frequent itemsets are mentioned. Second partfocuses on describing the process of implementation FPI in Python. Then follows benchmarkwith existing implementation of FPI in R, testing of this method on training set. In the lastpart the method is tested on test data including the evaluation of results.
Klíčová slova: anomaly; FPI; frequent patterns; itemset; anomaly detection

Informace o studiu

Studijní program / obor: Aplikovaná informatika/Znalostní a webové technologie
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce: 16. 10. 2018
Datum podání práce: 28. 4. 2019
Datum obhajoby: 3. 6. 2019
Identifikátor v systému InSIS: https://insis.vse.cz/zp/67392/podrobnosti

Soubory ke stažení

    Poslední aktualizace: