OLAP Recommender

Název práce: OLAP Recommender: Supporting Navigation in Data Cubes Using Association Rule Mining
Autor(ka) práce: Koukal, Bohuslav
Typ práce: Diploma thesis
Vedoucí práce: Chudán, David
Oponenti práce: Vojíř, Stanislav
Jazyk práce: English
Abstrakt:
Manual data exploration in data cubes and searching for potentially interesting and useful information starts to be time-consuming and ineffective from certain volume of the data. In my thesis, I designed, implemented and tested a system, automating the data cube exploration and offering potentially interesting views on OLAP data to the end user. The system is based on integration of two data analytics methods - OLAP analysis data visualisation and data mining, represented by GUHA association rules mining. Another contribution of my work is a research of possibilities how to solve differences between OLAP analysis and association rule mining. Implemented solutions of the differences include data discretization, dimensions commensurability, design of automatic data mining task algorithm based on the data structure and mapping definition between mined association rules and corresponding OLAP visualisation. The system was tested with real retail sales data and with EU structural funds data. The experiments proved that complementary usage of the association rule mining together with OLAP analysis identifies relationships in the data with higher success rate than the isolated use of both techniques.
Klíčová slova: OLAP visualisation; OLAP navigation; OLAP analysis; association rules; data mining; mining aggregate data; recommender system; data cube; GUHA; OLAP Recommender
Název práce: OLAP Recommender
Autor(ka) práce: Koukal, Bohuslav
Typ práce: Diplomová práce
Vedoucí práce: Chudán, David
Oponenti práce: Vojíř, Stanislav
Jazyk práce: English
Abstrakt:
Manuální prozkoumávání agregovaných dat v datových kostkách a vyhledávání potenciálně užitečných informací je od určitého objemu dat časově náročné a neefektivní. V této práci jsem navrhnul, implementoval a na reálných datech otestoval systém, který prohledávání datové kostky automatizuje a nabízí uživateli potenciálně zajímavé pohledy na OLAP kostku. Systém je založen na propojení dvou metod datové analýzy - vizualizaci dat v OLAP analýze a dobývání znalostí z dat, reprezentovaném GUHA asociačními pravidly. Dalším přínosem práce je výzkum možností řešení rozdílů mezi OLAP analýzou a dolováním asociačních pravidel. Mezi implementačně řešené rozdíly patří především diskretizace dat, problém souměřitelnosti dimenzí, návrh automatického nastavení algoritmu pro dolování na základě struktury dat a definice provázání asociačních pravidel s OLAP vizualizací. Nástroj byl testován s reálnými maloobchodními prodejními daty a s daty o strukturálních fondech EU. Testování prokázalo, že propojení metod dolování asociačních pravidel a OLAP analýzy dokáže identifikovat zajímavé vztahy v datech s vyšší úspěšností než použití těchto metod samostatně.
Klíčová slova: OLAP vizualizace; navigace v OLAP; OLAP analýza; asociační pravidla; datová kostka; doporučovací systém; OLAP Recommender; GUHA; vytěžování dat

Informace o studiu

Studijní program / obor: Aplikovaná informatika/Znalostní a webové technologie
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce: 14. 11. 2016
Datum podání práce: 26. 4. 2017
Datum obhajoby: 7. 6. 2017
Identifikátor v systému InSIS: https://insis.vse.cz/zp/59645/podrobnosti

Soubory ke stažení

    Poslední aktualizace: