Fuzzy GUHA

Název práce: Fuzzy GUHA
Autor(ka) práce: Ralbovský, Martin
Typ práce: Dissertation thesis
Vedoucí práce: Rauch, Jan
Oponenti práce: Svátek, Vojtěch; Holeňa, Martin ; Vojtáš, Peter
Jazyk práce: English
Abstrakt:
The GUHA method is one of the oldest methods of exploratory data analysis, which is regarded as part of the data mining or knowledge discovery in databases (KDD) scienti_c area. Unlike many other methods of data mining, the GUHA method has firm theoretical foundations in logic and statistics. In scope of the method, finding interesting knowledge corresponds to finding special formulas in satisfactory rich logical calculus, which is called observational calculus. The main topic of the thesis is application of the "fuzzy paradigm" to the GUHA method By the term "fuzzy paradigm" we mean approaches that use many-valued membership degrees or truth values, namely fuzzy set theory and fuzzy logic. The thesis does not aim to cover all the aspects of this application, it emphasises mainly on: - Association rules as the most prevalent type of formulas mined by the GUHA method - Usage of fuzzy data - Logical aspects of fuzzy association rules mining - Comparison of the GUHA theory to the mainstream fuzzy association rules - Implementation of the theory using the bit string approach The thesis throughoutly elaborates the theory of fuzzy association rules, both using the theoretical apparatus of fuzzy set theory and fuzzy logic. Fuzzy set theory is used mainly to compare the GUHA method to existing mainstream approaches to formalize fuzzy association rules, which were studied in detail. Fuzzy logic is used to define novel class of logical calculi called logical calculi of fuzzy association rules (LCFAR) for logical representation of fuzzy association rules. The problem of existence of deduction rules in LCFAR is dealt in depth. Suitable part of the proposed theory is implemented in the Ferda system using the bit string approach. In the approach, characteristics of examined objects are represented as strings of bits, which in the crisp case enables efficient computation. In order to maintain this feature also in the fuzzy case, a profound low level testing of data structures and algoritms for fuzzy bit strings have been carried out as a part of the thesis.
Klíčová slova: fuzzy set theory; association rules; GUHA method; fuzzy logic
Název práce: Fuzzy GUHA
Autor(ka) práce: Ralbovský, Martin
Typ práce: Disertační práce
Vedoucí práce: Rauch, Jan
Oponenti práce: Svátek, Vojtěch; Holeňa, Martin ; Vojtáš, Peter
Jazyk práce: English
Abstrakt:
Metoda GUHA je jednou z nejstarších metod explorační analýzy dat, která je považována za součást vědního oboru dobývání znalostí z databází. Na rozdíl od jiných metod tohoto oboru, metoda GUHA staví na pevných teoretických základech logiky a statistiky. Metoda vnímá nalezení zajímavé znalosti jako nalezení určité formule v dostatečně bohatém logickém kalkulu, kterému se říká observační kalkul. Hlavním tématem dizertační práce je aplikace "fuzzy paradigmatu" na metodu GUHA. Pod pojmem "fuzzy paradigma" myslíme přístupy, které používají vícehodnotové stupně náležení, nebo pravdivostní hodnoty, jmenovitě fuzzy teorii množin a fuzzy logiku. Práce se nesnaží pokrýt všechny aspekty této aplikace, soustředí se na: - asociační pravidla, která jsou nejpoužívanější typy formulí v metodě GUHA - použití fuzzy dat - logické aspekty dobývání fuzzy asociačních pravidel - porovnání GUHA teorie s výzkumem fuzzy asociačních pravidel hlavního proudu - implementaci teorie s použitím bitových řetízků Práce zevrubně rozpracovává teorii fuzzy asociačních pravidel a používá přitom teoretický aparát fuzzy teorie množin i fuzzy logiky. Fuzzy teorie množin slouží zejména k porovnání metody GUHA s existujícími pokusy o formalizaci fuzzy asociačních pravidel založených na algoritmu apriori. Fuzzy logika je použita k definici nové třídy logických kalkulů nazvaných logické kalkuly fuzzy asociačních pravidel (LCFAR). Práce se detailně zabývá problémem existence dedukčních pravidel v LCFAR. Vhodná část navržené teorie je implementována v systému Ferda za pomoci bitových řetízků, což znamená reprezentace charakteristik zkoumaných objektů jako řetezce bitů. Tento přístup lze v crisp případě efektivně implementovat. Pro zachování jeho výhod ve fuzzy případě bylo provedeno hloubkové testování datových struktur a algoritmů pro reprezentaci fuzzy bitových řetízků.
Klíčová slova: fuzzy teorie množin; asociační pravidla; fuzzy logika; metoda GUHA

Informace o studiu

Studijní program / obor: Aplikovaná informatika/Informatika
Typ studijního programu: Doktorský studijní program
Přidělovaná hodnost: Ph.D.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce: 27. 9. 2006
Datum podání práce: 30. 9. 2011
Datum obhajoby: 19. 11. 2009
Identifikátor v systému InSIS: https://insis.vse.cz/zp/14956/podrobnosti

Soubory ke stažení

    Poslední aktualizace: