Shlukování dat pomocí procedury MCluster-Miner systému LISp-Miner

Název práce: Shlukování dat pomocí procedury MCluster-Miner systému LISp-Miner
Autor(ka) práce: Pelc, Tomáš
Typ práce: Bakalářská práce
Vedoucí práce: Šimůnek, Milan
Oponenti práce: Šulc, Zdeněk
Jazyk práce: Česky
Abstrakt:
Bakalářská práce se zabývá shlukováním dat pomocí procedury MCluster-Miner systému LISp-Miner. Prvním cílem práce je shluková analýza dat pomocí zmíněné procedury a posouzení možností jejího využití na různých datových sadách. Pro dosažení tohoto cíle práce je prakticky aplikována daná procedura na šesti datových sadách. Druhým cílem práce je rozebrat možnosti implementovaných algoritmů, měr podobnosti a navrhnout doporučení pro volbu parametrů úlohy shlukování. K splnění tohoto cíle jsou dostupné algoritmy a míry podobnosti porovnány podle dosažených výsledků (kvalita rozdělení objektů do shluků, čas úlohy, počet atributů použi-tých pro shlukování). Následně jsou z těchto porovnání odvozena doporučení pro volbu parame-trů úlohy shlukování. Přínosem práce jsou tyto doporučení, porovnání dostupných algoritmů a měr podobnosti, shrnutí aktuálního stavu (ke květnu 2017) modulu MCluster-Miner a ukázání možnosti zobrazení výsledků shlukovací úlohy na interaktivní analýze geografických dat. V teo-retické části práce je popsán systém LISp-Miner, základní principy shlukování, způsoby shluková-ní a míry podobnosti, které využívá GUHA-procedura MCluster-Miner, a modul MCluster-Miner. V praktické části je aplikována procedura MCluster-Miner na šesti různých datových sadách a jsou zde shrnuty dosažené výsledky.
Klíčová slova: MCluster-Miner; metody shlukování; míry podobnosti; LISp-Miner; shluková analýza
Název práce: Clustering objects with the MCluster-Miner procedure of the LISp-Miner system
Autor(ka) práce: Pelc, Tomáš
Typ práce: Bachelor thesis
Vedoucí práce: Šimůnek, Milan
Oponenti práce: Šulc, Zdeněk
Jazyk práce: Česky
Abstrakt:
This bachelor thesis deals with clustering objects with the MCluster-Miner procedure of the LISp-Miner system. The first aim of this bachelor thesis is clustering objects with the mentioned pro-cedure and analyzing its possible usage on different datasets. To achieve this goal, the procedure was applied on six different datasets. The secong aim of this thesis is to analyze and compare implemented algorithms, similarity measures and to propose recommendations for clustering parameters. To achieve this goal, the available algorithms and similarity measures are compared based on achieved results (the quality of distribution objects into clusters, the time of clustering task, the number of attributes used for clustering). Based on these comparisons, the recommen-dations for clustering parameters are proposed. The benefits of this thesis are these recommenda-tions, comparisons of available algorithms and similarity measures, summary of actual state (da-ted to May 2017) of the MCluster-Miner module and showing the possibility of displaying results of clustering task at the interactive analysis of geodata. The theoretical part comprises the description of the LISp-Miner system, basic clustering principles, clustering methods and similari-ty measures used by the GUHA-procedure MCluster-Miner, and the MCluster-Miner module. In the practical part the MCluster-Miner procedure is being applied on six different datasets and the achieved results are summarized there.
Klíčová slova: similarity measures; MCluster-Miner; LISp-Miner; clustering methods; clustering

Informace o studiu

Studijní program / obor: Aplikovaná informatika/Aplikovaná informatika
Typ studijního programu: Bakalářský studijní program
Přidělovaná hodnost: Bc.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce: 29. 10. 2016
Datum podání práce: 1. 5. 2017
Datum obhajoby: 19. 6. 2017
Identifikátor v systému InSIS: https://insis.vse.cz/zp/59469/podrobnosti

Soubory ke stažení

    Poslední aktualizace: