Shluková analýza jako nástroj klasifikace objektů

Název práce: Shluková analýza jako nástroj klasifikace objektů
Autor(ka) práce: Vanišová, Adéla
Typ práce: Diplomová práce
Vedoucí práce: Löster, Tomáš
Oponenti práce: Bílková, Diana
Jazyk práce: Česky
Abstrakt:
Cílem této diplomové práce je prověření schopnosti vybraných metod shlukové analýzy správně segmentovat datový soubor složený pouze z kvantitativních proměnných. Základním kritériem pro datové soubory je předpoklad, že musí být znám počet tříd a příslušnost jednotlivých objektů do těchto tříd. Na základě znalosti o počtu tříd byla provedena shluková analýza. Přiřazení objektů k jednotlivým shlukům bylo následně porovnáno se skutečnou příslušností objektů do původních tříd. Výstupem je relativní úspěšnost vybraných metod na zkoumaných datech. Metody shlukové analýzy samy o sobě nejsou schopné určit, jaký má být optimální počet shluků, proto byly v druhém kroku pro každý zkoumaný datový soubor určeny hodnoty vybraných kritérií odhadujících optimální počet shluků. Na základě tohoto výstupu byla zkoumána schopnost vybraných kritérií správně rozpoznat původní počet tříd. Hlavním přínosem této diplomové práce je validace schopnosti vybraných metod shlukové analýzy identifikovat podobnost objektů a ověření schopnosti vybraných kritérií odhadnout počet shluků, který odpovídá skutečnému rozdělení souboru. Zároveň tato práce nabízí strukturovaný přehled základních metod shlukové analýzy a ukazatelů pro odhad optimálního počtu shluků.
Klíčová slova: shluková analýza; metody shlukování; optimální počet shluků
Název práce: Cluster analysis as a tool for object classification
Autor(ka) práce: Vanišová, Adéla
Typ práce: Diploma thesis
Vedoucí práce: Löster, Tomáš
Oponenti práce: Bílková, Diana
Jazyk práce: Česky
Abstrakt:
The aim of this thesis is to examine the cluster analysis ability segment the data set by selected methods. The data sets are consisting of quantitative variables. The basic criterion for the data sets is that the number of classes has to be known and the next criterion is that the membership of all object to each class has to be known too. Execution of the cluster analysis was based on knowledge about the number of classes. Classified objects to individual clusters were compared with its original classes. The output was the relative success of classification by selected methods. Cluster analysis methods are not able to determine an optimal number of clusters. Estimates of the optimal number of clusters were the second step in analysis for each data set. The ability of selected criteria identify the original number of classes was analyzed by comparing numbers of original classes and numbers of optimal clusters. The main contribution of this thesis is the validation of the ability of selected cluster analysis methods to identify similar objects and verify the ability of selected criteria to estimate the number of clusters corresponding to the real file distribution. Moreover, this work provides a structured overview of the basic cluster analysis methods and indicators for estimating the optimal number of clusters.
Klíčová slova: methods for cluster analysis; cluster analysis; optimal number of clusters

Informace o studiu

Studijní program / obor: Kvantitativní metody v ekonomice/Statisticko-pojistné inženýrství
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra statistiky a pravděpodobnosti

Informace o odevzdání a obhajobě

Datum zadání práce: 12. 1. 2012
Datum podání práce: 10. 5. 2012
Datum obhajoby: 14. 6. 2012
Identifikátor v systému InSIS: https://insis.vse.cz/zp/36820/podrobnosti

Soubory ke stažení

    Poslední aktualizace: