Empirické porovnání volně dostupných systémů dobývání znalostí z databází

Název práce: Empirické porovnání volně dostupných systémů dobývání znalostí z databází
Autor(ka) práce: Kasík, Josef
Typ práce: Diplomová práce
Vedoucí práce: Berka, Petr
Oponenti práce: Rauch, Jan
Jazyk práce: Česky
Abstrakt:
Tématem a cílem práce je srovnání volně dostupných systémů k dobývání znalostí z databází. Předmětem srovnání je šest konkrétních aplikací vyvíjených v rámci univerzitních projektů jako experimentální nástroje v oblasti data miningu i jako prostředky pro výukové účely. Kritéria srovnání jsou odvozena ze čtyř obecných pohledů, dle kterých je na jednotlivé systémy nahlíženo. Každý z nich je hodnocen jako nástroj k řešení reálných úloh dobývání, nástroj podporující fáze metodiky CRISP-DM, nástroj schopný praktického nasazení na konkrétních datech a také jako běžný softwarový systém. Z těchto pohledů vyplývá 31 dílčích kritérií srovnání, jejichž ohodnocení bylo stanoveno důkladným rozborem všech systémů. Výsledky komparace potvrdily předpokládanou skutečnost. Nejlépe dopadl program Weka, který vyniká především množstvím dostupných metod strojového učení, bohatými nástroji k předzpracování dat a rychlostí zpracování.
Klíčová slova: kritéria srovnání; porovnání; srovnání; dobývání znalostí; sady k dobývání znalostí; systémy k dobývání znalostí; data mining
Název práce: Empirical comparison of free software suites for knowledge discovery from data
Autor(ka) práce: Kasík, Josef
Typ práce: Diploma thesis
Vedoucí práce: Berka, Petr
Oponenti práce: Rauch, Jan
Jazyk práce: Česky
Abstrakt:
Both topic and main objective of the diploma thesis is a comparison of free data mining suites. Subjects of comparison are six particular applications developed under university projects as experimental tools for data mining and mediums for educational purposes. Criteria of the comparison are derived from four general aspects that form the base for further analyses. Each system is evaluated as a tool for handling real-time data mining tasks, a tool supporting various phases of the CRISP-DM methodology, a tool capable of practical employment on certain data and as a common software system. These aspects bring 31 particular criteria for comparison, evaluation of whose was determined by thorough analysis of each system. The results of comparison confirmed the anticipated assumption. As the best tool the Weka data mining suite was evaluated. The main advantages of Weka are high number of machine learning algorithms, numerous data preparation tools and speed of processing.
Klíčová slova: criteria; software suites; knowledge discovery from data; comparison; data mining

Informace o studiu

Studijní program / obor: Aplikovaná informatika/Znalostní technologie
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce: 11. 2. 2009
Datum podání práce: 11. 5. 2009
Datum obhajoby: 2. 9. 2009
Identifikátor v systému InSIS: https://insis.vse.cz/zp/18718/podrobnosti

Soubory ke stažení

    Poslední aktualizace: