Empirické porovnání komerčních systémů dobývání znalostí z databází

Název práce: Empirické porovnání komerčních systémů dobývání znalostí z databází
Autor(ka) práce: Faruzel, Petr
Typ práce: Diplomová práce
Vedoucí práce: Berka, Petr
Oponenti práce: Máša, Petr
Jazyk práce: Česky
Abstrakt:
Předkládaná práce "Empirické porovnání komerčních systémů dobývání znalostí z databází" se zabývá systémy dobývání znalostí z databází od předních světových dodavatelů statistického softwaru. Cílem této práce je porovnat komerční systémy IBM SPSS Modeler a SAS Enterprise Miner na základě jejich specifikace a funkčnosti vzhledem k vybrané množině srovnávacích kritérií. Zvoleného cíle chci dosáhnout jednak rozborem vybraných vlastností analyzovaných systémů, jednak jejich aplikací na reálných datech. Základem srovnání je 29 dílčích kritérií odrážejících základní požadavky uživatele na funkcionalitu, použitelnost a otevřenost systému. Stěžejní částí celého srovnávacího procesu je praktické nasazení těchto systémů na datech o meningoencefalitidě. Jeho výsledkem je zhodnocení výkonnosti zkoumaných systémů při analýze malého a velkého objemu dat. Kvalita generovaných výstupů a doba jejich odvození jsou stanoveny na základě aplikace šesti srovnatelných klasifikačních metod dobývání znalostí z databází. Ukázalo se, že systému IBM SPSS Modeler vyhovuje spíše menší objem dat. Nepatrně nižší přesnost klasifikace nalezených datových modelů je zastíněna podstatně vyšší rychlostí jejich odvození. S růstem objemu analyzovaných dat se však situace mění ve prospěch konkurenčního systému. Při analýze velkých dat dosahuje výrazně lepších výsledků systém SAS Enterprise Miner. Podstatně vyšší přesnost klasifikace nalezených modelů je umocněna mírně kratší dobou jejich odvození. Zatímco funkcionalitu analyzovaných systémů lze označit za srovnatelnou, ze srovnání jejich použitelnosti vyšel jako jasný vítěz systém IBM SPSS Modeler. Zhodnocení otevřenosti těchto systémů staví do role mírného favorita systém SAS Enterprise Miner.
Klíčová slova: SAS Enterprise Miner; Data mining; IBM SPSS Modeler
Název práce: An Empirical Comparison of Commercial Data Mining Tools
Autor(ka) práce: Faruzel, Petr
Typ práce: Diploma thesis
Vedoucí práce: Berka, Petr
Oponenti práce: Máša, Petr
Jazyk práce: Česky
Abstrakt:
The presented work "An Empirical Comparison of Commercial Data Mining Tools" deals with data mining tools from world's leading software providers of statistical solutions. The aim of this work is to compare commercial packages IBM SPSS Modeler and SAS Enterprise Miner in terms of their specification and utility considering a chosen set of evaluation criteria. I would like to achieve the appointed goal by a detailed analysis of selected features of the surveyed software packages as well as by their application on real data. The comparison is founded on 29 component criteria which reflect user's requirements regarding functionality, usability and flexibility of the system. The pivotal part of the comparative process is based on an application of the surveyed data mining tools on data concerning meningoencephalitis. Results predestinate evaluation of their performance while analyzing small and large data. Quality of developed data models and duration of their derivation are stated in reference to the use of six comparable data mining techniques for classification. Small data more likely comply with IBM SPSS Modeler. Although it produces slightly less accurate models, their development times are much shorter. Increasing the amount of data changes the situation in favor of competition. SAS Enterprise Miner manages better results while analyzing large data. Considerably more accurate models are accompanied by slightly shorter times of their development. Functionality of the surveyed data mining tools is comparable, whereas their usability and flexibility differentiate. IBM SPSS Modeler offers apparently better usability and learnability. Users of SAS Enterprise Miner have a slightly more flexible data mining tool at hand.
Klíčová slova: SAS Enterprise Miner; IBM SPSS Modeler; Data mining

Informace o studiu

Studijní program / obor: Aplikovaná informatika/Znalostní technologie
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce: 2. 11. 2009
Datum podání práce: 4. 5. 2010
Datum obhajoby: 10. 2. 2011
Identifikátor v systému InSIS: https://insis.vse.cz/zp/22609/podrobnosti

Soubory ke stažení

    Poslední aktualizace: