Analýza reálných dat spotřebitelských úvěrů pomocí systému LISp-Miner

Název práce: Analýza reálných dat spotřebitelských úvěrů pomocí systému LISp-Miner
Autor(ka) práce: Rytych, Maxim
Typ práce: Bakalářská práce
Vedoucí práce: Šimůnek, Milan
Oponenti práce: Chudán, David
Jazyk práce: Česky
Abstrakt:
Cílem této práce je nalézt v reálných datech spotřebitelských úvěrů zajímavé souvislosti, které by mohly být využity v praxi. Analýza dat je prováděna pomocí systému LISp-Miner, což je software určený pro dobývání znalostí z databází založený na metodě GUHA. Při analýze dat budou používány konkrétně procedury 4ft-Miner a SD4ft-Miner popsané dále. Použitá metodika je CRISP-DM. Přínos práce spočívá především v nalezení v datech neznámých nebo potvrzení známých souvislostí, které by mohly být prakticky využity. Dalšími přínosy jsou představení možností DZD a systému LISp-Miner. Práce je rozdělena na část teoretickou a praktickou. Ve třech kapitolách věnovaných teorii nejprve vysvětluji, co je dobývání znalostí z databází, kdy se objevuje, čím je zajímavé a jeho techniky s důrazem na použitá asociační pravidla. Poté popisuji stručně systém LISp-Miner a na umělých datech použité procedury. V poslední kapitole věnované teorii seznamuji čtenáře s metodikami používanými při dobývání znalostí z databází s důrazem na metodiku CRISP-DM, kterou jsem se rozhodl použít. Praktická část odpovídá jednotlivým krokům metodiky CRISP-DM, tj. porozumění problematice, porozumění datům, příprava dat, modelování, vyhodnocení a využití výsledků. Poslední dvě fáze jsem se rozhodl z důvodu přehlednosti spojit do jedné.
Klíčová slova: procedura SD4ft-Miner; procedura 4ft-Miner; CRISP-DM; LISp-Miner; asociační pravidla; dobývání znalostí z databází
Název práce: Analysis of real consumer loans data by LISp-Miner system
Autor(ka) práce: Rytych, Maxim
Typ práce: Bachelor thesis
Vedoucí práce: Šimůnek, Milan
Oponenti práce: Chudán, David
Jazyk práce: Česky
Abstrakt:
The goal of this paper is to find interesting relations in real consumer loans data, which could be used practically. The analysis is done using LISp-Miner system which is a software designed for data discovery in databases based on the GUHA method. The analysis will use specifically 4ft-Miner and SD4ft-Miner procedures described below. The methodology used is CRISP-DM. The contribution of my work lies in finding unknown or confirming known relations in the field of consumer loans, which could be used practically. Further contribution lies in presentation of possibilities of data discovery in databases and the non-commercial LISp-Miner system. The bachelor thesis consists of a theoretical and a practical part. In the three chapters assigned for the theoretical part I explain at first, what is data discovery in databases, when it appears, why is it interesting and its techniques with an emphasis on the association rules used in this paper. Afterwards I briefly describe the LISp-Miner system and demonstrate the procedures used on artificial data. In the last theoretical chapter I introduce methodologies of data discovery in databases with an accent on CRISP-DM, which is the one used here. The practical part corresponds with the individual steps of the CRISP-DM metodology, i.e. business understanding, data understanding, data preparation, modeling, evaluation and deployment. Because of clarity I decided to join last two steps into one.
Klíčová slova: SD4ft-Miner procedure; 4ft-Miner procedure; CRISP-DM; data discovery in databases; LISp-Miner; association rules

Informace o studiu

Studijní program / obor: Aplikovaná informatika/Informatika
Typ studijního programu: Bakalářský studijní program
Přidělovaná hodnost: Bc.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce: 30. 10. 2012
Datum podání práce: 10. 5. 2013
Datum obhajoby: 20. 6. 2013
Identifikátor v systému InSIS: https://insis.vse.cz/zp/40091/podrobnosti

Soubory ke stažení

    Poslední aktualizace: