Využití procesu získávání znalostí z databází na data z insolvenčního rejstříku ČR

Název práce: Využití procesu získávání znalostí z databází na data z insolvenčního rejstříku ČR
Autor(ka) práce: Kadlec, Karel
Typ práce: Diplomová práce
Vedoucí práce: Rauch, Jan
Oponenti práce: Chudán, David
Jazyk práce: Česky
Abstrakt:
Tato diplomová práce se zabývá procesem dobývání znalostí z databází na reálných datech z insolvenčního rejstříku České republiky. Počet insolvenčních řízení je jedním z vážných problémů současné společnosti. Vzhledem k tomu, že informace o jejich průběhu jsou detailně zaznamenané v insolvenčním rejstříku, je možné na data uplatnit metody datové analýzy a získat poznatky, které by mohly pomoci v pochopení hlubších souvislostí.Cílem této diplomové práce je v souladu s metodikou CRISP-DM analyzovat oblast insolvenčních řízení z legislativního a procesního pohledu, analyzovat strukturu a význam dat z insolvenčního rejstříku, připravit pomocí transformací a přidáním dodatečných informací z externích zdrojů data pro analýzu a následně aplikovat procedury datové analýzy, které by mohly přinést doposud neidentifikované souvislosti, trendy a příčiny některých problémů. Dílčím cílem je analýza příčin, podmínek a důsledků exponenciálního růstu objemu generovaných dat, možností jejich využití a stejně tak z toho plynoucích rizik. Dalším dílčím cílem je validace použitelnosti metodiky CRISP-DM, která je použita v praktické části, včetně ověření odhadů pracnosti jednotlivých fází na reálné úloze.
Klíčová slova: Insolvenční rejstřík; GUHA metoda; LISp-Miner; CRISP-DM; datová analýza; insolvenční proces; oddlužení; konkurz; Big Data
Název práce: Application of Process of Knowledge Discovery from Databases to Data from the Insolvency Register of the Czech Republic
Autor(ka) práce: Kadlec, Karel
Typ práce: Diploma thesis
Vedoucí práce: Rauch, Jan
Oponenti práce: Chudán, David
Jazyk práce: Česky
Abstrakt:
This diploma thesis deals with the process of Knowledge Discovery and Data Mining applied to the database from the Czech Republic registry of insolvencies. The number of insolvency proceedings is one of the serious problems of contemporary society. Given that information on their progress is recorded in detail in the insolvency register, it is possible to apply data analysis methods to the data and gain knowledge that could help in understanding the deeper context.The aim of this thesis is, in accordance with CRISP-DM methodology, to analyze the area of insolvency proceedings from the legislative and procedural point of view, to analyze the structure and meaning of data from the insolvency register and to use transformations and external sources to prepare data for data analysis procedures that could reveal some new views, connections, trends and causes of some problems.A partial goal is to analyze the causes, conditions and consequences of exponential growth in the volume of generated data, the possibilities of their use, as well as the resulting risks. Another partial goal is to validate the applicability of CRISP-DM methodology, which is used in the practical part, including verification of estimates of labor intensity of individual phases on a real task.
Klíčová slova: GUHA method; LISp-Miner; CRISP-DM; data analysis; insolvency process; debt relief; bankruptcy; Insolvency register; Big Data

Informace o studiu

Studijní program / obor: Aplikovaná informatika/Podniková informatika
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce: 26. 3. 2019
Datum podání práce: 2. 12. 2019
Datum obhajoby: 31. 1. 2020
Identifikátor v systému InSIS: https://insis.vse.cz/zp/69352/podrobnosti

Soubory ke stažení

    Poslední aktualizace: