Metody modelování pravděpodobnosti defaultu firemních zákazníků banky

Název práce: Metody modelování pravděpodobnosti defaultu firemních zákazníků banky
Autor(ka) práce: Oleynik, Mariya
Typ práce: Diplomová práce
Vedoucí práce: Formánek, Tomáš
Oponenti práce: Holý, Vladimír
Jazyk práce: Česky
Abstrakt:
Cílem diplomové práce je predikce pravděpodobnosti defaultu pomocí čtyř modelů a porovnání predikční schopnosti modelů. Použité modely pro predikci binární závislé proměnné jsou logistická regrese, zobecněný aditivní model, metoda podpůrných vektorů a rozhodovací strom. Aplikace modelů probíhá na reálných datech firemních klientů jedné české banky. K porovnání modelů se používají ROC, AUC a matice záměn. Nejlepším modelem na základě AUC se jeví metoda podpůrných vektorů, i když model vykazuje nejnižší hodnotu celkové správnosti v porovnání s ostatními modely. Zobecněný aditivní model má druhou největší hodnotu AUC a hodnotu celkové správnosti, jež jsou jenom o pár bodů vyšší než hodnoty odpovídající logistické regresi. Nejnižší AUC vychází u rozhodovacího stromu, který má zato nejvyšší hodnotu celkové správnosti, jelikož model správně zařadil největší počet klientů do jednotlivých tříd.
Klíčová slova: Pravděpodobnost defaultu; logistická regrese; zobecněný aditivní model; metoda podpůrných vektorů; rozhodovací strom
Název práce: Methods for modeling the probability of default of the bank's corporate clients
Autor(ka) práce: Oleynik, Mariya
Typ práce: Diploma thesis
Vedoucí práce: Formánek, Tomáš
Oponenti práce: Holý, Vladimír
Jazyk práce: Česky
Abstrakt:
The aim of the thesis is the prediction of the probability of default using four models and comparison of predictive accuracy of models. The models used for the prediction of binary dependent variable are logistic regression, generalized additive model, support vector machine and decision tree. The models are applied on real data of corporate clients of a Czech bank. ROC, AUC and confusion matrix are used to compare models. The support vector machine seems to be the best model based on AUC, although the model shows the lowest value of overall accuracy compared to other models. The generalized additive model has the second largest value of AUC and the value of overall accuracy, which are only a few points higher than the corresponding values of logistic regression. Decision tree has the lowest AUC, but also the model has the highest value of overall accuracy, because the model correctly classified the largest number of clients into classes.
Klíčová slova: Probability of default; logistic regression; generalized additive model; support vector machine; decision tree

Informace o studiu

Studijní program / obor: Kvantitativní metody v ekonomice/Ekonometrie a operační výzkum
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra ekonometrie

Informace o odevzdání a obhajobě

Datum zadání práce: 21. 6. 2019
Datum podání práce: 24. 6. 2020
Datum obhajoby: 27. 8. 2020
Identifikátor v systému InSIS: https://insis.vse.cz/zp/70084/podrobnosti

Soubory ke stažení

    Poslední aktualizace: