Modely pravděpodobností odchodu klientů finančních institucí

Název práce: Models of Churn Probabilities of Clients of Financial Institutions
Autor(ka) práce: Houšková, Helena
Typ práce: Diploma thesis
Vedoucí práce: Černý, Michal
Oponenti práce: Formánek, Tomáš
Jazyk práce: English
Abstrakt:
The aim of this thesis is to create models that will predict the probability of client churn during mortgage refixation from a year to six months in advance using three different methods. Separate models are made for the clients who applied for the loan directly in the bank and for those that applied through a broker. The reason is different churn rate in these two groups as well as possibility tu use additional variables for the second group of clients. The used methods are logistic regression, regression tree and random forest. Models are compared with each other as well as with the model that is currently used in the bank. To compare the models the Gini coefficient and the confusion matrix are used. For both groups of clients, the best model is the random forest, which has the highest Gini coefficient on the test sample.
Klíčová slova: client churn probability; regression tree; logistic regression; random forest
Název práce: Modely pravděpodobností odchodu klientů finančních institucí
Autor(ka) práce: Houšková, Helena
Typ práce: Diplomová práce
Vedoucí práce: Černý, Michal
Oponenti práce: Formánek, Tomáš
Jazyk práce: English
Abstrakt:
Cílem této práce je za pomoci tří různých metod vytvořit modely, které budou v předstihu rok až šest měsíců predikovat pravděpodobnost odchodu klienta ke konkurenci v čase refixace hypotéky. Modely jsou vytvořeny zvlášť pro klienty, kteří si hypotéku vyřídili přímo v dané bance, a zvlášť pro klienty, kteří si hypotéku sjednali přes brokera. Důvodem je rozdílná odchodovost v těchto dvou skupinách a možnost využití více proměnných u druhé skupiny klientů. Použité metody jsou logistická regrese, regresní strom a náhodný les. Modely jsou porovnány mezi sebou a také s modelem, který banka používá v současnosti. K porovnání modelů je použit Gini koeficient a matice záměn. Pro obě skupiny klientů je nejlepším modelem náhodný les, který dosahuje nejvyšších hodnot Giniho koeficientu na testovacím vzorku.
Klíčová slova: pravděpodobnost odchodu klienta; logistická regrese; regresní strom; náhodný les

Informace o studiu

Studijní program / obor: Kvantitativní metody v ekonomice/Ekonometrie a operační výzkum
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra ekonometrie

Informace o odevzdání a obhajobě

Datum zadání práce: 10. 12. 2018
Datum podání práce: 26. 6. 2019
Datum obhajoby: 9. 9. 2019
Identifikátor v systému InSIS: https://insis.vse.cz/zp/68019/podrobnosti

Soubory ke stažení

Hlavní práce
Neveřejný soubor
Stáhnout
    Poslední aktualizace: