Analýza dat týkajících se risku sebevraždy u mentálně nemocných

Název práce: Analysis of data concerning risk of suicide in mentally ill patients
Autor(ka) práce: Hron, Jiří
Typ práce: Bachelor thesis
Vedoucí práce: Rauch, Jan
Oponenti práce: Malá, Ivana
Jazyk práce: English
Abstrakt:
The three goals of this thesis are to present a coherent overview of the research on suicide in both the general population and among mentally ill, to analyse records of hospitalisations of mentally ill from years 2006 to 2012 while looking for patterns either leading to identification of suicide risk factors or useful for predicting probability of suicide at the time of discharge, and finally to compare a selected subset of statistical, data mining and machine learning methods in relation to their applicability to the second goal. The overview is based on information from over 40 published articles. The analysis and the comparison make use of associative rules mining, visual and stepwise methods for exploration, standard and conditional logistic regression models for inference, and variations of random forests for prediction. To the best of author's knowledge, none of the three goals was previously pursued by any other researcher in the Czech Republic, certainly not using the data set provided for purposes of this thesis. A new modification of random forest combined with a set of logistic regression in order to refine prediction accuracy is also briefly explored. The structure closely follows the above--stated goals starting from the chapters on related work and on the theoretical basis of the methods used, and concluding by the analysis itself and discussion of its results.
Klíčová slova: machine learning; suicide risk; statistical inference
Název práce: Analýza dat týkajících se risku sebevraždy u mentálně nemocných
Autor(ka) práce: Hron, Jiří
Typ práce: Bakalářská práce
Vedoucí práce: Rauch, Jan
Oponenti práce: Malá, Ivana
Jazyk práce: English
Abstrakt:
Cíle této práce jsou poskytnutí uceleného přehledu poznatků o sebevraždách jak mezi obecnou populací, tak specificky mezi mentálně postiženými pacienty, analýza záznamů o hospitalizacích mentálně postižených pacientů mezi lety 2006 a 2008 s důrazem na nalezení potencionálních rizikových faktorů sebevraždy nebo informací vhodných pro predikci pravděpodobnosti sebevraždy v době propuštění z lékařského zařízení, a konečně porovnání vybraných statistických metod v kontrastu k metodám strojového učení a dobývání znalostí z databází ve vztahu k předchozímu úkolu. Přehled je založen na poznatcíh z více jak 40 odborných článků. Analýza a porovnání metod využívá metod pro těžení asociativních pravidel, vizuálních a krokových metod pro exploraci dat, logistické a podmíněné logistické regrese pro analytickou část, a tzv. textit{random forest} modelu pro predikci. Autor si není vědom existence jakékoliv práce na témata stanovená pro tuto tezi vypracované na území České republiky, přičemž tato témata jistě nikdy nebyla zkoumána nad datovým souborem poskytnutým pro účely této teze. Dalším původním přínosem autora je krátký popis a otestování nové verze učícího algoritmu založená na kombinaci textit{random forest} a setu logistických regresních modelů použitých pro zpřesnění odhadů produkovaných prvním z modelů. Struktura sleduje výše uvedené cíle začínaje od kapitol o poznatcích předchozího výzkumu a o teoretických základech použitých metod a konče vlastní analýzou a interpretací výsledků.
Klíčová slova: strojové učení; rizika sebevražd; statistická inference

Informace o studiu

Studijní program / obor: Aplikovaná informatika/Informatika
Typ studijního programu: Bakalářský studijní program
Přidělovaná hodnost: Bc.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce: 9. 12. 2014
Datum podání práce: 31. 5. 2015
Datum obhajoby: 22. 6. 2015
Identifikátor v systému InSIS: https://insis.vse.cz/zp/50545/podrobnosti

Soubory ke stažení

    Poslední aktualizace: