Data mining v medicínských datech
Název práce: | Data Mining in Medical Data |
---|---|
Autor(ka) práce: | Kalecký, Karel |
Typ práce: | Bachelor thesis |
Vedoucí práce: | Rauch, Jan |
Oponenti práce: | Berka, Petr |
Jazyk práce: | English |
Abstrakt: | In this thesis, medical data have been cleaned, arranged, and analyzed to provide results, which could be further consulted with medical specialists and possibly reflected in medical practice. Specifically, two analytical tasks have been designed. The first one is focused on predicting diseases and revealing disease determinants. The second task is aimed at differences in blood pressure levels of hypertensive patients in dependence on their prescribed medications. The analyzed data have been collected under the aegis of the Research Center EuroMISE -- Cardio within the project of ADAMEK. An overview of eight popular data-mining techniques has been formed. The tasks have been solved using two of those techniques (logistic regression and neural networks; in the first task only) in combination with statistical methods (hypothesis testing). For these purposes, analytical tools by Microsoft (Microsoft SQL Server Analysis Services and Microsoft Office Excel) have been explored and employed. Possible applications of results include improvements in targeting health care and enhancements in systems for early diagnosis, which might result in reducing expenditures and providing patients with a better quality of life. |
Klíčová slova: | antihypertensives; Microsoft SQL Server Analysis Services; disease determinants; project of ADAMEK; data-mining techniques; knowledge discovery in databases |
Název práce: | Data mining v medicínských datech |
---|---|
Autor(ka) práce: | Kalecký, Karel |
Typ práce: | Bakalářská práce |
Vedoucí práce: | Rauch, Jan |
Oponenti práce: | Berka, Petr |
Jazyk práce: | English |
Abstrakt: | Cílem této práce je praktické zpracování (vyčistění, připravení a analyzování) medicínských dat tak, aby výsledky mohly být následně konzultovány s lékařskými odborníky a případně využity v lékařské praxi. Konkrétně jsou sestaveny dvě analytické úlohy. První se zaměřuje na predikci chorob a odhalení rizikových faktorů. V druhé jsou porovnávány rozdíly krevního tlaku mezi hypertonickými pacienty v závislosti na předepsaných lécích. Zpracovávaná data byla shromážděna v rámci projektu ADAMEK pod záštitou výzkumného centra EuroMISE -- Kardio. Součástí práce je přiblížení osmi známých technik pro dolování v datech. Při řešení úloh jsou využity dvě z těchto technik (logistická regrese a neurální sítě; pouze v první úloze) v kombinaci se statistickými metodami (testování hypotéz). Pro tyto účely byly prozkoumány a nasazeny analytické nástroje od společnosti Microsoft (Microsoft SQL Server Analysis Services a Microsoft Office Excel). Prezentované výsledky by mohly být uplatněny pro efektivnější cílení lékařské péče a vylepšení systémů včasné diagnózy, což by následně mohlo vést k poklesu nákladů na zdravotnickou péči či zajištění kvalitnější péče o pacienty. |
Klíčová slova: | antihypertenzíva; rizikové faktory chorob; Microsoft SQL Server Analysis Services; dobývání znalostí z databází; projekt ADAMEK; techniky dolování v datech |
Informace o studiu
Studijní program / obor: | Aplikovaná informatika/Informatika |
---|---|
Typ studijního programu: | Bakalářský studijní program |
Přidělovaná hodnost: | Bc. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra informačního a znalostního inženýrství |
Informace o odevzdání a obhajobě
Datum zadání práce: | 26. 6. 2012 |
---|---|
Datum podání práce: | 14. 5. 2013 |
Datum obhajoby: | 20. 6. 2013 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/38219/podrobnosti |