Data mining v medicínských datech

Název práce: Data Mining in Medical Data
Autor(ka) práce: Kalecký, Karel
Typ práce: Bachelor thesis
Vedoucí práce: Rauch, Jan
Oponenti práce: Berka, Petr
Jazyk práce: English
Abstrakt:
In this thesis, medical data have been cleaned, arranged, and analyzed to provide results, which could be further consulted with medical specialists and possibly reflected in medical practice. Specifically, two analytical tasks have been designed. The first one is focused on predicting diseases and revealing disease determinants. The second task is aimed at differences in blood pressure levels of hypertensive patients in dependence on their prescribed medications. The analyzed data have been collected under the aegis of the Research Center EuroMISE -- Cardio within the project of ADAMEK. An overview of eight popular data-mining techniques has been formed. The tasks have been solved using two of those techniques (logistic regression and neural networks; in the first task only) in combination with statistical methods (hypothesis testing). For these purposes, analytical tools by Microsoft (Microsoft SQL Server Analysis Services and Microsoft Office Excel) have been explored and employed. Possible applications of results include improvements in targeting health care and enhancements in systems for early diagnosis, which might result in reducing expenditures and providing patients with a better quality of life.
Klíčová slova: antihypertensives; Microsoft SQL Server Analysis Services; disease determinants; project of ADAMEK; data-mining techniques; knowledge discovery in databases
Název práce: Data mining v medicínských datech
Autor(ka) práce: Kalecký, Karel
Typ práce: Bakalářská práce
Vedoucí práce: Rauch, Jan
Oponenti práce: Berka, Petr
Jazyk práce: English
Abstrakt:
Cílem této práce je praktické zpracování (vyčistění, připravení a analyzování) medicínských dat tak, aby výsledky mohly být následně konzultovány s lékařskými odborníky a případně využity v lékařské praxi. Konkrétně jsou sestaveny dvě analytické úlohy. První se zaměřuje na predikci chorob a odhalení rizikových faktorů. V druhé jsou porovnávány rozdíly krevního tlaku mezi hypertonickými pacienty v závislosti na předepsaných lécích. Zpracovávaná data byla shromážděna v rámci projektu ADAMEK pod záštitou výzkumného centra EuroMISE -- Kardio. Součástí práce je přiblížení osmi známých technik pro dolování v datech. Při řešení úloh jsou využity dvě z těchto technik (logistická regrese a neurální sítě; pouze v první úloze) v kombinaci se statistickými metodami (testování hypotéz). Pro tyto účely byly prozkoumány a nasazeny analytické nástroje od společnosti Microsoft (Microsoft SQL Server Analysis Services a Microsoft Office Excel). Prezentované výsledky by mohly být uplatněny pro efektivnější cílení lékařské péče a vylepšení systémů včasné diagnózy, což by následně mohlo vést k poklesu nákladů na zdravotnickou péči či zajištění kvalitnější péče o pacienty.
Klíčová slova: antihypertenzíva; rizikové faktory chorob; Microsoft SQL Server Analysis Services; dobývání znalostí z databází; projekt ADAMEK; techniky dolování v datech

Informace o studiu

Studijní program / obor: Aplikovaná informatika/Informatika
Typ studijního programu: Bakalářský studijní program
Přidělovaná hodnost: Bc.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce: 26. 6. 2012
Datum podání práce: 14. 5. 2013
Datum obhajoby: 20. 6. 2013
Identifikátor v systému InSIS: https://insis.vse.cz/zp/38219/podrobnosti

Soubory ke stažení

    Poslední aktualizace: