Doménové znalosti, analytické otázky, systém LISp-Miner a data ADAMEK

Název práce: Doménové znalosti, analytické otázky, systém LISp-Miner a data ADAMEK
Autor(ka) práce: Kubín, Richard
Typ práce: Diplomová práce
Vedoucí práce: Rauch, Jan
Oponenti práce: Šimůnek, Milan
Jazyk práce: Česky
Abstrakt:
Tématem práce jsou kroky spojené s řešením analytické otázky pomocí systému LISp-Miner v medicínských datech Adámek. Kromě popisu postupu při aplikaci procedur 4ft-Miner a SD4ft-Miner na data Adámek, si práce klade za cíl všímat si možnosti budoucího zakomponování práce s formalizovanou doménovou znalostí, a připravit postup pro automatizaci prováděných kroků. Obsahem teoretické části je shrnutí základních pojmů a principů spojených s asociačními pravidly a metodou GUHA. Praktická část postupuje podle metodologie CRISP-DM. Výsledkem práce je postup, podle kterého je možné hledat zajímavá pravidla v jiných datech. Postup je dále aplikován na lékařská data STULONG pro získání podnětů pro jeho revizi. Použitá data se týkají kardiologických pacientů a pocházejí z EuroMISE.
Klíčová slova: data mining; CRISP-DM; GUHA; analytická otázka; 4ft-Miner; SD4ft-Miner; ADAMEK; automatizace; doménové znalosti
Název práce: Knowledge base, analytical questions, LISp-Mner system and ADAMEK data
Autor(ka) práce: Kubín, Richard
Typ práce: Diploma thesis
Vedoucí práce: Rauch, Jan
Oponenti práce: Šimůnek, Milan
Jazyk práce: Česky
Abstrakt:
The steps associated with the analytical question solving in terms of LISp-Miner system in ADAMEK medical data are the theme of this thesis. The operating sequence of using 4ft-Miner and SD4ft-Miner procedures in ADAMEK data together with the possibility of further use of formalized background knowledge and preparing routing for automatization of the downrighted steps are the objectiv of this thesis. The summary of the basic concepts and axioms of association rules and GUHA method is the content of the theoretical part of the thesis. Operativ part starts from CRISP-DM methodology. The operating sequence enabling searching for interesting association rules in different data, that is applied on STULONG medical data afterwards in order to get instigations for it's revision, is the produce of this thesis. Used data that come from EuroMISE are concern with cardiological patients.
Klíčová slova: data mining; CRISP-DM methodology; GUHA method; ADAMEK data; automatization; knowledge base; analytical question; SD4ft-Miner; 4ft-Miner

Informace o studiu

Studijní program / obor: Aplikovaná informatika/Znalostní technologie
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce: 15. 5. 2009
Datum podání práce: 30. 6. 2009
Datum obhajoby: 1. 2. 2010
Identifikátor v systému InSIS: https://insis.vse.cz/zp/20692/podrobnosti

Soubory ke stažení

    Poslední aktualizace: