Doménové znalosti, analytické otázky, systém LISp-Miner a data ADAMEK
Název práce: | Doménové znalosti, analytické otázky, systém LISp-Miner a data ADAMEK |
---|---|
Autor(ka) práce: | Kubín, Richard |
Typ práce: | Diplomová práce |
Vedoucí práce: | Rauch, Jan |
Oponenti práce: | Šimůnek, Milan |
Jazyk práce: | Česky |
Abstrakt: | Tématem práce jsou kroky spojené s řešením analytické otázky pomocí systému LISp-Miner v medicínských datech Adámek. Kromě popisu postupu při aplikaci procedur 4ft-Miner a SD4ft-Miner na data Adámek, si práce klade za cíl všímat si možnosti budoucího zakomponování práce s formalizovanou doménovou znalostí, a připravit postup pro automatizaci prováděných kroků. Obsahem teoretické části je shrnutí základních pojmů a principů spojených s asociačními pravidly a metodou GUHA. Praktická část postupuje podle metodologie CRISP-DM. Výsledkem práce je postup, podle kterého je možné hledat zajímavá pravidla v jiných datech. Postup je dále aplikován na lékařská data STULONG pro získání podnětů pro jeho revizi. Použitá data se týkají kardiologických pacientů a pocházejí z EuroMISE. |
Klíčová slova: | data mining; CRISP-DM; GUHA; analytická otázka; 4ft-Miner; SD4ft-Miner; ADAMEK; automatizace; doménové znalosti |
Název práce: | Knowledge base, analytical questions, LISp-Mner system and ADAMEK data |
---|---|
Autor(ka) práce: | Kubín, Richard |
Typ práce: | Diploma thesis |
Vedoucí práce: | Rauch, Jan |
Oponenti práce: | Šimůnek, Milan |
Jazyk práce: | Česky |
Abstrakt: | The steps associated with the analytical question solving in terms of LISp-Miner system in ADAMEK medical data are the theme of this thesis. The operating sequence of using 4ft-Miner and SD4ft-Miner procedures in ADAMEK data together with the possibility of further use of formalized background knowledge and preparing routing for automatization of the downrighted steps are the objectiv of this thesis. The summary of the basic concepts and axioms of association rules and GUHA method is the content of the theoretical part of the thesis. Operativ part starts from CRISP-DM methodology. The operating sequence enabling searching for interesting association rules in different data, that is applied on STULONG medical data afterwards in order to get instigations for it's revision, is the produce of this thesis. Used data that come from EuroMISE are concern with cardiological patients. |
Klíčová slova: | data mining; CRISP-DM methodology; GUHA method; ADAMEK data; automatization; knowledge base; analytical question; SD4ft-Miner; 4ft-Miner |
Informace o studiu
Studijní program / obor: | Aplikovaná informatika/Znalostní technologie |
---|---|
Typ studijního programu: | Magisterský studijní program |
Přidělovaná hodnost: | Ing. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra informačního a znalostního inženýrství |
Informace o odevzdání a obhajobě
Datum zadání práce: | 15. 5. 2009 |
---|---|
Datum podání práce: | 30. 6. 2009 |
Datum obhajoby: | 1. 2. 2010 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/20692/podrobnosti |