Učení business rules z výsledků dolování GUHA asociačních pravidel

Název práce: Učení business rules z výsledků dolování GUHA asociačních pravidel
Autor(ka) práce: Vojíř, Stanislav
Typ práce: Disertační práce
Vedoucí práce: Strossa, Petr
Oponenti práce: Pour, Jan; Kouba, Zdeněk; Gregor, Jiří
Jazyk práce: Česky
Abstrakt:
V současném vysoce-konkurenčním prostředí je pro podniky velmi důležité, aby jejich informační systémy nejen co nejefektivněji podporovaly stávající podnikové procesy, ale aby se zároveň byly schopny se dynamicky přizpůsobovat měnícímu se prostředí. Stále více se prosazují snahy vzájemně oddělit aplikační a business logiku v rámci informačních systémů, přičemž jedním z vhodných prostředků pro záznam business logiky je využití business rules. Business rules jakožto jednoduchá a srozumitelná pravidla je možné využívat nejen pro shromažďování znalostí v rámci podniku, ale také pro aktivní rozhodování a řízení podnikových procesů. Ačkoliv je business rule přístup využíván již téměř 20 let, jednotlivé specifikace a možné aplikace business rules jsou stále předmětem aktivního výzkumu i praktického vývoje. Nevýhodou business rules je velká náročnost jejich získávání - pravidla jsou obvykle zadávána ručně prostřednictvím doménových expertů. Jedním z problémů, na které je zaměřen aktuální výzkumu v této oblasti, je možnost (polo)automatického získávání business rules z jiných zdrojů - podnikových dokumentů či historických dat. Získávání business pravidel z historických podnikových dat je věnována také tato práce. Hlavním cílem této disertační práce je navrhnout a ověřit metodu (polo)automatického učení business rules za využití dolování asociačních pravidel. Asociační pravidla jsou známou data miningovou metodou objevování zajímavých vztahů v datech, přičemž nalezené vztahy jsou srozumitelné a vysvětlitelné. Tato srozumitelnost napomáhá možnosti využívat je pro učení business pravidel. K učení business pravidel lze využívat nejen jednoduchá asociační pravidla získávaná pomocí algoritmu Apriori či FP Growth, ale také složitější asociační pravidla získávaná za využití metody GUHA. V rámci práce je využívána procedura 4ft-Miner data miningového systému LISp-Miner. V rámci této práce je nejprve popsána problematika business pravidel a jejich využívání pro modelování podniků i praktické zapojení do podnikových procesů a také problematika dolování asociačních pravidel. S ohledem na roztříštěnost specifikací a standardů pro definici business rules je v rámci práce definován a následně prakticky aplikován proces pro výběr odpovídající specifikace business rules pro konkrétní praktické využití. Následně jsou v rámci práce navrženy tři způsoby zapojení dolování asociačních pravidel pro učení business rules. V rámci těchto modelů byl též definován model pro transformaci GUHA asociačních pravidel do business pravidel ve formátu DRL (pro systém Drools). Pro možnost získávání business pravidel za využití většího množství zdrojů, zejména za využití dolování asociačních pravidel z většího množství data setů, je v další části práce navržena struktura báze znalostí vhodné pro propojení business rules a asociačních pravidel z většího množství zdrojů, přičemž z pohledu business rules slouží jako terminologický slovník, pro dolování asociačních pravidel pak plní úlohu báze doménových znalostí pro předzpracování dat. Navržené modely byly ověřeny za využití praktických implementacích v systémech EasyMiner (v kombinaci se systémem Drools) a Erian. V rámci práce jsou kromě popisů praktických implementací definovány také dva modelové příklady praktického využití učení business pravidel z výsledků dolování GUHA asociačních pravidel, založené na reálných datech. Jeden v oblasti marketingu, druhý v oblasti kontrol ve zdravotních pojišťovnách.
Klíčová slova: asociační pravidla; business pravidla; EasyMiner; LISp-Miner; Erian; Drools; klasifikace; báze znalostí; data mining; business rules
Název práce: Business rule learning using data mining of GUHA association rules
Autor(ka) práce: Vojíř, Stanislav
Typ práce: Dissertation thesis
Vedoucí práce: Strossa, Petr
Oponenti práce: Pour, Jan; Kouba, Zdeněk; Gregor, Jiří
Jazyk práce: Česky
Abstrakt:
In the currently highly competitive environment, the information systems of the businesses should not only effectively support the existing business processes, but also have to be dynamically adaptable to the changes in the environment. There are increasing efforts at separation of the application and the business logic in the information system. One of the appropriate instruments for this separation is the business rule approach. Business rules are simple, understandable rules. They can be used for the knowledge externalization and sharing also as for the active control and decisions within the business processes. Although the business rule approach is used for almost 20 years, the various specifications and practical applications of business rules are still a goal of the active research. The disadvantage of the business rule approach is great demands on obtaining of the rules. There has to be a domain expert, who is able to manually write them. One of the problems addressed by the current research is the possibility of (semi)automatic acquisition of business rules from the different resources - unstructured documents, historical data etc. This dissertation thesis addresses the problem of acquisition (learning) of business rules from the historical data of the company. The main objective of this thesis is to design and validate a method for (semi)automatic learning of business rules using the data mining of association rules. Association rule are a known data mining method for discovering of interesting relations hidden in the data. Association rules are comprehensible and explainable. The comprehensibility of association rules is suitable for the use of them for learning of business rules. For this purpose the user can use not only simple rules discovered using the algorithm Apriori or FP-Growth, but also more complex association rules discovered using the GUHA method. Within this thesis is used the procedure 4ft-Miner implemented in the data mining system LISp Miner. The first part of this thesis contains the description of the relevant topics from the research of business rules and association rules. Business rules is not a name of one specification of standard but rather a label of the approach to modelling of business logic. As part of the work there is defined a process of selection of the most appropriate specification of business rules for the selected practical use. Consequently, the author proposed three models of involving of data mining of association rules into business rule sets. These models contain also the definition of a model for the transformation of GUHA association rules in the business rules for the system JBoss Drools. For the possibility of learning of business rules using the data mining results from more than one data set, the author proposed a knowledge base. The knowledge base is suitable for the interconnection of business rules and data mining of association rules. From the perspective of business rules the knowledge base is a term dictionary. From the perspective of data mining the knowledge base contains some background knowledge for data preprocessing and preparation of classification models. The proposed models have been validated using practical implementations in the systems EasyMiner (in conjunction with JBoss Drools) and Erian. The thesis contains also a description of two model use cases based on real data from the field of marketing and the field of health insurance.
Klíčová slova: LISp-Miner; Erian; Drools; classification; EasyMiner; data mining; business rules; association rules; knowledge base

Informace o studiu

Studijní program / obor: Aplikovaná informatika/Aplikovaná informatika
Typ studijního programu: Doktorský studijní program
Přidělovaná hodnost: Ph.D.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce: 16. 2. 2012
Datum podání práce: 31. 5. 2016
Datum obhajoby: 20. 9. 2016
Identifikátor v systému InSIS: https://insis.vse.cz/zp/36011/podrobnosti

Soubory ke stažení

    Poslední aktualizace: