Datová kvalita v rámci DWH

Název práce: Datová kvalita v rámci DWH
Autor(ka) práce: Kukla, David
Typ práce: Bakalářská práce
Vedoucí práce: Karkošková, Soňa
Oponenti práce: Palovská, Helena
Jazyk práce: Česky
Abstrakt:
Tato bakalářská práce řeší problém snížené datové kvality v rámci datového skladu na praktickém příkladu pojišťovny. Toto téma jsem zvolil z důvodu, že je velice aktuální. S nekvalitními daty se setkávám denně v zaměstnání. Rád bych představil jednoduché řešení pro malé podniky, které nemají prostředky na DQ programy. Pro vyřešení toho problému jsou stanoveny tři dílčí cíle. Prvním cílem je popis struktury datového skladu, který nám pomůže pochopit zasazení datového skladu do BI řešení. Druhým cílem je definice a řízení datové kvality, toto nám pomůže pro vyhodnocení aktuálního stavu a pochopení základních metrik a metodik. Posledním cílem je samotný návrh a implementace řešení reálného problému. Práce se dělí na teoretickou a praktickou část. První a druhý cíl spadají do teoretické části, třetí cíl je část praktická.V praktické části byl proveden data profiling, který pomohl pro pochopení problému a slabých míst stávajícího řešení. Následně byl vytvořen návrh a implementace řešení. Na základě testů provedených před ostrým nasazením, bylo posouzeno za vhodné. Po nasazení bylo provedeno dotazníkové šetření s odběratelem a ten byl nadmíru spokojen. Výsledkem je funkční univerzální řešení, spokojený odběratel a plno ušetřeného času. Řešení je dostupné v příloze BP na CD.
Klíčová slova: datový sklad; business intelligence; čištění dat; datová kvalita
Název práce: Data quality in DWH
Autor(ka) práce: Kukla, David
Typ práce: Bachelor thesis
Vedoucí práce: Karkošková, Soňa
Oponenti práce: Palovská, Helena
Jazyk práce: Česky
Abstrakt:
This bachelor thesis solves the problem of reduced data quality within the data warehouse on the practical example of the insurance company. I chose this topic because it is very actual and important. I encounter problems with poor data quality every day in work. I would like to introduce a simple solution for small businesses that do not have resources for data quality program. Three sub-goals are set to solve this problem. The first goal is to describe the structure of data warehouse, which will help us to understand position of data warehouse in business intelligence solution. The second goal is a definition of data quality and its managing, this will help us to evaluate the current condition and understand the basic metrics and methodologies. The last goal is to design and implement a solution to a real problem. The thesis is divided into theoretical and practical part. The first and second goal belong into the theoretical part. The third goal belongs in practical part.Data profiling was performed in the practical part, which helped to understand the problem and weaknesses of the existing solution. Subsequently, the design and implementation of the solution was created. Based on the tests performed before the live deployment, the solution was considered appropriate. After deployment, a questionnaire survey was carried out with the customer and he was very satisfied. The result is a functional universal solution, a satisfied customer and a lot of time saved. The solution is available in attachment of thesis on the CD.
Klíčová slova: data cleansing; business intelligence; data quality; data warehouse

Informace o studiu

Studijní program / obor: Aplikovaná informatika/Aplikovaná informatika
Typ studijního programu: Bakalářský studijní program
Přidělovaná hodnost: Bc.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačních technologií

Informace o odevzdání a obhajobě

Datum zadání práce: 8. 1. 2019
Datum podání práce: 5. 5. 2019
Datum obhajoby: 17. 6. 2019
Identifikátor v systému InSIS: https://insis.vse.cz/zp/68751/podrobnosti

Soubory ke stažení

    Poslední aktualizace: