Datová kvalita v rámci DWH
Název práce: | Datová kvalita v rámci DWH |
---|---|
Autor(ka) práce: | Kukla, David |
Typ práce: | Bakalářská práce |
Vedoucí práce: | Karkošková, Soňa |
Oponenti práce: | Palovská, Helena |
Jazyk práce: | Česky |
Abstrakt: | Tato bakalářská práce řeší problém snížené datové kvality v rámci datového skladu na praktickém příkladu pojišťovny. Toto téma jsem zvolil z důvodu, že je velice aktuální. S nekvalitními daty se setkávám denně v zaměstnání. Rád bych představil jednoduché řešení pro malé podniky, které nemají prostředky na DQ programy. Pro vyřešení toho problému jsou stanoveny tři dílčí cíle. Prvním cílem je popis struktury datového skladu, který nám pomůže pochopit zasazení datového skladu do BI řešení. Druhým cílem je definice a řízení datové kvality, toto nám pomůže pro vyhodnocení aktuálního stavu a pochopení základních metrik a metodik. Posledním cílem je samotný návrh a implementace řešení reálného problému. Práce se dělí na teoretickou a praktickou část. První a druhý cíl spadají do teoretické části, třetí cíl je část praktická.V praktické části byl proveden data profiling, který pomohl pro pochopení problému a slabých míst stávajícího řešení. Následně byl vytvořen návrh a implementace řešení. Na základě testů provedených před ostrým nasazením, bylo posouzeno za vhodné. Po nasazení bylo provedeno dotazníkové šetření s odběratelem a ten byl nadmíru spokojen. Výsledkem je funkční univerzální řešení, spokojený odběratel a plno ušetřeného času. Řešení je dostupné v příloze BP na CD. |
Klíčová slova: | datový sklad; business intelligence; čištění dat; datová kvalita |
Název práce: | Data quality in DWH |
---|---|
Autor(ka) práce: | Kukla, David |
Typ práce: | Bachelor thesis |
Vedoucí práce: | Karkošková, Soňa |
Oponenti práce: | Palovská, Helena |
Jazyk práce: | Česky |
Abstrakt: | This bachelor thesis solves the problem of reduced data quality within the data warehouse on the practical example of the insurance company. I chose this topic because it is very actual and important. I encounter problems with poor data quality every day in work. I would like to introduce a simple solution for small businesses that do not have resources for data quality program. Three sub-goals are set to solve this problem. The first goal is to describe the structure of data warehouse, which will help us to understand position of data warehouse in business intelligence solution. The second goal is a definition of data quality and its managing, this will help us to evaluate the current condition and understand the basic metrics and methodologies. The last goal is to design and implement a solution to a real problem. The thesis is divided into theoretical and practical part. The first and second goal belong into the theoretical part. The third goal belongs in practical part.Data profiling was performed in the practical part, which helped to understand the problem and weaknesses of the existing solution. Subsequently, the design and implementation of the solution was created. Based on the tests performed before the live deployment, the solution was considered appropriate. After deployment, a questionnaire survey was carried out with the customer and he was very satisfied. The result is a functional universal solution, a satisfied customer and a lot of time saved. The solution is available in attachment of thesis on the CD. |
Klíčová slova: | data cleansing; business intelligence; data quality; data warehouse |
Informace o studiu
Studijní program / obor: | Aplikovaná informatika/Aplikovaná informatika |
---|---|
Typ studijního programu: | Bakalářský studijní program |
Přidělovaná hodnost: | Bc. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra informačních technologií |
Informace o odevzdání a obhajobě
Datum zadání práce: | 8. 1. 2019 |
---|---|
Datum podání práce: | 5. 5. 2019 |
Datum obhajoby: | 17. 6. 2019 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/68751/podrobnosti |