Komponentizace transformací linked data
Název práce: | Komponentizace transformací linked data |
---|---|
Autor(ka) práce: | Pilař, Štěpán |
Typ práce: | Diplomová práce |
Vedoucí práce: | Mynarz, Jindřich |
Oponenti práce: | Knap, Tomáš |
Jazyk práce: | Česky |
Abstrakt: | Diplomová práce se zabývá problematikou transformací linked data a možností kom-ponentizace extract, transform, load procesu s důrazem na přepoužitelnost. Příklady komponent jsou demonstrovány v prostředí nástroje UnifiedViews. Po prozkoumání souvisejících oblastí výzkumu, především ETL v relačním světě a managementu kvali-ty linked data, jsou pomocí bottom-up přístupu rozebrány existující extrakce a trans-formace, v nichž jsou identifikovány příležitosti komponentizace, které jsou doplněny o další možné operace inspirované transformacemi relačních dat. Kromě uvedení potenciálních komponent jsou pro každou z nich diskutovány i možnosti a limitace využití samostatně i v kombinaci s jinými komponentami. Následuje rozbor možností implementace komponent a přehled klíčových otázek při volbě způsobu jejich reali-zace. Implementace vybraných komponent v souladu s navrženým postupem je po-psána v poslední části práce. Současně je jejich využití a omezení demonstrováno na praktických úlohách s daty z oblasti veřejných zakázek. |
Klíčová slova: | linked data; transformace dat; deduplikace; geokódování; UnifiedViews |
Název práce: | Componentization of Linked Data Transformations |
---|---|
Autor(ka) práce: | Pilař, Štěpán |
Typ práce: | Diploma thesis |
Vedoucí práce: | Mynarz, Jindřich |
Oponenti práce: | Knap, Tomáš |
Jazyk práce: | Česky |
Abstrakt: | The diploma thesis is focused on transformation of linked data and opportunities for componentization of extract, transform, load process resulting in reusability of such components. UnifiedViews serves as a framework for demonstration of implementa-tion of selected components. Initial review of related fields of study, relational data oriented ETL and linked data quality management being most prominent, is followed by bottom-up analysis of existing extractors and transformations. Identified common transformations are supplemented by operations known from transformations of relational data. Options and limits of each component candidate are discussed as well as possible cooperation with other components. The next section discusses supported ways of implementation in the selected environment and provides a list of key questions for decision making process is provided. The last part describes implementation of selected components with respect to the approach suggested in the preceding section. Practical use as well as limitations of the implemented components are demonstrated on tasks transforming public contracts datasets. |
Klíčová slova: | deduplication; geocoding; linked data; UnifiedViews; data transformation |
Informace o studiu
Studijní program / obor: | Aplikovaná informatika/Kognitivní informatika |
---|---|
Typ studijního programu: | Magisterský studijní program |
Přidělovaná hodnost: | Ing. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra informačního a znalostního inženýrství |
Informace o odevzdání a obhajobě
Datum zadání práce: | 16. 12. 2013 |
---|---|
Datum podání práce: | 1. 6. 2014 |
Datum obhajoby: | 10. 6. 2014 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/45913/podrobnosti |