Predikce výsledků hokejových utkání pomocí data mining modelu

Název práce: Predikce výsledků hokejových utkání pomocí data mining modelu
Autor(ka) práce: Matuš, Martin
Typ práce: Diplomová práce
Vedoucí práce: Maryška, Miloš
Oponenti práce: Volavka, Filip
Jazyk práce: Česky
Abstrakt:
V této práci se zaměřuji na tvorbu a porovnání modelu pro predikci výsledků hokejových utkání se specializací na zápasy mistrovství světa v ledním hokeji. V první části se nejprve věnuji shromáždění teoretických znalostí umožňujících takovou úlohu vyřešit a ve druhé části tyto znalosti aplikuji. Postup tvorby modelu se řídí data mining metodologií CRISP-DM, jejíž etapy se promítají i v práci samotné. Jako vstupní data jsou využity údaje o výsledcích jednotlivých hráčů reprezentačních mužstev z ligových ročníků předcházejících danému mistrovství. Tato data se nacházejí na veřejně přístupných internetových zdrojích, tudíž součástí práce je i tvorba a využití automatizovaného skriptu, který tyto zdroje prochází a data agreguje. Získaná data jsou upravena do podoby jednotlivých utkání odehraných na šampionátech (tým A složený z hráčů X proti týmu B složenému z hráčů Y) doplněných o výsledky těchto utkání (výhra domácího týmu, prohra domácího týmu). Poté jsou data analyzována za účelem odhalení možných nedostatků a přípravy hypotéz (popis atributů, volba závislého atributu -- výsledek utkání) a transformována do podoby využitelné data miningovým nástrojem. Hodnocení výsledků se skládá ze dvou částí, v té první hodnotím výsledky jednotlivých modelů jako takových při porovnání klasifikace dat z testovací skupiny na skutečné výsledky zápasů. Zde hodnotím také možnosti nasazení modelu do praxe. Součástí této fáze je i opětovná kontrola správnosti použití atributů vstupujících do analýzy. Ve druhé části dochází k porovnávání dosažených hodnot s údaji o sázkových kurzech -- ověřuje se tak smysluplnost použití takovýchto modelů. Pro tento účel využívám volně dostupné údaje o kurzech, které byly vypsány pro zápasy odpovídající utkáním z testovací množiny dat (kurz na výhru domácích a kurz na výhru hostů). Na závěr je vybraný predikční model nasazen na utkání základních skupin MS v hokeji v roce 2015.
Klíčová slova: predikce; hokej; RapidMiner; CRISP-DM; umělé neuronové sítě; data mining
Název práce: Ice Hockey Match Prediction Using Data Mining Model
Autor(ka) práce: Matuš, Martin
Typ práce: Diploma thesis
Vedoucí práce: Maryška, Miloš
Oponenti práce: Volavka, Filip
Jazyk práce: Česky
Abstrakt:
This thesis focuses on creation and comparison of ice hockey matches prediction models with the view on ice hockey world championship matches. The first part is dedicated to collecting theoretical knowledge needed for solving this problem and the second to applying this set of knowledge. The model creation approach is intertwined with the CRISP-DM data mining methodology, which also defines several chapters of this work. As input data for the models I used performance statistics of individual ice hockey players -- this brought me to implementing a script capable of automatic downloading and aggregating of player data from the Internet. Downloaded data were arranged so as they would represent ice hockey matches that were played during the championships (team A consisting of players X against team B consisting of players Y) with result of the match added to the data row. Data were also analyzed to detect any quality issue prior to the model creation and transformed into an integrated view. Result assessment consists of two parts, in the first the technical evaluation of models using data from the testing data set takes place. The first part also points out practical usefulness of the models. The next part is about comparing result data with the betting odds -- the business relevance of the model. This part uses open source data about betting odds listed on the corresponding matches. Finally, the outcome model is used for predicting matches of the group phase of the world championship taking place in Prague, 2015.
Klíčová slova: artificial neural networks; prediction; CRISP-DM; ice hockey; data mining; RapidMiner

Informace o studiu

Studijní program / obor: Aplikovaná informatika/Informační systémy a technologie
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačních technologií

Informace o odevzdání a obhajobě

Datum zadání práce: 12. 12. 2014
Datum podání práce: 7. 5. 2015
Datum obhajoby: 29. 5. 2015
Identifikátor v systému InSIS: https://insis.vse.cz/zp/50594/podrobnosti

Soubory ke stažení

    Poslední aktualizace: