Gaussian mixtures in R
Název práce: | Gaussian mixtures in R |
---|---|
Autor(ka) práce: | Marek, Petr |
Typ práce: | Diploma thesis |
Vedoucí práce: | Malá, Ivana |
Oponenti práce: | Zimmermann, Pavel |
Jazyk práce: | English |
Abstrakt: | Using Gaussian mixtures is a popular and very flexible approach to statistical modelling. The standard approach of maximum likelihood estimation cannot be used for some of these models. The estimates are, however, obtainable by iterative solutions, such as the EM (Expectation-Maximization) algorithm. The aim of this thesis is to present Gaussian mixture models and their implementation in R. The non-trivial case of having to use the EM algorithm is assumed. Existing methods and packages are presented, investigated and compared. Some of them are extended by custom R code. Several exhaustive simulations are run and some of the interesting results are presented. For these simulations, a notion of usual fit is presented. |
Klíčová slova: | EM algorithm; finite Gaussian mixture; R |
Název práce: | Gaussian mixtures in R |
---|---|
Autor(ka) práce: | Marek, Petr |
Typ práce: | Diplomová práce |
Vedoucí práce: | Malá, Ivana |
Oponenti práce: | Zimmermann, Pavel |
Jazyk práce: | English |
Abstrakt: | Směsi normálních rozdělení jsou velmi populárním a flexibilním nástrojem statistického modelování. Standardní postup odhadu pomocí maximální věrohodnosti bohužel nemůže být pro některé z těchto modelů použit. Pro odhad takovýchto modelů lze však použít některé z iterativních procedur, jako například EM (Expectation-Maximization) algoritmus. Cílem této práce je vysvětlit směsi pravděpodobnostních rozdělení a jejich odhad pomocí EM algoritmu. Hlavní náplní práce je ukázka implementace směsi normálních rozdělení v R. Existující balíčky a metody jsou prezentovány, popsány a porovnány. Pro některé z balíčků jsou dopsány rozšiřující funkce v jazyku R. V práci je provedeno několik rozsáhlých simulací. Některé z výsledků jsou prezentovány. Při práci s těmito simulacemi je navrhnuta a popsána myšlenka "nejčastějšího odhadu" (usual fit). |
Klíčová slova: | R; EM algoritmus; konečná směs normálních rozdělení |
Informace o studiu
Studijní program / obor: | Kvantitativní metody v ekonomice/Statisticko-pojistné inženýrství |
---|---|
Typ studijního programu: | Magisterský studijní program |
Přidělovaná hodnost: | Ing. |
Instituce přidělující hodnost: | Vysoká škola ekonomická v Praze |
Fakulta: | Fakulta informatiky a statistiky |
Katedra: | Katedra statistiky a pravděpodobnosti |
Informace o odevzdání a obhajobě
Datum zadání práce: | 17. 2. 2015 |
---|---|
Datum podání práce: | 15. 5. 2015 |
Datum obhajoby: | 9. 6. 2015 |
Identifikátor v systému InSIS: | https://insis.vse.cz/zp/51280/podrobnosti |