Rozpoznávání znaků z realných scén pomocí neuronových sítí

Název práce: Rozpoznávání znaků z realných scén pomocí neuronových sítí
Autor(ka) práce: Fiala, Petr
Typ práce: Diplomová práce
Vedoucí práce: Neumann, Lukáš
Oponenti práce: Berka, Petr
Jazyk práce: Česky
Abstrakt:
Tato práce se zabývá úlohou rozpoznávání znaků z reálných scén, které je věnována značná pozornost s rozvojem moderních technologií. Cílem studie je k rozpoznávání použít algoritmus, který dosahuje aktuálně nejlepších výsledků na standardních datových sadách. Vybraným modelem je konvoluční síť s deep architekturou, jejíž aplikace na zadanou úlohu nebyla dosud publikována. Implementované řešení navazuje na teoretickou část, která poskytuje ucelený přehled dané problematiky. V praktické části se vyskytují dva typy neuronových sítí: vícevrstvý perceptron a zmíněný model. Z porovnání výsledků těchto dvou typů architektur na první datové sadě vychází výrazně lépe použití komplexní struktury konvoluční sítě. Tento model byl dále ověřen na dvou veřejných datových sadách, které korespondují se zadáním úlohy. Zároveň bylo vyzkoušeno několik modifikací sítě a použití různých úprav vstupních dat s cílem získat optimální řešení v závislosti na struktuře dat. Prezentované řešení dokázalo poskytnout srovnatelnou úspěšnost predikce v porovnání s nejlepšími dosaženými výsledky, při použití syntetických učících vzorů a ověřilo možnost využití této architektury pro danou úlohu. V závěru studie jsou zmíněny možné rozšíření a vylepšení modelu, která by mohla vést k dalšímu snížení klasifikační chyby.
Klíčová slova: Deep learning; Photo OCR; Neuronové sítě; Rozpoznávání znaků; Konvoluční sítě; Robust reading
Název práce: Character recognition of real scenes using neural networks
Autor(ka) práce: Fiala, Petr
Typ práce: Diploma thesis
Vedoucí práce: Neumann, Lukáš
Oponenti práce: Berka, Petr
Jazyk práce: Česky
Abstrakt:
This thesis focuses on a problem of character recognition from real scenes, which has earned significant amount of attention with the development of modern technology. The aim of the paper is to use an algorithm that has state-of-art performance on standard data sets and apply it for the recognition task. The chosen algorithm is a convolution network with deep structure where the application of the specified model has not yet been published. The implemented solution is built on theoretical parts which are provided in comprehensive overview. Two types of neural network are used in the practical part: a multilayer perceptron and the convolution model. But as the complex structure of the convolution networks gives much better performance compare with the classification error of the MLP on the first data set, only the convolution structure is used in the further experiments. The model is validated on two public data sets that correspond with the specification of the task. In order to obtain an optimal solution based on the data structure several tests had been made on the modificated network and with various adjustments on the input data. Presented solution provided comparable prediction rate compare to the best results of the other studies while using artificially generated learning pattern. In conclusion, the thesis describes possible extensions and improvements of the model, which should lead to the decrease of the classification error.
Klíčová slova: Convolution networks; Character recognition; Deep learning; Neural networks; Photo OCR; Robust reading

Informace o studiu

Studijní program / obor: Aplikovaná informatika/Znalostní technologie
Typ studijního programu: Magisterský studijní program
Přidělovaná hodnost: Ing.
Instituce přidělující hodnost: Vysoká škola ekonomická v Praze
Fakulta: Fakulta informatiky a statistiky
Katedra: Katedra informačního a znalostního inženýrství

Informace o odevzdání a obhajobě

Datum zadání práce: 13. 1. 2014
Datum podání práce: 7. 5. 2014
Datum obhajoby: 9. 6. 2014
Identifikátor v systému InSIS: https://insis.vse.cz/zp/47400/podrobnosti

Soubory ke stažení

    Poslední aktualizace: