Vizualizace a hodnocení augmentačních technik v počítačovém vidění

DSpace Repository

Language: English čeština 

Vizualizace a hodnocení augmentačních technik v počítačovém vidění

Show simple item record

dc.contributor.advisor Viktorin, Adam
dc.contributor.author Buček, Petr
dc.date.accessioned 2025-12-10T23:09:48Z
dc.date.available 2025-12-10T23:09:48Z
dc.date.issued 2024-10-27
dc.identifier Elektronický archiv Knihovny UTB
dc.identifier.uri http://hdl.handle.net/10563/57687
dc.description.abstract Tato práce se zabývá analýzou vlivu augmentace dat na rozmanitost datových souborů a výkon modelu hlubokého učení v oblasti počítačového vidění. Cílem práce bylo analyzovat, jak různé augmentační metody ovlivňují rozmanitost dat a jejich reprezentaci v latentním prostoru neuronové sítě. Bylo vybráno sedm typů augmentací: rotace, horizontální převrácení, perspektivní transformace, změna barevnosti, převod do stupně šedi, Gaussův šum a náhodné mazání. Tyto metody byly aplikovány na datový soubor CIFAR-10 a jejich dopad byl hodnocen pomocí kombinace kvantitativních metrik. Výsledky ukázaly, že některé augmentace, například horizontální převrácení a Gaussův šum, významně rozšiřují prostor příznaků při zachování nízkého doménového posunu, což z nich činí vhodné nástroje pro zlepšení generalizace a odolnosti modelu vůči variacím v obrazových datech. Perspektivní transformace se ukázala jako nejproblematičtější tím, že výrazně narušila strukturu tříd a zvýšila doménový posun.
dc.format 81
dc.language.iso cs
dc.publisher Univerzita Tomáše Bati ve Zlíně
dc.rights Bez omezení
dc.subject augmentace dat cs
dc.subject počítačové vidění cs
dc.subject t-SNE cs
dc.subject analýza dat cs
dc.subject data augmentation en
dc.subject computer vision en
dc.subject t-SNE en
dc.subject data analysis en
dc.title Vizualizace a hodnocení augmentačních technik v počítačovém vidění
dc.title.alternative Visualization and Evaluation of Augmentation Techniques in Computer Vision
dc.type diplomová práce cs
dc.contributor.referee Volná, Eva
dc.date.accepted 2025-06-18
dc.description.abstract-translated This thesis analyzes the impact of data augmentation on dataset diversity and the performance of deep learning models in the field of computer vision. The aim of the work was to examine how different augmentation methods influence data diversity and their representation in the latent space of a neural network. Seven types of augmentations were selected: rotation, horizontal flipping, perspective transformations, color jitter, grayscale conversion, Gaussian noise, and random erasing. These methods were applied to the CIFAR-10 dataset, and their effects were evaluated using a combination of quantitative metrics. The results showed that certain augmentations, such as horizontal flipping and Gaussian noise, significantly expanded the feature space while maintaining a low domain shift, making them suitable tools for improving model generalization and robustness to variations in image data. Perspective transformations proved to be the most problematic, as they considerably disrupted class structure and increased domain shift.
dc.description.department Ústav informatiky a umělé inteligence
dc.thesis.degree-discipline Softwarové inženýrství cs
dc.thesis.degree-discipline Software Engineering en
dc.thesis.degree-grantor Univerzita Tomáše Bati ve Zlíně. Fakulta aplikované informatiky cs
dc.thesis.degree-grantor Tomas Bata University in Zlín. Faculty of Applied Informatics en
dc.thesis.degree-name Ing.
dc.thesis.degree-program Informační technologie cs
dc.thesis.degree-program Information Technologies en
dc.identifier.stag 70061
dc.date.submitted 2025-05-28


Files in this item

Files Size Format View

There are no files associated with this item.

This item appears in the following Collection(s)

Show simple item record

Find fulltext

Search DSpace


Browse

My Account