Comparison of Deep Neural Networks and Regression Models for Software Effort Estimation

Repozitář DSpace/Manakin

Jazyk: English čeština 

Comparison of Deep Neural Networks and Regression Models for Software Effort Estimation

Zobrazit minimální záznam

dc.contributor.advisor Šilhavý, Radek
dc.contributor.author Michalov, Ján
dc.date.accessioned 2025-12-10T23:09:50Z
dc.date.available 2025-12-10T23:09:50Z
dc.date.issued 2024-10-27
dc.identifier Elektronický archiv Knihovny UTB
dc.identifier.uri http://hdl.handle.net/10563/57729
dc.description.abstract Tato diplomová práce zkoumá efektivitu hlubokých neuronových sítí ve srovnání s tradičními regresními modely pro odhad softwarového úsilí. Po úvodním přehledu prediktivních technik a metrik hodnocení byla navržena strukturovaná experimentální studie porovnávající čtyři regresní modely lineární regresi, polynomiální regresi, Lasso a Ridge s dopřednou (feedforward) neuronovou sítí. Regresní modely prošly laděním pomocí grid search nejen pro své interní hyperparametry, ale také v rámci výběru příznaků (feature selection), aby bylo dosaženo optimální konfigurace pro každý přístup. Každý regresní model byl laděn nezávisle a nejlépe fungující regresní model byl poté zvolen jako základní srovnávací referenční bod vůči nejlépe fungující neuronové síti, přičemž oba modely byly hodnoceny za shodných podmínek. Modely byly testovány na reálném datasetu Use Case Points (UCP) obsahujícím 70 softwarových projektů. Pomocí trojnásobné křížové validace (3-fold cross-validation) byla predikční výkonnost měřena pomocí koeficientu determinace (R?) a střední kvadratické chyby (RMSE). Výsledky ukazují, že kompaktní neuronová síť se čtyřmi neurony ve skryté vrstvě překonala všechny regresní modely jak z hlediska přesnosti, tak i schopnosti generalizace. Zatímco regresní modely nabídly interpretovatelné výchozí hodnoty, vykazovaly vyšší rozptyl chyb a menší robustnost při zachycování složitějších vzorců. Naše zjištění jsou v souladu s předchozími studiemi, které naznačují, že neuronové sítě - pokud jsou správně nakonfigurovány - mohou překonat tradiční regresní techniky i v podmínkách s omezeným množstvím dat.
dc.format 94
dc.language.iso en
dc.publisher Univerzita Tomáše Bati ve Zlíně
dc.rights Bez omezení
dc.subject Software Effort Estimation cs
dc.subject Hluboké neuronové sítě cs
dc.subject Regresní modely cs
dc.subject Use Case Points cs
dc.subject Grid Search cs
dc.subject Feature Selection cs
dc.subject Křížová validace cs
dc.subject Střední kvadratická chyba cs
dc.subject Koeficient determinace cs
dc.subject Porovnání modelů cs
dc.subject Software Effort Estimation en
dc.subject Deep Neural Networks en
dc.subject Regression Models en
dc.subject Use Case Points en
dc.subject Grid Search en
dc.subject Feature Selection en
dc.subject Cross-Validation en
dc.subject RMSE en
dc.subject R2 Score en
dc.subject Model Comparison en
dc.title Comparison of Deep Neural Networks and Regression Models for Software Effort Estimation
dc.title.alternative Comparison of Deep Neural Networks and Regression Models for Software Effort Estimation
dc.type diplomová práce cs
dc.contributor.referee Habiballa, Hashim
dc.date.accepted 2025-06-19
dc.description.abstract-translated This thesis explores the effectiveness of deep neural networks in comparison to traditional regression models for software effort estimation. Following a literature review of predictive techniques and evaluation metrics, a structured experiment was designed to compare four regression modelsLinear Regression, Polynomial Regression, Lasso, and Ridgewith a feedforward neural network. Regression models underwent grid search not only for their internal hyperparameters but also for feature selection, ensuring optimal configuration for each approach. Each regression model was tuned independently, and the best-performing regression model was selected as a baseline for comparison with the best-performing neural network, both evaluated under the same conditions. The models were tested on a real-world Use Case Points (UCP) dataset containing 70 software projects. Using 3-fold cross-validation, predictive performance was measured with the coefficient of determination (R²) and Root Mean Squared Error (RMSE). The results show that a compact neural network using just 4 neurons in its hidden layer outperformed all regression models in both accuracy and generalization. While regression models offered interpretable baselines, they exhibited greater error variance and were less robust in capturing complex patterns. Our findings are consistent with prior studies suggesting that neural networks, when properly configured, can outperform traditional regression techniques even in low-data scenarios.
dc.description.department Ústav informatiky a umělé inteligence
dc.thesis.degree-discipline Kybernetická bezpečnost cs
dc.thesis.degree-discipline Cyber Security en
dc.thesis.degree-grantor Univerzita Tomáše Bati ve Zlíně. Fakulta aplikované informatiky cs
dc.thesis.degree-grantor Tomas Bata University in Zlín. Faculty of Applied Informatics en
dc.thesis.degree-name Ing.
dc.thesis.degree-program Informační technologie cs
dc.thesis.degree-program Information Technologies en
dc.identifier.stag 70127
dc.date.submitted 2025-06-02


Soubory tohoto záznamu

Soubory Velikost Formát Zobrazit

K tomuto záznamu nejsou připojeny žádné soubory.

Tento záznam se objevuje v následujících kolekcích

Zobrazit minimální záznam

Find fulltext

Prohledat DSpace


Procházet

Můj účet