Konvolucijski modeli za semantičku segmentaciju primjeraka

Lokalizacija i segmentacija primjeraka objekata jedni su od bitnih problema dubokog učenja. Mask R-CNN predstavlja stanje tehnike modela koji rješavaju te zadatke. U sklopu rada pojašnjene su sve komponente Mask R-CNN-a poput kralježnice u vidu rezidualnih neuronskih mreža ResNet, rezolucijske piram...

Full description

Bibliographic Details
Main Author: Kovač, Bruno
Other Authors: Šegvić, Siniša
Format: Master Thesis
Language:Croatian
Published: Sveučilište u Zagrebu. Fakultet elektrotehnike i računarstva. 2020
Subjects:
FPN
RPN
Online Access:https://zir.nsk.hr/islandora/object/fer:8365
https://urn.nsk.hr/urn:nbn:hr:168:984466
https://repozitorij.unizg.hr/islandora/object/fer:8365
https://repozitorij.unizg.hr/islandora/object/fer:8365/datastream/PDF
Description
Summary:Lokalizacija i segmentacija primjeraka objekata jedni su od bitnih problema dubokog učenja. Mask R-CNN predstavlja stanje tehnike modela koji rješavaju te zadatke. U sklopu rada pojašnjene su sve komponente Mask R-CNN-a poput kralježnice u vidu rezidualnih neuronskih mreža ResNet, rezolucijske piramide značajki FPN, modula za predlaganje regija interesa RPN te samih glava za klasifikaciju, okvire i semantičku segmentaciju specifičnih za cijeli model. Model Mask R-CNN-a implementiran je i naučen na dva različita skupa podataka PASCAL VOC-2012 i AOLP. Prikazane su dobiveni vrijednosti AP metrika te sami rezultati na slikama gdje su objekti klasificirani, lokalizirani i segmentirani. Za oba skupa podataka i područja primjene također su prikazani i rezultati na slikama izvan navedenih skupova kako bismo prikazali mogućnost generalizacije našeg modela. Object detection and instance segmentation are one of the most important problems in deep learning. Mask R-CNN represents state-of-the-art model which solves these tasks. As part of the paper, all components of Mask R-CNN are explained, such as backbone in form of residual neural networks ResNet, feature pyramid network FPN, region proposal network RPN and classification, bounding box and semantic segmentation heads specific for the whole model. Mask R-CNN model was implemented and trained on two different datasets PASCAL VOC-2012 and AOLP. Values of AP metrics are shown and also results on images where objects are classified, localized and segmented. For both datasets and areas of application results are also shown on images not included in mentioned datasets to show generalization of our model.