Konvolucijski modeli za semantičku segmentaciju primjeraka
Lokalizacija i segmentacija primjeraka objekata jedni su od bitnih problema dubokog učenja. Mask R-CNN predstavlja stanje tehnike modela koji rješavaju te zadatke. U sklopu rada pojašnjene su sve komponente Mask R-CNN-a poput kralježnice u vidu rezidualnih neuronskih mreža ResNet, rezolucijske piram...
Main Author: | |
---|---|
Other Authors: | |
Format: | Master Thesis |
Language: | Croatian |
Published: |
Sveučilište u Zagrebu. Fakultet elektrotehnike i računarstva.
2020
|
Subjects: | |
Online Access: | https://zir.nsk.hr/islandora/object/fer:8365 https://urn.nsk.hr/urn:nbn:hr:168:984466 https://repozitorij.unizg.hr/islandora/object/fer:8365 https://repozitorij.unizg.hr/islandora/object/fer:8365/datastream/PDF |
Summary: | Lokalizacija i segmentacija primjeraka objekata jedni su od bitnih problema dubokog učenja. Mask R-CNN predstavlja stanje tehnike modela koji rješavaju te zadatke. U sklopu rada pojašnjene su sve komponente Mask R-CNN-a poput kralježnice u vidu rezidualnih neuronskih mreža ResNet, rezolucijske piramide značajki FPN, modula za predlaganje regija interesa RPN te samih glava za klasifikaciju, okvire i semantičku segmentaciju specifičnih za cijeli model. Model Mask R-CNN-a implementiran je i naučen na dva različita skupa podataka PASCAL VOC-2012 i AOLP. Prikazane su dobiveni vrijednosti AP metrika te sami rezultati na slikama gdje su objekti klasificirani, lokalizirani i segmentirani. Za oba skupa podataka i područja primjene također su prikazani i rezultati na slikama izvan navedenih skupova kako bismo prikazali mogućnost generalizacije našeg modela. Object detection and instance segmentation are one of the most important problems in deep learning. Mask R-CNN represents state-of-the-art model which solves these tasks. As part of the paper, all components of Mask R-CNN are explained, such as backbone in form of residual neural networks ResNet, feature pyramid network FPN, region proposal network RPN and classification, bounding box and semantic segmentation heads specific for the whole model. Mask R-CNN model was implemented and trained on two different datasets PASCAL VOC-2012 and AOLP. Values of AP metrics are shown and also results on images where objects are classified, localized and segmented. For both datasets and areas of application results are also shown on images not included in mentioned datasets to show generalization of our model. |
---|