Uporaba algoritma podržanog učenja u problemima s većim prostorom stanja

Razvoj sustava koji sami uče jedan je od važnijih problema računarske znanosti. Poseban izazov predstavlja učenje rješavanja problema s velikim prostorom stanja. U ovom se radu razmatra implementacija Q-učenja, algoritma podržanog učenja uz aproksimaciju Q funkcije umjetnom neuronskom mrežom. Ispitu...

Full description

Bibliographic Details
Main Author: Dugonjić, Stjepan
Other Authors: Čupić, Marko
Format: Bachelor Thesis
Language:Croatian
Published: Sveučilište u Zagrebu. Fakultet elektrotehnike i računarstva. 2017
Subjects:
Online Access:https://zir.nsk.hr/islandora/object/fer:2815
https://urn.nsk.hr/urn:nbn:hr:168:886267
https://repozitorij.unizg.hr/islandora/object/fer:2815
https://repozitorij.unizg.hr/islandora/object/fer:2815/datastream/PDF
Description
Summary:Razvoj sustava koji sami uče jedan je od važnijih problema računarske znanosti. Poseban izazov predstavlja učenje rješavanja problema s velikim prostorom stanja. U ovom se radu razmatra implementacija Q-učenja, algoritma podržanog učenja uz aproksimaciju Q funkcije umjetnom neuronskom mrežom. Ispituje se sposobnost takvog sustava na primjeru savladavanja klasične igre Bomberman. Prikazani su i komentirani dobiveni rezultati, uz kratak opis funkcionalnosti razvijenog grafičkog sučelja. Development of self-learning systems is one of the key aspects of computer science. Most challenging problems are ones where the state-space domain size is astronomically large. This thesis covers implementation of Q-learning, a reinforcement learning algorithm with non-linear Q function approximation using artificial neural networks. Capabilities of the algorithm are tested on the classic game Bomberman. Results are shown and commented, and short description of developed graphical user interface is presented.