Uporaba algoritma podržanog učenja u problemima s većim prostorom stanja

Razvoj sustava koji sami uče jedan je od važnijih problema računarske znanosti. Poseban izazov predstavlja učenje rješavanja problema s velikim prostorom stanja. U ovom se radu razmatra implementacija Q-učenja, algoritma podržanog učenja uz aproksimaciju Q funkcije umjetnom neuronskom mrežom. Ispitu...

Full description

Bibliographic Details
Main Author:	Dugonjić, Stjepan
Other Authors:	Čupić, Marko
Format:	Bachelor Thesis
Language:	Croatian
Published:	Sveučilište u Zagrebu. Fakultet elektrotehnike i računarstva. 2017
Subjects:	Podržano učenje neuronske mreže Q-učenje aproksimacija velik prostor stanja Reinforcement learning Q-learning neural network approximation large state-space TEHNIČKE ZNANOSTI. Računarstvo TECHNICAL SCIENCES. Computing sami
Online Access:	https://zir.nsk.hr/islandora/object/fer:2815 https://urn.nsk.hr/urn:nbn:hr:168:886267 https://repozitorij.unizg.hr/islandora/object/fer:2815 https://repozitorij.unizg.hr/islandora/object/fer:2815/datastream/PDF

Description
Summary:	Razvoj sustava koji sami uče jedan je od važnijih problema računarske znanosti. Poseban izazov predstavlja učenje rješavanja problema s velikim prostorom stanja. U ovom se radu razmatra implementacija Q-učenja, algoritma podržanog učenja uz aproksimaciju Q funkcije umjetnom neuronskom mrežom. Ispituje se sposobnost takvog sustava na primjeru savladavanja klasične igre Bomberman. Prikazani su i komentirani dobiveni rezultati, uz kratak opis funkcionalnosti razvijenog grafičkog sučelja. Development of self-learning systems is one of the key aspects of computer science. Most challenging problems are ones where the state-space domain size is astronomically large. This thesis covers implementation of Q-learning, a reinforcement learning algorithm with non-linear Q function approximation using artificial neural networks. Capabilities of the algorithm are tested on the classic game Bomberman. Results are shown and commented, and short description of developed graphical user interface is presented.

Uporaba algoritma podržanog učenja u problemima s većim prostorom stanja

Similar Items