Uporaba algoritma podržanog učenja u problemima s većim prostorom stanja
Razvoj sustava koji sami uče jedan je od važnijih problema računarske znanosti. Poseban izazov predstavlja učenje rješavanja problema s velikim prostorom stanja. U ovom se radu razmatra implementacija Q-učenja, algoritma podržanog učenja uz aproksimaciju Q funkcije umjetnom neuronskom mrežom. Ispitu...
Main Author: | |
---|---|
Other Authors: | |
Format: | Bachelor Thesis |
Language: | Croatian |
Published: |
Sveučilište u Zagrebu. Fakultet elektrotehnike i računarstva.
2017
|
Subjects: | |
Online Access: | https://zir.nsk.hr/islandora/object/fer:2815 https://urn.nsk.hr/urn:nbn:hr:168:886267 https://repozitorij.unizg.hr/islandora/object/fer:2815 https://repozitorij.unizg.hr/islandora/object/fer:2815/datastream/PDF |
Summary: | Razvoj sustava koji sami uče jedan je od važnijih problema računarske znanosti. Poseban izazov predstavlja učenje rješavanja problema s velikim prostorom stanja. U ovom se radu razmatra implementacija Q-učenja, algoritma podržanog učenja uz aproksimaciju Q funkcije umjetnom neuronskom mrežom. Ispituje se sposobnost takvog sustava na primjeru savladavanja klasične igre Bomberman. Prikazani su i komentirani dobiveni rezultati, uz kratak opis funkcionalnosti razvijenog grafičkog sučelja. Development of self-learning systems is one of the key aspects of computer science. Most challenging problems are ones where the state-space domain size is astronomically large. This thesis covers implementation of Q-learning, a reinforcement learning algorithm with non-linear Q function approximation using artificial neural networks. Capabilities of the algorithm are tested on the classic game Bomberman. Results are shown and commented, and short description of developed graphical user interface is presented. |
---|