PRIMJENA ALGORITAMA DUBINSKE ANALIZE PODATAKA I STROJNOG UČENJA ZA KLASIFIKACIJU I PREDIKCIJU U DRUŠTVENOM PODRUČJU

Ovaj rad se bavi otkrivanjem znanja primjenom postupaka strojnog učenja iz baze podataka web aplikacije iz društvenog područja. Izvršena je dubinska analiza podataka pomoću četiri različite metode na skupu podataka vezanih uz prijave i pohađanje poslovnih događaja organiziranih od strane jedne tvrtk...

Full description

Bibliographic Details
Main Authors: Kraljević, Sanja, Staničić, Ognjen
Format: Article in Journal/Newspaper
Language:Croatian
Published: University of applied sciences Zagreb 2020
Subjects:
Online Access:https://hrcak.srce.hr/242766
https://hrcak.srce.hr/file/352669
Description
Summary:Ovaj rad se bavi otkrivanjem znanja primjenom postupaka strojnog učenja iz baze podataka web aplikacije iz društvenog područja. Izvršena je dubinska analiza podataka pomoću četiri različite metode na skupu podataka vezanih uz prijave i pohađanje poslovnih događaja organiziranih od strane jedne tvrtke u razdoblju od tri godine. Primarni cilj rada je otkrivanje znanja iz postojećeg skupa podataka. Pokazano je kako su se deskriptivnom dubinskom analizom otkrila nova znanja. Za analizu su korištene metode stabla odlučivanja, slučajne šume, indukcija pravila te metoda potpornih vektora. Proučene su razlike između navedenih metodologija, te prednosti i mane svake od njih s naglaskom na točnost i utrošak vremena. Osim toga, u radu je opisan i proces pripreme podataka koji je vremenski najzahtjevniji, te sami brojčani rezultati dobiveni prediktivnom analizom. In this paper knowledge discovery is analyzed using machine learning methods from a database of a web application from the social field. Data mining is performed using four differend methods on a database linked to registrations and attendance of business events organized by a company in a three year span. The primary objective of the paper is to discover knowledge from an existing data set. New knowledge was discovered using descriptive deep analysis using the decision tree method, random forests, rule induction and the support vector machine. Differences between methods are studied, advantages and flaws with emphasis on precision and time consumption. The process of data preparation, which takes the most time, and numerical results yielded in the predictive analysis are also shown in this paper.