PRIMJENA ALGORITAMA DUBINSKE ANALIZE PODATAKA I STROJNOG UČENJA ZA KLASIFIKACIJU I PREDIKCIJU U DRUŠTVENOM PODRUČJU
Ovaj rad se bavi otkrivanjem znanja primjenom postupaka strojnog učenja iz baze podataka web aplikacije iz društvenog područja. Izvršena je dubinska analiza podataka pomoću četiri različite metode na skupu podataka vezanih uz prijave i pohađanje poslovnih događaja organiziranih od strane jedne tvrtk...
Main Authors: | , |
---|---|
Format: | Article in Journal/Newspaper |
Language: | Croatian |
Published: |
University of applied sciences Zagreb
2020
|
Subjects: | |
Online Access: | https://hrcak.srce.hr/242766 https://hrcak.srce.hr/file/352669 |
Summary: | Ovaj rad se bavi otkrivanjem znanja primjenom postupaka strojnog učenja iz baze podataka web aplikacije iz društvenog područja. Izvršena je dubinska analiza podataka pomoću četiri različite metode na skupu podataka vezanih uz prijave i pohađanje poslovnih događaja organiziranih od strane jedne tvrtke u razdoblju od tri godine. Primarni cilj rada je otkrivanje znanja iz postojećeg skupa podataka. Pokazano je kako su se deskriptivnom dubinskom analizom otkrila nova znanja. Za analizu su korištene metode stabla odlučivanja, slučajne šume, indukcija pravila te metoda potpornih vektora. Proučene su razlike između navedenih metodologija, te prednosti i mane svake od njih s naglaskom na točnost i utrošak vremena. Osim toga, u radu je opisan i proces pripreme podataka koji je vremenski najzahtjevniji, te sami brojčani rezultati dobiveni prediktivnom analizom. In this paper knowledge discovery is analyzed using machine learning methods from a database of a web application from the social field. Data mining is performed using four differend methods on a database linked to registrations and attendance of business events organized by a company in a three year span. The primary objective of the paper is to discover knowledge from an existing data set. New knowledge was discovered using descriptive deep analysis using the decision tree method, random forests, rule induction and the support vector machine. Differences between methods are studied, advantages and flaws with emphasis on precision and time consumption. The process of data preparation, which takes the most time, and numerical results yielded in the predictive analysis are also shown in this paper. |
---|