Prediction of Human Development Index with Health Indicators Using Tree-Based Regression Models

Machine learning is a field of artificial intelligence that allows computers to predict and model future events by making inferences from past information with mathematical and statistical operations. In this study, we used tree-based regression models, one of the machine learning methods, to determ...

Full description

Bibliographic Details
Published in:Adıyaman University Journal of Science
Main Authors: AKIN, Pelin, KOC, Tuba
Format: Article in Journal/Newspaper
Language:English
Published: Adıyaman Üniversitesi 2021
Subjects:
Online Access:https://dergipark.org.tr/tr/pub/adyujsci/issue/67254/895084
https://doi.org/10.37094/adyujsci.895084
Description
Summary:Machine learning is a field of artificial intelligence that allows computers to predict and model future events by making inferences from past information with mathematical and statistical operations. In this study, we used tree-based regression models, one of the machine learning methods, to determine and predict the effect of health indicators of 191 countries on the human development index (HDI) between 2014 and 2018 years. When tree-based regression models were compared according to model performance criteria, it was found that the best model was the gradient boosting model with the highest R2 = 0.9962 and the smallest RMSE = 0.0094. With the gradient boosting model, the three most important variables to HDI are; current health expenditure per capita, physicians and nurses, and midwives, respectively. By selecting the ten countries with the highest HDI values and Turkey, HDI values were estimated for 2018-2019 with a gradient boosting model. The countries for which HDI values are best predicted by the gradient boosting method are Netherlands, Sweden, Norway, Iceland, Denmark, Turkey, Ireland, Germany, Australia, and China. Makine öğrenmesi, bilgisayar yardımıyla geçmişteki bilgileri kullanarak matematiksel ve istatistiksel işlemlerle çıkarımlar elde eden ve gelecekteki olaylar hakkında tahmin yürütülmesi modelleme yapılmasına imkân veren bir yapay zekâ alanıdır. Bu çalışmada 191 ülkenin 2014-2018 yıllarında sağlık göstergelerinin insani gelişim endeksi (İGE) üzerindeki etkisini belirlemek ve tahmin yapmak için makine öğrenmesi yöntemlerinden ağaç tabanlı regresyon modelleri kullanılmıştır. Ağaçlı tabanlı regresyon modelleri model performans kriterlerine göre karşılaştırıldığında en iyi modelin en yüksek R2 = 0.9962 ve en küçük RMSE = 0.0094 değeri ile gradyan artırma model olduğu bulunmuştur. Gradyan artırma model ile İGE indeksine en fazla etki eden 3 değişken sırasıyla: kişi başına cari sağlık harcaması, doktorların sayısı ve hemşireler ile ebelerin sayısı olarak bulunmuştur. İGE değeri en yüksek olan 10 ülke ve Türkiye seçilerek gradyan artırma model ile 2018-2019 yılları için İGE değerleri tahmin edilmiştir. Gradyan artırma yöntemi ile İGE değeri en iyi tahmin edilen ülkeler sırasıyla Hollanda, İsveç, Norveç, İzlanda, Danimarka, Türkiye, İrlanda, Almanya, Avustralya ve Çin şeklindedir.