KLASIFIKASI TINGKAT PENGANGGURAN TERBUKA DI INDONESIA DENGAN ALGORITMA CLASSIFICATION AND REGRESSION TREE (CART) DAN C4.5

Authors

  • Inggit Fatika Jurusan Statistika, Fakultas Sains Terapan, IST AKPRIND Yogyakarta
  • Kris Suryowati Jurusan Statistika, Fakultas Sains Terapan, IST AKPRIND Yogyakarta
  • Noviana Pratiwi Jurusan Statistika, Fakultas Sains Terapan, IST AKPRIND Yogyakarta
  • Muhammad Sholeh Jurusan Statistika, Fakultas Sains Terapan, IST AKPRIND Yogyakarta

Keywords:

Klasifikasi, CART, C4.5, Tingkat Pengangguran Terbuka

Abstract

Tingkat pengangguran terbuka di Indonesia bulan Februari 2021 sebesar 6,26%, jumlah ini mengalami kenaikan sebesar 1,32% jika dibandingkan dengan keadaan bulan Februari 2020 yaitu sebesar 4,94%. Tingkat pengangguran terbuka yang tinggi pada suatu negara dapat menyebabkan rendahnya partisipasi masyarakat dalam pertumbuhan perekonomian yang akan berakibat pada penurunan tingkat pembangunan nasional. Selain itu, tingginya tingkat pengangguran terbuka juga dapat menyebabkan tingginya biaya sosial sehingga terjadi berbagai tindak kriminalitas dalam masyarakat. Agar permasalahan ini dapat diatasi perlunya mengetahui berbagai faktor yang dapat mempengaruhi peningkatan tingkat pengangguran terbuka pada berbagai Provinsi di Indonesia salah satunya dengan melakukan klasifikasi. Pada penelitian ini klasifikasi yang digunakan adalah CART (Classification and Regression Tree) dan C4.5. CART dan C4.5 merupakan salah satu algoritma decision tree yang dapat digunakan untuk melakukan klasifikasi menggunakan struktur hirarki. Algoritma CART dapat digunakan untuk klasifikasi dengan jumlah data yang cukup besar dengan banyak faktor serta dapat melakukan analisis klasifikasi pada peubah respon baik nominal, ordinal, maupun kontinu. Algoritma C4.5 memiliki kelebihan dalam menangani missing value, mengatasi pohon keputusan yang overfitting, serta dapat digunakan untuk jenis data kontinu yang mana sesuai dengan bentuk data penelitian yang akan digunakan. Hasil dari penelitian ini menunjukkan bahwa model pohon keputusan yang terbentuk dari kedua algoritma adalah sama, yaitu dengan kedalaman satu dan variabel tingkat kesempatan kerja merupakan variabel yang paling berpengaruh. Tingkat akurasi, sensitivity, dan Specificity dari kedua model yang terbentuk berdasarkan algoritma tersebut adalah sama, yaitu sebesar 100%, sehingga kedua model sama baiknya untuk digunakan dalam melakukan klasifikasi tingkat pengangguran terbuka di Indonesia.

Downloads

Published

2023-07-18