KLASIFIKASI STATUS KEMISKINAN KABUPATEN/KOTA DI INDONESIA MENGGUNAKAN NAÏVE BAYES CLASSIFIER DAN CLASSIFICATION AND REGRESSION TREE

Authors

  • Kristina Millenia Seran Jurusan Statistika, Fakultas Sains Terapan, Institut Sains & Teknologi AKPRIND Yogyakarta
  • Yudi Setyawan Jurusan Statistika, Fakultas Sains Terapan, Institut Sains & Teknologi AKPRIND Yogyakarta
  • Maria Titah Jatipaningrum Jurusan Statistika, Fakultas Sains Terapan, Institut Sains & Teknologi AKPRIND Yogyakarta
  • Febriani Astuti Jurusan Statistika, Fakultas Sains Terapan, Institut Sains & Teknologi AKPRIND Yogyakarta

DOI:

https://doi.org/10.34151/statistika.v9i1.4819

Keywords:

Klasifikasi, Status kemiskinan, Naïve Bayes Classifier, Classification and Regression Tree

Abstract

Indonesia masuk dalam 100 besar negara miskin dengan menempati urutan ke-73 di dunia. Diketahui persentase penduduk miskin dilihat pada Maret 2022 sebesar 5,94% atau 26,16 juta jiwa, meningkat pada September 2022 menjadi 9,57% atau 26,36 juta jiwa. Status kemiskinan adalah kondisi dimana seorang atau sekelompok orang tidak mampu memenuhi kebutuhan hidup. Kemiskinan juga dapat dipengaruhi oleh beberapa faktor seperti pengeluaran perkapita, rata-rata lama sekolah, tingkat pengangguran terbuka serta indeks pembangunan manusia. Data yang digunakan dalam penelitian ini yaitu data kabupaten/kota di Indonesia tahun 2022. Pada penelitian ini klasifikasi dilakukan dengan menggunakan metode Naïve Bayes Classifier dan Classification and Regression Tree. Kedua metode dilakukan dengan membagi data training dan data testing sebesar 90%:10%, 80%:20%, dan 70%:30%. Selain itu, dilakukan pengacakan sampel sebanyak 30 kali dengan fungsi set.seed(). Hasil analisis dengan kedua metode diperoleh metode Classification and Regression Tree lebih baik digunakan dengan rata-rata akurasi untuk proporsi data 90%:10% sebesar 77,81%, untuk proporsi data 80%:20% sebesar 78,31%, dan untuk proporsi data 70%:30% sebesar 79,67%. Sedangkan metode Naïve Bayes Classifier menghasilkan rata-rata akurasi untuk proporsi data 90%:10% sebesar 72,57%, untuk proporsi data 80%:20% sebesar 73,00%, dan untuk proporsi data 70%:30% sebesar 73,13%. Kedua metode ini masing-masing menghasilkan nilai akurasi yang tinggi pada proporsi data 70%:30%.

Downloads

Published

2024-01-31