PENGELOMPOKAN PROVINSI DI INDONESIA BERDASARKAN PENGELUARAN PER KAPITA TAHUN 2023 DENGAN METODE K-MEANS DAN K-MEDOIDS

Authors

  • Sitti Ulfa Nur Fadhilah
  • Yudi Setyawan
  • Rokhana Dwi Bekti

DOI:

https://doi.org/10.34151/prosidingsnast.v1i1.5014

Abstract

Berdasarkan data Survei Sosial-Ekonomi Nasional (Susenas) Maret 2023 pada level nasional, rata-rata pengeluaran per kapita sebulan untuk konsumsi makanan dan bukan makanan naik 9,35 persen sejak Maret tahun 2022. Kenaikan ini diduga dipicu oleh beberapa faktor seperti nilai inflasi, meningkatnya pertumbuhan ekonomi, menurunnya tingkat pengangguran terbuka serta dampak dari program-program perlindungan sosial yang telah pemerintah jalankan. Tujuan dari penelitian ini untuk mengetahui hasil pengelompokan pengeluaran per kapita di Indonesia pada tahun 2023 berdasarkan kelompok makanan dan non makanan serta memberikan gambaran sehingga dapat menjadi acuan bagi pemerintah untuk mengestimasi kebutuhan pasar di masing-masing provinsi. Dari hasil analisis diketahui bahwa jumlah total variabel yang digunakan sebanyak dua puluh variabel dan terdapat  lima variabel yang mengalami multikolinieritas sehingga dilakukan analisis PCA untuk mengubah dimensi dari data tanpa menghilangkan informasi penting dari data tersebut. Dalam penelitian ini dilakukan perbandingan analisis klaster K-Means dan K-Medoids dengan menggunakan jarak Euclid dan jarak Manhattan.  Penentuan metode terbaik menggunakan beberapa uji validasi yakni Silhouette Index, Davies-Bouldin Index (DBI) dan Connectivity Index. Uji validasi menunjukkan bahwa metode terbaik adalah metode K-Medoids dengan jarak Manhattan karena memiliki nilai DBI dan Connectivity Index yang paling kecil dibandingkan metode lainnya. Pengelompokan berdasarkan metode terbaik menghasilkan 2 klaster dimana klaster 1 memuat 21 provinsi dan klaster  2 memuat 13 provinsi.

References

Bhandari, P. (2021). How to Find Outliers, 4 Ways with Examples & Explanation. Diakses 20 Mei 2024 dari https://www.scribbr.com/statistics/outliers/

Cahaya, Y. M. (2023). Perbandingan Metode Perhitungan Jarak Euclidean dengan Perhitungan Jarak Manhattan pada K-Means Clustering dalam Menentukan Penyebaran Covid di Kota Bekasi. Jurnal Matematika Terapan, 43-55.

Farissa, R. A., Mayasari, R., & Umaidah, Y. (2021). Perbandingan Algoritma K-Means dan K-Medoids untuk Pengelompokan Data Obat dengan Silhouette Coefficient . JAIC, Vol.5, No.2, Desember 2021, pp. 109~116.

Ghozali, I. (2018). Aplikasi Analisis Multivariate dengan Program IBM SPSS 25. Universitas Diponegoro.

Halim, N. N., & Widodo, E. (2017). Pengklasteran Dampak Gempa Bumi di Indonesia Menggunakan Kohonen Self Organizing Maps. Prosiding SI MaNIs, Vol.1, No.1, Juli 2017, Hal. 188-194.

Jamal, A., Handayani, A., Septiandri, A. A., & Ripmiatin, E. (2018). Dimensionality Reduction using PCA and K-Means Clustering for Breast Cancer Prediction. Lontar Komputer, Vol. 9, No. 3.

Nabilah, N. A., Perdana, H., & Sulistianingsih, E. (2024). Pengelompokan Provinsi Di Indonesia Berdasarkan Indikator Kesejahteraan Masyarakat dengan Algoritma K-Means++. Bimaster, Volume 13, No. 3 (2024), hal 419 – 426.

Nicolaus, Sulistianingsih, E., & Perdana, H. (2016). Penentuan Jumlah Cluster Optimal pada Median Linkage dengan Indeks Validitas Silhouette. Bimaster, 97-102.

Norris, S.(2018) Assessment Metric for Clustering Algorithm.

Orisa, M., & Faisol, A. (2021). Analisis Algoritma Partitioning Around Medoid untuk Penentuan Klasterisasi. J- TIT, Vol 8, No 2.

Ramadhayani, A. N., & Lusiana, V. (2022). Klasifikasi Jenis Kucing Menggunakan Algoritma Principal Component Analysis dan K-Nearest Neighbor. Jurnal Informasi dan Komputer, Vol: 10 No:2.2022.

Samudro, A.B.P. (2023). Pengeluaran untuk Konsumsi Penduduk Indonesia Per Provinsi Maret 2023, Badan Pusat Statistik RI.

Supriyadi, A., Triayudi, A., & Sholihati, I. D. (2021). Perbandingan Algoritma K-Means dan K-Medoids pada Pengelompokan Armada Kendaraan Truk Berdasarkan Produktivitas. JIPI, Volume 06, Nomor 02, Desember 2021 : 229 – 240.

Syarif, R. M. (2018). Perbandingan Algoritme K-Means dengan Algoritme Fuzzy C Means (FCM) dalam Clustering Moda Transportasi Berbasis GPS. Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer.

Downloads

Published

23-11-2024

Issue

Section

Articles