PERBANDINGAN METODE RANDOM FOREST DAN SUPPORT VECTOR MACHINE PADA KLASIFIKASI CURAH HUJAN DI PROVINSI DAERAH ISTIMEWA YOGYAKARTA
DOI:
https://doi.org/10.34151/statistika.v9i1.4840Keywords:
Curah Hujan, Klasifikasi, Random Forest, Support Vector MachineAbstract
Curah hujan merupakan salah satu dari komponen iklim. Menurut Badan Meteorologi, Klimatologi dan Geofisika, curah hujan merupakan ketebalan air hujan yang terkumpul dalam satu luasan milimeter. Terdapat beberapa faktor yang mempengaruhi curah hujan diantaranya suhu, kelembapan, lama penyinaran dan kecepatan arah angin. Klasifikasi adalah teknik data mining yang bertujuan untuk memprediksi kategori yang tidak diketahui untuk setiap kasus data secara akurat. Penelitian ini bertujuan untuk melakukan klasifikasi curah hujan di Daerah Istimewa Yogyakarta menggunakan metode Random Forest dan Support Vector Machine dan melakukan perbandingan rerata keakuratan dengan tiga kali set.seed dan tiga proporsi data training dan data testing dari masing-masing metode. Untuk metode Random Forest melalui set.seed (107), proporsi data training dan data testing 70:30 diperoleh nilai akurasi terbesar 71,8% dengan prakiraan angka kejadian curah hujan selama 79 hari dari 110 hari. Untuk metode Support Vector Machine melalui set.seed (107), proporsi data training dan data testing 60:40 diperoleh nilai akurasi terbesar 93,83% dengan prakiraan angka kejadian curah hujan 137 hari dari 146 hari. Berdasarkan keakuratan yang dihitung melalui tiga kali set.seed dan tiga proporsi, metode support vector machine memiliki nilai akurasi yang lebih tinggi dengan nilai akurasi 90,25% dari metode random forest dengan nilai akurasi 70,5%.