Abstract:
Bencana dapat terjadi kapan saja dan di mana saja, bencana banjir dan kebakaran hutan adalah dua diantara jenis bencana yang terjadi Indonesia. Provinsi Kalimantan Selatan merupakan wilayah yang tidak luput dari bencana banjir dan kebakaran hutan. Dataset yang digunakan untuk penelitian ini adalah data bencana banjir dan kebakaran hutan dari penelitian sebelumnya oleh Zahra (2020) dan data yang di gunakan tidak seimbang. Kondisi data tidak seimbang bisa menyulitkan metode klasifikasi dalam melakukan proses pada data mining. Metode sampling pada pendekatan level data yang bisa digunakan untuk menyelesaikan permasalahan ketidakseimbangan adalah oversampling, salah satu turunan dari oversampling yaitu SMOTE. Metode K-Means SMOTE merupakan hasil modifikasi dari SMOTE. Salah satu model dari Naïve Bayes yang sering digunakan dalam klasifikasi teks adalah Multinomial Naïve Bayes. Multinomial Naïve Bayes memiliki performa yang baik dalam melakukan klasifikasi teks. Hasil penelitian ini pada data bencana banjir menggunakan K-Means SMOTE dengan Multinomial Naïve Bayes menghasilkan kinerja f1 score 66,04?n data bencana kebakaran hutan menggunakan K-Means SMOTE dengan Multinomial Naïve Bayes menghasilkan kinerja f1 score 66,31%.
Kata Kunci : Data Tidak Seimbang, Pesan Bencana, K-means SMOTE, Klasifikasi, Multinomial Naïve Bayes