Abstract:
Masalah ketidakseimbangan data merupakan masalah yang terjadi di mana jumlah kelas data yang satu lebih sedikit atau lebih banyak dibanding dengan jumlah kelas data lainnya. Metode Synthetic Minority Oversampling Technique (SMOTE) dan Random Undersampling (RUS) merupakan metode yang paling banyak diterapkan untuk menangani permasalahan ketidakseimbangan data dan menggunakan Support Vector Machine sebagai metode klasifikasi. Pada penelitian ini pengujian akan dilakukan dengan tanpa dan menyeimbangkan data. Data yang digunakan adalah data hatespeech twitter mengenai pemilihan calon Gubernur 2017. Berdasarka hasil pengujian yang telah dilakukan bahwa pengujian tanpa menyeimbangkan data mendapatkan akurasi sebesar 83,96%, menggunakan SMOTE mendapatkan hasil 85,55%, dan SMOTE+RUS mendapatkan hasil 85,69%. Nilai akurasi tertinggi ada pada pengujian dengan SMOTE+RUS sebesar 85,69%.