Abstract:
Hepatitis adalah penyakit peradangan hati yang disebabkan oleh virus hepatitis.
Penyakit ini menjadi ancaman kesehatan utama di seluruh dunia, termasuk di
Indonesia. Kumpulan data (dataset) tersebut perlu diklasifikasikan sebelum dapat
digunakan untuk tujuan medis. Namun, dataset yang tidak lengkap (missing value)
dapat menghambat proses klasifikasi. Untuk mengatasi masalah ini, pendekatan yang
dapat dilakukan adalah dengan menghapus data yang memiliki missing value atau
melakukan perbaikan imputasi dengan metode tertentu. Dalam penelitian ini,
terdapat 155 data dan dilakukan dua skenario untuk mengetahui akurasi klasifikasi
terbaik. Pada skenario pertama, klasifikasi naïve bayes dilakukan dengan menghapus
75 data yang memiliki missing value. Sedangkan pada skenario kedua, klasifikasi
naïve bayes dilakukan setelah melakukan perbaikan imputasi dengan algoritma
Missforest pada 75 data dari 155 data. Pengujian dilakukan dengan komposisi data
50:50, 60:40, dan 70:30. Hasil penelitian menunjukkan bahwa pada skenario
pertama, akurasi klasifikasi berturut-turut sebesar 87,50%, 87,50%, dan 83,33%.
Sementara pada skenario kedua, akurasi klasifikasi berturut-turut sebesar 83,33%,
90,32%, dan 93,62%. Dari hasil ini dapat disimpulkan bahwa penggunaan algoritma
Missforest mampu meningkatkan performa pada akurasi klasifikasi naïve bayes.
Kata kunci : Klasifikasi, Missforest, Naïve Bayes