Abstract:
Missing values atau data dengan nilai null (kosong) merupakan masalah tersendiri
dalam menjaga kualitas suatu data. Missing values dapat disebabkan oleh beberapa hal,
salah satunya diakibatkan oleh kesalahan pada saat entri data. Missing values dapat
menyebabkan tingkat keakuratan suatu data berkurang dan menurunnya kualitas data
saat akan dilakukan pengolahan data lanjut, seperti proses klasifikasi. Algoritma C5.0
dapat menangani kasus missing values. Namun dari sekian model penanganan missing
values seperti mean, median, modus, Naïve Bayes Imputation dan model yang tanpa
penanganan belum diketahui model mana yang paling memberikan kontribusi terhadap
akurasi klasifikai pada algoritma C5.0.Dari hasil penelitian yang dilakukan dapat
diambil kesimpulan bahwa tingkat akurasi klasifikasi C5.0 dengan penanganan missing
values menggunanakan metode Mean sebesar 71,27%. Tingkat akurasi klasifikasi C5.0
dengan penanganan missing values menggunanakan metode Median sebesar 71,27%.
Tingkat akurasi klasifikasi C5.0 dengan penanganan missing values menggunanakan
metode Modus sebesar 71,27%. Tingkat akurasi klasifikasi C5.0 dengan penanganan
missing values menggunanakan metode NBI sebesar 69,14%. dan tingkat akurasi
klasifikasi C5.0 dengan penanganan missing values menggunanakan metode tanpa
penanganan sebesar 71.27%. Hasil akurasi tertinggi didapat oleh metode mean,
median, modus dan tanpa penanganan, sedangkan akurasi terendah didapat pada
metode Naïve Bayes Inputation. Dari hasil akurasi menunjukkan bahwa tidak ada
pengaruh pada metode C5.0 ketika dilakukan penanganan. Sebab, metode C5.0 sudah
mampu mengatasi dataset yang memiliki beberapa nilai null.