Abstract:
Prediksi cacat software merupakan pendekatan yang digunakan untuk mengindentifikasi modul yang rentan cacat atau tidak cacat. Namun, pendekatan ini memiliki masalah terhadap ketidakseimbangan data (imbalanced data) dan fitur yang tidak relevan (noise attribute). Kedua permasalahan tersebut dapat ditangani dengan melibatkan algoritma machine learning. Pada penelitian ini menggunakan algoritma SMOTE (Synthetic Minority Over Sampling Technique) untuk menangani ketidakseimbangan data dan Algoritma Genetika sebagai seleksi fitur untuk menangani masalah noise attribute serta meningkatkan kinerja dari SMOTE dan Stacking. Tujuan dari penelitian ini adalah untuk mengetahui kinerja yang dihasilkan oleh SMOTE dan Stacking yang dioptimasi dengan Algoritma Genetika. Dari hasil penelitian yang telah dilakukan pada 12 dataset NASA MDP didapatkan nilai rata-rata AUC keseluruhan dataset pada model SMOTE dan Stacking sebesar 0.684 sedangkan pada model dengan menggunakan Algoritma Genetika didapatkan nilai rata-rata AUC sebesar 0.812. Dari hasil yang didapatkan menunjukkan bahwa Algoritma Genetika dapat meningkatkan dan mengoptimasi kinerja dari model SMOTE dan Stacking pada prediksi cacat software.