Abstract:
Phising adalah salah satu bentuk Cyber Crime yang merugikan orang lain dan termasuk perbuatan yang melawan hukum. Terdapat beberapa pendekatan untuk memberantas kejahatan phising, salah satunya dengan melakukan klasifikasi terhadap situs phising menggunakan metode machine learning. Dataset yang digunakan yaitu dataset situs phising dari UCI Repository dengan 11055 data dan 30 fitur kategorial. Metode pengklasifikasi yang digunakan yaitu XGBoost. XGBoost baik untuk melakukan klasifikasi terhadap data dengan fitur kategorikal, namun kinerja algoritma ini masih bisa ditingkatkan. Untuk mengatasi permasalahan tersebut peneliti menggunakan solusi hyper-parameter tuning. XGBoost memiliki beberapa hyper-parameter yang dapat dikonfigurasi untuk meningkatkan kinerja dari model. Masalah mengidentifikasi nilai yang baik untuk hyper-parameter disebut hyper-parameter tuning. Metode hyper-parameter tuning yang digunakan yaitu Random Search yang kemudian divalidasi menggunakan 5-Fold Cross Validation sebanyak 30 iterasi. Hyper-parameter XGBoost yang dikonfigurasi antara lain n_estimators, max_depth, subsample dan learning_rate. Pengujian pada XGBoost tanpa hyper-parameter tuning memperoleh akurasi sebesar 95,34%. Untuk pengujian XGBoost dengan hyper-parameter tuning memperoleh akurasi sebesar 97,69%. Hyper-parameter tuning dengan Random Search pada XGBoost untuk klasifikasi situs phising memberikan peningkatan kinerja model pada akurasi sekitar 2,35%.