Abstract:
Abstrak
Saat pengambilan data dilapangan sering kali terjadi kesalahan dalam pengambilan data, salah satunya yaitu berupa data kosong atau data tidak lengkap atau disebut juga dengan missing value. Missing value ini mengakibatkan menurunnya kualitas data untuk diproses lebih lanjut oleh algoritma machine learning. Maka diperlukannya sebuah metode untuk mengisi kekosongan data tersebut. Salah satu metode yang bisa mengisi kekosongan tersebut adalah linear regression dimana model akan melakukan pengisian dengan menggunakan persamaan garis lurus yang dibuat dari koefisien-koefisien fitur yang berkaitan dengan target. Pada penelitian ini akan menggunakan linear regression untuk melakukan pengisian data pada dataset Pima Indian Diabetes yang telah diberi missing value sebanyak 10?ngan MCAR. Model linear regression tersebut mendapatkan error RMSE sebesar 48,997 pada imputasi missing value single target, sedangkan pada multi target missing value mendapatkan error RMSE sebesar 30,897 dan RMSE keseluruhan missing value sebesar 40,642.
Keywords: Missing Value, Imputasi Linear Regression, Linear Regression