Abstract:
Instagram merupakan media sosial yang paling populer pada zaman sekarang. Pengguna yang dimulai dari anak-anak, remaja hingga orang dewasa turut mendongkrak popularitas Instagram. Namun, media sosial ini tidak lepas dari bahaya cyberbullying yang sering dilakukan oleh pengguna khususnya pada kolom komentar. Maka dari itu dapat dilakukan suatu analisis sentimen pada kolom komentar Instagram yang berupaya untuk mengetahui nilai sentimen dari setiap komentar. Di era serba teknologi, pembelajaran untuk melakukan penelitian sentiment analisis juga dapat dilakukan melalui data yang ada di internet, tak hanya itu metode untuk penelitian sentiment analaisis ini juga sudah banyak dikembangkan. Machine Learning sendiri adalah sistem yang dapat memprediksi dengan tingkat keakuratan yang tinggi, sehingga machine learning adalah teknologi yang terpenting setelah Internet. Ini dikarenakan cara kerja sistem Machine Learning menggunakan prinsip dari probabilitas dengan menggunakan berbagai macam kemungkinan yang akan terjadi, sehingga dengan adanya kemungkinan tersebut Machine Learning dapat menentukan keputusan yang akan diambil berdasarkan kemungkinan yang dipelajari dari peristiwa yang pernah ada. Algoritma K- Nearest Neighbor (KNN) merupakan algoritma yang digunakan untuk mengklasifikasikan objek baru berdasarkan atribut dan training sample. Prinsip kerja KNN adalah dengan mencari jarak terdekat antara data yang digunakan dengan K tetangga (neighbor) terdekatnya dalam data training. Setiap metode mempunyai kelebihan dan kekurangan masing-masing tingkat akurasinya berbeda-beda. Weighted Inverse Document Frequency Weighted inverse document frequency (WIDF) adalah sebuah perluasan dari inverse document frequency (IDF) Salah satu bentuk data yang dapat digunakan dalam sentiment analysis yaitu Data Komentar Cyberbullying pada media Social Instagram. Data termasuk dalam kumpulan data teks berbahasa Indonesia yang dapat diolah menggunakan algoritma pembobotan WIDF. WIDF sendiri merupakan metode hasil peningkatan dari IDF. Data yang telah dilakukan pembobotan akan dihitung hasil akurasinya dengan K- Nearest Neighbor (KNN). Hasil pengujian dengan pembobotan WIDF diperoleh nilai akurasi sebesar 83,1%