Abstract:
Banyaknya ujaran kebencian yang bertebaran di sosial media dikarenakan bebasnya mengungkapkan pendapat tanpa konsekuensi yang besar dapat mengakibatkan efek negatif ke orang lain. Memasuki paruh pertama 2022, rumor penundaan pemilu dilakukan oleh partai-partai politik dengan berbagai alasan. Dari rumor tersebut terdapat potensi keluarnya kritik atau pendapat berlebihan yang bisa menjadi ujaran kebencian dari perdebatan antara kubu pro dan kontra terkait penundaan pemilu 2024. Klasifikasi ujaran kebencian diperlukan agar menjadi acuan dalam melakukan proses filtering kalimat yang dikirimkan melalui sosial media. Natural Language Processing dapat digunakan untuk melakukan text classification. IndoBERT merupakan salah satu pre-trained model menggunakan Bahasa Indonesia untuk mempermudah melakukan NLP. Data yang digunakan diambil dari beberapa platform media sosial dengan jumlah total data sebanyak 24.671 data. Performa model IndoBERT yang dibangun menggunakan konfigurasi rasio pembagian 80:20, untuk nilai 80?ta yang digunakan sebanyak 19.736 data, sedangkan untuk nilai 20?ta yang digunakan sebanyak 4935 data, 12 epoch, dan batch size 16 mendapatkan hasil terbaik dengan nilai accuracy, f1-score, precision, dan recall tertingi sebesar, 98.64%, 98.65%, 98.83%, dan 98.48%.