Abstract:
Dimasa sekarang masyarakat sudah berani
memberitahukan dirinya terpapar covid-19 melalui unggahan di
media sosial dan banyak masyarakat yang menceritakan di Twitter.
Metode pembobotan kata unsupervised merupakan pembobotan
yang tidak memperhatikan letak term di kelas positif atau negatif.
Kemudian metode pembobotan ini dikembangkan menjadi
pembobotan supervised, karena dalam proses pembobotannya
metode ini membobotkan term dengan memperhatikan letak term
di kelas positif atau negatif. Maka dari itu, akan dilakukan
penelitian dengan membandingkan kedua jenis pembobotan pada
klasifikasi data tweet gejala covid dengan metode Random Forest.
Dari hasil penelitian dapat diketahui bahwa kinerja klasifikasi
dengan pembobotan Delta TF-IDF terbukti lebih bagus dengan
akurasi sebesar 88,5% sedangkan dengan TF-IDF diperoleh hasil
akurasi 87,9%.