Abstract:
Kasus COVID-19 pertama kali muncul di Indonesia pada bulan Maret Tahun 2020. Gejala umum penderitan COVID-19 antara lain demam, batuk, kelelahan, dan kehilangan rasa pada indera penciuman. Sejak pandemi dimulai, beberapa pengguna Twitter menyampaikan keresahan mereka akan gejala yang mereka alami melalui tweet dan beberapa secara jelas menyatakan apakah mereka terinfeksi virus tersebut atau tidak. Tweet yang berhubungan dengan COVID-19 beberapa kali menjadi sumber penelitian terkait analisis sentimen, diantaranya tweet sentimen tentang varian baru dari virus, kebijakan pemerintah dalam menghadapi pandemi, dan sentimen terhadap proses vaksinasi, sedangkan penelitian untuk mendeteksi gejala COVID-19 dari pesan di media sosial masih belum banyak dilakukan di Indonesia. Hasil deteksi untuk menunjukkan apakah tweet tersebut dibuat oleh seseorang yang terindikasi positif COVID-19 atau negatif. Metode Long Short-Term Memory (LSTM) merupakan bagian dari jaringan saraf berulang dan pengembangan dari metode RNN dengan kelebihan mampu memproses data teks yang relatif panjang. Metode Word Embedding yang digunakan adalah Word2Vec, FastText, dan GloVe untuk membuat model dan membandingkan metode yang memiliki hasil akurasi dan prediksi yang baik. Pada penelitian ini diusulkan metode gabungan dari ketiga word embedding. Hasil yang diperoleh yaitu metode LSTM dengan Word Embedding Word2Vec mendapatkan akurasi 87%, hasil akurasi dengan GloVe 84.5%, hasil akurasi dengan FastText 86%, dan gabungan dari ketiga word embedding yang diusulkan nilai akurasinya sebesar 89%.