ANALISIS PERFORMA NAIVE BAYES DAN SVM TERHADAP SENTIMEN TEKS MEDIA SOSIAL DENGAN WORD2VEC DAN SMOTE

Authors

  • Juliandri Saputra Universitas Sains dan Teknologi Indonesia
  • Lily Maryani Universitas Sains dan Teknologi Indonesia
  • Rahmaddeni Universitas Sains dan Teknologi Indonesia
  • Denok Wulandari Institut Az Zuhra Pekanbaru
  • Wisnu Eka Universitas Sains dan Teknologi Indonesia

DOI:

https://doi.org/10.24252/instek.v10i1.54889

Keywords:

analisis sentimen, media sosial, naive bayes, support vector machine (SVM), Word2Vec, SMOTE

Abstract

Penelitian ini membandingkan performa algoritma Naive Bayes dan Support Vector Machine (SVM) dalam klasifikasi sentimen teks dari media sosial. Dataset berisi 736 unggahan dari Facebook, Instagram, dan Twitter yang telah dilabeli sebagai positif, netral, atau negatif. Proses prapemrosesan mencakup pembersihan teks, normalisasi, tokenisasi, penghapusan kata umum, dan stemming. Fitur diekstraksi menggunakan Word2Vec, sedangkan ketidakseimbangan kelas diatasi dengan Synthetic Minority Oversampling Technique (SMOTE). Model dilatih dan dievaluasi menggunakan metrik akurasi, presisi, recall, dan F1-score, serta divalidasi melalui K-Fold Cross-Validation. Hasil menunjukkan bahwa algoritma SVM mencapai akurasi 88,85% dan F1-score 88,86%, lebih unggul dibandingkan Naive Bayes dengan akurasi 72,64% dan F1-score 72,26%. SVM juga menunjukkan konsistensi dalam memprediksi sentimen netral, yang menjadi kelemahan Naive Bayes. Temuan ini memperkuat posisi SVM sebagai algoritma yang lebih efektif untuk analisis sentimen teks media sosial.

Downloads

Download data is not yet available.

References

[1] H. Sujadi, “Analisis Sentimen Pengguna Media Sosial Twitter Terhadap Wabah Covid-19 Dengan Metode Naive Bayes Classifier Dan Support Vector Machine,” INFOTECH J., vol. 8, no. 1, pp. 22–27, 2022, doi: 10.31949/infotech.v8i1.1883.

[2] R. I. Syah, H. Hoiriyah, and M. Walid, “Analisis Sentimen Pengguna Media Sosial Terhadap Aplikasi M-Health Peduli Lindungi Dengan Metode Lexicon Based Dan Naïve Bayes,” Indones. J. Bus. Intell., vol. 6, no. 1, 2023, doi: 10.21927/ijubi.v6i1.3275.

[3] T. Setiawan, S. Liem, and D. M. R. Pribadi, “Perbandingan Algoritma SVM dan Naïve Bayes dalam Analisis Sentimen Komentar Tiktok pada Produk Skincare,” Appl. Inf. Technol. Comput. Sci., vol. 3, no. 2, pp. 28–32, 2024, [Online]. Available: https://jurnal.politap.ac.id/index.php/aicoms

[4] M. I. Fikri, T. S. Sabrila, and Y. Azhar, “Perbandingan Metode Naïve Bayes dan Support Vector Machine pada Analisis Sentimen Twitter,” Smatika J., vol. 10, no. 02, pp. 71–76, 2020, doi: 10.32664/smatika.v10i02.455.

[5] A. Fauzi and A. H. Yunial, “Analisis Sentimen Pada Media Sosial Menggunakan Perbandingan Algoritma Data Mining,” J. Edukasi dan Penelit. Inform., vol. 10, no. 2, p. 277, 2024, doi: 10.26418/jp.v10i2.76024.

[6] Gishella Septania Al-Husna, Dian Asmarajati, Iman Ahmad Ihsannuddin, and Rina Mahmudati, “Perbandingan Metode Naïve Bayes Dan Support Vector Machine Untuk Analisis Sentimen Pada Ulasan Pengguna Aplikasi Linkedin,” STORAGE J. Ilm. Tek. dan Ilmu Komput., vol. 3, no. 2, pp. 139–144, 2024, doi: 10.55123/storage.v3i2.3602.

[7] U. Khaira, R. Aryani, and R. W. Hardian, “Komparasi Algoritma Naïve Bayes Dan Support Vector Machine (SVM) Pada Analisis Sentimen Kebijakan Kemdikbudristek Mengenai Kuota Internet Selama Covid-19,” J. Process., vol. 18, no. 2, pp. 183–191, 2023, doi: 10.33998/processor.2023.18.2.897.

[8] W. Ningsih, B. Alfianda, R. Rahmaddeni, and D. Wulandari, “Perbandingan Algoritma SVM dan Naïve Bayes dalam Analisis Sentimen Twitter pada Penggunaan Mobil Listrik di Indonesia,” MALCOM Indones. J. Mach. Learn. Comput. Sci., vol. 4, no. 2, pp. 556–562, 2024, doi: 10.57152/malcom.v4i2.1253.

[9] R. Ridwan, E. H. Hermaliani, and M. Ernawati, “Penerapan: Penerapan Metode SMOTE Untuk Mengatasi Imbalanced Data Pada Klasifikasi Ujaran Kebencian,” Comput. Sci., vol. 4, no. 1, pp. 80–88, 2024, [Online]. Available: https://jurnal.bsi.ac.id/index.php/co-science/article/view/2990

[10] M. Safrudin, M. Martanto, and U. Hayati, “Perbandingan Kinerja Naïve Bayes Dan Support Vector Machine Untuk Klasifikasi Sentimen Ulasan Game Genshin Impact,” JATI (Jurnal Mhs. Tek. Inform., vol. 8, no. 3, pp. 3182–3188, 2024, doi: 10.36040/jati.v8i3.8415.

[11] E. Apriani, F. Oktavianalisti, L. D. H. Monasari, I. Winarni, and I. F. Hanif, “Analisis Sentimen Penggunaan TikTok Sebagai Media Pembelajaran Menggunakan Algoritma Naïve Bayes Classifier,” MALCOM Indones. J. Mach. Learn. Comput. Sci., vol. 4, no. 3, pp. 1160–1168, 2024, doi: 10.57152/malcom.v4i3.1482.

[12] D. Darwis, E. S. Pratiwi, and A. F. O. Pasaribu, “Penerapan Algoritma Svm Untuk Analisis Sentimen Pada Data Twitter Komisi Pemberantasan Korupsi Republik Indonesia,” Edutic - Sci. J. Informatics Educ., vol. 7, no. 1, pp. 1–11, 2020, doi: 10.21107/edutic.v7i1.8779.

[13] M. Rahman Fauzan, H. Oktafia Lingga Wijaya, and J. Karman, “Analisis Sentimen Masyarakat Terhadap Kenaikan Harga Bbm Di Media Sosial Twitter Menggunakan Metode Support Vector Machine,” Semin. Ris. Mahasiswa-Computer Electr. (SERIMA-CE, vol. 1, no. 1, p. 82, 2023.

[14] Yuyun, Nurul Hidayah, and Supriadi Sahibu, “Algoritma Multinomial Naïve Bayes Untuk Klasifikasi Sentimen Pemerintah Terhadap Penanganan Covid-19 Menggunakan Data Twitter,” J. RESTI (Rekayasa Sist. dan Teknol. Informasi), vol. 5, no. 4, pp. 820–826, 2021, doi: 10.29207/resti.v5i4.3146.

[15] A. Putri et al., “Komparasi Algoritma K-NN, Naive Bayes dan SVM untuk Prediksi Kelulusan Mahasiswa Tingkat Akhir,” MALCOM Indones. J. Mach. Learn. Comput. Sci., vol. 3, no. 1, pp. 20–26, 2023, doi: 10.57152/malcom.v3i1.610.

[16] M. Dennis, R. Rahmaddeni, F. Zoromi, and M. K. Anam, “Penerapan Algoritma Naïve Bayes Untuk Pengelompokkan Predikat Peserta Uji Kemahiran Berbahasa Indonesia,” J. Media Inform. Budidarma, vol. 6, no. 2, p. 1183, 2022, doi: 10.30865/mib.v6i2.3956.

[17] D. N. Herisnan, E. Dadynata, and L. Efrizoni, “Komparasi Algoritma Decision Tree, SVM, Naive Bayes Dalam Prediksi Penyakit Liver,” J. Jar. Sist. Inf. Robot., vol. 8, no. 1, pp. 104–109, 2024, [Online]. Available: http://ojsamik.amikmitragama.ac.id

[18] I. N. Rizki, D. Prayoga, M. L. Puspita, and M. Q. Huda, “Implementasi Exploratory Data Analysis Untuk Analisis Dan Visualisasi Data Penderita Stroke Kalimantan Selatan Menggunakan Platform Tableau,” J. Inform. dan Tek. Elektro Terap., vol. 12, no. 1, 2024, doi: 10.23960/jitet.v12i1.3856.

[19] R. Safitri, I. Ali, and N. Rahaningsih, “Analisis Sentimen Terhadap Tren Fashion Di Media Sosial Dengan Metode Support Vector Machine (Svm),” JATI (Jurnal Mhs. Tek. Inform., vol. 8, no. 2, pp. 1746–1754, 2024, doi: 10.36040/jati.v8i2.9045.

[20] N. Fitriyah, B. Warsito, and D. A. I. Maruddani, “Analisis Sentimen Gojek Pada Media Sosial Twitter Dengan Klasifikasi Support Vector Machine (Svm,” J. Gaussian, vol. 9, no. 3, pp. 376–390, 2020, doi: 10.14710/j.gauss.v9i3.28932.

[21] K. Parmar, “Social Media Sentiments Analysis Dataset.” Accessed: Jan. 24, 2025. [Online]. Available: https://www.kaggle.com/datasets/kashishparmar02/social-media-sentiments-analysis-dataset

[22] A. Nurdin, B. Anggo Seno Aji, A. Bustamin, and Z. Abidin, “Perbandingan Kinerja Word Embedding Word2Vec, Glove, Dan Fasttext Pada Klasifikasi Teks,” J. Tekno Kompak, vol. 14, no. 2, p. 74, 2020, doi: 10.33365/jtk.v14i2.732.

[23] M. R. Hunafa and A. Hermawan, “KLIK: Kajian Ilmiah Informatika dan Komputer Perbandingan Algoritma Naïve Bayes dan K-Nearest Neighbor Pada Imbalace Class Dataset Penyakit Diabetes,” Media Online, vol. 4, no. 3, pp. 1551–1561, 2023, doi: 10.30865/klik.v4i3.1486.

[24] I. Muhamad Malik Matin, “Hyperparameter Tuning Menggunakan GridsearchCV pada Random Forest untuk Deteksi Malware,” Multinetics, vol. 9, no. 1, pp. 43–50, 2023, doi: 10.32722/multinetics.v9i1.5578.

Downloads

Published

2025-05-01

How to Cite

[1]
J. Saputra, L. Maryani, Rahmaddeni, D. Wulandari, and W. Eka, “ANALISIS PERFORMA NAIVE BAYES DAN SVM TERHADAP SENTIMEN TEKS MEDIA SOSIAL DENGAN WORD2VEC DAN SMOTE”, INSTEK, vol. 10, no. 1, pp. 143–155, May 2025.

Issue

Section

Volume 10 Nomor 1 April Tahun 2025