PENERAPAN METODE RESAMPLING DALAM MENGATASI IMBALANCED DATA PADA DETERMINAN KASUS DIARE PADA BALITA DI INDONESIA (ANALISIS DATA SDKI 2017)

Andriansyah Muqiit WS, Rani Nooraeni

Abstract


Data yang memiliki rasio yang tidak berimbang antara data satu dengan data lainnya dapat dikatakan sebagai imbalanced. Metode Synthetic Minority Oversampling Technique (SMOTE) merupakan metode yang populer diterapkan dalam rangka menangani imbalanced. Pada penelitian ini penulis ingin membandingkan model data sebelum dan data sesudah dilakukan oversampling menggunakan analisis regresi logistik berganda. Data yang digunakan adalah data sekunder dari hasil Survei Demografi dan Kesehatan (SDKI) tahun 2017. Variabel respon (dependent) yang digunakan adalah balita mengalami diare dalam dua minggu terakhir sebelum pencacahan. Variabel penjelas dikelompokkan menjadi dua yaitu faktor sosio-demografi dan faktor lingkungan. Variabel penjelas yang termasuk ke dalam faktor sosio-demografi antara lain jenis kelamin balita, umur balita, umur ibu, dan tingkat pendidikan ibu. Sedangkan variabel penjelas yang merupakan faktor lingkungan antara lain sumber air minum, jenis fasilitas toilet, jenis lantai rumah utama, dan daerah tempat tinggal. Berdasarkan penelitian yang telah dilakukan dapat disimpulkan bahwa model dengan data hasil SMOTE pada uji parsial menghasilkan lebih banyak variabel yang signifikan dibandingkan dengan model dengan data tanpa SMOTE.


Keywords


Imbalanced, Oversampling, SMOTE, Diare

References


Barro, Rossi Azmatul, dkk. 2013. Penerapan Synthetic Minority Oversampling Technique (SMOTE) terhadap Data Tidak Seimbang pada Pembuatan Model Komposisi Jamu. Jurnal Xplore Vol.1, 2013, 1-6.

Blagus, Rok dan Lara Lusa. 2013. SMOTE for High-Dimensional Class-Imbalanced Data. BMC Bioinformatics 2013, 14:106.

Chawla, Nitesh V., dkk. 2002. SMOTE: Synthetic Minority Over-sampling Technique. Journal of Artificial Intelligence Research 16, 2002, 321-357.

Chawla, Nitesh V., dkk. 2018. SMOTE for Learning from Imbalanced Data: Progress and Challenges, Marking the 15-year Anniversary. Journal of Artificial Intelligence Research 61, 2018, 863-905.

Ganganwar, Vaishali. 2012. An Overview of Classification Algorithms for Imbalanced Datasets. International Journal of Emerging Technology and Advanced Engineering Vol.2 Issue 4, April 2012, 42-47.

Rahayu, Sri, dkk. 2017. Analisis Perbandingan Metode Over-Sampling Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data dengan Fitur Nominal-Multi Categories. Jurnal CITEE, 2017.

Siringoringo, Rimbun. 2018. Klasifikasi Data Tidak Seimbang Menggunakan Algoritma SMOTE Dan K-Nearest Neighbor. Jurnal ISD Vol.3 No.1 Januari - Juni 2018.

Skryjomski, Przemyslaw dan Bartosz Krawczyk. 2017. Infuence of Minority Class Instance Types on SMOTE Imbalanced Data Oversampling. Proceedings od Machine Learning Research Vol.74, 2017, 7-21.

Untoro, Meida Cahyo dan Joko Lianto Buliali. 2018. Penanganan imbalance class data laboratorium kesehatan dengan Majority Weighted Minority Oversampling Technique. Jurnal Ilmiah Teknologi Sistem Informasi 4 (1), 2018, 23-29.

Zheng, Zhuoyuan, dkk. 2015. Oversampling Method for Imbalanced Classification. Computing an Informatics Vol.34 No. 5 2015, 1017-1037.




DOI: https://doi.org/10.24252/msa.v8i1.13452

Refbacks

  • There are currently no refbacks.

Comments on this article

View all comments




Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.

Crossref Cited-by logo