Mengatasi Imbalanced Class Pada Software Defect Prediction Menggunakan Two-Step Clustering-Based Undersampling dan Bagging Tehcnique

Ketidakseimbangan kelas seringkali menjadi masalah di berbagai set data dunia nyata, di mana satu kelas (yaitu kelas minoritas) berisi sejumlah kecil titik data dan yang lainnya (yaitu kelas mayoritas) berisi sejumlah besar titik data. Sangat sulit untuk mengembangkan model yang efektif dengan mengg...

Full description

Bibliographic Details
Main Authors: Muhammad Faittullah Akbar, Ilham Kurniawan, Ahmad Fauzi
Format: Article
Language:Indonesian
Published: Universitas Bina Sarana Informatika, LPPM 2019-04-01
Series:Jurnal Informatika
Online Access:http://ejournal.bsi.ac.id/ejurnal/index.php/ji/article/view/5448
id doaj-8f8d586192894d4c827096c8a337fcbf
record_format Article
spelling doaj-8f8d586192894d4c827096c8a337fcbf2020-11-25T01:30:12ZindUniversitas Bina Sarana Informatika, LPPMJurnal Informatika2355-65792528-22472019-04-016110711310.31311/ji.v6i1.54482976Mengatasi Imbalanced Class Pada Software Defect Prediction Menggunakan Two-Step Clustering-Based Undersampling dan Bagging TehcniqueMuhammad Faittullah Akbar0Ilham Kurniawan1Ahmad Fauzi2Universitas BSIUniversitas BSIUniversitas BSIKetidakseimbangan kelas seringkali menjadi masalah di berbagai set data dunia nyata, di mana satu kelas (yaitu kelas minoritas) berisi sejumlah kecil titik data dan yang lainnya (yaitu kelas mayoritas) berisi sejumlah besar titik data. Sangat sulit untuk mengembangkan model yang efektif dengan menggunakan data mining dan algoritma machine learning tanpa mempertimbangkan preprocessing data untuk menyeimbangkan set data yang tidak seimbang. Random undersampling dan oversampling telah digunakan dalam banyak penelitian untuk memastikan bahwa kelas yang berbeda mengandung jumlah titik data yang sama. Dalam penelitian ini, kami mengusulkan kombinasi two-step clustering-based random undersampling dan bagging technique untuk meningkatkan nilai akurasi software defect prediction. Metode yang diusulkan dievaluasi menggunakan lima set data dari repositori program data metrik NASA dan area under the curve (AUC) sebagai evaluasi utama. Hasil telah menunjukkan bahwa metode yang diusulkan menghasilkan kinerja yang sangat baik untuk semua dataset (AUC> 0,9). Dalam hal SN, percobaan kedua mengungguli percobaan pertama di hampir semua dataset (3 dari 5 dataset). Sementara itu, dalam hal SP, percobaan pertama tidak mengungguli percobaan kedua di semua dataset. Secara keseluruhan percobaan kedua mengungguli dan lebih baik daripada percobaan pertama karena evaluasi utama dalam klasifikasi kelas yang tidak seimbang seperti SDP adalah AUC Oleh karena itu, dapat disimpulkan bahwa metode yang diusulkan menghasilkan kinerja yang optimal baik untuk set data skala kecil maupun besar.http://ejournal.bsi.ac.id/ejurnal/index.php/ji/article/view/5448
collection DOAJ
language Indonesian
format Article
sources DOAJ
author Muhammad Faittullah Akbar
Ilham Kurniawan
Ahmad Fauzi
spellingShingle Muhammad Faittullah Akbar
Ilham Kurniawan
Ahmad Fauzi
Mengatasi Imbalanced Class Pada Software Defect Prediction Menggunakan Two-Step Clustering-Based Undersampling dan Bagging Tehcnique
Jurnal Informatika
author_facet Muhammad Faittullah Akbar
Ilham Kurniawan
Ahmad Fauzi
author_sort Muhammad Faittullah Akbar
title Mengatasi Imbalanced Class Pada Software Defect Prediction Menggunakan Two-Step Clustering-Based Undersampling dan Bagging Tehcnique
title_short Mengatasi Imbalanced Class Pada Software Defect Prediction Menggunakan Two-Step Clustering-Based Undersampling dan Bagging Tehcnique
title_full Mengatasi Imbalanced Class Pada Software Defect Prediction Menggunakan Two-Step Clustering-Based Undersampling dan Bagging Tehcnique
title_fullStr Mengatasi Imbalanced Class Pada Software Defect Prediction Menggunakan Two-Step Clustering-Based Undersampling dan Bagging Tehcnique
title_full_unstemmed Mengatasi Imbalanced Class Pada Software Defect Prediction Menggunakan Two-Step Clustering-Based Undersampling dan Bagging Tehcnique
title_sort mengatasi imbalanced class pada software defect prediction menggunakan two-step clustering-based undersampling dan bagging tehcnique
publisher Universitas Bina Sarana Informatika, LPPM
series Jurnal Informatika
issn 2355-6579
2528-2247
publishDate 2019-04-01
description Ketidakseimbangan kelas seringkali menjadi masalah di berbagai set data dunia nyata, di mana satu kelas (yaitu kelas minoritas) berisi sejumlah kecil titik data dan yang lainnya (yaitu kelas mayoritas) berisi sejumlah besar titik data. Sangat sulit untuk mengembangkan model yang efektif dengan menggunakan data mining dan algoritma machine learning tanpa mempertimbangkan preprocessing data untuk menyeimbangkan set data yang tidak seimbang. Random undersampling dan oversampling telah digunakan dalam banyak penelitian untuk memastikan bahwa kelas yang berbeda mengandung jumlah titik data yang sama. Dalam penelitian ini, kami mengusulkan kombinasi two-step clustering-based random undersampling dan bagging technique untuk meningkatkan nilai akurasi software defect prediction. Metode yang diusulkan dievaluasi menggunakan lima set data dari repositori program data metrik NASA dan area under the curve (AUC) sebagai evaluasi utama. Hasil telah menunjukkan bahwa metode yang diusulkan menghasilkan kinerja yang sangat baik untuk semua dataset (AUC> 0,9). Dalam hal SN, percobaan kedua mengungguli percobaan pertama di hampir semua dataset (3 dari 5 dataset). Sementara itu, dalam hal SP, percobaan pertama tidak mengungguli percobaan kedua di semua dataset. Secara keseluruhan percobaan kedua mengungguli dan lebih baik daripada percobaan pertama karena evaluasi utama dalam klasifikasi kelas yang tidak seimbang seperti SDP adalah AUC Oleh karena itu, dapat disimpulkan bahwa metode yang diusulkan menghasilkan kinerja yang optimal baik untuk set data skala kecil maupun besar.
url http://ejournal.bsi.ac.id/ejurnal/index.php/ji/article/view/5448
work_keys_str_mv AT muhammadfaittullahakbar mengatasiimbalancedclasspadasoftwaredefectpredictionmenggunakantwostepclusteringbasedundersamplingdanbaggingtehcnique
AT ilhamkurniawan mengatasiimbalancedclasspadasoftwaredefectpredictionmenggunakantwostepclusteringbasedundersamplingdanbaggingtehcnique
AT ahmadfauzi mengatasiimbalancedclasspadasoftwaredefectpredictionmenggunakantwostepclusteringbasedundersamplingdanbaggingtehcnique
_version_ 1725092909132283904