ANALISIS KOMPARASI ALGORITMA KLASIFIKASI UNTUK MENANGANI DATA TIDAK SEIMBANG PADA DATA KEBAKARAN HUTAN
<p><em>Untuk menghasilkan hasil yang maksimal di dalam proses klasifikasi data harus memiliki distribusi yang sama dengan data pelatihan. Namun, kenyataannya data seperti ini, tidak selalu ditemukan banyak juga data yang distribusinya tidak sama, dimana satu kelas mungkin diwakili oleh d...
Main Author: | |
---|---|
Format: | Article |
Language: | Indonesian |
Published: |
Universitas Dian Nuswantoro
2015-11-01
|
Series: | Techno.Com |
Online Access: | http://publikasi.dinus.ac.id/index.php/technoc/article/view/992 |
id |
doaj-9934feb76949409d93ce18269d209b40 |
---|---|
record_format |
Article |
spelling |
doaj-9934feb76949409d93ce18269d209b402020-11-24T23:29:27ZindUniversitas Dian NuswantoroTechno.Com1412-26932356-25792015-11-01144336342719ANALISIS KOMPARASI ALGORITMA KLASIFIKASI UNTUK MENANGANI DATA TIDAK SEIMBANG PADA DATA KEBAKARAN HUTANCastaka Agus Sugianto0Program Studi Teknik Informatika, Politeknik TEDC Bandung, 40513 Indonesia<p><em>Untuk menghasilkan hasil yang maksimal di dalam proses klasifikasi data harus memiliki distribusi yang sama dengan data pelatihan. Namun, kenyataannya data seperti ini, tidak selalu ditemukan banyak juga data yang distribusinya tidak sama, dimana satu kelas mungkin diwakili oleh data dengan jumlah yang besar, sementara kelas yang lain diwakili oleh hanya beberapa. Algoritma klasifikasi data mining banyak yang dapat digunakan untuk menangani data tidak seimbang, maka dari itu perlu dilakukan komparasi untuk mengetahui seberapa tinggi tingkat akurasi dari masing-masing algoritma yang ada. Algoritma yang digunakan adalah K-Means + C4.5, K-Means + Naïve Bayes, K-Means + Random Forest dan K-Means + Neural Network. Dataset terdiri dari dua kombinasi, yang terdiri dari variabel meteorologi dan fire weather index (FWI) untuk memprediksi ukuran kebakaran hutan. Hasil dari proses klasifikasi dievaluasi dengan menggunakan cross validation, confusion matrix, dan T-Test</em></p> <p><em> </em></p> <strong><em>Kata Kunci :</em></strong><em> Algoritma C4.5, Naïve Bayes, Random Forest, Neural Network, K-Means, Data tidak seimbang, Data Mining.</em>http://publikasi.dinus.ac.id/index.php/technoc/article/view/992 |
collection |
DOAJ |
language |
Indonesian |
format |
Article |
sources |
DOAJ |
author |
Castaka Agus Sugianto |
spellingShingle |
Castaka Agus Sugianto ANALISIS KOMPARASI ALGORITMA KLASIFIKASI UNTUK MENANGANI DATA TIDAK SEIMBANG PADA DATA KEBAKARAN HUTAN Techno.Com |
author_facet |
Castaka Agus Sugianto |
author_sort |
Castaka Agus Sugianto |
title |
ANALISIS KOMPARASI ALGORITMA KLASIFIKASI UNTUK MENANGANI DATA TIDAK SEIMBANG PADA DATA KEBAKARAN HUTAN |
title_short |
ANALISIS KOMPARASI ALGORITMA KLASIFIKASI UNTUK MENANGANI DATA TIDAK SEIMBANG PADA DATA KEBAKARAN HUTAN |
title_full |
ANALISIS KOMPARASI ALGORITMA KLASIFIKASI UNTUK MENANGANI DATA TIDAK SEIMBANG PADA DATA KEBAKARAN HUTAN |
title_fullStr |
ANALISIS KOMPARASI ALGORITMA KLASIFIKASI UNTUK MENANGANI DATA TIDAK SEIMBANG PADA DATA KEBAKARAN HUTAN |
title_full_unstemmed |
ANALISIS KOMPARASI ALGORITMA KLASIFIKASI UNTUK MENANGANI DATA TIDAK SEIMBANG PADA DATA KEBAKARAN HUTAN |
title_sort |
analisis komparasi algoritma klasifikasi untuk menangani data tidak seimbang pada data kebakaran hutan |
publisher |
Universitas Dian Nuswantoro |
series |
Techno.Com |
issn |
1412-2693 2356-2579 |
publishDate |
2015-11-01 |
description |
<p><em>Untuk menghasilkan hasil yang maksimal di dalam proses klasifikasi data harus memiliki distribusi yang sama dengan data pelatihan. Namun, kenyataannya data seperti ini, tidak selalu ditemukan banyak juga data yang distribusinya tidak sama, dimana satu kelas mungkin diwakili oleh data dengan jumlah yang besar, sementara kelas yang lain diwakili oleh hanya beberapa. Algoritma klasifikasi data mining banyak yang dapat digunakan untuk menangani data tidak seimbang, maka dari itu perlu dilakukan komparasi untuk mengetahui seberapa tinggi tingkat akurasi dari masing-masing algoritma yang ada. Algoritma yang digunakan adalah K-Means + C4.5, K-Means + Naïve Bayes, K-Means + Random Forest dan K-Means + Neural Network. Dataset terdiri dari dua kombinasi, yang terdiri dari variabel meteorologi dan fire weather index (FWI) untuk memprediksi ukuran kebakaran hutan. Hasil dari proses klasifikasi dievaluasi dengan menggunakan cross validation, confusion matrix, dan T-Test</em></p> <p><em> </em></p> <strong><em>Kata Kunci :</em></strong><em> Algoritma C4.5, Naïve Bayes, Random Forest, Neural Network, K-Means, Data tidak seimbang, Data Mining.</em> |
url |
http://publikasi.dinus.ac.id/index.php/technoc/article/view/992 |
work_keys_str_mv |
AT castakaagussugianto analisiskomparasialgoritmaklasifikasiuntukmenanganidatatidakseimbangpadadatakebakaranhutan |
_version_ |
1725545565027041280 |