Prapemrosesan klasifikasi algoritme kNN menggunakan K-means dan matriks jarak untuk dataset hasil studi mahasiswa
Keberadaan outlier pada dataset dapat menyebabkan rendahnya hasil akurasi pada proses klasifikasi. Outlier pada dataset dapat dihilangkan pada tahapan prapemrosesan algoritme klasifikasi. Clustering dapat digunakan sebagai metode pendeteksi outlier. Kajian ini bertujuan menerapkan K-means dan matrik...
Main Authors: | , |
---|---|
Format: | Article |
Language: | English |
Published: |
Diponegoro University
2020-10-01
|
Series: | Jurnal Teknologi dan Sistem Komputer |
Subjects: | |
Online Access: | https://jtsiskom.undip.ac.id/index.php/jtsiskom/article/view/13874 |
id |
doaj-3aaf3d45bd3b4d2bbaeec637a678d375 |
---|---|
record_format |
Article |
spelling |
doaj-3aaf3d45bd3b4d2bbaeec637a678d3752021-10-02T15:30:37ZengDiponegoro UniversityJurnal Teknologi dan Sistem Komputer2338-04032020-10-018431131610.14710/jtsiskom.2020.1387412843Prapemrosesan klasifikasi algoritme kNN menggunakan K-means dan matriks jarak untuk dataset hasil studi mahasiswaSugriyono Sugriyono0Maria Ulfah Siregar1https://orcid.org/0000-0001-7983-1007Master of Informatics Department, Sunan Kalijaga Islamic State University, IndonesiaMaster of Informatics Department, Sunan Kalijaga Islamic State University, IndonesiaKeberadaan outlier pada dataset dapat menyebabkan rendahnya hasil akurasi pada proses klasifikasi. Outlier pada dataset dapat dihilangkan pada tahapan prapemrosesan algoritme klasifikasi. Clustering dapat digunakan sebagai metode pendeteksi outlier. Kajian ini bertujuan menerapkan K-means dan matriks jarak untuk mendeteksi outlier dan menghapusnya dari dataset yang sudah memiliki kelas label. Penelitian ini menggunakan dataset hasil studi mahasiswa berjumlah 6847 instance, dengan 18 atribut dan tiga kelas. Prapemrosesan menerapkan metode K-means untuk mendapatkan pusat klaster pada tiap class, matriks jarak digunakan untuk mengevaluasi jarak instance dengan pusat klaster. Outlier, kelas baru yang berbeda dengan kelas awal, yang ditemukan akan dihilangkan. Prapemrosesan ini meningkatkan hasil akurasi klasifikasi algoritme kNN. Data tanpa prapemrosesan menghasilkan akurasi sebesar 72,28 %, data hasil prapemrosesan menggunakan metode K-means dan Euclidean menghasilkan akurasi hasil klasifikasi sebesar 98,42 % (meningkat 26,14 %), sedangkan metode K-means dan Manhattan menghasilkan akurasi sebesar 97,76 % (meningkat 25,48 %).https://jtsiskom.undip.ac.id/index.php/jtsiskom/article/view/13874preprocessingk-meansknndistance matrixmanhattaneuclidean |
collection |
DOAJ |
language |
English |
format |
Article |
sources |
DOAJ |
author |
Sugriyono Sugriyono Maria Ulfah Siregar |
spellingShingle |
Sugriyono Sugriyono Maria Ulfah Siregar Prapemrosesan klasifikasi algoritme kNN menggunakan K-means dan matriks jarak untuk dataset hasil studi mahasiswa Jurnal Teknologi dan Sistem Komputer preprocessing k-means knn distance matrix manhattan euclidean |
author_facet |
Sugriyono Sugriyono Maria Ulfah Siregar |
author_sort |
Sugriyono Sugriyono |
title |
Prapemrosesan klasifikasi algoritme kNN menggunakan K-means dan matriks jarak untuk dataset hasil studi mahasiswa |
title_short |
Prapemrosesan klasifikasi algoritme kNN menggunakan K-means dan matriks jarak untuk dataset hasil studi mahasiswa |
title_full |
Prapemrosesan klasifikasi algoritme kNN menggunakan K-means dan matriks jarak untuk dataset hasil studi mahasiswa |
title_fullStr |
Prapemrosesan klasifikasi algoritme kNN menggunakan K-means dan matriks jarak untuk dataset hasil studi mahasiswa |
title_full_unstemmed |
Prapemrosesan klasifikasi algoritme kNN menggunakan K-means dan matriks jarak untuk dataset hasil studi mahasiswa |
title_sort |
prapemrosesan klasifikasi algoritme knn menggunakan k-means dan matriks jarak untuk dataset hasil studi mahasiswa |
publisher |
Diponegoro University |
series |
Jurnal Teknologi dan Sistem Komputer |
issn |
2338-0403 |
publishDate |
2020-10-01 |
description |
Keberadaan outlier pada dataset dapat menyebabkan rendahnya hasil akurasi pada proses klasifikasi. Outlier pada dataset dapat dihilangkan pada tahapan prapemrosesan algoritme klasifikasi. Clustering dapat digunakan sebagai metode pendeteksi outlier. Kajian ini bertujuan menerapkan K-means dan matriks jarak untuk mendeteksi outlier dan menghapusnya dari dataset yang sudah memiliki kelas label. Penelitian ini menggunakan dataset hasil studi mahasiswa berjumlah 6847 instance, dengan 18 atribut dan tiga kelas. Prapemrosesan menerapkan metode K-means untuk mendapatkan pusat klaster pada tiap class, matriks jarak digunakan untuk mengevaluasi jarak instance dengan pusat klaster. Outlier, kelas baru yang berbeda dengan kelas awal, yang ditemukan akan dihilangkan. Prapemrosesan ini meningkatkan hasil akurasi klasifikasi algoritme kNN. Data tanpa prapemrosesan menghasilkan akurasi sebesar 72,28 %, data hasil prapemrosesan menggunakan metode K-means dan Euclidean menghasilkan akurasi hasil klasifikasi sebesar 98,42 % (meningkat 26,14 %), sedangkan metode K-means dan Manhattan menghasilkan akurasi sebesar 97,76 % (meningkat 25,48 %). |
topic |
preprocessing k-means knn distance matrix manhattan euclidean |
url |
https://jtsiskom.undip.ac.id/index.php/jtsiskom/article/view/13874 |
work_keys_str_mv |
AT sugriyonosugriyono prapemrosesanklasifikasialgoritmeknnmenggunakankmeansdanmatriksjarakuntukdatasethasilstudimahasiswa AT mariaulfahsiregar prapemrosesanklasifikasialgoritmeknnmenggunakankmeansdanmatriksjarakuntukdatasethasilstudimahasiswa |
_version_ |
1716853848957517824 |